Videreutvikling av et diagnostisk verktøy for automatisk svulstinntegning av livmorhalskreft i MR-bilder
Master thesis
Svulstavgrensning og svulstinntegning innenfor medisinsk avbildning er en utfordrende, tid-krevende og stadig mer kompleks del av strålebehandling. I denne oppgaven videreutvikles et program som automatiserer svulstinntegningen, basert på MR-bilder av pasienter med livmorhalskreft. Programmet klassifiserer vokslene i MR-bildene som svulst eller ikke-svulst, med metoden lineær diskriminant analyse (LDA). I denne oppgaven testes nye metoder for (1) preprosessering av MR-bildene, (2) klassifisering av vokslene, og (3) postprosessering basert på klassifiseringsresultatene, for å øke nøyaktigheten til svulstinntegningene.
Oppgaven er basert på en studie gjennomført ved Radiumhospitalet i perioden 2001-2004. MR-avbildning av 78 kvinner med lokalavansert livmorhalskreft ble utført i forkant av behandling. Bildene består av T1-vektede, T2-vektede og dynamisk kontrastforsterkede (DCE) bildesekvenser. Samtlige pasienter mottok strålebehandling og kjemoterapi i etterkant. Livmorhalssvulstene ble tegnet inn av to radiologer. Radiologinntegningene ble brukt i modelltreningen og som fasit for å vurdere den automatiske inntegning.
For å forbedre analysegrunnlaget og kompensere for variasjoner i MR-bildenes intensitet mellom hver pasient, ble Median filter, Savitzky-Golay filter og Contrast Limited Adaptive Histogram Equalization (CLAHE) testet som preprosesseringsalgoritmer. En postprosesseringsmetode ble implementert, hvor en ROI (Region of Interest) maske tegnes rundt området hvor LDA klassifiseringen predikerte høy sannsynlighet for svulst. Dette fjerner irrelevante områder og reduserer vokselantallet, og det undersøkes om vokselklassifiseringen forbedres. Til slutt ble det undersøkt om ikke-lineære klassifiseringsmetoder skiller svulst og frisk vev mer nøyaktig enn den lineære klassifiseringsmetoden LDA. Klassifiseringsmetodene Random Forest, AdaBoost, k nærmeste nabo (kNN) og støtte vektor maskiner (SVM) ble testet.
Resultatene viser at postprosesseringen ved å velge en ROI maske ga en signifikant forbedring av vokselklassifiseringen. Hverken Random Forest, AdaBoost eller kNN klassifiseringsmetodene ga en signifikant forbedring av klassifiseringen. I tillegg brukte disse metodene vesentlig lenger tid på modelltreningen enn LDA. Uttesting av SVM klassifiseringsmetoden ble ikke fullført på grunn av for tidkrevende modelltrening. Ingen av preprosesseringsmetodene ga en forbedring av vokselklassifiseringen.
Den beste LDA klassifiseringen med ROI masken ga en gjennomsnittlig DSC og Kappa verdi på henholdsvis 0,53 og 0,51, og sensitivitet og spesifisitet på henholdsvis 0,91 og 0,81. Kappa verdien for LDA modellen var høyere enn forventet overenstemmelsen mellom radiologer, med en multirater Kappa på 0,32. Således viser det diagnostiske verktøyet for automatisk svulstinntegning av livmorhalskreft potensiale til å blir et nyttig verktøy for radiologer. Tumour delineation in medical imaging is a challenging, time-consuming and increasingly complex part of radiotherapy planning. The aim of this thesis is to further develop and improve an automatic tumour delineation program, based on MR-images of patients with cervical cancer. The program classifies voxels in MR-images into two classes, tumour and non-tumour, using linear discriminant analysis (LDA). In this thesis new methods were tested for (1) pre-processing of the MRI images, (2) classification of the voxels as tumour/non-tumour and (3) post-processing of the MRI images based on the classification results.
The analysis is based on a study done by the Norwegian Radium Hospital in the period 2001-2004. MRI imaging of 78 women with locally advanced cervical cancer was performed prior to treatment. The MRI images consist of T1-weighted, T2-weighted and dynamic contrast-enhanced (DCE) sequences. All patients received curative radiotherapy with adjuvant chemotherapy afterwards. The tumours were outlined by two radiologists. These contours were used in the modeltraining and as the ground truth to evaluate the autodelineation.
To compensate for intensity variations between the patients, the Median Filter, the Savitzky-Golay Filter and Contrast Limited Adaptive Histogram Equalization (CLAHE) were tested as pre-processing algorithms. To improve voxel classification, a post-processing method was implemented, where the results from the initial linear classification were used to draw a mask called Region of Interest (ROI) around the image region predicted to contain the tumour. This mask removed irrelevant areas and reduced the number of voxels. Finally, different classification methods were tested to investigate if non-linear classification models performed better than the linear classification model implemented in the program. The classifiers Random Forest, AdaBoost, k nearest neighbour (kNN) and support vector machines (SVM) were tested.
The analysis showed that post-processing by selecting a ROI mask significantly improved voxel classification. Neither Random Forest, AdaBoost nor the kNN classification models gave significantly better classification. In addition, these methods used significantly longer time to train the model, than LDA. The SVM classification method was not sufficiently tested because of time-consuming training. None of the pre-processing methods gave a better voxel classification.
The best LDA classification using the ROI post-processed images gave mean DSC and Kappa values of 0.53 and 0.51, respectively, and sensitivity and specificity values of 0.91 and 0.81, respectively. The Kappa values for the LDA model were higher than the expected agreement between radiologists, with a multirater Kappa of 0.32. Subsequently, the autodelineation program for cervical cancers has the potential to become a useful tool for radiologists.