A Comparison of Methods for Modelling Survival Time for Cancer Patients
Abstract
I denne oppgaven brukte vi tre typer overlevelsesanalysemodeller for å modellereoverlevelsestiden til pasienter som lider av endetarmskreft og pasienter som liderav hode- og halskreft.Disse modellene var Cox-regresjon, Aalens additive regresjonsmodell og akselerertelevetidsmodeller. Målet med denne oppgaven var å sammenligne den målte ytelsentil disse modellene ved hjelp av å bruke concordance index og Brier score somytelsesberegninger.Vi estimerte disse ved å bruke en metode som heter "repeated stratified k-folds"for å kryssvalidere de målte resultatene. Vi delte datasettene opp i fire og gjentokdette 25 ganger, for å oppnå totalt 100 "folds". Dette gav oss muligheten til åkalkulere ytelsesberegningene 100 ganger per modell. Vi benyttet denne løsningenpå begge datasettene.Cox-regresjon oppnådde høyest concordance index på begge datasettene.For å forstå modellenes nøyaktighet de første fem årene visualiserte vi Brier scorenover tidsperioden tolv til 60 måneder. Alle modellene viste en trend. Dette indik-erte at modellene blir mindre nøyaktige over tid. De fleste modellene hadde sværtliknende resultater målt med Brier score, men Aalens additive regresjonsmodellhadde noe svakere resultater. In this thesis, we used three types of survival-analysis models to model the overallsurvival time for patients suffering from rectal cancer and head and neck cancer.These models were Cox proportional hazards, Aalen’s additive fitter and acceler-ated failure time models. The goal was to compare the performance in terms ofthe measured concordance index and Brier scores.The performance metrics were estimated using a repeated stratified k-folds cross-validation scheme. With four splits and 25 repeats, we achieved 100 estimates ofthe performance for each model. This was done for both data sets.The Cox proportional hazards model achieved the highest concordance indexmeasured on both data sets.When we visualised the measured Brier scores over the time period of 12 to 60months in order to interpret the models’ overall performance for the five first years.All models showed a rising trend in the measured Brier score. This indicates lessaccurate predictions over time. The models had similar Brier scores, with theexception of Aalen’s additive fitter. This model had a slightly poorer result whentime increased.i