A Comparison of Methods for Modelling Survival Time for Cancer Patients

Rekstad, Mikko Johan Vatterdal

Rekstad, Mikko Johan Vatterdal

Master thesis

View/Open

no.nmbu:wiseflow:6839521:54591698.pdf (5.070Mb)

URI

https://hdl.handle.net/11250/3076766

Date

2023

Metadata

Show full item record

Collections

Master's theses (RealTek) [1826]

Abstract

I denne oppgaven brukte vi tre typer overlevelsesanalysemodeller for å modellere

overlevelsestiden til pasienter som lider av endetarmskreft og pasienter som lider

av hode- og halskreft.

Disse modellene var Cox-regresjon, Aalens additive regresjonsmodell og akselererte

levetidsmodeller. Målet med denne oppgaven var å sammenligne den målte ytelsen

til disse modellene ved hjelp av å bruke concordance index og Brier score som

ytelsesberegninger.

Vi estimerte disse ved å bruke en metode som heter "repeated stratified k-folds"

for å kryssvalidere de målte resultatene. Vi delte datasettene opp i fire og gjentok

dette 25 ganger, for å oppnå totalt 100 "folds". Dette gav oss muligheten til å

kalkulere ytelsesberegningene 100 ganger per modell. Vi benyttet denne løsningen

på begge datasettene.

Cox-regresjon oppnådde høyest concordance index på begge datasettene.

For å forstå modellenes nøyaktighet de første fem årene visualiserte vi Brier scoren

over tidsperioden tolv til 60 måneder. Alle modellene viste en trend. Dette indik-

erte at modellene blir mindre nøyaktige over tid. De fleste modellene hadde svært

liknende resultater målt med Brier score, men Aalens additive regresjonsmodell

hadde noe svakere resultater.

In this thesis, we used three types of survival-analysis models to model the overall

survival time for patients suffering from rectal cancer and head and neck cancer.

These models were Cox proportional hazards, Aalen’s additive fitter and acceler-

ated failure time models. The goal was to compare the performance in terms of

the measured concordance index and Brier scores.

The performance metrics were estimated using a repeated stratified k-folds cross-

validation scheme. With four splits and 25 repeats, we achieved 100 estimates of

the performance for each model. This was done for both data sets.

The Cox proportional hazards model achieved the highest concordance index

measured on both data sets.

When we visualised the measured Brier scores over the time period of 12 to 60

months in order to interpret the models’ overall performance for the five first years.

All models showed a rising trend in the measured Brier score. This indicates less

accurate predictions over time. The models had similar Brier scores, with the

exception of Aalen’s additive fitter. This model had a slightly poorer result when

time increased.

Publisher

Norwegian University of Life Sciences