Show simple item record

dc.contributor.advisorTomic, Oliver
dc.contributor.advisorFutsæther, Cecilia Marie
dc.contributor.advisorLiland, Kristian Hovde
dc.contributor.authorOlofsson, Charlott Kjærre
dc.date.accessioned2022-02-21T12:14:53Z
dc.date.available2022-02-21T12:14:53Z
dc.date.issued2021
dc.identifier.urihttps://hdl.handle.net/11250/2980497
dc.description.abstractAlzheimer's disease is a neurodegenerative brain disease that damages neurons in the part of the brain involved in cognitive function, and early diagnosis is crucial for treatment that could slow down the progression of the disease. In the preclinical stage, the accumulation of a protein fragment called amyloid-beta outside the neurons can be associated with the early onset of Alzheimer's disease. The aim of the study was to identify biomarkers (features) for early detection of Alzheimer's disease using data from patients known to have an accumulation of amyloid-beta in their brains. 44 features from different sources were used and divided into 5 blocks of similar measurements. A baseline analysis was done with all the features combined, consisting of 172 patient assessments with complete measurements, where 49 had presence of amyloid-beta. The same patient assessments were used as the test data for block-wise analysis. This study includes exploratory analysis of the data using correlation, principal components analysis (PCA) and partial least squares regression (PLSR). The performance outcomes of five different classifiers were compared when trying to separate the two classes. Repeated Elastic Net Technique (RENT) was used for feature selection, in combination with repeated stratified k-fold validation for the acquisition of robust results. Using the selected features from the RENT analysis, the best performing classifier for the individual blocks were identified through repeated stratified k-fold validation. A final prediction of the class was computed from the prediction of each block using a performance-based weighted average. The final score based on this weighted average did not exceed the score of the baseline study. The block consisting of factors related to environment and heritage provided the highest predictive performance. In the baseline analysis with RENT, the factors related to heritage came out as important for the classification task, along with features related to cognitive tests. From the features containing information from MR-images of the brain, white matter hyperintensity and lesion measured in the occipital lobe can be considered as important for both the baseline analysis and the block-wise analysis.en_US
dc.description.abstractAlzheimers sykdom er en nevrodegenerativ hjernesykdom som skader nevroner i den delen av hjernen som er involvert i kognitiv funksjon, og tidlig diagnose er avgjørende for behandling som kan bremse utviklingen av sykdommen. I det prekliniske stadiet kan akkumulering av et proteinfragment kalt amyloid-beta utenfor nevronene assosieres med begynnelsen av Alzheimers sykdom. Målet med dette studiet var å identifisere biomarkører (variabler) for tidlig oppdagelse av Alzheimers sykdom ved å bruke data fra pasienter som er kjent for å ha en akkumulering av amyloid-beta i hjernen. 44 variabler fra forskjellige kilder ble brukt og delt inn i 5 blokker med lignende målinger. En baseline-analyse ble gjort med alle variablene kombinert, bestående av 172 pasientvurderinger med komplette målinger, der 49 hadde tilstedeværelse av amyloid-beta. De samme pasientvurderingene ble brukt som testdata for blokkvis analyse. Dette studiet inkluderer utforskende analyse av dataene ved bruk av korrelasjon, hovedkomponentanalyse (PCA) og partiell minste kvadraters regresjon (PLSR). Ytelsen til fem forskjellige modeller for klassifisering ble sammenlignet for å skille mellom de to klassene. Repeated Elastic Net Technique (RENT) ble brukt for variabel seleksjon, i kombinasjon med gjentatt stratifisert k-fold validering for å oppnå robuste resultater. Ved å bruke de selekterte variablene fra RENT-analysen, ble den modellen med best ytelse for de individuelle blokkene identifisert gjennom gjentatt stratifisert k-fold validering. En endelig prediksjon av klassen ble beregnet fra prediksjonen for hver blokk ved å bruke et ytelsesbasert vektet gjennomsnitt. Den endelige poengsummen basert på dette vektede gjennomsnittet oversteg ikke resultatet i baseline-analysen. Blokken bestående av faktorer knyttet til miljø og arv ga den høyeste prediktive ytelsen. I baseline-analysen med RENT kom variablene knyttet til arv ut som viktige for klassifiseringsoppgaven, sammen med variabler knyttet til kognitive tester. Fra variablene som inneholder informasjon fra MR-bilder av hjernen, kom hyperintensitet og lesjon i hvit substans målt i occipitallappen ut som viktige både for baseline-analysen og den blokkvise analysen.en_US
dc.language.isoengen_US
dc.publisherNorwegian University of Life Sciences, Åsen_US
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internasjonal*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/deed.no*
dc.titleUsing machine learning and Repeated Elastic Net Technique for identification of biomarkers of early Alzheimer's diseaseen_US
dc.typeMaster thesisen_US
dc.description.localcodeM-TDVen_US


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivatives 4.0 Internasjonal
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivatives 4.0 Internasjonal