dc.contributor.advisor | Liland, Kristian Hovde | |
dc.contributor.advisor | Tomic, Oliver | |
dc.contributor.advisor | Indahl, Ulf Geir | |
dc.contributor.author | Helin, Runar | |
dc.date.accessioned | 2023-09-19T12:48:49Z | |
dc.date.available | 2023-09-19T12:48:49Z | |
dc.date.issued | 2023 | |
dc.identifier.isbn | 978-82-575-2076-2 | |
dc.identifier.issn | 1894-6402 | |
dc.identifier.uri | https://hdl.handle.net/11250/3090487 | |
dc.description.abstract | Data analysis methods based on machine- and deep learning approaches are
continuously replacing traditional methods. Models based on deep learning (DL)
are applicable to many problems and often have better prediction performance
compared to traditional methods. One major difference between the traditional
methods and machine learning (ML) approaches is the black box aspect often
associated with ML and DL models. The use of ML and DL models offers
many opportunities but also challenges. This thesis explores some of these
opportunities and challenges of DL modelling with a focus on applications in
spectroscopy.
DL models are based on artificial neural networks (ANNs) and are known to
automatically find complex relations in the data. In Paper I, this property is
exploited by designing DL models to learn spectroscopic preprocessing based on
classical preprocessing techniques. It is shown that the DL-based preprocessing
has some merits with regard to prediction performance, but there is considerable
extra effort required when training and tuning these DL models. The flexibility
of ANN architecture designs is further studied in Paper II when a DL model for
multiblock data analysis is proposed which can also quantify the importance of
each data block.
A drawback of the DL models is the lack of interpretability. To address this,
a different modelling approach is taken in Paper III where the focus is to use
DL models in such a way as to retain as much interpretability as possible. The
paper presents the concept of non-linear error modelling, where the DL model
is used to model the residuals of the linear model instead of the raw input
data. The concept is essentially a shrinking of the black box aspect since the
majority of the data modelling is done by a linear interpretable model.
The final topic explored in this thesis is a more traditional modelling approach
inspired by DL techniques. Data sometimes contain intrinsic subgroups which
might be more accurately modelled separately than with a global model. Paper
IV presents a modelling framework based on locally weighted models and
fuzzy partitioning that automatically finds relevant clusters and combines the predictions of each local model. Compared to a DL model, the locally weighted
modelling framework is more transparent. It is also shown how the framework
can utilise DL techniques to be scaled to problems with huge amounts of data. | en_US |
dc.description.abstract | Metoder basert på maskin- og dyp læring erstatter i stadig økende grad tradisjonell
datamodellering. Modeller basert på dyp læring (DL) kan brukes på
mange problemer og har ofte bedre prediksjonsevne sammenlignet med tradisjonelle
metoder. En stor forskjell mellom tradisjonelle metoder og metoder
basert på maskinlæring (ML) er den "svarte boksen" som ofte forbindes med
ML- og DL-modeller. Bruken av ML- og DL-modeller åpner opp for mange
muligheter, men også utfordringer. Denne avhandlingen utforsker noen av disse
mulighetene og utfordringene med DL modeller, fokusert på anvendelser innen
spektroskopi.
DL-modeller er basert på kunstige nevrale nettverk (KNN) og er kjent for å
kunne finne komplekse relasjoner i data. I Artikkel I blir denne egenskapen
utnyttet ved å designe DL-modeller som kan lære spektroskopisk preprosessering
basert på klassiske preprosesseringsteknikker. Det er vist at DL-basert
preprosessering kan være gunstig med tanke på prediksjonsevne, men det kreves
større innsats for å trene og justere disse DL-modellene. Fleksibiliteten til
design av KNN-arkitekturer er studert videre i Artikkel II hvor en DL-modell
for analyse av multiblokkdata er foreslått, som også kan kvantifisere viktigheten
til hver datablokk.
En ulempe med DL-modeller er manglende muligheter for tolkning. For å
adressere dette, er en annen modelleringsframgangsmåte brukt i Artikkel III,
hvor fokuset er på å bruke DL-modeller på en måte som bevarer mest mulig
tolkbarhet. Artikkelen presenterer konseptet ikke-lineær feilmodellering, hvor
en DL-modell blir bruk til å modellere residualer fra en lineær modell i stedet
for rå inputdata. Konseptet kan ses på som en krymping av den svarte boksen,
siden mesteparten av datamodelleringen er gjort av en lineær, tolkbar modell.
Det siste temaet som er utforsket i denne avhandlingen er nærmere en tradisjonell
modelleringsvariant, men som er inspirert av DL-teknikker. Data har av
og til iboende undergrupper som kan bli mer nøyaktig modellert hver for seg
enn med en global modell. Artikkel IV presenterer et modelleringsrammeverk
basert på lokalt vektede modeller og "fuzzy" oppdeling, som automatisk finner relevante grupperinger ("clusters") og kombinerer prediksjonene fra hver lokale
modell. Sammenlignet med en DL-modell, er det lokalt vektede modelleringsrammeverket
mer transparent. Det er også vist hvordan rammeverket kan
utnytte teknikker fra DL for å skalere opp til problemer med store mengder
data. | en_US |
dc.language.iso | eng | en_US |
dc.publisher | Norwegian University of Life Sciences, Ås | en_US |
dc.relation.ispartofseries | PhD Thesis;2023:47 | |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Internasjonal | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/deed.no | * |
dc.subject | Machine learning | en_US |
dc.subject | Chemometrics | en_US |
dc.subject | Deep learning | en_US |
dc.subject | Spectroscopy | en_US |
dc.subject | Data modelling | en_US |
dc.title | Exploring the transition from traditional data analysis to machine- and deep learning approaches | en_US |
dc.title.alternative | Utforsking av overgangen fra tradisjonell dataanalyse til metoder med maskin- og dyp læring | en_US |
dc.type | Doctoral thesis | en_US |