Advancing tree species composition prediction in boreal forests with remote sensing
Doctoral thesis
Accepted version
Date
2025Metadata
Show full item recordCollections
- Doctoral theses (MINA) [112]
Abstract
Accurate tree species composition information is crucial for forest management,
influencing harvest scheduling, regeneration choices, and silvicultural treatments. In
operational forest management inventories (FMIs), species composition is typically
estimated through manual photo interpretation, a costly, subjective method prone to
systematic errors. While efforts to improve species data have focused on species
classification (identifying tree species), species composition (quantifying relative
amount) provides a more detailed forest description, particularly relevant in Nordic
countries where forest attributes are reported by species. Most tree species classification
studies have been limited to small experimental areas and individual trees, offering
limited insights for operational applications.
To address these gaps, the first two studies in this thesis employed an area-based
approach, which linked remotely sensed data with field inventory plots to predict forest
attributes over larger areas. Conducted across eight study areas, these studies provided
findings that are more generalizable to a broader range of forest conditions and
operational management contexts.
The first study evaluated combinations of remote sensing (RS) data (ALS, aerial imagery
and Sentinel-2 imagery) to determine the most accurate predictors of species
composition. Results demonstrated that combining ALS data with spectral Sentinel-2
imagery, particularly when multi-season Sentinel-2 imagery was used, capturing
phenological variations. The findings highlight the potential of such data combinations
to reduce reliance on manual photo interpretation.
The second study compared parametric (Dirichlet regression and multinomial logistic
regression) and non-parametric (random forest (RF), k-nearest neighbors (k-NN),
extreme gradient boosting and multilayer perceptron) modeling techniques for
predicting species composition. While Dirichlet regression, RF and k-NN showed
similar predictive accuracy without significant differences in performance, Dirichlet
regression offers advantages such as simplicity and lower data requirements, making it
more suitable for FMIs with limited sample plots. On the other hand, non-parametric
RF and k-NN are better suited for modeling more complex relationships in the data,
vii
emphasizing the importance of choosing modeling techniques based on data
availability and application needs.
The third study examined the separate and combined effects of species composition
and site index (SI) prediction uncertainties on net present value (NPV) calculations, a
common measure of forest economic value. The findings revealed that site index
uncertainty had a greater impact on NPV than species composition uncertainty and
that their interaction amplified errors in economic valuation. The study also
demonstrated that calibration of both species composition and SI predictions
systematically reduced NPV errors, highlighting the value of calibrating remote sensing
predictions to minimize uncertainty in forest inventories.
Overall, this thesis demonstrates the potential of integrating remotely sensed data and
statistical modeling to improve forest inventory practices. By combining ALS and
multi-season Sentinel-2 data and selecting appropriate modeling techniques, tree
species composition can be predicted with improved accuracy and reliability than
current operational methods. These advancements provide scalable and cost-efficient
alternatives to conventional methods, reducing reliance on manual aerial photo
interpretation to support forest management decisions. Furthermore, the demonstrated
impact of prediction uncertainty on economic valuation emphasizes the need for
accurate species composition and SI predictions in forestry planning. Ultimately, this
research contributed to the development of objective, data-driven methods that can
improve the precision, efficiency and adaptability of operational FMIs. Nøyaktig informasjon om treslagsammensetning er avgjørende for skogforvaltning, da
det påvirker hogstplanlegging, valg av foryngelsesmetoder og skogbehandling. I dag
bestemmes ofte treslagsfordelingen i operasjonelle skogtakster (FMIs) ved manuell
fototolkning, en metode som er kostbar og subjektiv, som gjør det utsatt for
systematiske feil. Mens mye forskning har fokusert på treslagsklassifisering
(identifisering av treslag), gir treslagsammensetning (kvantifisering av relativ mengde)
en mer detaljert beskrivelse av skogen som er spesielt relevant i nordiske land der
skoglige attributter rapporteres per treslag. De fleste studier om treslagsklassifisering
har vært begrenset til små forsøksområder og enkelttrær, noe som gir begrenset innsikt
for operativ anvendelse.
For å adressere disse utfordringene benyttet de to første studiene i denne avhandlingen
en arealbasert tilnærming, hvor fjernmålte data ble koblet til prøveflater for å predikere
skoglige attributter over større områder. Disse to studiene gjennomført i åtte ulike
studieområder gir resultater som er generaliserbare til ulike skogforhold og
operasjonelle takster.
Den første studien evaluerte kombinasjoner av fjernmålingsdata (ALS, flybilder og
Sentinel-2-bilder) for å identifisere de mest presise prediktorene for
treslagsammensetning. Resultatene viste at en kombinasjon av ALS-data og spektrale
Sentinel-2-bilder, spesielt når Sentinel-2-bilder fra ulike tider på året ble brukt, forbedret
prediksjonen ved å fange opp fenologiske variasjoner. Funnene understreker
potensialet til slike datakombinasjoner for å redusere behovet for manuell
fototolkning.
Den andre studien sammenlignet parametriske (Dirichlet-regresjon og multinomisk
logistisk regresjon) og ikke-parametriske (random forest (RF), k-nærmeste nabo (k-NN),
extreme gradient boosting og multilayer perceptron) modelleringsmetoder for å
predikere treslagsammensetning. Selv om Dirichlet-regresjon, RF og k-NN viste
lignende prediksjonsnøyaktighet uten signifikante forskjeller, tilbyr Dirichlet-regresjon
fordeler som enkelhet og lavere datakrav, noe som gjør den mer egnet for FMIs med et
begrenset antall prøveflater. På den annen side er ikke-parametriske metoder som RF og k-NN bedre egnet for å modellere mer komplekse sammenhenger i dataene, noe
som understreker viktigheten av å velge modelleringsmetoder basert på tilgjengelige
data og bruksbehov.
Den tredje studien undersøkte de separate og kombinerte effektene av usikkerhet i
prediksjon av treslagsammensetning og bonitet på netto nåverdi, en vanlig økonomisk
indikator i skogbruket. Resultatene viste at usikkerhet i bonitet hadde større
innvirkning på netto nåverdi enn usikkerhet i treslagsammensetning, og at deres
interaksjon forsterket feil i økonomiske beregninger. Studien demonstrerte også at
kalibrering av både treslagsammensetning og bonitet reduserte feil i netto nåverdi, noe
som understreker verdien av å kalibrere fjernmålte prediksjoner for å minimere
usikkerhet i skogsinventeringer.
Samlet sett demonstrerer denne avhandlingen potensialet ved å integrere fjernmålte
data og statistisk modellering for å forbedre skogbruksinventeringer. Ved å kombinere
ALS- og multisesongale Sentinel-2-data og velge passende modelleringsmetoder, kan
treslagsammensetning predikeres med høyere nøyaktighet og pålitelighet enn dagens
operative metoder. Disse fremskrittene gir skalerbare og kostnadseffektive alternativer
til konvensjonelle metoder, noe som reduserer avhengigheten av manuell fototolkning
i skogforvaltningen. Videre fremhever den demonstrerte effekten av
prediksjonsusikkerhet på økonomiske verdiberegninger behovet for presise estimater
av treslagsammensetning og bonitet i skogplanleggingen. Til slutt bidrar denne
forskningen til utviklingen av objektive datadrevne metoder som kan forbedre
presisjonen, effektiviteten og tilpasningsevnen til operative FMIs.