Semantisk segmentering av objekter på hustak i flybilder
Master thesis
Permanent lenke
https://hdl.handle.net/11250/3029324Utgivelsesdato
2022Metadata
Vis full innførselSamlinger
- Master's theses (RealTek) [1707]
Sammendrag
I dette prosjektet utforskes muligheten til å detektere objekter gjennom semantisk segmen tering av flybilder ved bruk av U-Net med et forhåndstrent ResNet34 som grunnlag.
Det finnes store mengder flybilder av forskjellige typer som er offentlig tilgjengelig og som dekker store deler av Norge. Bildene tatt i bruk i dette prosjektet produseres av Blom Norway AS og er åpent tilgjengelig via karttjenesten til Opplysningen 1881. Dette er en enorm ressurs, og denne oppgaven presenterer en metode for å benytte noe av den informa sjonen som er tilgjengelig.
Metoden beskriver nødvendig forarbeid og trening for å lære et nevralt nett å detektere tak-objekter i skråbilder og ortofoto tatt fra fly. Objektene som detekteres i denne oppgaven er begrenset til piper, takstiger og takvinduer, men metoden muliggjør detektering av en hvilken som helst samling klasser. Arbeidet resulterer i to modeller, der den ene er trent med data fra et område i form av skråfoto, mens den andre har blitt trent med data basert på ortofoto av samme området. De to modellene sammenliknes og det konkluderes med at ortofoto er marginalt bedre egnet til bruken i denne oppgaven. This project explores the possibility of detecting objects in aerial images through semantic segmentation using a U-Net with a pre-trained ResNet34 as a backbone.
There are large amounts of aerial photographs of various types that are publicly available and that cover large parts of Norway. The images used in this project are produced by Blom Norway AS and are openly available via the map service from ’Opplysningen 1881’. This is an enormous resource, and this thesis presents a method using some of the information that is available.
The method describes the necessary preparations and training to teach a neural network to detect rooftop objects in oblique images and orthophotos captured from airplanes. The objects detected in this task are limited to chimneys, roof ladders and skylights, but the method enables the detection of any collection of classes. The method results in two models, where one has been trained with data from an area in the form of oblique photos, while the other has been trained with data based on orthophotos of the same area. The two models are compared and it is concluded that orthophotos are marginally better suited for the use in this thesis.