Vis enkel innførsel

dc.contributor.advisorLien, Sigbjørn
dc.contributor.authorKjelstrup, Anna Sofie
dc.date.accessioned2022-11-04T13:50:14Z
dc.date.available2022-11-04T13:50:14Z
dc.date.issued2022
dc.identifier.urihttps://hdl.handle.net/11250/3030212
dc.description.abstractStructural variants (SVs) are defined as genomic rearrangements of 50 base pairs (bp) or larger. Although they are less frequent in the genome, they can account for ten folds more variable base pairs than the widely studied singe nucleotide polymorphisms (SNPs). SVs have been hard to detect by short-read sequencing, especially in repeat rich regions. The recent addition of a new reference genome (GCA_905237065.2) and long-read sequencing data for eleven Atlantic salmon individuals has allowed for a more extensive characterization of SVs, revealing a significantly higher count than previously reported. By constructing a genome graph with new high-quality assemblies based on long-reads, we aim to genotype salmon SVs in short-read data, not detectable by traditional methods. We demonstrate how genome graphs, generated with the bioinformatic pipeline PGGB, can be used to detect and accurately represent SVs in Atlantic salmon genomes. We also present two pipelines for graph-based genotyping using short-reads and discuss alternative metrics for genome graph quality improvement. Eventually, this work will contribute to building a whole genome graph for Atlantic salmon, enabling population scale SV-calling based on already available short-read data.en_US
dc.description.abstractStrukturelle varianter (SVer) er definert som genomisk endring på 50 basepar eller mer. Selv om de er i mindretall i genomet, står SVer for mange ganger antallet variable basepar enn de mye studerte enkeltnukleotidpolymorfismer (SNPs). Strukturelle varianter har tidligere vært utfordrende å oppdage ved bruk av eldre teknologi som shortread sekvensering, spesielt i regioner med høyt innhold av repetativt DNA. Et nytt refereanse genom for atlanterhavslaks (GCA_905237065.2), samnt long-read sekvenseringsdata for elleve individer, har åpnet opp for utvidet karakterisering/deteksjon av strukturelle varianter. Dette har avdekket høyere forekomster enn hva som tidligere har blitt rapportert. Ved å konstruere en genomgraf fra nye assemblies av høy kvalitet, basert på long-read sekvenseringsdata, åpner vi for mulighetene til å genotype flere strukturelle varianter med short-read data fra Atlantisk laks. Vi demonstrerer hvordan det bioinformatiske verktøyet PGGB kan produsere genomgrafer som kan brukes til å detektere og representere strukturelle varianter i atlanterhavslaks. Videre presenterer vi to datastrømmer for grafbasert genotyping ved bruk av short-read data, og diskuterer ulike målbare kvaliteter som kan brukes til å forbedre grafen. Hensikten med dette arbeidet er å bidra til utviklingen av en helgenom graf for atlanterhavslaks som vil muliggjøre SV-calling på populasjonsnivå ved bruk av allerede eksisterende short-read data.en_US
dc.language.isoengen_US
dc.publisherNorwegian University of Life Sciences, Åsen_US
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internasjonal*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/deed.no*
dc.titleDetection and genotyping of Atlantic salmon structural variants with genome graphsen_US
dc.typeMaster thesisen_US
dc.subject.nsiVDP::Landbruks- og Fiskerifag: 900en_US
dc.description.localcodeM-BIASen_US


Tilhørende fil(er)

Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel

Attribution-NonCommercial-NoDerivatives 4.0 Internasjonal
Med mindre annet er angitt, så er denne innførselen lisensiert som Attribution-NonCommercial-NoDerivatives 4.0 Internasjonal