Quantitative genetics and statistical genomics of amoebic gill disease resistance and gill health in Atlantic salmon
Abstract
Gill diseases such as amoebic gill disease (AGD) are a significant concern to the
salmon industry worldwide. Genetic variation in susceptibility to AGD has been
documented, hence, selective breeding can reduce the frequency and impact of AGD
outbreaks. This thesis aims to identify the optimal genetic evaluation method for
reduced susceptibility to AGD in different Atlantic salmon breeding populations from
Mowi. Additionally, it explores strategies to increase reference population size for
genomic selection (GS) and improve the power of detecting quantitative trait loci
(QTLs) in genome-wide association (GWA) analysis using data from multiple
populations. Since records of individual populations may not be available for GWA
analysis due to proprietorship or censorship, summary statistics of different studies
can be harmonised in a meta-analysis. Consequently, different meta-analysis methods
were evaluated to find which approximates mega-analysis (combination of individual
records from all populations) best. Sequence data was used to fine-map the QTL
region associated with AGD, and GWA analysis was conducted for gill lesions (gill
score at harvest) in another cohort of Atlantic salmon. There was genetic variation in
susceptibility to AGD in our study populations. Genomic-based evaluation models
(linear and nonlinear) performed better than the pedigree-based model. In general,
all the genomic-based evaluation models evaluated had similar performance. Due to
the higher computing requirements of nonlinear GS models, the linear GS model is
recommended for the genetic evaluation of AGD. Whereas combining multiple
populations for GS did not increase prediction accuracy, it significantly increased the
power of QTL detection compared to within-population GWA analysis, and an even
higher detection power was observed with meta-analysis. However, the results from
meta-analysis should be interpreted cautiously because their test statistics can be
inflated due to (un)known relationships across populations or studies. A QTL region
on chromosome 12 was found to be significantly associated with susceptibility to
AGD, while two QTLs regions on chromosomes 2 and 12 were found to be
significantly associated with risks of gill lesions in a mega-GWA analysis conducted
for AGD and gill lesions independently. The nearest gene to the lead variants in the
QTLs regions include tfeb, ZSCAN12l, and ifi44l, with the majority having immunerelated
functions. Since the lead variants identified explained only about 3 - 10% of
the genetic variance, GS is recommended for the genetic improvement of reduced
susceptibility to AGD and gill lesions. Gjellesykdommer, og spesielt amøbegjellesykdom (AGD: amoebic gill disease), er et økende problem for lakseindustrien over hele verden. Resistens mot gjellesykdom er imidlertid arvelig, og systematisk avlsarbeid kan derfor bidra til å redusere forekomsten og skadeomfang. Dette doktorgradsarbeidet sammenligner og optimaliserer genetiske evalueringsmetoder for motstandsevne mot AGD i tolv ulike, men beslektede, avlspopulasjoner av atlantisk laks hos verdens største lakseprodusent, Mowi. I tillegg undersøkes ulike strategier for å øke datagrunnlaget og dermed presisjonen for to viktigste genetiske analysemetodene som brukes i avlen: genomisk seleksjon (GS) og detektering av gen som har en signifikant effekt på egenskapens, såkalte QTL-er (Quantitative trait loci), som gjøres vha assosiasjonsstudier (GWAS – genome wide association studies). Datagrunnlaget ble utvidet ved å inkludere flere avlspopulasjoner i analysen samtidig. Dersom rådata fra andre avlspopulasjoner ikke er tilgjengelige, f.eks på grunn av immaterielle rettigheter, kan likevel de statistiske parameterne fra publiserte studier av populasjonene dras nytte av i en såkalt meta-analyse. Ulike meta-analysemetder ble derfor sammenlignet, også med mega-analyse, som benytter rådata fra alle populasjonene. DNA-sekvenseringsdata ble også brukt til å finkartlegge QTLregionen assosiert med AGD. En siste variabel som ble undersøkt var ulike statiske modeller for avlsverdiberegninger: Det finnes flere GS modeller, både lineare og ikkelineare, og en som kun bruker vanlig slektskapsdata, dvs ikke bruker DNA-data. Pga ulike forekomst i de ulike populasjonene, er det også to ulike egenskaper som har blitt undersøkt, AGD og såkalte gjelle-lesjoner. Disse sykdommene kan være forårsaket av ulike typer parasitter.
Det ble funnet genetisk variasjon i mottakelighet for AGD i våre studiepopulasjoner. Det var liten forskjell mellom lineære og ikke-lineære GS-modeller, men de presterte bedre, mht. prediksjonsevne, enn modellen som ikke bruker genom-data. Pga økt databehandlingskraft for ikke-lineære GS-modeller, anbefales bruk av den lineære GS-modellen. Kombinasjon av flere populasjoner økte ikke prediksjonsnøyaktigheten for GS, men det økte evnen til QTL-deteksjon betydelig, sammenlignet med kun innen-populasjon GWAS. En QTL-region på kromosom 12 var signifikant assosiert med mottakelighet for AGD, mens to QTL-regioner på henholdsvis kromosom 2 og 12 var signifikant assosiert med risiko for gjelle-lesjoner. I denne QTL-regionen finner vi flere interessante gen, bl.a tfeb, ZSCAN12l og ifi44l, som hovedsakelig er immunrelaterte gen. Siden de to beste QTL-variantene kun forklarte ca 3-10% av den genetiske variansen, anbefales bruk av GS i avlsarbeidet med begge typer gjellesykdommer, AGD og gjelle-lesjoner.