Vis enkel innførsel

dc.contributor.advisorMeuwissen, Theo H. E.
dc.contributor.advisorWoolliams, John A.
dc.contributor.authorIheshiulor, Oscar Okechukwu Michael
dc.date.accessioned2017-12-06T13:21:14Z
dc.date.available2017-12-06T13:21:14Z
dc.date.issued2017-12-06
dc.identifier.isbn978-82-575-1349-8
dc.identifier.issn1894-6402
dc.identifier.urihttp://hdl.handle.net/11250/2469404
dc.description.abstractGenomic selection (GS) is increasingly being implemented in livestock, especially in the dairy cattle sector. While dairy cattle populations such as Holsteins have benefitted greatly from GS in the accuracy of evaluation due to their large reference population size and low effective population size (Ne), the impact of GS on numerically small breeds, sometimes with small reference population size and larger Ne, is much less. The overall aim of this research work was to explore strategies to improve the accuracy of genomic prediction in numerically small cattle breeds. Firstly, we conducted a computer simulation in order to assess how much predictive ability is gained by using WGS data under varied QTL density (45 or 132 QTL/Morgan) and heritability (0.07 or 0.30) compared to different SNP densities with emphasis on diverged dairy breeds of small populations with large Ne (>100). Also assessed was the relative performance of a non-variable selection method (SNP-BLUP) and a variable selection method (MixP). The use of WGS data for within-population predictions resulted in small to large increases in accuracy for lowly to moderately heritable traits when compared to the SNP densities. Depending on the heritability, marker and QTL density, the observed increase in accuracy was up to 13%. In comparison to the lowest simulated marker density, the increase was as much as 24-31%. The advantage of WGS data was more pronounced (7-92% increase in accuracy depending on the heritability, marker and QTL density, and time of divergence between populations) with a combined reference population across populations and when using MixP. While MixP outperformed SNP-BLUP at 45 QTL/Morgan, SNP-BLUP was as good as MixP when QTL density increased to 132 QTL/Morgan. Secondly, we evaluated an iterative method (referred to as GBC) that combines relationship information using the G-BLUP approach and LD between QTL and neighbouring SNPs using the BayesC approach for genomic prediction. The performance of GBC was compared to other evaluation methods. Two datasets were utilized for the analysis: 1) imputed medium-density (50k; MD) SNP dataset based on Illumina Bovine50k BeadChip, containing 48,249 SNPs and 3,244 records; and 2) imputed high-density (777k; HD) SNP dataset originating from the Illumina BovineHD chip and containing 539,665 SNPs and 3,164 records. With the MD SNP dataset, GBC showed an advantage over G-BLUP for all traits, while in comparison to MixP, accuracy was slightly lower. With the HD SNP dataset, GBC also performed better than G-BLUP and slightly below that of MixP except for fat yield where it gave higher prediction accuracy than both methods. The results show that incorporating aspects of G-BLUP and BayesC in a single model can improve accuracy of genomic prediction over the commonly used method: G-BLUP. On the other hand, MixP showed higher accuracies than G-BLUP for all traits studied and in most cases slightly higher than GBC. Thirdly, we proposed and evaluated an approach to absorb phenotypic information on large numbers of ungenotyped animals into the mixed model equations of genotyped animals so that all information can be utilized in predictions. Predictions were then done using DYD (daughter yield deviations) or the resulting pseudo-records from absorption as response variables. These pseudo-records were calculated for the genotyped animals and their (ungenotyped) ancestors. The ungenotyped ancestors were included in the analysis by calculating their genotype probabilities. Two datasets were used for the analysis: 1) DYD dataset, i.e. a combination of DYD and genotype of 3,244 progeny-tested bulls; and 2) Absorbed dataset, i.e. a combination of absorbed records and genotype probabilities of 20,918 animals. With DYD as response variable, forward prediction accuracies ranged from 0.427 to 0.664 across the traits and evaluation methods. With absorbed records as response variable, accuracies ranged from 0.429 to 0.667 across the traits and evaluation methods. Comparison of performance between DYD and the Absorbed dataset showed that differences in accuracy between both datasets were not statistically significant, but were on average slightly higher for the Absorbed dataset for A-BLUP, whilst the opposite was found for G-BLUP, GBC, and SS-GBLUP. In terms of bias, predictions based on the Absorbed dataset were generally less biased.nb_NO
dc.description.abstractGenomisk seleksjon (GS) har i økende grad blitt implementert innen husdyravlen, særlig innen avl av melkefe. Populasjoner som Holstein har hatt gunstig effekt av GS gjennom bruk av data fra store referansepopulasjoner, kombinert med liten effektiv populasjonsstørrelse (Ne). På den annen side har den gunstige effekten av GS vært langt mindre uttalt for mindre tallrike populasjoner, men som potensielt kan ha større Ne enn Holstein. Hovedmålet med dette forskningsarbeidet var derfor å undersøke ulike strategier for å øke sikkerhet ved genomisk prediksjon for antallsmessig små storfepopulasjoner. Det første arbeidet var en simuleringsstudie for å undersøke muligheter for å øke prediksjonsevne ved bruk av helgenom-data ved varierende QTL tettheter (45 eller 132 QTL/Morgan) og ulike arvegrader (0.07 eller 0.30) sammenliknet med bruk av SNP markører med varierende tetthet. Fokus var på divergerende melkeku-populasjoner med stor Ne (>100). Den prediktive evnen til enklere GS modeller uten variabelseleksjon (SNP-BLUP) ble sammenliknet med variabelseleksjons-modeller (MixP). Bruk av helgenom-data til innen-populasjon prediksjon ga liten til betydelig økning i sikkerhet for lav- til høyarvelige egenskaper sammenlignet med SNP tettheter. Avhengig av arvegrad, markør- og QTL tetthet, økte sikkerheten opp til 13%. Sammenliknet med de laveste markørtetthetene var økningen i sikkerhet ved bruk av helsekvens så mye som 24-31%. Fordelen ved helgenom-data var mest uttalt ved bruk av referanse-data over populasjoner basert på MixP modellen (7-92% økning i sikkerhet avhengig av markør- og QTL-tetthet, og grad av divergens mellom populasjonene). MixP modellen var bedre enn SNP-BLUP ved 45 QTL/Morgan, mens SNP-BLUP var like god som MixP dersom QTL tetthet økte til 132 QTL/Morgan. I det andre arbeidet ble en iterativ metode (kalt GBC) evaluert. Metoden kombinerer slektskaps-informasjon (via G-BLUP) og LD mellom QTL and SNP loci i nærheten (med BayesC tilnærming) i genomisk prediksjon uten anvendelse av Monte Carlo sampling metodikk. Prediktiv evne til GBC ble sammenliknet med andre modeller. To datasett ble brukt i analysen: 1) Imputert medium tetthet (50k, MD) SNP datasett basert på Illumina Bovine50k BeadChip, inneholdende 48,249 SNP loci og 3,244 fenotyper; og 2) Imputert høy-tetthets (777k; HD) SNP datasett basert på Illumina BovineHD chip, inneholdende 539,665 SNP loci og 3,164 fenotyper. Basert på MD SNP datasettet, ga GBC bedre sikkerhet enn G-BLUP for alle egenskaper, men noe lavere sikkerheter enn MixP. Basert på HD SNP datasettet, ga GBC også bedre sikkerheter enn G-BLUP, og litt lavere enn MixP unntatt for kg fett, der GBC ga bedre sikkerhet enn begge de to andre modellene. Resultatene viser at å inkorporere egenskaper ved modellene G-BLUP og BayesC i en enkelt modell (GBC) kan øke sikkerhet ved genomisk prediksjon over den mest brukte metoden: G-BLUP. På den annen side hadde MixP høyere sikkerhet enn G-BLUP for alle egenskaper som ble studert, og i de fleste tilfeller også noe høyere sikkerhet enn GBC. In en tredje studie ble det foreslått og evaluert en ny metode for å absorbere fenotypisk informasjon på store antall ikke-genotyperte dyr inn i likningene for genotyperte dyr, slik at all informasjon kan bli utnyttet i genomiske prediksjoner. Genetiske effekter av fedre ble predikert, der enten DYD (døtrenes gjennomsnittlige fenotypiske prestasjoner korrigert for ikke-genetiske effekter og effekt av mødre) eller pseudo-observasjoner fra absorpsjonen av ikke-genotyperte dyr ble brukt som responsvariable. Pseudo-observasjoner ble beregnet for genotyperte dyr og deres (ikke-genotyperte) avkom. Ikke-genotyperte stamfedre ble inkludert i analysen gjennom beregned genotype-sannsynligheter. To datasett ble brukt i analysen: DYD datasett, dvs. en kombinasjon av DYD og genotyper for 3,244 avkomsgranskede okser; og 2) Absorbert datasett, dvs. en kombinasjon av absorberte pseudo-observasjoner og genotype sannsynligheter for 20,918 dyr. Med DYD som responsvariabel og genotyper av 3,244 avkomsgranskede okser varierte sikkerheten basert på fremtidige observasjoner fra 0.427 til 0.664 over egenskaper og evalueringsmetoder. Med absorberte fenotyper som responsvariabel varierte sikkerheten fra 0.429 til 0.667 over egenskaper og evalueringsmetoder. Forskjellene mellom DYD og det absorberte datasettet var ikke signifikante, men sikkerheten var i gjennomsnitt noe høyere for det absorberte datasettet for klassiske avlsverdiberegninger uten bruk av genetiske markører, men noe lavere for G-BLUP, GBC og SS-GBLUP (single-step G-BLUP). Prediksjoner basert på det absorberte datasettet hadde generelt mindre bias enn prediksjoner basert på DYD.nb_NO
dc.language.isoengnb_NO
dc.publisherNorwegian University of Life Sciences, Ås
dc.relation.ispartofseriesPhD Thesis;2016:20
dc.titleImproving the accuracy of genomic predictions in numerically small populationsnb_NO
dc.title.alternativeSikkerhet ved genomisk prediksjon i små populasjonernb_NO
dc.typeDoctoral thesisnb_NO
dc.source.pagenumber1 b. (flere pag.)nb_NO
dc.relation.projectEU FP-7: 289592nb_NO


Tilhørende fil(er)

Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel