Evaluation of long-read Nanopore sequencing in genome studies
Master thesis
Permanent lenke
http://hdl.handle.net/11250/2452217Utgivelsesdato
2017Metadata
Vis full innførselSamlinger
- Master's theses (KBM) [888]
Sammendrag
The development of the latest generation of sequencing technologies, known as third-generation sequencing, has revolutionized sequence assembly due to long reads compared to the short reads of second-generation sequencing technologies. However, these long reads are highly error-prone (~8 – 40 % error rate). In this thesis, we performed an evaluation of using the Nanopore MinION platform, developed by Oxford Nanopore Technologies, for de novo assembly of the Bifidobacterium longum genome. In addition, we tested whether Amplified Fragment Length Polymorphism (AFLP) fragments, sequenced on the Illumina MiSeq platform, have the potential to correct highly error-prone Nanopore reads. The MinION sequencing run generated highly erroneous reads, resulting in long stretches of A’s and T’s in the output data, revealing the issue of G/C-bias related to Nanopore sequencing. However, an in silico experiment demonstrated the suitability of short AFLP fragments to correct long reads that had up to 40 % of erroneous bases. This demonstrates their high potential for error-correction. Utviklingen av den nyeste generasjonen innen sekvenseringsteknologi, kjent som tredje-generasjons sekvensering, har revolusjonert hvordan man rekonstruerer sekvenser sammenliknet med andre-generasjons sekvensering på grunn av evnen til å sekvensere lange sekvenser. En ulempe med å sekvensere lange sekvenser, er derimot høy sekvenseringsfeil (~8 – 40 %). I denne masteroppgaven ble det gjort en vurdering av bruksevnen til sekvenseringsplatformen Nanopore MinION, utviklet av Oxford Nanopore Technologies, til å generere data for å rekonstruere genomet til Bifidobacterium longum, uten å sammenlikne med referanser (de novo). I tillegg ble det testet om ‘Amplified Fragment Length Polymorphism’ (AFLP) fragmenter, sekvensert med Illumina MiSeq, kunne brukes til å rette opp sekvenseringsfeil i lange Nanopore sekvenser. Sekvenseringsforsøket med MinION gav sekvenser med veldig høy feilrate som ikke kunne brukes i videre analyse, og resulterte i generering av lange sekvenser bestående av basene A og T. Dette avslørte sekvenseringsproblemet tilknyttet høyt innhold av basene G og C under Nanopore sekvensering. Det ble derimot gjort et simulert forsøk som demonstrerte evnen AFLP fragmenter har til å rette opp sekvenseringsfeil i lange sekvenser, som bestod av opptil 40 % feilaktige baser. Dette demonsterer potensialet disse fragmentene har til å rette opp sekvenseringsfeil.