Fylogenetisk analyse av helgenom NGS-data av Bacillus cereus-gruppen
Master thesis
Permanent lenke
http://hdl.handle.net/11250/294032Utgivelsesdato
2015-07-31Metadata
Vis full innførselSamlinger
- Master's theses (KBM) [927]
Sammendrag
Sammenlikning av bakteriers genom er en effektiv måte å kartlegge hva som skiller arter og stammer fra hverandre. For å sammenlikne hele genomer fra bakterier er det vanlig å sekvensere. Utfordringen er dagens sekvenseringsteknologi, som ikke klarer å lese av hele lengden til genom-sekvensen, men kutter DNA-molekylene i kortere fragmenter før avlesning. Resultatet etter sekvensering er et stort antall korte fragmenter som etter sekvensering må pusles sammen til et fullstendig genom. Til dette finnes det flere programmer det er mulig å benytte seg av.
I denne oppgaven ble det undersøkt om ulike bioinformatiske verktøy har ulik effekt på det endelige fylogenetiske resultatet, i hovedsak i form av fylogenetiske trær. Det ble plukket ut tre programmer som forbehandler rådata-filene etter sekvensering (preprosessering): Quake, Timmomatic og Nesoni. Videre ble det plukket ut tre programmer som setter sammen de korte fragmentene til lengre sekvenser (assemblering): SPAdes, Velvet og Celera. Det ble gjennomført et faktorialt forsøk der alle tre nivåer av faktoren preprosessering er kombinert med alle nivåer av faktoren assemblering. Hvor vellykket resultatet hver kombinasjon ga, ble evaluert med sammenstilling mot referansegenom og N50.
For videre fylogenetiske analyser ble det brukt ”Multilocus Sequence Typing” (MLST) for bestemmelse av allelvariasjoner i utvalgte gener, og hvert bakterieisolat fikk en sekvenstype. Basert på variasjon mellom isolatene ble fylogeni kartlagt med ”neigbor joining” trær, og eBURST.