Finding small genes by conservation with a focus on bacteriocins
Master thesis
Permanent lenke
http://hdl.handle.net/11250/216649Utgivelsesdato
2014-08-04Metadata
Vis full innførselSamlinger
- Master's theses (KBM) [932]
Sammendrag
Genprediksjonsprogrammer er ofte brukt til å predikere gener i genomer gjennom automatiserte annoteringsrutiner. Evnen til populære genfinningsverktøy som Glimmer og GeneMark til å predikere lange gener er rimelig god, men de klarer ofte ikke å predikere mindre gener med lengder på mindre enn 150 nukleotider. Dette er på grunn av den statistiske usikkerheten som eksisterer når det skal predikeres små gener. Små åpne leserammer (ORFer) er forventet å inntreffe mye oftere ved tilfeldighet i en helgenomsekvens sammenlignet med lengre gener på 1kb eller mer.
Målet med dette prosjektet var å finne ut om små gener i bakterier kunne bli funnet ved å bruke konservering, med fokus på bakteriocin-produserende gener. En algoritme ble utviklet for å kvantifisere konserveringen av hver posisjon i en DNA-sekvens. Sammenstillinger produsert av BLAST ble analysert av den selvlagde programvaren orfstat, som kvantifiserte konservasjonen av hver posisjon i alle analyserte sekvenser.
149 intergeniske, dvs. uannoterte, kromosom- og plasmidsekvenser fra bakterieslektene Staphylococcus og Enterococcus ble analysert ved bruk av BLAST og orfstat, og 179 ORFer ble valgt ut som bakteriosin-genkandidater. Av de 179 kandidatene ble 8 manuelt utvalgt til å bli testet for antibakteriell aktivitet på 53 forskjellige bakterier i laboratoriet.
Ved testing av fire annoterte kromosomer ble de RNA-kodende annoterte områdene gitt mye høyere gjennomsnittlig konservering enn de uannoterte- og de protein-kodende annoterte områdene av orfstat programvaren. Den gjennomsnittlige konserveringsverdien for de protein-kodende annoterte områdene var omtrent lik som for de uannoterte intergeniske områdene. Laboratorietestene for de åtte utvalgte bakteriosin-kandidatene viste ingen signifikant vekstinhibering for noen av de testede bakteriene.