Show simple item record

dc.contributor.authorBrodal, Hans Petter
dc.date.accessioned2011-09-05T12:16:51Z
dc.date.available2011-09-05T12:16:51Z
dc.date.issued2011-09-05T12:16:51Z
dc.identifier.urihttp://hdl.handle.net/11250/186333
dc.descriptionKomparativt helgenom studie av utvalgte Enterococcus-arter; E. faecalis og E. faecium.en_US
dc.description.abstractSekvenseringsteknologien er i dag på et stadium som gjør at utfordringene ikke lenger ligger i selve sekvenseringen av genomer, men i det å utnytte og behandle all informasjon fra genomene. Fokuset og tilnærmingen til denne oppgaven er metoder der hele genomer, i stedet for bare utvalgte deler, ble brukt for å sammenligne stammer og arter av bakterier. Oppgaven har altså vært et helgenom-studie der stammer fra utvalgte Enterococcus-arter er blitt studert. Helgenom-studiet har i hovedsak vært fokusert på Enterococcus faecalis og Enterococcus faecium. I tillegg ble det tatt med noen få stammer fra to andre arter, Enterococcus casseliflavus og Enterococcus gallinarum. Stammene innad i artene, og artene i forhold til hverandre, ble sammenlignet i forhold til genetisk likhet/ulikhet, og det ble generert pangenom-trær, estimert pangenom- og kjernegenom-størrelse og estimert en parameter kalt genomic fluidity. Såvidt jeg vet, er det ikke tidligere blitt gjort noen lignende studie der disse artene sammenlignes på denne måten. Såkalte pangenom-trær er diagrammer som baserer seg på relative avstander, eventuelt grad av ulikhet, mellom genomer. Vi observerte at alle trærne ga tydelig inndeling etter art, og at de ulike trærne viste ulik grad av likhet mellom stammene. Stort sett virket det som om stammene innenfor E. faecalis ligner mer på hverandre enn stammene innenfor E. faecium. Pangenomet til en art består av alle de forskjellige genfamiliene innenfor arten, og er interessant fordi det kan si noe om den genetiske diversiteten som arten innehar, og dermed artens evne til å tilpasse seg ulike miljøer. Kjernegenomet er alle genfamiliene som finnes i alle stammer innenfor en art, og disse genfamiliene sier også noe om diversiteten ved å gi et mål på hva som er likt for alle stammene innenfor en art. Binomiske mixture modeller ble brukt for å estimere pangenom og kjernegenom for E. faecalis og E. faecium. E. faecium fikk estimert pangenomet til å være større enn for E. faecalis. Parametereren genomic fluidity, som er ment som et annet mål på diversiteten innenfor en art, ble også estimert til å være høyere for E. faecium enn for E. faecalis. Det ble funnet en del genfamilier blant kjernegenene som kun fantes innenfor arten. For å finne ut mer om disse unike kjernegenene, ble de klassifisert etter hvilke funksjonelle COG-grupper (Cluster of Orthologous Groups) de tilhørte. Deretter ble det utført Fisher's exact test for å undersøke om noen av gruppene var over- eller underrepresentert blant de unike kjernegenene. Her så vi at noen av de funksjonelle gruppene var overrepresentert blant de unike kjernegenene, og disse kan kanskje forklare noen artskjennetegn. Sequencing-technology is now at a stage where the challenges no longer lies in the sequencing of genomes, but rather in utilizing and processing all of the data. The main focus this thesis is the study of whole genomes; a so called whole-genome study. The methods that are used focuses on entire genomes, rather than just selected parts, to compare strains and species of bacteria. Two different Enterococci species, Enterococcus faecalis and Enterococcus faecium have been the main area of interest. In addition, a few genomes from two other species, Enterococcus casseliflavus and Enterococcus gallinarum were also included. The strains within the species, and also the species in relation to each other, were compared in terms of genetic similarity and difference. Pangenome trees were generated, pangenome and core-genome sizes were estimated, and a statistic called genomic fluidity was also estimated. Pangenome trees are diagrams that are based on the relative difference between genomes. The distances between genomes reflects the amount of gene families they have in common, and not in common. The pangenome trees that were generated showed a clear separation due to different species. It also seemed that the largest distances between genomes were found within E. faecium, and that this species contains more diversity between strains than E. faecalis. The pangenome of a species consists of all the different gene families found within that species. This can give an idea of the genetic diversity that the species possesses, and thus the species' ability to adapt to different environments. The core genome consists of all gene families found in all strains within a species, and the size of the core genome can provides a measure of expected similarity within a species. Binomial mixture models were used to estimate the pangenome and core-genome sizes of E. faecalis and E. faecium. We found the pangenome size to be larger for E. faecium than E. faecalis, but the core genome sizes were quite similar. Genomic fluidity, a proposed alternative measure of diversity within a species was also estimated, and the statistic showed lower amount of shared genes within E. faecium than E. faecalis. Some of the gene families among the core genes only existed within the species. To find out more about these unique core genes, they were classified according to which functional COG (Cluster of Orthologous Groups) group they belong. Fisher's exact test was utilized to examine whether any of the groups were significantly over- or under-represented among the unique core genes, compared to all of the core genes. We found that some of the functional groups were overrepresented among the unique core genes of E. faecalis, and these genes can maybe explain some characteristics of the species.en_US
dc.language.isonoben_US
dc.subjectkomparativ genomikken_US
dc.subjectpangenom studieen_US
dc.titlePangenom-studier av genus Enterococcusen_US
dc.title.alternativePangenome studies of genus Enterococcusen_US
dc.typeMaster thesisen_US
dc.subject.nsiVDP::Mathematics and natural science: 400::Basic biosciences: 470::Bioinformatics: 475en_US
dc.source.pagenumber67en_US


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record