Vis enkel innførsel

dc.contributor.advisorSæbø, Solve
dc.contributor.advisorSnipen, Lars
dc.contributor.authorDørum, Guro
dc.date.accessioned2017-03-15T12:11:45Z
dc.date.available2017-03-15T12:11:45Z
dc.date.issued2011
dc.identifier.isbn978-82-575-1009-1
dc.identifier.issn1503-1667
dc.identifier.urihttp://hdl.handle.net/11250/2434195
dc.description.abstractMicroarray gene expression data are usually associated with a large number of correlated variables measured on few samples. This type of data typically contain high levels of noise, and the biological signals may be difficult to extract. The classical approach for analysing gene expression data is to test individual genes for differential expression. This basically implies performing tests on possibly thousands of dependent variables while incorrectly assuming statistical independence. The probability of doing false positive discoveries is accordingly high, the results of the analysis may be difficult to reproduce, and the outcome may be a list of biologically unrelated genes that leaves very much to the imagination. An increasing number of publications have therefore started to focus on incorporating prior biological information about gene dependencies in the analysis of gene expression data. Vast amounts of knowledge about relationships between genes based on previous studies are available. The motivation behind analysing the data in light of this information, include increased sensitivity and robustness of the analysis, better reproducibility of the results and easier interpretation. The prior information can for example be groups of genes with a similar function, or gene networks that describe some relationship between genes. With this information in hand, the focus can be turned from identifying important individual genes, to identifying larger groups of important genes that are also related. The aim of this thesis has been to improve and adapt existing methods to accommodate gene expression data from various types of experimental designs, in addition to developing novel procedures that incorporate prior information. A central part of this work has been concerned with significance testing in data sets with few and dependent samples. Most existing methods in this field use permutation tests to assess significance when the distribution of the test statistics is unknown. This is however problematic in data sets with very small sample sizes and complex experimental designs. In paper I we adopt a popular method for analysing gene sets, and replace the permutation test with a rotation test to accommodate it to small sample sizes. Paper III and IV introduce improvements to the method in paper I by adapting it to data from complex experimental designs and time series data. In paper II we propose a novel method that uses gene networks to improve test statistics for individual genes.nb_NO
dc.description.abstractGenekspresjonsdata fra mikromatriser assosieres ofte med et stort antall korrelerte variabler målt på få observasjoner. Denne typen data inneholder vanligvis mye irrelevant variasjon, og de biologiske signalene kan være vanskelig å skille fra bakgrunnsstøyet. Den vanligste måten å analysere geneekspresjonsdata på, har vært å teste hvert enkelt gen for differensiell ekspresjon. Dette innebærer å utføre tester på potensielt tusenvis av avhengige variabler, samtidig som man antar statistisk uavhengighet. Sannsynligheten for å finne falske positive er tilsvarende høy, resultatene kan være vanskelig å reprodusere, og utfallet av analysen kan være en liste med gener uten biologisk relasjon som overlater veldig mye til fantasien. Et økende antall publikasjoner har derfor begynt å fokusere på inkludering av a priori informasjon om genavhengigheter i analyse av genekspresjonsdata. Fra tidligere studier finnes store mengder biologisk kunnskap om relasjoner mellom gener. Ved å analysere dataene i lys av denne informasjonen, ønsker man å oppnå en mer sensitiv og robust analyse med resultater som er enklere å reprodusere og tolke. Forhåndsinformasjonen kan for eksempel bestå av grupper av gener med lignende funksjon eller gennettverk som beskriver relasjoner mellom gener. Med denne informasjonen for hånden, kan fokuset flyttes fra viktige enkeltgener, til grupper av viktige gener som også har noe felles. Målet med denne avhandlingen har vært å forbedre og tilpasse eksisterende metoder til genekspresjonsdata med forkjellige typer forsøksdesign, samt utvikling av nye metoder som benytter seg av a priori informasjon. En sentral del av dette arbeidet har vært knyttet til testing av signifikans i datasett med få og avhengige observasjoner. De fleste eksisterende metoder innenfor dette feltet bruker permutasjonstester for å evaluere signifikans når testobservatoren har en ukjent fordeling. Dette er imidlertid problematisk for datasett med veldig få observasjoner som ikke kan antas uavhengige grunnet forsøksdesignet. I artikkel I tar vi for oss en populær metode for å analysere gengrupper og bytter ut permutasjonstesten med en rotasjonstest for å tilpasse metoden til små utvalgsstørrelser. I artikkel III og IV introduseres forbedringer av metoden i artikkel I ved å tilpasse den til data med komplekse forsøksdesign og tidsseriedata. I artikkel II foreslår vi en ny metode som bruker gennettverk til å forbedre testobservatoren til enkeltgener.nb_NO
dc.language.isoengnb_NO
dc.publisherNorwegian University of Life Sciences, Åsnb_NO
dc.relation.ispartofseriesPhD Thesis;2011:46
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internasjonal*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/deed.no*
dc.titleKnowledge-based methods handling complex dependency structures : applications to gene expression datanb_NO
dc.title.alternativeKunnskapsbaserte metoder som håndterer komplekse avhengighetsstrukturer : anvendelser på genekspresjonsdatanb_NO
dc.typeDoctoral thesisnb_NO
dc.subject.nsiVDP::Mathematics and natural science: 400nb_NO
dc.source.pagenumber1 b. (flere pag.)nb_NO


Tilhørende fil(er)

Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel

Attribution-NonCommercial-NoDerivatives 4.0 Internasjonal
Med mindre annet er angitt, så er denne innførselen lisensiert som Attribution-NonCommercial-NoDerivatives 4.0 Internasjonal