Bart Hoorens

Meervoudig hypothesen toetsen

Toegepast op microarrays

Bart Hoorens, juli 2009

We kennen het allemaal, het toetsen van één hypothese. Een nulhypothese H0 moet worden getoetst tegen een alternatieve hypothese H1 . Hiervoor wordt een informatieve toetsingsgrootheid gebruikt. Geef H0 het voordeel van de twijfel en onderzoek met behulp van de verdeling van de toetsingsgrootheid onder de nulhypothese de waarschijnlijkheid van de data. Dit geeft een p-waarde, op basis waarvan we beslissen of we H0 ten gunste van H1 verwerpen of niet. De beslisregel is dan om te verwerpen als de p-waarde kleiner dan of gelijk aan het signifcantieniveau α is. Bij het tegelijkertijd toetsen van een hele rij hypothesen, is het niet verstandig deze beslisregel te gebruiken. Door alle hypothesen te verwerpen waarvoor de p-waarde kleiner dan of gelijk aan α is, kan de kans op het maken van een type I fout groter dan α worden.

We zien dat we niet zomaar n hypothesen tegelijk kunnen toetsen. In deze voordracht laten we zien hoe we dit probleem wel kunnen aanpakken. Hoe moet bijvoorbeeld de type I en de type II fout worden gegeneraliseerd tot het meervoudige geval? De Family Wise Error Rate en False Discovery Rate zijn twee veel gebruikte manieren voor de gegeneraliseerde type I fout. We zullen de beslisregels van Hochberg en Benjamini & Hochberg bespreken waarmee we een meervoudige toets kunnen uitvoeren.

In microarray toepassingen wordt veel gebruik gemaakt van meervoudig hypothesen toetsen. Dit zijn over het algemeen toepassingen waar men uit duizenden genen wil beslissen welke genen zich anders gedragen op het moment dat ze in een veranderde situatie zitten. Je kunt hierbij denken aan genen die zich anders gedragen in een bepaald tumorweefsel, ten opzichte van dezelfde genen in gezond weefsel. Deze genen kunnen een rol spelen in het ontstaan en ontwikkelen van een bepaald type kanker. Vanuit dit toepassingsgebied ontstaan steeds nieuwe vragen met betrekking tot meervoudig hypothesen toetsen.