Opdracht 3: Chi-kwadraat goodness of fit toets


De organische verbinding phenylthiocarbamide (PTC) heeft voor de meeste mensen een bittere smaak. Sommige mensen proeven de bittere smaak van PTC niet. Deze eigenschap, het niet proeven van PTC, wordt bepaald door een recessief homozygoot allel op één locus (genotype aa). In Nederland is onderzoek gedaan naar het voorkomen van dit allel bij honderd mensen, de onderzoeksvraag hierbij was of de genotype frequenties in Hardy Weinberg evenwicht zijn. Genotype frequenties zijn in Hardy Weinberg evenwicht als de drie genotypen (AA, Aa en aa) respectievelijk de frequentie p², 2pq en q² hebben.  

Om een antwoord te vinden  op deze onderzoeksvraag moet je stap voor stap de onderstaande opdrachten uitvoeren. (In de Kennisbasis kun je nadere uitleg krijgen over de betrokken statistische begrippen. )

De gegevens die deze onderzoeker heeft verzameld staan in het bestand 'PTC.xls’ op de I-schijf. De verschillende kolommen bevatten de volgende waarnemingen:

proefpersoon het nummer van de proefpersoon
genotype genotype van de proefpersoon
(AA homozygoot dominant, Aa heterozygoot en aa homozygoot recessief)
code code van het genotype 
(AA =1, Aa =2  en aa =3)

 

a) De eerste stap is het goed sorteren van de dataset. Welke proefpersoon staat nu bovenaan (nummer)?

b) Bepaal de frequentie van de genotypen met de optie subtotalen onder data (x aantal AA, y aantal Aa en z aantal aa). 
c) Met de genotypefrequentie kan de allelfrequentie uitgerekend worden. De (relatieve) frequentie van het A allel (p) is (het aantal van AA + ½ aantal Aa)/ totaal aantal. De andere allelfrequentie is eenvoudig 1-p.
Wat is de frequentie van allel a?


d) De allelfrequenties worden gebruikt om de verwachte verdeling uit te rekenen:
genotype AA Aa aa
verwachte verdeling 2pq=2p(1-p) q²=(1-p)²
verwacht aantal p² x totaal aantal 2pq x totaal aantal q² x totaal aantal

Reken de verwachte waarden uit voor alledrie de genotypen (met de allelfrequenties van c)). Wat is het verwachte aantal mensen met genotype AA (afgerond op een geheel aantal)?

e) Om de Chi-kwadraattoets uit te voeren moet je in Excel in een lege cel gaan staan en vervolgens:
- het icoontje f
x aanklikken
- Statistical (statistisch) selecteren
- CHITEST (CHI.TOETS) selecteren
- op ok klikken
- bij Actual_range (waarnemingen) de cellen met de waargenomen tabel selecteren (bijv.a2..b5)
- bij Expected_range (verwacht) de cellen met de verwachte waarden selecteren
- op ok klikken
In de cel staat nu de overschrijdingskans p, die hoort bij de uitgerekende Chi-kwadraat. Hoe groot is de overschrijdingskans (vier cijfers achter de komma, gebruik een punt als decimaalteken)?

f) Wat is de nulhypothese bij dit onderzoek?

De genotype frequenties zijn in Hardy Weinberg evenwicht.
De genotype frequenties zijn niet in Hardy Weinberg evenwicht.

g) Hoeveel vrijheidsgraden worden gebruikt en waarom dit aantal?

3: 3x1
2: 3-1
0: (3-1)x(1-1) :

h) Toets je éénzijdig of tweezijdig?

éénzijdig
tweezijdig

i) Mag de nulhypothese verworpen worden, en waarom wel/niet?

ja, p<0.05
nee, p<0.05
ja, p<0.025
nee, p<0.025

j) Nu kan (eindelijk) het antwoord op de onderzoeksvraag gegeven worden. Zijn de genotype frequenties in Hardy Weinberg evenwicht?

ja
nee


Vul je e-mail adres in:
Als je met zijn tweeën werkt, ook die van je maat: