Opdracht 1: Chi-kwadraat toets


Een onderzoeker heeft op drie locaties in de buurt van Nijmegen padden gevangen. Hij wil weten of de kans dat we ze terugvangen (#vangsten) gelijk is voor mannetjes en vrouwtjes. De onderzoeksvraag luidt dan ook: Is de verdeling van het aantal keren terugvangen gelijk voor mannen en vrouwen?

Om een antwoord te vinden  op deze onderzoeksvraag moet de Chi-kwadraat toets worden gebruikt. Om deze uit te voeren moet je stap voor stap de onderstaande opdrachten uitvoeren. (In de Kennisbasis kun je nadere uitleg krijgen over de betrokken statistische begrippen. )

De gegevens die deze onderzoeker heeft verzameld staan in het bestand 'bufovalk.xls’ op de I-schijf. De verschillende kolommen bevatten de volgende waarnemingen:

beestnr het nummer van de pad
geslacht 1=man, 2=vrouw en 3=juveniel
jaar jaar van vangst
maand maand van vangst
dag dag van vangst
plaats 1=hamert, 2=nijmegen, 3=de valk
lengte lengte van de pad in mm
#vangsten aantal keer dat de pad in totaal werd gevangen

Om een beetje een idee te krijgen van de waarnemingen die we hebben, maken we eerst een tabel waarin we het geslacht uitzetten tegen het aantal keren vangen.

a) We sorteren de dataset nu per geslacht en daarbinnen op het aantal keren vangen: Selecteer de hele dataset (dus alle variabelen!) en kies onder het kopje Data (data) de optie Sort... (sorteren). Vul bij Sort by (sorteren per) de variabele ‘geslacht’ in en bij Then by (vervolgens per) de variabele '#vangsten'. Laat de dataset sorteren. 
Welke pad staat nu bovenaan (beestnummer)?

b) We hebben dit sorteren gedaan om te kunnen bepalen hoeveel keer het in de dataset voorkomt dat bijvoorbeeld een mannetje 2x wordt teruggevangen. Om niet zelf alle voorkomende combinaties van de variabelen '#vangsten' en 'geslacht' te hoeven tellen, gebruiken we de optie Subtotals... (subtotalen) onder Data. Vul de kolom '#vangsten' in onder At each change in: (Bij iedere wijziging in veld:). De functie die we willen gebruiken is Count (aantal). De subtotalen voegen we toe aan #vangsten. Selecteer alleen Summary below data (overzicht onder de gegevens plaatsen). Laat deze opdracht uitvoeren.
In het werkblad verschijnt nu het totaal aantal waarnemingen van de variabele '#vangsten', en bij elke verandering van getal het aantal enen, tweeën etc. Een overzicht hiervan wordt zichtbaar als je op de '2' klikt die links in de kantlijn is verschenen.
Hoeveel mannetjes zijn 2x gevangen?

c) Maak van de aantallen die je bij b) hebt gevonden een klein tabelletje in een nieuw werkblad van Excel waarbij je het aantal vangsten in kolommen weergeeft en het geslacht in rijen. Maak ook labels bij de kolommen en rijen.
d) Nu kunnen we beginnen met de onderzoeksvraag te beantwoorden. Hiervoor moeten we een Chi-kwadraattoets uitvoeren. Bij deze toets wordt gekeken naar het verschil tussen de verwachte en waargenomen frequentieverdeling. De waargenomen verdeling staat in de tabel die je bij c) hebt gemaakt. Om de verwachte verdeling uit te rekenen gebruiken we de randtotalen. Als de beide variabelen onafhankelijk van elkaar zijn moet de verdeling over de categorieëen evenredig zijn met de randtotalen, zie voorbeeld hieronder.
      Haarkleur    
Oogkleur     blond zwart randtotaal

bruin waargenomen
waarde
  35 25 60 (oog1)
verwachte
waarde
  oog1 x haar1/totaal= 60 x 70/100=42 60x30/100=18  

blauw waargenomen
waarde
  35 5 40 (oog2)
verwachte
waarde
  40x70/100=28 40x  

randtotaal     70
(haar1)
30
(haar2)
100 (totaal)

Vul de randtotalen in bij de tabel die je bij opdracht c) hebt gemaakt. Maak nu onder de tabel met de gevonden waarden een tabel met de verwachte waarden (maak gebruik van formules en kopieer die!).
Wat is het verwachte aantal mannetjes (afgerond op een geheel aantal) dat 1x is teruggevangen?

e) Om de Chi-kwadraattoets uit te voeren moet je in Excel in een lege cel gaan staan en vervolgens:
- het icoontje f
x aanklikken
- Statistical (statistisch) selecteren
- CHITEST (CHI.TOETS) selecteren
- op ok klikken
- bij Actual_range (waarnemingen) de cellen met de waargenomen tabel selecteren (bijv.a2..b5)
- bij Expected_range (verwacht) de cellen met de verwachte waarden selecteren
- op ok klikken
In de cel staat nu de overschrijdingskans p, die hoort bij de uitgerekende Chi-kwadraat. Hoe groot is de overschrijdingskans (twee cijfers achter de komma, gebruik een punt als decimaalteken)?

f) Wat is de nulhypothese bij dit onderzoek?

Mannetjes en vrouwtjes worden naar verhouding even vaak gevangen.
Mannetjes en vrouwtjes worden niet naar verhouding even vaak gevangen.
Mannetjes worden naar verhouding vaker gevangen dan vrouwtjes.
Mannetjes worden naar verhouding minder vaak gevangen dan vrouwtjes.

g) Hoeveel vrijheidsgraden worden gebruikt en waarom dit aantal?

8: 4x2
3: (4-1) x (2-1)
3: 4-1
1: 2-1:

h) Toets je éénzijdig of tweezijdig?

éénzijdig
tweezijdig

i) Mag de nulhypothese verworpen worden, en waarom wel/niet?

ja, p>0.05
nee, p>0.05
ja, p>0.025
nee, p>0.025

j) Nu kan (eindelijk) het antwoord op de onderzoeksvraag gegeven worden. Is de verdeling van het aantal keren terugvangen gelijk voor mannen en vrouwen?

ja
nee


Vul je e-mail adres in:
Als je met zijn tweeën werkt, ook die van je maat: