De Chi kwadraat toets

Deze toets kan gebruikt worden wanneer er twee nominale variabele zijn, beide met twee of meer categorieën. De nulhypothese die wordt getoetst is of de verdeling over de categorieën van de ene variabele binnen een gegeven categorie van de andere variabele onafhankelijk is van die gegeven categorie. Dit komt precies overeen met het begrip uit de statistiek dat de twee variabele stochastisch onafhankelijk zijn.

Voorbeeld:
Oogkleur en haarkleur. Stel dat van honderd mensen de oog- en haarkleur is gevraagd, zie onderstaande tabel. Als ooglkleur en haarkleur onafhankelijk van elkaar zijn, dan verwacht je dat er (70*60)/100 mensen blond haar en bruine ogen hebben, en (40*70)/100 mensen zouden dan blond haar en blauwe ogen moeten hebben.

  blond zwart totaal
bruin 35 25 60
blauw 35 5 40
totaal 70 30 100

Met de Chi-kwadraat toets reken je uit of de gevonden frequenties (Ei) afwijken van de verwachte frequenties (Oi).


De waarde (p-waarde) die de Excelfunctie CHITEST oplevert is de overschrijdingskans, d.w.z. de kans om een waarde te vinden die minstens zo groot is als de bij deze dataset berekende X2, dus NIET X2 zelf.
Als men de gebruikelijke H0 verwerpt als de gevonden p-waarde kleiner is dan 0.05, dan is de onbetrouwbaarheidsdrempel van de toetsingsprocedure 0.05.