Tagarchief: chi-kwadraat-toets

Waarom toetsen we eigenlijk?

Er zijn veel moeilijke boeken geschreven over toetsende statistiek. De Chi2-toets, Students t-toets, Paerson’s correlatie etc etc.. Al deze toetsen hebben gemeen dat het erom gaat dat je groepen antwoorden gaat vergelijken. De eenvoudigste is de Chi2.

De onderzoeker met een probleemstelling moet het probleem eerst opdelen in deelvragen. Vervolgens moet hij een antwoord zien te vinden op de deelvragen. In kwantitatief onderzoek gaan de deelvragen vaak over een vergelijking tussen producten,klanten, medewerkers, bedrijven etc.

Bijvoorbeeld : Komen er meer jongeren op zaterdagavonden in Horeca A dan in Horeca B? De vraag is duidelijk. Stap twee is om de kenmerken te bepalen die gemeten moeten worden. In dit geval de locatie/ vestiging en het aantal jongeren dat op zaterdagavond de gelegenheid bezoekt. Stap drie is het bepalen van de strategie om een en ander te meten.

Bijvoorbeeld: Een telling. Je bezoekt beide gelegenheden op zaterdagavond en je telt het aantal jongeren.

Het probleem is dat je voor een eerlijk onderzoek dan elke week (dus 52x per jaar) beide bedrijven moet bezoeken en moet gaan tellen. Maar daarvoor heb je geen tijd/ geld. Je gaat dus een aantal weken tellen en laat het daarbij. Vervol¬gens kun je een gemiddelde uitrekenen van het aantal jongeren in Horeca A en in Horeca B. Daar komt bijvoorbeeld uit dat er in Horeca A gemiddeld 40-, en in Horeca B 33 jongeren komen.

De reden om nu de Chi2 (Chi-kwadraat) toets uit te voeren is de volgende: Je hebt niet iedere week geteld. Het is dus best mogelijk dat als je het hele jaar had geteld, dat het verschil tussen de twee Horeca gelegenheden kleiner zou zijn (of juist veel groter). Dat kun je niet zeker weten! Heeft je onderzoek dan geen zin? Jawel, want je past de Chi2 toets toe. Met deze toets bereken je de kans ‘dat het verschil in gemiddelde toevallig is’. Je kunt dan in je rapport nog steeds schrijven dat er verschil is tussen de twee Horeca gelegenheden, ook al heb je niet alle 52 weken onderzocht. Dus dat er 95% kans is dat het verschil in gemiddelde niet toevallig komt doordat je maar een deel van de meting hebt kunnen doen.

Je kunt zelf bepalen of je vindt dat 95% betrouwbaarheid genoeg is. Voor prak¬tijkgericht onderzoek is 95% een heel mooi resultaat waarmee we aannemen dat je conclusie voldoende is onder¬bouwd. *) Er zijn diverse toetsen. Het hangt af welk soort kenmerken je onderzoekt. Voor begrippen als ‘zeer tevreden’, ‘tevreden’ etc. hebben we bijvoorbeeld andere toetsen dan voor getallen. Maar voor alle toetsen geldt dat je op zoek gaat naar de kans dat het verschil dat je ziet tussen twee (of meer) ken¬merken TOEVALLIG komt doordat je niet alles of iedereen hebt kunnen onder¬zoeken. Eigenlijk best eenvoudig.

Meer over dit onderwerp:
Statistiek als hulpmiddel, Manfred te Grotenhuis/ Theo van der Weegen, ISBN 978 90 232 4444 8

opm. *) In dit voorbeeld houden we geen rekening met een eventuele Tijdfout. (Dit gebeurt wanneer je maar een paar momenten meet terwijl er grote verschillen zijn per maand, dag van de week, tijdstip).
Even snel meer lezen over de Chi-kwadraattoets:
http://nl.wikipedia.org/wiki/Chi-kwadraattoets