KWANTITATIEF ONDERZOEK, STEEKPROEFOMVANG, STEEKPROEFFORMULE

KORTE EN DUIDELIJKE TIPS VOOR ONDERZOEKSOPDRACHTEN EN -TENTAMENSTOF (HBO/MBO+).

KWANTITATIEF ONDERZOEK EN HET BEREKENEN VAN DE STEEKPROEFOMVANG

In dit artikel wordt stap voor stap uitgelegd hoe de steekproefformule werkt:
Een aantal basisbegrippen. Betrouwbaarheid en toevallige fout. De toevallige fout. De kans op de toevallige fout.  De z-waarden tabel. Minimale steekproefomvang (steekproefformule 1). Gecorrigeerde steekproefomvang (steekproefformule 2). Rekenvoorbeeld (oefening).

Bij (kwantitatief) onderzoek (bijvoorbeeld met behulp van enquêtes) moet rekening gehouden worden met:

Een aantal basisbegrippen :

Gebruik een app voor het berekenen van de steekproefomvang...

Gebruik een app voor het berekenen van de steekproefomvang…

‘betrouwbaarheid’, ‘validiteit’, ‘representativiteit’ en ‘nauwkeurigheid’. In de steekproefformule komen betrouwbaarheid en nauwkeurigheid terug. Met de formule berekent de onderzoeker de betrouwbaarheid en de nauwkeurigheid van het onderzoek. Dat doet de onderzoeker ook al vooraf om te bepalen hoeveel enquêtes er nodig zijn.

Betrouwbaarheid:  Ook wel aangeduid met ‘herhaalbaarheid’. Het geeft aan dat de onderzoeker het onderzoek op zo’n manier heeft gedaan dat een herhaling van het onderzoek (bijvoorbeeld door een andere onderzoeker) dezelfde uitkomsten zou opleveren. (Dus als uit het onderzoek komt dat 75% van de klanten ontevreden is, dan zal hetzelfde onderzoek een maand later ook op ongeveer 75% uitkomen). Een onderzoeker zorgt voor een betrouwbaar onderzoek door er op te letten dat de vragen duidelijk zijn en niet verkeerd kunnen worden uitgelegd door de respondenten. Vragen mogen ook niet ‘sturend’ zijn, zodat de respondenten worden beïnvloed. Maar er zijn nog meer aandachtspunten:

Validiteit: Heeft ermee te maken dat je de vragen wel moet stellen aan de juiste mensen. Als je onderzoek doet naar de tevredenheid over babyshampoo en je vraagt het aan 20 mannen zonder kinderen dan heeft je onderzoek geen waarde. Omdat het niet VALIDE is. Dat geldt ook als je de verkeerde vragen stelt. Als je in een onderzoek over babyshampoo aan 100 jonge moeders vraagt wat ze vinden van de kleur van babykamers dan levert dat geen nuttige informatie op voor het babyshampoo-onderzoek. Dat noemen we dan ook NIET VALIDE.

Representativiteit: Ook moet je erop letten dat je de vragen stelt aan de juiste mix van respondenten. Stel bijvoorbeeld dat je onderzoek doet naar de tevredenheid van het publiek bij het optreden van Marco Borsato. En je vraagt 100 vrouwelijke bezoekers van boven de 40 jaar naar hun mening dan mis je de meningen van mannen, vrouwen jonger dan 40 en kinderen. Je onderzoek gaat dan dus niet over ‘de bezoekers van Marco Borsato’ maar alleen over de ‘vrouwelijke bezoekers van boven de 40 jaar’. We zeggen het onderzoek is NIET REPRESENTATIEF voor ALLE bezoekers. Representatief betekent ‘ juiste afspiegeling/ vertegenwoordiging van alle elementen uit je populatie’.

Betrouwbaarheid en de toevallige fout.

Om de steekproefformule te begrijpen moet je goed snappen:
– Betrouwbaarheid heeft te maken met het aantal deelnemers aan een enquete.
– Betrouwbaarheid gaat over de betrouwbaarheid van de conclusie (dus de ‘gemiddelde mening van alle deelnemers’).

a. Hoe meer deelnemers er zijn hoe beter / hoe betrouwbaarder je conclusie.
Dat is niet vreemd. Voorbeeld: Wanneer je een enquête houdt en het gaat bijvoorbeeld over de smaak van bier. Dan kan de conclusie zijn dat 100% van de Nederlanders bier lekker vindt.
Tenzij…. Je conclusie is gebaseerd op een enquete onder 3 respondenten. De kans is namelijk heel groot dat bij een herhaling van de enquete onder andere respondenten de conclusie heel anders zal zijn. (Let op: De definitie van ‘betrouwbaarheid’ is ‘herhaalbaarheid’ dus als de kans groot is dat de conclusie niet herhaald zal worden: is het onderzoek onbetrouwbaar).

b. Wat er ook nog meespeelt is de kans dat een kleine groep respondenten je conclusie onbetrouwbaar maakt. Als je maar 3 mensen enquêteert en deze drie mensen zijn TOEVALLIG allemaal tegen alcohol … Dan is de conclusie ‘… 100% van de Nederlanders vindt bier slecht’. Deze conclusie is dus onjuist en je hebt de kans op een onjuiste conclusie groter gemaakt door maar een kleine groep mensen te enqueteren. (Hoe kleiner de groep, des te groter is de invloed van een kleine groep respondenten). Wanneer je 1000 mensen enquêteert is de kans dat je conclusie niet klopt veel kleiner. Ook al zitten er 3 (of desnoods 10) respondenten tussen die tegen alcohol zijn. Deze 10 hebben weinig invloed. De onderzoeker krijgt een betrouwbaar idee van de mening van de gemiddelde Nederlander. De eigenschap dat je onderzoek onjuist is doordat er abnormaal veel mensen met een afwijkende mening meedoen heet ‘de toevallige fout ‘.

De oplossing die wiskundigen hebben bedacht: de kans op een toevallige fout.

Omdat je nooit kunt uitsluiten dat er een ‘toevallige fout’ gebeurt spreken we liever over ‘wat is de KANS dat de toevallige fout je conclusies onjuist maakt?’ Ze hebben het volgende bedacht: Laten we ervan uitgaan dat de meeste mensen ‘het gemiddelde’ antwoord geven; dat een kleiner percentage iets boven het gemiddelde antwoordt en dat een even groot percentage iets onder het gemiddelde zal antwoorden. Er blijft dan meestal zo’n 5% van de steekproef over die VEEL HOGER of VEEL LAGER antwoordt dan het gemiddelde.

Statistici zeggen : 68% van de steekproef zijn de antwoorden van mensen die het gemiddelde antwoord geven of iets erboven of iets eronder. 32% valt daar dus buiten. Het echte probleem zit echter in die 5% van de deelnemers die een zeer afwijkende mening heeft (waarvan dus 2,5% punt extreem hoger en 2,5% punt extreem lager).

Om deze kans op toevallige fout mee te nemen bij het berekenen van het aantal benodigde enquêtes hebben we de

Z-waarden tabel.

betrouwbaarheids-
niveau
                      z-waarde
68%                                   1
80%                                1,28
90%                                1,65
95%                                1,96
99%                                2,57

Je kunt zelf bepalen hoe klein je de kans wilt hebben op een toevallige fout. Hiervoor kijk je in de linkerkolom en leest de z-waarde af die daarbij hoort. Als je wilt dat de kans op een toevallige fout slechts 5% is dan hoort daar een z-waarde bij van 1,96 (zie boven). Als het heel belangrijk is dat er geen toevallige fout wordt gemaakt dan moet je kiezen voor een betrouwbaarheid van 99% (z=2,57).

Als je berekent hoeveel enquêtes er ingevuld moeten worden (lees: hoeveel respondenten hun mening moeten geven) dan moet je dus in de formule aangeven wat het ‘betrouwbaarheidsniveau’ moet zijn’. Dat doe je door de overeenkomstige z-waarde in de formule  in te vullen).

DE STEEKPROEFFORMULE
Voor het berekenen van het aantal enquêtes dat nodig is voor je onderzoek maken we gebruik van 2 formules.  Soms heb je maar 1 van de 2 nodig.
De eerste formule heet de FORMULE VOOR DE MINIMALE STEEKPROEFOMVANG

Formule:  n = p% x q% x (z/e%)²
n : de  minimale steekproefomvang (die ga je dus uitrekenen)
p%= percentage van de gespecificeerde  categorie
q%= percentage dat niet tot de gespecificeerde categorie hoort
z= z-waarde (van betrouwbaarheidsniveau)
e%= de vereiste foutmarge

De eerste formule gebruik je altijd. Wanneer je onderzoekspopulatie groter is dan 10 000 (personen/ elementen) dan heb je aan deze formule genoeg!!
De ‘n’ die je hiermee berekent is dan de steekproefgrootte/ het aantal deelnemers aan de enquete dat je nodig hebt voor je onderzoek.

Als er minder dan 10.000 elementen in de populatie zijn gebruik je ook nog de 2e formule.
Dit is de FORMULE VOOR DE GECORRIGEERDE STEEKPROEFOMVANG
                       n     
       n’ = 1 + (n/N)

n’ = gecorrigeerde minimale steekproefomvang
n = minimale steekproefomvang
N = de totale populatie

Rekenvoorbeeld

Paula onderzoekt de tevredenheid van de vaste gasten van een Hotel. Het hotel heeft 1100 vaste gasten. Ze wil een enquête afnemen met vragen over de tevredenheid. Hoeveel enquêtes moet ze nu afnemen?
Stap 1: Hoe betrouwbaar moet het onderzoek zijn? (Meeste onderzoekers kiezen voor een betrouwbaarheidsniveau van 95%). (5% kans op een verkeerde conclusie door toevallige fout)

Stap 2: Hoe nauwkeurig moet het onderzoek zijn?
We bedoelen daarmee dit: Wanneer uit het onderzoek komt dat 30% van de respondenten ontevreden is over het hotel. Mag de conclusie er een paar % naast zitten? Dus dat je in het rapport schrijft: Ik heb het niet helemaal precies kunnen meten maar tussen de 25% en 35% van alle gasten is ontevreden. (Dit is de nauwkeurigheidsmarge die je kiest. Hoe nauwkeuriger des te meer mensen moet je enqueteren.)

Stap 3: Heeft de onderzoeker zelf al een sterke aanwijzing over de uitkomst? Dan kan het verwachte antwoordpercentage worden ingevuld (p%) maar meestal heb je geen zekere verwachting van de uitkomst / of vinden we het veiliger om niet te ‘gokken’. In dat geval vullen we voor p de waarde 50 in en ook voor q de waarde 50.  (q is namelijk altijd 100 – p).

Stap 4: Hoe groot is de populatie? (Populatie= totaal aantal mensen/elementen waar het onderzoek over gaat). In het geval van Paula gaat het in totaal dus om 1100 gasten. (populatiegrootte is 1100).

Stap 5: Invullen van de formule voor de MINIMALE STEEKPROEFOMVANG.

Paula vult de formule als volgt in:
n = p% x q% x (z/e%)²       >>>>                 n= 50 x 50 x (1,96/5) ²
Uitleg:
Paula heeft geen idee van de uitkomst van het onderzoek en vult voor p 50 in en ook voor q 50 in. (Dit betekent dat onderzoeker de uitkomst niet van tevoren kan schatten). Voor de betrouwbaarheid van 95% zoekt ze in de tabel de Z-waarde op en die is 1,96

Voor de nauwkeurigheid (marge) vult ze 5 in. (Ze neemt hier de nauwkeurigheid die meestal aangenomen wordt voor onderzoek namelijk 5%). Dat betekent dat ze zegt: Ik ben al blij als ik er maximaal 5%-punt naast zit met mijn conclusie.

Uitrekenen van de formule geeft:     2500 x (0,392)x(0,392) = 384,16

Stap 6: Is het aantal van de popualtie groter dan 10 000? Dan is DIT het aantal enquêtes dat afgenomen moet worden: namelijk 385 (we ronden de uitkomst uit de berekening altijd naar boven af)

Als de populatie kleiner is dan 10 000 moet Paula ook nog rekenen met formule 2 (De GECORRIGEERDE STEEKPROEFOMVANG). Omdat het onderzoek van Paula over de vaste gasten gaat, is de populatie kleiner dan 10 000. De populatie is immers 1100. En dus moet ze ook nog rekenen met de 2e formule.
               n     
n’ =  1 + (n/N)  >>> n’= 385 :    (1 +(385/1100)) =  385:(1 +0,35) = 385 : 1,35 = 285,18

Er zijn dus 285,18  =  286 ingevulde enquêtes nodig. (we ronden de uitkomst uit de berekening weer naar boven af)
Paula kan haar berekening controleren met behulp van de rekentool op de website

http://onderzoekscoaching.nl/cms/rekenhulp/

Kijk voor meer interessants over dit onderwerp: http://onderzoekscoaching.nl/cms/rekenhulp/

The Research Company BV is een full-service onderzoeksbureau dat u kunt inschakelen voor onderzoekswerkzaamheden. De educatieve afdeling van Research Company deelt kennis en ervaring met studenten. Zij profiteren van de duidelijke artikelen over onderzoekstheorie, methoden en technieken en gratis hulpmiddelen zoals de gratis software voor online enquêteren en Rekenhulp om steekproefomvang, nauwkeurigheid en betrouwbaarheid te berekenen.

(Er is veel zorg besteed aan deze uitleg. Het is begrijpelijk geschreven met duidelijk voorbeelden. Maandelijks lezen 4000 HBO (en WO) studenten een of meer van de artikelen van Research Company. Als je geholpen bent met dit artikel dan kun je andere studenten ook een beetje helpen door het artikel te delen in je netwerk).