EEN STEEKPROEF TREKKEN DIE REPRESENTATIEF IS

KORTE EN DUIDELIJKE TIPS VOOR ONDERZOEKSOPDRACHTEN EN -TENTAMENSTOF (HBO/MBO+).

ALLES OVER REPRESENTATIVITEIT

In dit artikel: Inleiding representativiteit. De drie eisen voor een goede steekproef. De acht momenten in je scriptie om aan representativiteit te denken. Representativiteit in de methodologie. Het beschrijven van je doelgroep/populatie. Het steekproefkader en representativiteit. Representativiteit TIJDENS het enquêteren. Het beschrijven van de representativiteit. Representativiteit en weging.  Representativiteit in het hoofdstuk conclusie. Representativiteit in het hoofdstuk Discussie.

(Vergeet straks niet om nog even te kijken op:

Korte inleiding: Een Representatief onderzoek…

Wat heb je aan een onderzoek als niet iedereen meedoet? Dan is de uitkomst toch altijd maar een schatting? Als andere mensen hadden meegedaan aan je onderzoek dan waren er misschien andere uitkomsten! Antwoord: Als je 50 eieren omhoog gooit en elke keer valt het ei kapot. Moet je dan nog alle andere eieren testen om te weten of ze kapot gaan? Nee. Je hebt dus genoeg aan een ‘steekproef’ van 50 om conclusies te trekken. (Er is dan nog steeds een kleine kans dat het 51e ei niet kapot valt maar … ik durf dat risico wel te nemen).

Een groep van 50 eieren testen uit een totale groep van miljarden eieren is een voorbeeld van een onderzoek op basis van een steekproef.

Een onderzoek gaat meestal niet over eieren. En we stellen specifieke eisen aan de keuze van de deelnemers (steekproef). Dat komt doordat we op basis van de steekproef toch conclusies willen trekken over de hele groep (=populatie/ alle klanten / bewoners etc.).

De drie eisen voor een goede steekproef

De voorwaarden om conclusies te mogen trekken over de hele groep terwijl niet iedereen meedoet zijn:
1. De steekproef moeten voldoende groot zijn. (Je kunt niet concluderen dat de klanten van ABC BV ontevreden zijn wanneer je maar 5 klanten hebt geenquêteerd).
2. De deelnemers moeten toevallig geselecteerd zijn om mee te doen (Random steekproef= willekeurig gekozen= stochastische steekproef = kanssteekproef).
3. De samenstelling van de groep die meedoet moet lijken op de hele groep (= de groep moet representatief zijn).

1  Is het makkelijkste. (Het aantal ingevulde enquêtes dat je nodig hebt bereken je met de ‘rekenhulp’ van Research Company of handmatig met behulp van de ‘steekproefformule’).
2. Je moet ervoor zorgen dat iedereen een eerlijke (gelijke) kans heeft om door jou uitgekozen te worden. Dat kan je bijvoorbeeld bereiken door de deelnemers niet uit te kiezen maar willekeurig enquêtes uit te delen aan voorbijgangers of willekeurig namen te kiezen uit een lijst met klanten.  (Helaas lukt het vaak niet om echt iedereen een gelijke kans te geven om mee te doen…).

Maar de derde voorwaarde, de samenstelling? Hoe kan je daarvoor zorgen? Je kunt mensen immers wel vragen om mee te doen maar je kunt ze niet dwingen. Je kunt er niet veel aan doen wanneer er teveel mannen meedoen of teveel ouderen. Als dat gebeurt dan is je steekproef niet meer representatief. Anders gezegd : de groep die meedoet is geen goede afspiegeling van de hele groep. Want : Stel dat in de hele populatie van 1200 klanten de helft vrouw is en de helft man. Je deelt enquêtes uit aan 500 klanten. Achteraf heb je 100 enquêtes terug van mannen en maar 40 van vrouwen. Je steekproef voldoet dan niet aan voorwaarde 3. Anders gezegd: de antwoorden van de mannen zijn veel meer meegenomen in je onderzoek dan de mening van de vrouwen.

Representativiteit van de steekproef is heel belangrijk. Voorbeeld:
Henry doet een klanttevredenheidonderzoek voor de website van Research Company met maandelijks ruim 2400 unieke bezoekers. Henry heeft op  de website een pop-up geplaatst met een enquête. De pop-up heeft 10 dagen op de site gestaan en er hebben maar liefst 300 unieke bezoekers meegedaan aan de vragenlijst. De conclusie is dat 30% van de deelnemers de website verouderd vindt. Henry presenteert de resultaten aan de manager online marketing. De manager vindt de uitkomst vreemd. Hij vindt 30% een erg hoog percentage. “Klopt je steekproefomvang wel?” “Ja, hoor” zegt Henry. Er hebben 300 klanten meegedaan.  “Is de steekproef wel representatief?” Henry snapt de vraag niet helemaal. “Wat bedoelt u? Iedereen die de site bezocht kreeg eerlijke kans om mee te doen…. Het is dus een random/toevals steekproef”. De manager denkt dat de steekproef niet representatief is voor alle bezoekers van de site. “Ik denk dat vooral jonge klanten de vragenlijst hebben ingevuld”. Daardoor lijkt het dus alsof 30% van alle klanten de website verouderd vindt maar je hebt vooral de mening van de jongeren meegenomen in je conclusie”.

De acht momenten waarop je moet kijken naar de representativiteit

Een scriptie vraagt 8x om aandacht voor het onderwerp representativiteit:
1e keer: Methodologie
2e keer: Beschrijven van de populatie die je gaat onderzoeken
3e keer: Beschrijven van het steekproefkader
4e keer: Tijdens het nemen van de steekproef
5e keer: Tijdens het beschrijven van de respons
6e keer: Als je gaat ‘wegen’ (weging is een corrigerende methode / optioneel)
7e keer: Conclusies
8e keer: Discussie

1e keer: Methodologie
In het hoofdstuk methodologie beschrijft de onderzoeker hoe het onderzoek is opgezet (dus voordat je het uitvoert). Daarbij behoort ook de beschrijving van de steeproefmethode. Hoe ga je proberen om een representatieve steekproef te krijgen?

2e keer: Beschrijven van de doelgroep/ populatie.
Een deel van deze beschrijving is soms terug te vinden in de contextanalyse (interne analyse). Dit hangt van je onderzoeksonderwerp af. Soms is het logischer om het mee te nemen in de methodologie. Je beschrijft:
– Hoe groot is de populatie (de hele groep waar je straks dus conclusies over gaat trekken)?
– Hoe is de groep samengesteld? Je moet de RELEVANTE eigenschappen (achtergrondkenmerken) beschrijven. Meestal zijn dat leeftijd, geslacht; opleiding; inkomen… .  Let op: Het gaat om die achtergrondkenmerken waarvan je denkt dat ze invloed hebben op de antwoorden die iemand geeft ( ‘afhankelijke variabelen’). Voorbeeld: Als je onderzoek doet naar klanttevredenheid dan zijn achtergrondkenmerken als geslacht en leeftijd van invloed op de antwoorden die iemand geeft. Maar bij het onderwerp ‘klanttevredenheid’ zal ook meespelen of het een vaste klant is of niet. Stel echter dat je onderzoek gaat over de tevredenheid van mensen met de attracties in een stad. Dan zou ik als achtergrond kenmerk ‘Woonplaats’ belangrijk vinden. Want het maakt voor de mening van de persoon wel uit of hij zelf uit de stad komt waar de attracties zijn of dat hij ergens anders vandaan komt (toerist).

Voor een Representatieve steekoproef moet de steekproef dus lijken op de samenstelling van de populatie:
Zoals in onderstaand onderzoek : Klanttevredenheid ABC BV
Klantenbestand:
1000 mannen; 200 vrouwen; 10% is jonger dan 21 jaar; 40% is tussen 21 en 35 jaar; 50% is ouder dan 35 jaar.
(83%)                  (17%)
Steekproef
100 mannen ;  15 vrouwen;    8% is jonger dan 21 jaar;  46% is tussen 21 en 35 jaar; 46% is ouder dan 35 jaar.
(87%)                  (13%)

De samenstelling van de steekproef lijkt op die van de populatie. De verdeling mannen en vrouwen en de verdeling op leeftijd is vergelijkbaar. De steekproef voldoet dus wat betreft geslacht en leeftijd aan de 3e voorwaarde van een goede steekproef.

3e keer: Steekproefkader
Beschrijf in methodologie ook waar je de adressen vandaan hebt. Een beschrijving van het ‘steekproefkader’ zegt veel over de kwaliteit van het bestand en ook over de betrouwbaarheid van de steekproef.
Voorbeelden van steekproefkaders:
Een klantenbestand (hoeveel klanten, wat is de samenstelling van het bestand, is het aktueel)
Een mailingbestand (welke adressen zitten er in? hoeveel? van wie?)
Het groep winkelend publiek in een winkelstraat (hoeveel mensen denk te dat er totaal door de straat komen? waar komen ze vandaan? wat weet je van leeftijd/geslacht?)
De bezoekers van een festival (hoeveel denk je dat het er totaal zijn? Is bekend hoeveel% man? hoeveel % vrouw? Waar vandaan?).
Beschrijf dus het BESTAND waar de mensen uit worden geselecteerd.

4e keer: Representativiteit TIJDENS het nemen van de steekproef
Dit wordt te vaak vergeten. Hou tijdens het verzamelen van enquêtes bij wat de verdeling is (hoeveel % enquêtes heb je terug van mannen? hoeveel % van vrouwen? hoeveel % van jongeren/ouderen?).  Reden: Als je tijdens het enquêteren oplet hoe het gaat met de representativiteit dan kan je er misschien nog wat aan doen! Als je het bijhoudt weet je dus dat je nog wat meer mannen moet enquêteren… Dan klopt je onderzoek dus aan het einde wat betreft de representativiteit veel beter. (En , achteraf tekorten in bepaalde groepen herstellen is haast nooit mogelijk…).

5e keer: Representativiteit beschrijven aan het eind van het veldwerk
Dit is waar het uiteindelijk om gaat. Dat je een vergelijking kan maken tussen de eigenschappen van de populatie die je onderzoekt en de steekproef die je hebt genomen. Je vergelijkt de samenstelling van populatie en steekproef. Je laat zien dat je steekproef representatief is voor de hele populatie. (Je steekproef is eigenlijk de populatie maar dan in het klein).

De samenstelling van de hierboven beschreven steekproef lijkt wat betreft achtergrondkenmerken op de populatie.
Er zijn 87% mannen die hebben meegedaan aan het onderzoek, in de populatie is dat percentage 83%.
Dat komt erg dicht in de buurt van het gewenste percentage. De steekproef is representatief te noemen*.
*) Dit is enigszins vereenvoudiging van de werkelijkheid omdat je eigenlijk ook nog per geslacht en per leeftijd moet gaan vergelijken.
(hoeveel % van de vrouwen in de populatie is jonger dan
21 ? en hoeveel % is dit in de steekproef? Er zijn dus nog veel van dergelijke
tellingen te doen voordat
de controle op representativiteit volledig is uitgevoerd.

6e keer: Weging
Het wordt door HBO studenten nauwelijks gedaan maar is in de onderzoekspraktijk wel gebruikelijk: Weging.
Weging houdt in dat we de afwijkingen tussen de steekproef en de populatie gaan corrigeren. In het voorbeeld
staat dat er 1000 mannelijke klanten zijn (83%) , in de steekproef zijn er 100 mannen die hebben meegedaan aan de enquête  (87%). Er hebben dus naar verhouding iets teveel mannen meegedaan. Om dat te corrigeren kunnen we de antwoorden van de mannen
voor 83/87 deel mee laten tellen. Dan tellen de stemmen van de mannen net zo zwaar mee ‘alsof’ ze slechts 83% van de mening van
de klanten uitmaken. [In SPSS is daar een speciale functie voor ‘weging’ ].

7e keer: Wat schrijf je over representativiteit in de Conclusie?
Het onderwerp ‘representativiteit’ komt zelden terug in de conclusie van een onderzoek. Alleen wanneer
het helemaal fout is gelopen. Dan kan het genoemd worden als een mogelijke oorzaak van bepaalde uitkomsten.

8e keer: Discussie
In het hoofdstuk Discussie beoordeelt de student zijn eigen onderzoek op kwaliteit (betrouwbaarheid, validiteit, nauwkeurigheid, representativiteit, bruikbaarheid). Wanneer er problemen waren met de representativiteit dan moeten die dus in dit hoofdstuk genoemd worden. Daarbij geldt als regel: Als er problemen zijn met de representativiteit noem ze dan ook in de discussie. Als je dat niet doet dan zal de scriptiecommissie aannemen dat je het zelf niet hebt gezien. Dat komt dan over als ‘slordig’. Wanneer je het wel noemt laat je dus zien dat je snapt wat de term inhoudt en dat je het kan toepassen. Het wordt studenten meestal niet zwaar aangerekend als de representativiteit niet helemaal klopt. Maar het kost wel wat puntjes als je net doet alsof er niets aan de hand is.

The Research Company BV is een full-service onderzoeksbureau dat u kunt inschakelen voor onderzoekswerkzaamheden. De educatieve afdeling van Research Company deelt kennis en ervaring met studenten. Zij profiteren van de duidelijke artikelen over onderzoekstheorie, methoden en technieken en gratis hulpmiddelen zoals de gratis software voor online enquêteren en Rekenhulp om steekproefomvang, nauwkeurigheid en betrouwbaarheid te berekenen.

Ook interessant bij dit artikel: http://onderzoekscoaching.nl/cms/wat-betekent-een-betrouwbaarheid-van-95-onderzoek-en-statistiek/

(Er is veel zorg besteed aan deze uitleg. Het is begrijpelijk geschreven met duidelijk voorbeelden. Maandelijks lezen 4000 HBO (en WO) studenten een of meer van de artikelen van Research Company. Als je geholpen bent met dit artikel dan kun je andere studenten ook een beetje helpen door het artikel te delen in je netwerk).