Mini cursus Data analyse t-d en chi-kwadraat (2/4)

Deze week: t-d toets en chi-kwadraat

Vorige week hebben we gekeken naar de t / t2 toetsen om te bepalen of een verschil wel een verschil is. Deze week zullen we bepalen of een verschil significant is op basis van een afhankelijke steekproef.

Van afhankelijke steekproeven is sprake als elke waarneming uit de ene steekproef gekoppeld kan worden aan een waarneming uit de andere steekproef. Er is hier dus sprake van twee metingen (bij de andere variant van de t-toets is er slechts 1 meting geweest).

Voorbeelden:

  • Aantal uur studeren student A vorig jaar en dit jaar
  • Uitgaven boodschappen groep consumenten week zonder aanbiedingen en de uitgaven van dezelfde groep consumenten in een week met aanbiedingen

Gebruik t-d toets in data analyse

Een t-d toets lijkt met de uitkomst meer op een t-toets dan een t2-toets. We vergelijken meestal een voor- en een nameting om te kijken of er verschillen zijn opgetreden. We vinden deze toets wederom in SPSS via het menu Analyze/Compare Means/Paired Samples T-test.

Om de werking van een t-d toets te illustreren gaan we bepalen of de remweg van een auto daadwerkelijk wordt verkort met ABS. We laten de auto met 9 verschillende snelheden remmen en doen het later nog een keer (met dezelfde auto) alleen met 1 wijziging, we zetten ook ABS op de auto. We krijgen dan 9 paren die we kunnen vergelijken. Onze hypothese is dat de auto met ABS een korte remweg heeft. SPSS geeft de volgende tabellen:

cursus data analyse

We zien dat de remweg met ABS aanzienlijk korter is in het gemiddelde. Maar is dit significant?

training data analyse

We hebben een t en een Sig. (2-tailed) die we door twee mogen delen omdat we enkelzijdig toetsen. De betrouwbaarheid van onze uitspraak willen we met 99% doen, dus alpha is 0,01. Sig. = 0,096 / 2 = 0,048. Sig is nog altijd groter dan onze alpha, dus we kunnen geen uitspraak doen met 99% betrouwbaarheid. Omdat Sig lager is dan 0,05 kunnen we de uitspraak wel met 95% betrouwbaarheid doen.

Chi-kwadraat voor data analyse

De Chi-kwadraat gebruiken we om te toetsen of een vooraf verwachten verhouding/verdeling ook waar blijkt te zijn. Stel we verwachten van alle studenten die in jaar 1 instromen (landelijk) dat (op basis van voorgaande jaren) 80% doorstroomt naar het 2e jaar en 20% uitvalt. Als we dit onderzoeken met een steekproef en we krijgen een uitval van 25%, kunnen we met Chi-kwadraat toetsen of dit verschil toevallig is, of dat we hier te maken hebben met een significantie stijging.

Voorwaarden voor de chi-kwadraat:

  • Kan met elk meetniveau
  • Hoeft niet normaal verdeeld te zijn
  • Steekproef die op kans is berust

Om de chi-kwadraat uit te voeren gaan we in SPSS naar Analyze/Non Parametic test/Legacy Dialogs/ Chi Square. We toetsen (op basis van een onderzoek) of er ook afgelopen jaar weer 60% van de studenten in 1 jaar de propedeuse wist te behalen. We doen een onderzoek onder 80 studenten en toetsen daarna de verhouding. We willen minimaal 95% betrouwbaarheid in onze uitspraak. Hieronder zie je de uitkomst.

cursus data analyse

opleiding data analyse

We zien dat 38 studenten (van de 80) hun propedeuse in 1 jaar hebben behaald. Dit terwijl we hadden verwacht dat dit er 48 zouden zijn (o.b.v. de 60%). De Chi-kwadraat wordt door SPSS uitgerekend (5,208) en daarbij hoort weer een kans (Sig.). Als de significantie waarde gelijk aan 1 zou zijn, dan hadden we precies gevonden wat we zochten (namelijk 48 mensen die het gehaald hebben). Nu geeft de significantie de kans dat onze waarneming gelijk is aan wat we hadden verwacht. We moeten deze weer vergelijken met Alpha. Alpha is in dit geval 0,05 (95% betrouwbaarheid) en we zien dat sig kleiner is dan alpha. Dit betekend dat we een significant verschil hebben gevonden met 95% betrouwbaarheid.

De volgende mini cursus data analyse zal gaan over verschillende verbanden. Wil je op een professionele manier data leren analyseren? De cursus Data Analyse leidt jou door de wereld van de toegepaste toetsende statistiek. Je leert latente variabelen begrijpen en je leert hoe je betrouwbare en valide toetsen uitvoert.

Terug