Mini cursus Data analyse verbanden (3/4)

Deze week: Verbanden

Vorige week hebben we gekeken naar de td toets en chi kwadraat om te bepalen of een verschil significant is op basis van een afhankelijke steekproef. Deze week zullen we verbanden leren gebruiken om te bepalen of er daadwerkelijk een verband is tussen twee variabelen. Om daadwerkelijk een causale relatie te vinden zul je altijd rekening moeten houden met een verborgen derde variabele of contaminatie in het onderzoek.

Verborgen derde in Data analyse

Statement: 100% bioscoopgangers gebruikt internet

  • Verborgen derde: online onderzoek

Statement: Vakkenvullers zijn zwaarder dan caissières

  • Verborgen derde: Geslacht

Oorzaak door het onderzoek zelf

  • Contaminatie: Besmetting, verwarring, vervuiling
  • Onderzoeker is zelf verantwoordelijk voor de invloeden op de onafhankelijk variabele
  • Hierdoor ontstaat er causaliteit die wellicht niet bestaat

Om causale relaties te kunnen trekken mogen groepen die worden vergeleken alleen op basis van de onderzochte onafhankelijke variabele van elkaar verschillen!

Cramers V voor Data analyse

Om uit kruistabellen te bepalen of er een sterk verband is gebruik je het verband: Cramers V. Om Cramers V te gebruiken ga je in SPSS naar het menu Analyze/Descriptive Statistics/ Cross tabs, in dit menu vind je de Cramers V.

cursus data analyse

Als je nu de analyse draait, krijg je in de output ook een uitkomst voor Cramers V te zien en de significantie waarde die erbij hoort. Hierbij geldt standaard de 95% betrouwbaarheid regel. Dus alpha is 0,05. Pas als de significantiewaarde lager is dan 0,05 dan is er sprake van een verband.

Wanneer is er een sterk verband?

  • V = 1: Samenhang is volledig
  • V = +/- 0,75: Samenhang is sterk
  • V = +/- 0,50: Samenhang is middelmatig
  • V = +/- 0,25: Samenhang is zwak
  • V = 0: Samenhang ontbreekt
training data analyse

Gebruik Pearson Correlatie Data Analyse

Zodra we willen kijken of er een verband is tussen twee ratio variabelen gaan we opzoek naar de correlatie. De sterkte van de samenhang wordt gegeven door de Pearson Correlation Coëfficiënt. Je vindt deze in SPSS onder Analyze/Correlate/Bivariate. In dit menu geef je aan welke (twee of meer) variabelen je wilt vergelijken. SPSS kijkt in deze analyse altijd naar koppeltjes en niet naar interactie effecten. Dus als je meer variabelen er in stopt (A, B en C) dan berekent hij de correlatie A-B, A-C, B-C. Je ziet in de output dat SPSS ook de volgende correlatie berekend (A-A, B-B, C-C = altijd 1, want perfecte correlatie) en (B-A, C-A, C-B = gelijk aan de correlaties A-B, A-C, B-C, want precies dezelfde toets.

Ook voor Pearson geldt dat we deze pas kunnen gebruiken als er aan de betrouwbaarheid van 95% is voldaan (alpha 0,05).

opleiding data analyse

Wat zegt dit nu?

  • r = 1: Samenhang volledig Positief
  • r = -1: Samenhang volledig Negatief
  • r = 0: Totaal geen samenhang

r moet minimaal 0,3 zijn (zwak), liever 0,6 of 0,7 (gemiddeld), het liefst 0,8/0,9 (sterk)

Cursus Data analyse

Wil je op een professionele manier data leren analyseren? De cursus Data Analyse leidt jou door de wereld van de toegepaste toetsende statistiek. Je leert latente variabelen begrijpen en je leert hoe je betrouwbare en valide toetsen uitvoert.

Terug