Articles

Correlatie in Statistiek: Correlatieanalyse Uitgelegd

Delen op

Inhoud:
Wat is Correlatie?
De correlatiecoëfficiënt
Correlatie in Excel

Definitie

Correlatie wordt gebruikt om verbanden te testen tussen kwantitatieve variabelen of categorische variabelen. Met andere woorden, het is een maatstaf voor het verband tussen dingen. De studie van hoe variabelen gecorreleerd zijn, wordt correlatieanalyse genoemd.

Een paar voorbeelden van gegevens die een hoge correlatie hebben:

  • Uw calorie-inname en uw gewicht.
  • Uw oogkleur en de oogkleuren van uw familieleden.
  • De hoeveelheid tijd die je studeert en je GPA.

Een paar voorbeelden van gegevens die een lage correlatie hebben (of helemaal geen):

  • Jouw seksuele voorkeur en het soort cornflakes dat je eet.
  • De naam van een hond en het soort hondenkoekje dat hij het liefst eet.
  • De kosten van een autowasbeurt en hoe lang het duurt om een frisdrankje te kopen in het station.

Correlaties zijn nuttig, want als je kunt achterhalen welk verband variabelen hebben, kun je voorspellingen doen over toekomstig gedrag. Weten wat de toekomst brengt is erg belangrijk in de sociale wetenschappen zoals de overheid en de gezondheidszorg. Bedrijven gebruiken deze statistieken ook voor begrotingen en bedrijfsplannen.

De correlatiecoëfficiënt

Een correlatiecoëfficiënt is een manier om een waarde aan de relatie te geven. Correlatiecoëfficiënten hebben een waarde tussen -1 en 1. Een “0” betekent dat er helemaal geen verband is tussen de variabelen, terwijl -1 of 1 betekent dat er een perfecte negatieve of positieve correlatie is (negatieve of positieve correlatie verwijst hier naar het type grafiek dat de relatie zal opleveren).

wat is correlatie

Grafieken met een correlatie van -1, 0 en +1

Typen

De meest voorkomende correlatiecoëfficiënt is de Pearson Correlatiecoëfficiënt. Deze wordt gebruikt om lineaire verbanden tussen gegevens te testen. In AP stats of elementaire stats is de Pearson waarschijnlijk de enige coëfficiënt waar je mee zult werken. Maar je kunt er nog andere tegenkomen, afhankelijk van het soort gegevens waarmee je werkt. De lambda-coëfficiënt van Goodman en Kruskal is bijvoorbeeld een vrij gebruikelijke coëfficiënt. Hij kan symmetrisch zijn, waarbij je niet hoeft te specificeren welke variabele afhankelijk is, en asymmetrisch, waarbij de afhankelijke variabele wel wordt gespecificeerd.

Correlatie in Excel

Accepteer statistische, marketing cookies om deze video te bekijken.

Correlatie in Excel 2013Het met de hand vinden van Pearsons correlatiecoëfficiënten is lelijk en brengt veel tijdrovend rekenwerk met zich mee. Excel kan deze berekeningen echter in een fractie van een seconde voor u maken. Je hebt twee opties in Excel (2013 en later): De CORREL-functie of de Data Analysis Toolpak.


Als u bekend bent met het invoeren van functies in Excel, zou u de opdracht CORREL kunnen invoeren:
=CORREL(array 1, array 2)
Bijv. =CORREL(A2:A6,B2:B6)

Het Data Analysis Toolpak is echter veel eenvoudiger, omdat u niet een hele reeks functies hoeft te onthouden (of te zoeken); ze staan allemaal in de Data Analysis lijst. Als Data Analysis niet helemaal rechts op het tabblad gegevens staat, controleer dan of u het Data Analysis Toolpak hebt geladen. Het Data Analysis Toolpak is een optionele invoegtoepassing voor Excel waarmee u toegang krijgt tot een groot aantal functies, waaronder:

  • Correlatie,
  • Lineaire regressie,
  • Histogrammen,
  • T-tests,
  • Z-tests
  • ANOVA eenweg- en tweerichtingstoetsen.

Stap 1: Typ je gegevens in een werkblad in Excel. Het beste formaat is twee kolommen. Plaats je x-waarden in kolom A en je y-waarden in kolom B.


Stap 2: Klik op het tabblad “Gegevens” en klik vervolgens op “Gegevensanalyse”.

Stap 3: klik op “Correlatie” en klik vervolgens op “OK.”

Stap 4: typ de locatie voor uw x-y variabelen in het vak Input
Range. Of gebruik uw cursor om het gebied te markeren waar uw variabelen zich bevinden.

Stap 5: Klik op de optie “kolommen” of “rijen” om Excel te laten weten hoe uw gegevens zijn ingedeeld. In de meeste gevallen zult u op “kolommen” klikken, omdat dat de standaardmanier is om gegevens in Excel te rangschikken.

Stap 6: Vink “Labels in eerste rij” aan als u kolomkoppen hebt.

Stap 7: Klik op het tekstvak “Uitvoerbereik” en selecteer vervolgens een gebied op het werkblad waar u uw uitvoer naartoe wilt sturen.

Dat is het!

Kijk op ons YouTube-kanaal voor meer Excel-tips en hulp!

Agresti A. (1990) Categorical Data Analysis. John Wiley and Sons, New York.
Dodge, Y. (2008). De Beknopte Encyclopedie van de Statistiek. Springer.
Vogt, W.P. (2005). Dictionary of Statistics & Methodologie: A Nontechnical Guide for the Social Sciences. SAGE.
Wheelan, C. (2014). Naked Statistics. W. W. Norton & Bedrijf

CITE THIS AS:
Stephanie Glen. “Correlatie in Statistiek: Correlation Analysis Explained” Van StatisticsHowTo.com: Elementaire Statistiek voor de rest van ons! https://www.statisticshowto.com/probability-and-statistics/correlation-analysis/

——————————————————————————

Heb je hulp nodig bij een huiswerk of toetsvraag? Met Chegg Study kunt u stap-voor-stap oplossingen voor uw vragen krijgen van een expert op dit gebied. Uw eerste 30 minuten met een Chegg-leraar zijn gratis!

Laat een antwoord achter

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *