Enquête statistische analysemethoden: een beknopte handleiding
Waarom statistische analysemethoden gebruiken?
Als het gaat om enquêtegegevens, is het verzamelen slechts de helft van het plaatje. Wat u met uw resultaten doet, kan het verschil uitmaken tussen inspiratieloze topresultaten en diepgaande, onthullende inzichten. Met behulp van gegevensverwerkingshulpmiddelen en technieken zoals statistische tests kunt u erachter komen:
- of de trends die u in uw gegevens ziet zinvol zijn of gewoon toevallig
- wat uw resultaten betekenen in de context van andere informatie waarover u beschikt
- of één factor die uw bedrijf beïnvloedt belangrijker is dan andere
- wat uw volgende onderzoeksvraag zou moeten zijn
- hoe u inzichten kunt genereren die tot zinvolle veranderingen leiden
Er zijn verschillende soorten statistische analyse voor enquêtes. In dit artikel verkennen we enkele van de meest gebruikte methoden, en geven we links naar meer diepgaande uitleg van het Qualtrics-team.
Benchmarking
Benchmarking is een manier om te standaardiseren – het speelveld gelijk te maken – zodat je data en resultaten betekenisvol zijn in context. Hierbij wordt rekening gehouden met externe factoren, zodat u de parameters van uw onderzoek kunt aanpassen en een beter inzicht krijgt in wat er gebeurt.
Benchmarkingtechnieken maken gebruik van weging om te corrigeren voor variabelen die de algemene resultaten kunnen beïnvloeden. Stel bijvoorbeeld dat u geïnteresseerd bent in de groei van gewassen gedurende een seizoen. Uw benchmarking zal rekening houden met variabelen die een effect hebben gehad op de groei van gewassen, zoals regenval, zonuren, eventuele plagen of ziekten, type en frequentie van de bemesting, enz, zodat u kunt corrigeren voor ongewone gebeurtenissen, zoals een onverwachte uitbraak van een plantenziekte op een enkel bedrijf binnen uw steekproef.
Met benchmarks hebt u een referentie voor wat “standaard” is in uw interessegebied, zodat u afwijkingen van de norm beter kunt identificeren en onderzoeken.
Het doel is, zoals zo vaak bij de analyse van enquêtegegevens, ervoor te zorgen dat uw steekproef representatief is en niet scheef, en dat alle vergelijkingen met andere gegevens vergelijkbaar zijn.
Lees meer over benchmarking voor bedrijven
Regressieanalyse
Regressie is een statistische techniek die wordt gebruikt om het verband tussen twee (of meer) variabelen te bepalen.
Om regressies te begrijpen, hebben we een snelle terminologiecontrole nodig:
- Onafhankelijke variabelen zijn “op zichzelf staande” verschijnselen (in de context van het onderzoek) die van invloed zijn op afhankelijke variabelen
- Afhankelijke variabelen zijn dingen die veranderen als gevolg van hun relatie met onafhankelijke variabelen
Een verandering in een afhankelijke variabele – laten we zeggen, de groei van het gewas in augustus – is afhankelijk van, en hangt samen met, een verandering in een (of meer) onafhankelijke variabelen – die in het voorbeeld van het gewas zonneschijn, regenval en verontreinigingsniveaus kunnen zijn.
- Lineaire regressie maakt gebruik van één onafhankelijke variabele om een uitkomst van de afhankelijke variabele te voorspellen.
- Meervoudige regressie maakt gebruik van ten minste twee onafhankelijke variabelen. Een meervoudige regressie kan lineair of niet-lineair zijn.
De resultaten van een lineaire regressieanalyse worden weergegeven als een grafiek met variabelen op de assen en een ‘regressiecurve’ die de onderlinge relaties weergeeft. Gegevens zijn zelden recht evenredig, dus er is meestal sprake van een zekere mate van curve in plaats van een rechte lijn.
Dit is een nuttige test omdat u de precieze impact van een verandering in uw onafhankelijke variabele kunt vaststellen.
Lees meer over regressies
De T-test
De T-test (ook bekend als Student’s T-test) is een hulpmiddel voor het vergelijken van twee gegevensgroepen die verschillende gemiddelde waarden hebben. Bijvoorbeeld, hebben vrouwen en mannen verschillende gemiddelde hoogtes? Met de T-test kan de gebruiker interpreteren of de verschillen statistisch significant zijn of slechts op toeval berusten.
De resultaten van een T-test worden uitgedrukt in termen van waarschijnlijkheid (p-waarde). Als de p-waarde onder een bepaalde drempel ligt, meestal 0,05, dan kunt u er zeer zeker van zijn dat uw twee groepen echt verschillend zijn en het niet slechts een toevallige variatie was tussen uw steekproefgegevens.
Lees onze Inleiding tot de T-test theorie voor enquêtes
Analyse van variantie (ANOVA) test
Net als de T-test is ANOVA (analyse van variantie) een manier om de verschillen tussen groepen te testen om te zien of ze statistisch significant zijn. Met ANOVA kun je echter drie of meer groepen vergelijken in plaats van slechts twee.
ANOVA wordt gebruikt bij een regressiestudie om na te gaan welk effect onafhankelijke variabelen hebben op de afhankelijke variabele. Het kan meerdere groepen tegelijk vergelijken om te zien of er een verband tussen hen bestaat, bijvoorbeeld door te bestuderen of verschillende soorten advertenties verschillende reacties van consumenten krijgen.
Dieper: Wat is Analysis of Variance (ANOVA)?
Clusteranalyse
Clusteranalyse is een manier om datasets te verwerken door te identificeren hoe nauw verwant de individuele datapunten zijn. Met behulp van clusteranalyse kunt u vaststellen of er binnen een grote gegevensverzameling gedefinieerde groepen (clusters) zijn, of dat de gegevens tamelijk gelijkmatig zijn verspreid.
Clusteranalyse kan in een paar verschillende vormen worden gebruikt, afhankelijk van het type gegevens dat u hebt en wat u wilt weten. Het kan op een verkennende manier worden gebruikt, zoals het ontdekken van clusters in enquêtegegevens rond demografische trends of voorkeuren, of om bestaande hypotheses te bevestigen en te verduidelijken. Het is een van de populairdere statistische technieken in marktonderzoek, omdat het kan worden gebruikt om marktsegmenten en klantgroepen bloot te leggen.
Lees onze inleiding tot clusteranalyse
Factoranalyse
Factoranalyse is een manier om de complexiteit van uw onderzoeksresultaten te verminderen door een groot aantal initiële variabelen te ruilen voor een kleiner aantal diepere, onderliggende variabelen. Door factoranalyse uit te voeren, brengt u “verborgen” factoren aan het licht die variantie (verschil van het gemiddelde) in uw bevindingen verklaren.
Omdat het diep in de causaliteit achter uw gegevens graaft, is het ook een vorm van onderzoek op zich, omdat het u toegang geeft tot drijvende krachten achter resultaten die niet direct kunnen worden gemeten.
Meer informatie over factoranalyse
Conjoint analysis
Marktonderzoekers willen graag begrijpen en voorspellen waarom mensen de complexe keuzes maken die ze maken. Conjoint analysis komt hier het dichtst bij: het vraagt mensen om afwegingen te maken bij het nemen van beslissingen, net zoals ze dat in de echte wereld doen, en analyseert vervolgens de resultaten om de meest populaire uitkomst te geven.
Bij wijze van voorbeeld: een investeerder wil een nieuw restaurant openen in een stad. Hij denkt dat een van de volgende opties het meest winstgevend zou kunnen zijn:
Type Restaurant | Gourmet Burger | Spaanse Tapas | Thai |
Gemiddelde prijs per persoon | $20 | $40 | $60 |
Afstand vanaf stadscentrum | 5 mijlen | 2 mijlen | 10 mijlen |
Wat vindt de partner van de klant ervan? | Het is OK | Het is OK | Houdt ervan! |
Trade-offs | Het is goedkoop, redelijk dicht bij huis, partner vindt het gewoon OK | Het is iets duurder, maar heel dicht bij huis, partner vindt het prima | Het is duur, vrij ver van huis maar partner vindt het prima |
De investeerder geeft opdracht tot marktonderzoek. De opties worden omgezet in een enquête voor de bewoners:
- Welk type restaurant heeft uw voorkeur? (Gourmet burger/Spaanse tapas/Thai
- Wat zou u bereid zijn per persoon uit te geven? ($20, $40, $60)
- Hoe ver zou u bereid zijn te reizen? (5km, 2km, 10km)
- Zou uw partner…? (Zou het leuk vinden, zou het oké vinden)
Er zijn veel mogelijke combinaties van antwoorden – 54 in dit geval: (3 soorten restaurants) x (3 prijsniveaus) x (3 afstanden) x (2 partnervoorkeuren). Zodra de enquêtegegevens binnen zijn, verwerkt de conjoint analysis-software ze om uit te vinden hoe belangrijk elke optie is bij het nemen van beslissingen door klanten, welke prijsniveaus voor elke optie de voorkeur hebben, en met hoeveel.
Dus uit de conjoint analysis kan de restaurantinvesteerder ontdekken dat er een voorkeur is voor een dure Spaanse tapasbar aan de rand van de stad – iets wat ze eerder misschien niet hebben overwogen.
Meer details: Wat is een conjoint analysis? Conjoint types en wanneer ze te gebruiken
Crosstab analyse
Crosstab (kruistabellen) wordt gebruikt in kwantitatief marktonderzoek om categorische gegevens te analyseren – dat wil zeggen variabelen die verschillend zijn en elkaar uitsluiten, zoals: ‘mannen’ en ‘vrouwen’, of ‘onder de 30’ en ‘boven de 30’.
Ook bekend onder namen als contingentietabel, chi-kwadraat en datatabulatie, stelt het je in staat om de relatie tussen twee variabelen te vergelijken door ze te presenteren in gemakkelijk te begrijpen tabellen.
Een statistische methode genaamd chi-kwadraat kan worden gebruikt om te testen of de variabelen in een kruistabelanalyse onafhankelijk zijn of niet.
Lees meer in onze Crosstab Primer voor marktonderzoekers
Tekstanalyse en sentimentanalyse
Het analyseren van menselijke taal is een relatief nieuwe vorm van gegevensverwerking, en een die enorme voordelen biedt bij experience management. TextiQ van Qualtrics maakt deel uit van het Stats iQ-pakket en gebruikt machine learning en natuurlijke taalverwerking om gegevens uit tekstfeedback te ontleden en te categoriseren, waarbij positieve, negatieve of neutrale sentimenten worden toegekend aan klantberichten en beoordelingen.
Met deze gegevens uit tekstanalyse kun je vervolgens statistische tools inzetten om trends te analyseren, voorspellingen te doen en aanjagers van positieve verandering te identificeren.
Ontdek sentimentsanalyse met Qualtrics TextiQ