Metody statystycznej analizy ankiet: krótki przewodnik
Dlaczego warto stosować metody statystycznej analizy ankiet?
Jeśli chodzi o dane ankietowe, ich zbieranie to tylko połowa sukcesu. To, co zrobisz z wynikami, może zadecydować o tym, czy wyniki będą mało inspirujące czy głębokie i odkrywcze. Wykorzystanie narzędzi i technik przetwarzania danych, takich jak testy statystyczne, może pomóc Ci odkryć:
- czy trendy, które widzisz w swoich danych są znaczące, czy po prostu zdarzyły się przypadkiem
- co Twoje wyniki oznaczają w kontekście innych informacji, które posiadasz
- czy jeden czynnik wpływający na Twój biznes jest ważniejszy od innych
- jakie powinno być Twoje kolejne pytanie badawcze
- jak wygenerować spostrzeżenia, które prowadzą do znaczących zmian
Istnieje kilka rodzajów analizy statystycznej dla badań ankietowych. W tym artykule przedstawimy kilka najczęściej stosowanych metod oraz linki do bardziej szczegółowych wyjaśnień zespołu Qualtrics.
Benchmarking
Benchmarking to sposób na standaryzację – wyrównanie szans – tak, aby Twoje dane i wyniki były znaczące w kontekście. Wiąże się z uwzględnieniem czynników zewnętrznych, dzięki czemu można dostosować parametry badań i dokładniej zrozumieć, co się dzieje.
Techniki benchmarkingu wykorzystują ważenie, aby dostosować się do zmiennych, które mogą wpływać na ogólne wyniki. Na przykład, wyobraź sobie, że jesteś zainteresowany wzrostem upraw w ciągu sezonu. Twój benchmarking weźmie pod uwagę zmienne, które miały wpływ na wzrost upraw, takie jak opady deszczu, godziny nasłonecznienia, wszelkie szkodniki i choroby, rodzaj i częstotliwość nawożenia itp, tak, że można dostosować się do wszystkiego, co może się zdarzyć, takie jak nieoczekiwany wybuch choroby roślin w jednym gospodarstwie w ramach próby.
Z benchmarkami w miejscu, masz odniesienia do tego, co jest „standardem” w obszarze zainteresowania, tak, że można lepiej zidentyfikować i zbadać odchylenia od normy.
Celem, jak w przypadku wielu analiz danych ankietowych, jest upewnienie się, że Twoja próba jest reprezentatywna, a nie skośna, i że wszelkie porównania z innymi danymi są podobne.
Dowiedz się więcej o benchmarkingu dla biznesu
Analiza regresji
Regresja jest techniką statystyczną używaną do opracowania relacji pomiędzy dwoma (lub więcej) zmiennymi.
Aby zrozumieć regresję, musimy szybko sprawdzić terminologię:
- Zmienne niezależne to zjawiska „samodzielne” (w kontekście badania), które wpływają na zmienne zależne
- Zmienne zależne to rzeczy, które zmieniają się w wyniku ich związku ze zmiennymi niezależnymi
Zmiana zmiennej zależnej – powiedzmy, wzrost upraw w sierpniu – zależy i jest związana ze zmianą jednej (lub więcej) zmiennych niezależnych – którymi w przykładzie upraw mogą być nasłonecznienie, opady deszczu i poziom zanieczyszczeń.
- Regresja liniowa wykorzystuje pojedynczą zmienną niezależną do przewidywania wyniku zmiennej zależnej.
- Regresja wieloraka wykorzystuje co najmniej dwie zmienne niezależne. Regresja wielokrotna może być liniowa lub nieliniowa.
Wyniki analizy regresji liniowej są przedstawione w postaci wykresu ze zmiennymi na osiach i „krzywą regresji”, która pokazuje związki między nimi. Dane rzadko są wprost proporcjonalne, więc zwykle występuje pewien stopień krzywej zamiast linii prostej.
Jest to przydatny test, ponieważ można określić dokładny wpływ zmiany w zmiennej niezależnej.
Czytaj więcej o regresji
Test T
Test T (aka test T-Studenta) jest narzędziem do porównywania dwóch grup danych, które mają różne wartości średnie. Na przykład, czy kobiety i mężczyźni mają różną średnią wysokość? Test T pozwala użytkownikowi zinterpretować, czy różnice są statystycznie istotne czy tylko przypadkowe.
Wyniki testu T są wyrażone w kategoriach prawdopodobieństwa (p-wartość). Jeśli wartość p jest poniżej pewnego progu, zwykle 0,05, możesz być pewien, że Twoje dwie grupy naprawdę się różnią i nie jest to tylko przypadkowa różnica pomiędzy danymi z próby.
Przeczytaj Wprowadzenie do teorii testu T dla badań
Test ANOVA
Tak jak test T, ANOVA (analiza wariancji) jest sposobem na sprawdzenie różnic pomiędzy grupami, aby zobaczyć czy są one statystycznie istotne. Jednak ANOVA pozwala na porównanie trzech lub więcej grup, a nie tylko dwóch.
ANOVA jest używana w badaniach regresji, aby dowiedzieć się, jaki wpływ mają zmienne niezależne na zmienną zależną. Może porównywać wiele grup jednocześnie, aby sprawdzić, czy istnieje między nimi związek, np. badając, czy różne rodzaje reklam wywołują różne reakcje konsumentów.
Pogłębiaj: Co to jest analiza wariancji (ANOVA)?
Analiza skupień
Analiza skupień to sposób przetwarzania zbiorów danych poprzez określenie, jak blisko siebie są poszczególne punkty danych. Używając analizy skupień, można określić, czy istnieją określone grupy (klastry) w ramach dużej puli danych, czy też dane są dość równomiernie rozłożone.
Analiza skupień występuje w kilku różnych formach, w zależności od rodzaju danych i tego, co chcesz się dowiedzieć. Może być stosowana w sposób eksploracyjny, np. do odkrywania skupisk w danych ankietowych dotyczących trendów demograficznych lub preferencji, lub do potwierdzania i wyjaśniania istniejących hipotez. Jest to jedna z bardziej popularnych technik statystycznych w badaniach rynkowych, ponieważ może być wykorzystywana do odkrywania segmentów rynku i grup klientów.
Poznaj nasze wprowadzenie do analizy skupień
Analiza czynnikowa
Analiza czynnikowa to sposób na zmniejszenie złożoności wyników badań poprzez zamianę dużej liczby zmiennych początkowych na mniejszą liczbę głębszych, podstawowych zmiennych. Przeprowadzając analizę czynnikową, odkrywasz „ukryte” czynniki, które wyjaśniają wariancję (różnice w stosunku do średniej) w Twoich wynikach.
Ponieważ zagłębiasz się w przyczynowość stojącą za danymi, jest to również forma badania sama w sobie, ponieważ daje Ci dostęp do czynników wpływających na wyniki, które nie mogą być bezpośrednio zmierzone.
Dowiedz się więcej o analizie czynnikowej
Analiza conjoint
Badacze rynku uwielbiają rozumieć i przewidywać, dlaczego ludzie dokonują złożonych wyborów. Analiza Conjoint jest najbliższa temu celowi: prosi ludzi o dokonywanie kompromisów podczas podejmowania decyzji, tak jak robią to w świecie rzeczywistym, a następnie analizuje wyniki, aby podać najbardziej popularny rezultat.
Na przykład, inwestor chce otworzyć nową restaurację w mieście. Uważa, że jedna z poniższych opcji może być najbardziej opłacalna:
Typ restauracji | Gourmet Burger | Hiszpański Tapas | Tajski |
Średnia cena za głowę | $20 | $40 | $60 |
Odległość od centrum miasta | 5 mil | 2 mile | 10 mil |
Co czuje partner klienta? | To jest OK | To jest OK | Uwielbia to! |
Trade-offs | To jest tanie, dość blisko domu, partner jest z tym po prostu OK | To jest trochę droższe, ale bardzo blisko domu, partnerowi to odpowiada | Jest drogie, dość daleko od domu, ale partner je uwielbia |
Inwestor zleca badania rynku. Opcje zostają przekształcone w ankietę dla mieszkańców:
- Jaki typ restauracji preferujesz? (Gourmet burger/Spanish tapas/Thai
- Jaką kwotę byłbyś gotów wydać na głowę? ($20, $40, $60)
- Jak daleko byłbyś/byłabyś skłonny/a dojechać? (5km, 2km, 10km)
- Czy Twój partner…? (Love it, be OK with it)
Istnieje wiele możliwych kombinacji odpowiedzi – 54 w tym przypadku: (3 typy restauracji) x (3 poziomy cen) x (3 odległości) x (2 preferencje partnera). Po otrzymaniu danych z ankiety, oprogramowanie do analizy conjoint przetwarza je, aby dowiedzieć się, jak ważna jest każda opcja w podejmowaniu decyzji przez klienta, które poziomy cenowe dla każdej opcji są preferowane i o ile.
Więc, dzięki analizie conjoint, inwestor restauracyjny może odkryć, że istnieje preferencja dla drogiego hiszpańskiego baru tapas na obrzeżach miasta – coś, czego wcześniej mógł nie brać pod uwagę.
Zdobądź więcej szczegółów: Co to jest analiza conjoint? Rodzaje conjoint i kiedy ich używać
Analiza conjoint
Crosstab (tabela krzyżowa) jest używana w ilościowych badaniach rynku do analizy danych kategorycznych – czyli zmiennych, które są różne i wzajemnie się wykluczają, takich jak: 'mężczyźni' i 'kobiety', lub 'poniżej 30 roku życia' i 'powyżej 30 roku życia'.
Znany również pod takimi nazwami jak contingency table, chi-square i data tabulation, pozwala na porównanie relacji pomiędzy dwiema zmiennymi poprzez przedstawienie ich w łatwych do zrozumienia tabelach.
Metoda statystyczna zwana chi-squared może być użyta do sprawdzenia, czy zmienne w analizie krzyżowej są niezależne czy nie.
Czytaj więcej w naszym elementarzu tabel krzyżowych dla badaczy rynku
Analiza tekstu i analiza sentymentu
Analiza ludzkiego języka jest stosunkowo nową formą przetwarzania danych, która oferuje ogromne korzyści w zarządzaniu doświadczeniem. Jako część pakietu Stats iQ, TextiQ firmy Qualtrics wykorzystuje uczenie maszynowe i przetwarzanie języka naturalnego do analizy i kategoryzacji danych pochodzących z opinii tekstowych, przypisując pozytywny, negatywny lub neutralny sentyment do wiadomości i recenzji klientów.
Mając dane z analizy tekstowej, można następnie zastosować narzędzia statystyczne do analizy trendów, przewidywań i identyfikacji czynników powodujących pozytywne zmiany.
Odkryj analizę sentymentu z Qualtrics TextiQ