Correlazione in statistica: L’analisi di correlazione spiegata
Contenuti:
Che cos’è la correlazione?
Il coefficiente di correlazione
Correlazione in Excel
Definizione
La correlazione è usata per testare le relazioni tra variabili quantitative o categoriche. In altre parole, è una misura di come le cose sono correlate. Lo studio di come le variabili sono correlate è chiamato analisi di correlazione.
Alcuni esempi di dati che hanno un’alta correlazione:
- Il tuo apporto calorico e il tuo peso.
- Il tuo colore degli occhi e quello dei tuoi parenti.
- La quantità di tempo che studiate e la vostra GPA.
Alcuni esempi di dati che hanno una bassa correlazione (o nessuna):
- Le vostre preferenze sessuali e il tipo di cereali che mangiate.
- Il nome di un cane e il tipo di biscotto per cani che preferisce.
- Il costo di un autolavaggio e quanto tempo ci vuole per comprare una bibita dentro la stazione.
Le correlazioni sono utili perché se si può scoprire quale relazione hanno le variabili, si possono fare previsioni sul comportamento futuro. Sapere cosa riserva il futuro è molto importante nelle scienze sociali come il governo e la sanità. Anche le imprese usano queste statistiche per i bilanci e i piani aziendali.
Il coefficiente di correlazione
Un coefficiente di correlazione è un modo per dare un valore alla relazione. I coefficienti di correlazione hanno un valore compreso tra -1 e 1. Uno “0” significa che non c’è alcuna relazione tra le variabili, mentre -1 o 1 significa che c’è una perfetta correlazione negativa o positiva (la correlazione negativa o positiva qui si riferisce al tipo di grafico che la relazione produrrà).
Grafici che mostrano una correlazione di -1, 0 e +1
Tipi
Il coefficiente di correlazione più comune è il coefficiente di correlazione di Pearson. È usato per testare le relazioni lineari tra i dati. Nelle statistiche AP o elementari, il Pearson è probabilmente l’unico con cui lavorerai. Tuttavia, potreste incontrarne altri, a seconda del tipo di dati con cui state lavorando. Per esempio, il coefficiente lambda di Goodman e Kruskal è un coefficiente abbastanza comune. Può essere simmetrico, dove non è necessario specificare quale variabile è dipendente, e asimmetrico dove la variabile dipendente è specificata.
Correlazione in Excel
Trovare i coefficienti di correlazione di Pearson a mano è brutto e comporta un sacco di lunga matematica. Tuttavia, Excel può fare questi calcoli per voi in una frazione di secondo. Avete due opzioni in Excel (2013 e successivi): La funzione CORREL o il Data Analysis Toolpak.
Se avete familiarità con l’inserimento di funzioni in Excel potete inserire il comando CORREL:
=CORREL(array 1, array 2)
Ad esempio, =CORREL(A2:A6,B2:B6)
Tuttavia, Data Analysis Toolpak è molto più semplice in generale, perché non dovete ricordare (o cercare) una serie di funzioni; sono tutte semplicemente elencate nell’elenco Data Analysis. Se Data Analysis non appare all’estrema destra della scheda dati, assicuratevi di aver caricato il Toolpak Data Analysis. Data Analysis Toolpak è un add-in opzionale per Excel che ti dà accesso a molte funzioni, tra cui:
- Correlazione,
- Regressione lineare,
- Istogrammi,
- T test,
- Z test
- ANOVA one way e two way test.
Step 1: Scrivi i tuoi dati in un foglio di lavoro di Excel. Il formato migliore è due colonne. Metti i tuoi valori x nella colonna A e i tuoi valori y nella colonna B.
Step 2: Clicca sulla scheda “Dati” e poi su “Analisi dei dati”.
Fase 3: Clicca su “Correlazione” e poi clicca su “OK”.
Fase 4: Digita la posizione delle tue variabili x-y nella casella Input
Range. Oppure, usa il tuo cursore per evidenziare l’area dove si trovano le tue variabili.
Step 5: Clicca sull’opzione “colonne” o “righe” per far sapere a Excel come sono disposti i tuoi dati. Nella maggior parte dei casi, cliccherai su “colonne” perché questo è il modo standard di disporre i dati in Excel.
Passo 6: Spunta l’opzione “Etichette nella prima riga” se hai intestazioni di colonna.
Passo 7: Clicca sulla casella di testo “Intervallo di uscita” e poi seleziona un’area sul foglio di lavoro dove vuoi che vada il tuo output.
Ecco fatto!
Guarda il nostro canale YouTube per altri consigli e aiuti su Excel!
Agresti A. (1990) Categorical Data Analysis. John Wiley and Sons, New York.
Dodge, Y. (2008). The Concise Encyclopedia of Statistics. Springer.
Vogt, W.P. (2005). Dictionary of Statistics & Methodology: A Nontechnical Guide for the Social Sciences. SAGE.
Wheelan, C. (2014). Statistica nuda. W. W. Norton & Azienda
Stephanie Glen. “Correlazione in Statistica: Analisi di correlazione spiegata” da StatisticsHowTo.com: Statistica elementare per il resto di noi! https://www.statisticshowto.com/probability-and-statistics/correlation-analysis/
——————————————————————————
Hai bisogno di aiuto per un compito a casa o per un test? Con Chegg Study, puoi ottenere soluzioni passo dopo passo alle tue domande da un esperto del settore. I tuoi primi 30 minuti con un tutor Chegg sono gratuiti!