Definizione del coefficiente di correlazione di Pearson
Il coefficiente di correlazione di Pearson, noto anche come test statistico di Pearson R, misura la forza tra le diverse variabili e le loro relazioni. Ogni volta che viene condotto un test statistico tra le due variabili, è sempre una buona idea che la persona che esegue l'analisi calcoli il valore del coefficiente di correlazione per sapere quanto sia forte la relazione tra le due variabili.
Il coefficiente di correlazione di Pearson restituisce un valore compreso tra -1 e 1. L'interpretazione del coefficiente di correlazione è la seguente:
- Se il coefficiente di correlazione è -1, indica una forte relazione negativa. Implica una perfetta relazione negativa tra le variabili.
- Se il coefficiente di correlazione è 0, non indica alcuna relazione.
- Se il coefficiente di correlazione è 1, indica una forte relazione positiva. Implica una perfetta relazione positiva tra le variabili.
Un valore assoluto più alto del coefficiente di correlazione indica una relazione più forte tra le variabili. Pertanto, un coefficiente di correlazione di 0,78 indica una correlazione positiva più forte rispetto a un valore di, diciamo 0,36. Allo stesso modo, un coefficiente di correlazione di -0,87 indica una correlazione negativa più forte rispetto a un coefficiente di correlazione di diciamo -0,40.

In altre parole, se il valore è nell'intervallo positivo, allora mostra che la relazione tra le variabili è correlata positivamente, ed entrambi i valori diminuiscono o aumentano insieme. D'altra parte, se il valore è nell'intervallo negativo, mostra che la relazione tra le variabili è correlata negativamente ed entrambi i valori andranno nella direzione opposta.
Formula del coefficiente di correlazione di Pearson
La formula del coefficiente di correlazione di Pearson è la seguente,


Dove,
- r = coefficiente di Pearson
- n = numero delle coppie del calcio
- ∑xy = somma dei prodotti degli stock abbinati
- ∑x = somma degli x punteggi
- ∑y = somma dei punteggi y
- ∑x 2 = somma dei quadrati x punteggi
- ∑y 2 = somma dei punteggi y al quadrato
Spiegazione
Passaggio 1: scopri il numero di coppie di variabili, che è indicato da n. Supponiamo che x sia composto da 3 variabili - 6, 8, 10. Supponiamo che y sia composto da 3 variabili corrispondenti 12, 10, 20.
Passaggio 2: elenca le variabili in due colonne.

Passaggio 3: trova il prodotto di x e y nella terza colonna.

Passaggio 4: trova la somma dei valori di tutte le variabili x e di tutte le variabili y. Scrivi i risultati nella parte inferiore del 1 ° e 2 ° colonna. Scrivi la somma di x * y nella terza colonna.

Passaggio 5: trova x 2 ey 2 nella quarta e quinta colonna e la loro somma in fondo alle colonne.

Passaggio 6: inserire i valori trovati sopra nella formula e risolverlo.
r = 3 * 352-24 * 42 / √ (3 * 200-24 2 ) * (3 * 644-42 2 )
= 0,7559
Esempio di coefficiente di correlazione di Pearson R
Esempio 1
In questo esempio con l'ausilio dei seguenti dettagli nella tabella delle 6 persone di diversa età e diverso peso riportato di seguito per il calcolo del valore del Pearson R
Sr No | Età (x) | Peso (y) |
1 | 40 | 78 |
2 | 21 | 70 |
3 | 25 | 60 |
4 | 31 | 55 |
5 | 38 | 80 |
6 | 47 | 66 |
Soluzione:
Per il calcolo del coefficiente di correlazione di Pearson, calcoleremo prima i seguenti valori,

Qui il numero totale di persone è 6 quindi, n = 6
Ora il calcolo della Pearson R è il seguente,

- r = (n (∑xy) - (∑x) (∑y)) / (√ (n ∑x 2 - (∑x) 2 ) (n ∑y 2 - (∑y) 2 )
- r = (6 * (13937) - (202) (409)) / (√ (6 * 7280 - (202) 2 ) * (6 * 28365- (409) 2 )
- r = (6 * (13937) - (202) * (409)) / (√ (6 * 7280 - (202) 2 ) * (6 * 28365- (409) 2 )
- r = (83622- 82618) / (√ (43680-40804) * (170190-167281)
- r = 1004 / (√ (2876) * (2909)
- r = 1004 / (√ 8366284)
- r = 1004 / 2892,452938
- r = 0,35
Pertanto il valore del coefficiente di correlazione di Pearson è 0,35
Esempio n. 2
Ci sono 2 azioni - A e B. I prezzi delle azioni in determinati giorni sono i seguenti:
Stock A (x) | Stcok B (y) |
45 | 9 |
50 | 8 |
53 | 8 |
58 | 7 |
60 | 5 |
Scopri il coefficiente di correlazione di Pearson dai dati sopra.
Soluzione:
Innanzitutto, calcoleremo i seguenti valori.

Il calcolo del coefficiente di Pearson è il seguente,

- r = (5 * 1935-266 * 37) / ((5 * 14298- (266) 2) * (5 * 283- (37) 2)) 0,5
- = -0,9088
Pertanto il coefficiente di correlazione di Pearson tra i due titoli è -0,9088.
Vantaggi
- Aiuta a sapere quanto sia forte la relazione tra le due variabili. Non solo la presenza o l'assenza della correlazione tra le due variabili viene indicata utilizzando il coefficiente di correlazione di Pearson, ma determina anche la misura esatta in cui tali variabili sono correlate.
- Utilizzando questo metodo, è possibile accertare la direzione della correlazione, ovvero se la correlazione tra due variabili è negativa o positiva.
Svantaggi
- Il coefficiente di correlazione di Pearson R non è sufficiente per stabilire la differenza tra le variabili dipendenti e le variabili indipendenti poiché il coefficiente di correlazione tra le variabili è simmetrico. Ad esempio, se una persona sta cercando di conoscere la correlazione tra lo stress elevato e la pressione sanguigna, allora si potrebbe trovare il valore alto della correlazione, che mostra che lo stress elevato causa la pressione sanguigna. Ora, se la variabile viene cambiata, anche il risultato, in quel caso, sarà lo stesso, il che mostra che lo stress è causato dalla pressione sanguigna, il che non ha senso. Pertanto, il ricercatore dovrebbe essere a conoscenza dei dati che sta utilizzando per condurre l'analisi.
- Utilizzando questo metodo, non è possibile ottenere le informazioni sulla pendenza della linea poiché indica solo se esiste o meno una relazione tra le due variabili.
- È probabile che il coefficiente di correlazione di Pearson possa essere interpretato in modo errato, soprattutto nel caso di dati omogenei.
- Se confrontato con gli altri metodi di calcolo, questo metodo richiede molto tempo per arrivare ai risultati.
Punti importanti
- I valori possono variare dal valore +1 al valore -1, dove +1 indica la perfetta relazione positiva tra le variabili considerate, -1 indica la perfetta relazione negativa tra le variabili considerate, e un valore 0 indica che nessuna relazione esiste tra le variabili considerate.
- È indipendente dall'unità di misura delle variabili. Ad esempio, se l'unità di misura di una variabile è in anni mentre l'unità di misura della seconda variabile è in chilogrammi, anche allora il valore di questo coefficiente non cambia.
- Il coefficiente di correlazione tra le variabili è simmetrico, il che significa che il valore del coefficiente di correlazione tra Y e X o X e Y rimarrà lo stesso.
Conclusione
Il coefficiente di correlazione di Pearson è il tipo di coefficiente di correlazione che rappresenta la relazione tra le due variabili, misurate sullo stesso intervallo o sulla stessa scala di rapporto. Misura la forza della relazione tra le due variabili continue.
Non solo afferma la presenza o l'assenza della correlazione tra le due variabili, ma determina anche la misura esatta in cui tali variabili sono correlate. È indipendente dall'unità di misura delle variabili dove i valori del coefficiente di correlazione possono variare dal valore +1 al valore -1. Tuttavia, non è sufficiente dire la differenza tra le variabili dipendenti e le variabili indipendenti.