Formula per calcolare la correlazione
La correlazione è una misura statistica tra due variabili ed è definita come il cambiamento di quantità in una variabile corrispondente al cambiamento in un'altra ed è calcolata sommando il prodotto della somma della prima variabile meno la media della prima variabile nella somma della seconda variabile meno la media della seconda variabile divisa per intero sotto la radice del prodotto del quadrato della prima variabile meno la media della prima variabile nella somma dei quadrati della seconda variabile meno la media della seconda variabile.
Il valore di correlazione è limitato tra -1 e +1 e può essere interpretato come segue:
- -1: se è -1, le variabili sono note come perfettamente correlate negativamente. Ciò significa che se una variabile si muove in una direzione, un'altra si muove nella direzione opposta.
- 0: Ciò significa che la variabile non ha alcuna correlazione.
- +1: se è +1, le variabili sono note come perfettamente correlate positivamente. Entrambe le variabili si stanno muovendo in direzioni positive.
Se abbiamo 2 variabili x e y, il coefficiente di correlazione tra 2 variabili può essere trovato come:
Coefficiente di correlazione = ∑ (x (i) - media (x)) * (y (i) -mea (y)) / √ (∑ (x (i) -meana (x)) 2 * ∑ (y (i) -mean (y)) 2 )
Dove,
- x (i) = valore di x nel campione
- Media (x) = media di tutti i valori di x
- y (i) = valore di y nel campione
- Media (y) = media di tutti i valori di y
Esempi
È facile calcolare la correlazione in Excel. La sintassi della funzione utilizzata è la seguente:
Coefficiente di correlazione = CORREL (array1, array2)
Esempio 1
Prendiamo lo stesso esempio che abbiamo preso sopra per calcolare la correlazione usando Excel.
Soluzione:
Di seguito sono riportati i valori di x e y:

Il calcolo è il seguente.

Base excel formula = CORREL (matrice (x), matrice (y))

Coefficiente = +0,95
Poiché questo coefficiente è vicino a +1, quindi xey sono altamente correlati positivamente.
Esempio n. 2
La correlazione è utile principalmente per analizzare il prezzo delle azioni delle società e creare un portafoglio azionario basato su questo.
Cerchiamo di scoprire la correlazione del titolo Apple con l'indice Nasdaq sulla base dell'andamento del titolo dell'ultimo anno. Apple è una multinazionale con sede negli Stati Uniti specializzata in prodotti IT come iPod, iPad, Mac, ecc.
Soluzione:
Di seguito è riportato il rendimento mensile delle azioni Apple e Nasdaq per l'ultimo anno:

Inseriamo ora i valori -
Coefficiente di correlazione = ∑ (x (i) - media (x)). (Y (i) - media (y)) / √ ∑ (x (i) - media (x)) 2 ∑ (y (i) - media (y)) 2

Correlazione tra Apple e Nasdaq = 0,039 / (√0,0039)

Coefficiente = 0,62
Poiché la correlazione tra Apple e Nasdaq è positiva, quindi Apple è positivamente correlata con Nasdaq.
Esempio n. 3
Vediamo ora la correlazione tra Walmart e l'indice Nasdaq sulla base dell'andamento del titolo dell'ultimo anno. Walmart è una società con sede negli Stati Uniti che possiede una catena di supermercati al dettaglio.
Soluzione:
Di seguito è riportato il rendimento mensile tra Walmart e Nasdaq nell'ultimo anno:

Inseriamo ora i valori nella formula -
Coefficiente di correlazione = ∑ (x (i) - media (x)). (Y (i) - media (y)) / √ ∑ (x (i) - media (x)) 2 ∑ (y (i) - media (y)) 2
Pertanto, il calcolo è il seguente,

Correlazione tra Walmart e Nasdaq = 0,0032 / (√0,0346 * 0,0219)

Coefficiente = 0,12
Possiamo vedere che Walmart e Nasdaq sono anche correlati positivamente ma non così tanto rispetto alla correlazione di Apple con Nasdaq.
Rilevanza e utilizzo
Un coefficiente di correlazione è utile per stabilire la relazione lineare tra due variabili. Misura come si muoverà una variabile rispetto al movimento di un'altra variabile. L'uso pratico di questo coefficiente è scoprire la relazione tra il movimento del prezzo delle azioni e il movimento generale del mercato. Alla base di questa analisi, un analista di borsa, includerà la percentuale di azioni per creare un portafoglio ottimale con il minimo rischio. Inoltre, è utile nella scienza dei dati scoprire la relazione tra 2 variabili.
Inoltre, il coefficiente di correlazione è molto utilizzato per studiare la validità dei costrutti dei dati nell'analisi fattoriale. È molto utilizzato nell'analisi di regressione per prevedere i valori delle variabili dipendenti in base alla relazione tra variabili dipendenti e indipendenti. Questa equazione è molto utile nell'analisi quantitativa per ottenere la natura della relazione tra varie variabili. Alla base di questa relazione, se una variabile non è correlata ad altre variabili, allora può essere eliminata dall'elenco.