Qual è il coefficiente di determinazione?
Il coefficiente di determinazione, noto anche come R quadrato, determina l'entità della varianza della variabile dipendente che può essere spiegata dalla variabile indipendente. Osservando il valore R 2 si può giudicare se l'equazione di regressione è sufficientemente buona per essere utilizzata. Più alto è il coefficiente migliore è l'equazione di regressione in quanto implica che la variabile indipendente scelta per determinare la variabile dipendente sia scelta correttamente.
Spiegazione dettagliata


Dove
- R = Correlazione
- R 2 = Coefficiente di determinazione dell'equazione di regressione
- N = Numero di osservazioni nell'equazione di regressione
- Xi = Variabile indipendente dell'equazione di regressione
- X = Media della variabile indipendente dell'equazione di regressione
- Yi = Variabile dipendente dell'equazione di regressione
- Y = Media della variabile dipendente dell'equazione di regressione
- σx = Deviazione standard della variabile indipendente
- σy = Deviazione standard della variabile dipendente
Il valore del coefficiente varia da 0 a 1, dove un valore 0 indica che la variabile indipendente non spiega la variazione della variabile dipendente e un valore 1 indica che la variabile indipendente spiega perfettamente la variazione nella variabile dipendente.
Esempi
Esempio 1
Cerchiamo di capire la formula del coefficiente di determinazione con l'aiuto di un esempio. Cerchiamo di scoprire qual è la relazione tra la distanza percorsa dal camionista e l'età del camionista. Qualcuno esegue effettivamente un'equazione di regressione per convalidare se ciò che pensa della relazione tra due variabili è convalidato anche dall'equazione di regressione. In questo particolare esempio, vedremo quale variabile è la variabile dipendente e quale variabile è la variabile indipendente.
La variabile dipendente in questa equazione di regressione è la distanza percorsa dal camionista e la variabile indipendente è l'età del camionista. Possiamo trovare la correlazione con l'aiuto della formula e del quadrato che per ottenere il coefficiente dell'equazione di regressione. Il set di dati e le variabili sono presentati nel foglio excel allegato.
Soluzione:
Di seguito vengono forniti i dati per il calcolo del coefficiente di determinazione.

Pertanto, il calcolo del coefficiente di determinazione è il seguente,

R = -424520 / √ (683696 * 81071100)
R sarà -

R = -0,057020839
R 2 sarà -

R 2 = 0,325%
Esempio n. 2
Cerchiamo di comprendere il concetto di coefficiente di determinazione con l'aiuto di un altro esempio. Cerchiamo di scoprire qual è la relazione tra l'altezza degli studenti di una classe e il voto GPA di quegli studenti. In questo particolare esempio, vedremo quale variabile è la variabile dipendente e quale variabile è la variabile indipendente.
La variabile dipendente in questa equazione di regressione è il GPA degli studenti e la variabile indipendente è l'altezza degli studenti. Possiamo trovare la correlazione con l'aiuto della formula e del quadrato per ottenere l'R 2 dell'equazione di regressione. Il set di dati e le variabili sono presentati nel foglio excel allegato.
Soluzione:
Di seguito vengono forniti i dati per il calcolo del coefficiente di determinazione.

Pertanto, il calcolo è il seguente,

R = 34,62 / √ (169204 * 3245)

R = 0,000467045

R 2 = 0,000000218
Interpretazione
Il coefficiente di determinazione è un output critico per scoprire se il set di dati è adatto o meno. Qualcuno esegue effettivamente un'analisi di regressione per verificare se ciò che pensa della relazione tra due variabili è convalidato anche dall'equazione di regressione. Maggiore è il coefficiente, migliore è l'equazione di regressione poiché implica che la variabile indipendente scelta per determinare la variabile dipendente sia scelta correttamente. Idealmente, un ricercatore cercherà il coefficiente di determinazione, che è più vicino al 100%.
Articoli consigliati
Questo articolo è stato una guida al coefficiente di determinazione. Qui impariamo come calcolare il coefficiente di determinazione usando la sua formula con esempi e un modello Excel scaricabile. Puoi saperne di più sul finanziamento dai seguenti articoli:
- Coefficiente di Gini
- Formula di regressione multipla
- Formula per coefficiente di variazione
- Formula per il coefficiente di correlazione
- Vantaggi e svantaggi del periodo di rimborso