Definizione del metodo di regressione dei minimi quadrati
Un metodo di regressione dei minimi quadrati è una forma di analisi di regressione che stabilisce la relazione tra la variabile dipendente e indipendente insieme a una linea lineare. Questa linea viene definita "linea di migliore adattamento".
L'analisi di regressione è un metodo statistico con l'aiuto del quale è possibile stimare o prevedere i valori sconosciuti di una variabile dai valori noti di un'altra variabile. La variabile utilizzata per prevedere l'interesse variabile è chiamata variabile indipendente o esplicativa e la variabile che viene prevista è chiamata variabile dipendente o spiegata.
Consideriamo due variabili, x & y. Questi sono tracciati su un grafico con valori di x sui valori dell'asse x di y sull'asse y. Questi valori sono rappresentati dai punti nel grafico sottostante. Una linea retta viene tracciata attraverso i punti, indicata come la linea di migliore adattamento.
![](https://cdn.know-base.net/3053857/least_squares_regression_-_how_to_create_line_of_best_fit_.png.webp)
L'obiettivo della regressione ai minimi quadrati è garantire che la linea tracciata attraverso l'insieme di valori fornito stabilisca la relazione più stretta tra i valori.
Formula di regressione dei minimi quadrati
La linea di regressione con il metodo dei minimi quadrati viene calcolata utilizzando la seguente formula:
ŷ = a + bx![](https://cdn.know-base.net/3053857/least_squares_regression_-_how_to_create_line_of_best_fit_.jpg.webp)
Dove,
- ŷ = variabile dipendente
- x = variabile indipendente
- a = intercetta y
- b = pendenza della linea
La pendenza della linea b viene calcolata utilizzando la seguente formula:
![](https://cdn.know-base.net/3053857/least_squares_regression_-_how_to_create_line_of_best_fit__2.png.webp)
O
![](https://cdn.know-base.net/3053857/least_squares_regression_-_how_to_create_line_of_best_fit__3.png.webp)
Intercetta Y, "a" viene calcolato utilizzando la seguente formula:
![](https://cdn.know-base.net/3053857/least_squares_regression_-_how_to_create_line_of_best_fit__4.png.webp)
Linea di adattamento migliore nella regressione dei minimi quadrati
La linea di adattamento migliore è una linea retta tracciata attraverso una dispersione di punti dati che rappresenta al meglio la relazione tra di loro.
Consideriamo il grafico seguente in cui un insieme di dati è tracciato lungo gli assi xey. Questi punti dati sono rappresentati utilizzando i punti blu. Tre linee vengono tracciate attraverso questi punti: una verde, una rossa e una blu. La linea verde passa per un singolo punto e la linea rossa passa per tre punti dati. Tuttavia, la linea blu passa attraverso quattro punti dati e la distanza tra i punti residui e la linea blu è minima rispetto alle altre due linee.
![](https://cdn.know-base.net/3053857/least_squares_regression_-_how_to_create_line_of_best_fit__5.png.webp)
Nel grafico sopra, la linea blu rappresenta la linea di migliore adattamento in quanto si trova più vicina a tutti i valori e la distanza tra i punti al di fuori della linea alla linea è minima (cioè, la distanza tra i residui e la linea di migliore adattamento - dette anche somme dei quadrati dei residui). Nelle altre due linee, quella arancione e quella verde, la distanza tra i residui e le linee è maggiore rispetto alla linea blu.
Il metodo dei minimi quadrati fornisce la relazione più stretta tra le variabili dipendenti e indipendenti riducendo al minimo la distanza tra i residui e la linea di adattamento migliore, ovvero la somma dei quadrati dei residui è minima con questo approccio. Da qui il termine "minimi quadrati".
Esempi di linea di regressione dei minimi quadrati
Applichiamo queste formule nella domanda seguente:
Esempio 1
I dettagli relativi all'esperienza dei tecnici in un'azienda (in diversi anni) e la loro valutazione delle prestazioni sono forniti nella tabella seguente. Utilizzando questi valori, stimare la valutazione delle prestazioni di un tecnico con 20 anni di esperienza.
Esperienza di tecnico (in anni) | valutazione delle prestazioni |
16 | 87 |
12 | 88 |
18 | 89 |
4 | 68 |
3 | 78 |
10 | 80 |
5 | 75 |
12 | 83 |
Soluzione -
Per calcolare prima i minimi quadrati calcoleremo l'intercetta Y (a) e la pendenza di una linea (b) come segue:
![](https://cdn.know-base.net/3053857/least_squares_regression_-_how_to_create_line_of_best_fit__6.png.webp)
La pendenza della linea (b)
![](https://cdn.know-base.net/3053857/least_squares_regression_-_how_to_create_line_of_best_fit__7.png.webp)
- b = 6727 - ((80 * 648) / 8) / 1018 - ((80) 2 /8)
- = 247/218
- = 1,13
Intercetta Y (a)
![](https://cdn.know-base.net/3053857/least_squares_regression_-_how_to_create_line_of_best_fit__8.png.webp)
- a = 648 - (1,13) (80) / 8
- = 69,7
La linea di regressione viene calcolata come segue:
![](https://cdn.know-base.net/3053857/least_squares_regression_-_how_to_create_line_of_best_fit__9.png.webp)
Sostituendo 20 al valore di x nella formula,
- ŷ = a + bx
- ŷ = 69,7 + (1,13) (20)
- ŷ = 92,3
La valutazione delle prestazioni per un tecnico con 20 anni di esperienza è stimata in 92,3.
Esempio n. 2
Equazione di regressione dei minimi quadrati con Excel
L'equazione di regressione dei minimi quadrati può essere calcolata utilizzando Excel nei seguenti passaggi:
- Inserisci la tabella dei dati in Excel.
![](https://cdn.know-base.net/3053857/least_squares_regression_-_how_to_create_line_of_best_fit__10.png.webp)
- Inserisci un grafico a dispersione utilizzando i punti dati.
![](https://cdn.know-base.net/3053857/least_squares_regression_-_how_to_create_line_of_best_fit__11.png.webp)
- Inserisci una linea di tendenza all'interno del grafico a dispersione.
![](https://cdn.know-base.net/3053857/least_squares_regression_-_how_to_create_line_of_best_fit__12.png.webp)
- Sotto le opzioni della linea di tendenza: seleziona la linea di tendenza lineare e seleziona Visualizza equazione sul grafico.
![](https://cdn.know-base.net/3053857/least_squares_regression_-_how_to_create_line_of_best_fit__13.png.webp)
- L'equazione di regressione dei minimi quadrati per il dato insieme di dati Excel viene visualizzata sul grafico.
![](https://cdn.know-base.net/3053857/least_squares_regression_-_how_to_create_line_of_best_fit__14.png.webp)
Pertanto, viene calcolata l'equazione di regressione dei minimi quadrati per il dato insieme di dati Excel. Utilizzando l'equazione, è possibile effettuare previsioni e analisi delle tendenze. Gli strumenti di Excel forniscono anche calcoli di regressione dettagliati.
Vantaggi
- Il metodo dei minimi quadrati di analisi di regressione è più adatto per i modelli di previsione e l'analisi delle tendenze. È utilizzato al meglio nei settori dell'economia, della finanza e dei mercati azionari in cui il valore di qualsiasi variabile futura è previsto con l'aiuto delle variabili esistenti e la relazione tra le stesse.
- Il metodo dei minimi quadrati fornisce la relazione più stretta tra le variabili. La differenza tra le somme dei quadrati dei residui e la linea di migliore adattamento è minima con questo metodo.
- Il meccanismo di calcolo è semplice e facile da applicare.
Svantaggi
- Il metodo dei minimi quadrati si basa sullo stabilire la relazione più stretta tra un dato insieme di variabili. Il meccanismo di calcolo è sensibile ai dati e, in caso di valori anomali (dati eccezionali), i risultati possono tendere ad influire maggiormente.
- Questo tipo di calcolo è più adatto per i modelli lineari. Per le equazioni non lineari, vengono applicati meccanismi di calcolo più esaustivi.
Conclusione
Il metodo dei minimi quadrati è uno dei metodi più comunemente utilizzati per i modelli di previsione e l'analisi delle tendenze. Se calcolato in modo appropriato, offre i migliori risultati.