Regressione dei minimi quadrati: come creare una linea di adattamento migliore?

Definizione del metodo di regressione dei minimi quadrati

Un metodo di regressione dei minimi quadrati è una forma di analisi di regressione che stabilisce la relazione tra la variabile dipendente e indipendente insieme a una linea lineare. Questa linea viene definita "linea di migliore adattamento".

L'analisi di regressione è un metodo statistico con l'aiuto del quale è possibile stimare o prevedere i valori sconosciuti di una variabile dai valori noti di un'altra variabile. La variabile utilizzata per prevedere l'interesse variabile è chiamata variabile indipendente o esplicativa e la variabile che viene prevista è chiamata variabile dipendente o spiegata.

Consideriamo due variabili, x & y. Questi sono tracciati su un grafico con valori di x sui valori dell'asse x di y sull'asse y. Questi valori sono rappresentati dai punti nel grafico sottostante. Una linea retta viene tracciata attraverso i punti, indicata come la linea di migliore adattamento.

L'obiettivo della regressione ai minimi quadrati è garantire che la linea tracciata attraverso l'insieme di valori fornito stabilisca la relazione più stretta tra i valori.

Formula di regressione dei minimi quadrati

La linea di regressione con il metodo dei minimi quadrati viene calcolata utilizzando la seguente formula:

ŷ = a + bx

Dove,

  • ŷ = variabile dipendente
  • x = variabile indipendente
  • a = intercetta y
  • b = pendenza della linea

La pendenza della linea b viene calcolata utilizzando la seguente formula:

O

Intercetta Y, "a" viene calcolato utilizzando la seguente formula:

Linea di adattamento migliore nella regressione dei minimi quadrati

La linea di adattamento migliore è una linea retta tracciata attraverso una dispersione di punti dati che rappresenta al meglio la relazione tra di loro.

Consideriamo il grafico seguente in cui un insieme di dati è tracciato lungo gli assi xey. Questi punti dati sono rappresentati utilizzando i punti blu. Tre linee vengono tracciate attraverso questi punti: una verde, una rossa e una blu. La linea verde passa per un singolo punto e la linea rossa passa per tre punti dati. Tuttavia, la linea blu passa attraverso quattro punti dati e la distanza tra i punti residui e la linea blu è minima rispetto alle altre due linee.

Nel grafico sopra, la linea blu rappresenta la linea di migliore adattamento in quanto si trova più vicina a tutti i valori e la distanza tra i punti al di fuori della linea alla linea è minima (cioè, la distanza tra i residui e la linea di migliore adattamento - dette anche somme dei quadrati dei residui). Nelle altre due linee, quella arancione e quella verde, la distanza tra i residui e le linee è maggiore rispetto alla linea blu.

Il metodo dei minimi quadrati fornisce la relazione più stretta tra le variabili dipendenti e indipendenti riducendo al minimo la distanza tra i residui e la linea di adattamento migliore, ovvero la somma dei quadrati dei residui è minima con questo approccio. Da qui il termine "minimi quadrati".

Esempi di linea di regressione dei minimi quadrati

Applichiamo queste formule nella domanda seguente:

Esempio 1

I dettagli relativi all'esperienza dei tecnici in un'azienda (in diversi anni) e la loro valutazione delle prestazioni sono forniti nella tabella seguente. Utilizzando questi valori, stimare la valutazione delle prestazioni di un tecnico con 20 anni di esperienza.

Esperienza di tecnico (in anni) valutazione delle prestazioni
16 87
12 88
18 89
4 68
3 78
10 80
5 75
12 83

Soluzione -

Per calcolare prima i minimi quadrati calcoleremo l'intercetta Y (a) e la pendenza di una linea (b) come segue:

La pendenza della linea (b)

  • b = 6727 - ((80 * 648) / 8) / 1018 - ((80) 2 /8)
  • = 247/218
  • = 1,13

Intercetta Y (a)

  • a = 648 - (1,13) (80) / 8
  • = 69,7

La linea di regressione viene calcolata come segue:

Sostituendo 20 al valore di x nella formula,

  • ŷ = a + bx
  • ŷ = 69,7 + (1,13) (20)
  • ŷ = 92,3

La valutazione delle prestazioni per un tecnico con 20 anni di esperienza è stimata in 92,3.

Esempio n. 2

Equazione di regressione dei minimi quadrati con Excel

L'equazione di regressione dei minimi quadrati può essere calcolata utilizzando Excel nei seguenti passaggi:

  • Inserisci la tabella dei dati in Excel.
  • Inserisci un grafico a dispersione utilizzando i punti dati.
  • Inserisci una linea di tendenza all'interno del grafico a dispersione.
  • Sotto le opzioni della linea di tendenza: seleziona la linea di tendenza lineare e seleziona Visualizza equazione sul grafico.
  • L'equazione di regressione dei minimi quadrati per il dato insieme di dati Excel viene visualizzata sul grafico.

Pertanto, viene calcolata l'equazione di regressione dei minimi quadrati per il dato insieme di dati Excel. Utilizzando l'equazione, è possibile effettuare previsioni e analisi delle tendenze. Gli strumenti di Excel forniscono anche calcoli di regressione dettagliati.

Vantaggi

  • Il metodo dei minimi quadrati di analisi di regressione è più adatto per i modelli di previsione e l'analisi delle tendenze. È utilizzato al meglio nei settori dell'economia, della finanza e dei mercati azionari in cui il valore di qualsiasi variabile futura è previsto con l'aiuto delle variabili esistenti e la relazione tra le stesse.
  • Il metodo dei minimi quadrati fornisce la relazione più stretta tra le variabili. La differenza tra le somme dei quadrati dei residui e la linea di migliore adattamento è minima con questo metodo.
  • Il meccanismo di calcolo è semplice e facile da applicare.

Svantaggi

  • Il metodo dei minimi quadrati si basa sullo stabilire la relazione più stretta tra un dato insieme di variabili. Il meccanismo di calcolo è sensibile ai dati e, in caso di valori anomali (dati eccezionali), i risultati possono tendere ad influire maggiormente.
  • Questo tipo di calcolo è più adatto per i modelli lineari. Per le equazioni non lineari, vengono applicati meccanismi di calcolo più esaustivi.

Conclusione

Il metodo dei minimi quadrati è uno dei metodi più comunemente utilizzati per i modelli di previsione e l'analisi delle tendenze. Se calcolato in modo appropriato, offre i migliori risultati.

Articoli interessanti...