Regressione (significato, tipi) - Cos'è l'analisi di regressione?

Cos'è la regressione?

L'analisi di regressione è una misurazione basata su statistiche utilizzata nella finanza, negli investimenti, ecc., Che mira a stabilire una relazione tra una variabile dipendente e altre serie di variabili indipendenti e l'obiettivo principale è determinare la forza della relazione di cui sopra.

Spiegazioni

  • Per spiegare l'analisi di regressione in un termine laico, supponiamo che un responsabile vendite di un'azienda stia cercando di prevedere le vendite del mese successivo. Numerosi sono i fattori coinvolti che guidano le vendite del prodotto, a partire dalle condizioni meteorologiche fino alla nuova strategia, festival e cambiamento nello stile di vita dei consumatori del concorrente.
  • Questo è un metodo per allineare i diversi fattori che influenzano la vendita, che sono quelli che hanno l'impatto maggiore. Può aiutare a rispondere a molte domande come quali sono i fattori più importanti, quali fattori sono meno importanti, qual è la relazione tra questi fattori e, soprattutto, qual è la certezza di questi fattori.
  • Questi fattori sono chiamati variabili. Il fattore principale che stiamo cercando di prevedere è chiamato variabile dipendente, e gli altri fattori che hanno un impatto sulla variabile dipendente sono chiamati variabili indipendenti.

Formula

L'analisi di regressione lineare semplice in Excel può essere espressa come la formula seguente e misura la relazione tra una variabile dipendente e una variabile indipendente.

Y = a + bX + ϵ

Qui:

  • Y - Variabile dipendente
  • X - Variabile indipendente (esplicativa)
  • a - Intercetta
  • b - Pendenza
  • ϵ - Residuo (errore)

Come interpretare l'analisi di regressione?

Questo può essere interpretato assumendo uno scenario semplice. Qui stiamo prendendo il rapporto tra i prezzi della collezione di antiquariato all'asta e la durata della sua età. Più un oggetto antico invecchia, più il prezzo prende. Supponendo di aver impostato i dati per gli ultimi 50 articoli che sono stati messi all'asta, possiamo prevedere quali saranno i futuri prezzi d'asta in base all'età dell'articolo. Usando questi dati, possiamo costruire un'equazione di regressione.

La formula di regressione che può stabilire una relazione tra età e prezzo è la seguente:

y = β0 + β1 x + errore
  • Qui il fattore dipendente è Y. Y rappresenta il prezzo di ogni oggetto da mettere all'asta, mentre il fattore indipendente è X, che determina l'età.
  • I parametri β0 e β1 sono parametri non noti e verranno stimati dall'equazione.
  • β0 è una costante utilizzata per definire la linea di tendenza lineare che intercetta l'asse Y.
  • β1 è una costante che dimostra l'ampiezza della variazione del valore della variabile dipendente come funzione correlata alla variazione implicita nelle variabili indipendenti.
  • Questo è fondamentalmente chiamato la pendenza dell'equazione. Quando la pendenza è un liner, significa che esiste una relazione proporzionale tra età e prezzo, e dove la pendenza è inversa, significa che la relazione è indirettamente proporzionale.
  • L' errore può essere definito come il rumore o la variazione della variabile target ed è di natura casuale.

Esempi reali di analisi della regressione

Supponiamo di dover stabilire una relazione tra le vendite avvenute e l'importo speso in pubblicità relativa a un prodotto.

In genere possiamo osservare una relazione positiva tra la quantità di vendite e l'importo speso in pubblicità. Allineando una semplice equazione di regressione lineare, abbiamo:

Y = a + bX

Supponiamo di ottenere il valore come

Y = 500 + 30X

Interpretazione dei risultati:

La pendenza prevista di 30 ci aiuta a trarre una conclusione che le vendite medie aumentano di $ 30 all'anno all'aumentare della spesa per la pubblicità.

Tipi di analisi di regressione

# 1 - Lineare

Questo può essere espresso come la formula seguente e misura la relazione tra una variabile dipendente e una variabile indipendente.

# 2 - Polinomio

In questo metodo, l'analisi viene utilizzata per misurare la relazione tra singoli fattori dipendenti e più variabili indipendenti.

# 3 - Logistica

Qui il fattore o la variabile dipendente è di natura binaria. Le variabili indipendenti possono essere continue o binarie. Nella regressione logistica multinomiale, possiamo permetterci di avere più di due categorie mentre scegliamo la nostra variabile indipendente.

# 4 - Quantile

Questo è un concetto additivo di regressione lineare e viene utilizzato principalmente quando nei dati sono presenti valori anomali e asimmetria.

# 5 - Rete elastica

Ciò è utile quando si gestiscono variabili indipendenti correlate molto elevate.

# 6 - Regressione dei componenti principali (PCR)

Questa è una tecnica che è applicabile quando ci sono troppe variabili indipendenti o esistono multicollinearità nei dati

# 7 - Minimi quadrati parziali (PLS)

È un metodo opposto alla componente principale in cui abbiamo variabili indipendenti altamente correlate. È applicabile anche quando ci sono molte variabili indipendenti.

# 8 - Supporto vettoriale

Ciò può fornire una soluzione ai modelli lineari e non lineari. Utilizza funzioni del kernel non lineari per trovare la soluzione ottimale per i modelli non lineari.

# 9 - Ordinale

È applicabile alla previsione dei valori classificati. Fondamentalmente, è adatto quando la variabile dipendente è di natura ordinale

# 10 - Poisson

Questo è applicabile quando la variabile dipendente ha dati di conteggio.

# 11 - Binomiale negativo

È anche applicabile per gestire i dati di conteggio solo che la regressione binomiale negativa non presuppone la distribuzione del conteggio con varianza uguale alla sua media, mentre la regressione di Poisson assume la varianza uguale alla sua media.

# 12 - Quasi Poisson

È un sostituto della regressione binomiale negativa. È applicabile anche ai dati di conteggio dispersi. La varianza di un modello quasi-Poisson è una funzione lineare della media, mentre la varianza di un modello binomiale negativo è una funzione quadratica della media.

# 13 - Cox

Viene maggiormente utilizzato per analizzare i dati relativi al tempo all'evento.

Differenza tra regressione e correlazione

  • La regressione stabilisce la relazione tra una varianza indipendente e una variabile dipendente in cui entrambe le variabili sono diverse, mentre la correlazione determina l'associazione o la dipendenza di due variabili in cui non vi è differenza tra entrambe le variabili.
  • L'obiettivo principale della regressione è creare una linea di migliore adattamento e la stima di una variabile viene eseguita sulla base di altre, mentre in correlazione dimostra la relazione lineare tra due variabili.
  • In questo, stimiamo l'entità di un certo cambiamento nella variabile riconosciuta (X) sulla variabile stimata (Y), mentre, in correlazione, il coefficiente viene utilizzato per misurare fino a che punto le due variabili si muovono insieme.
  • È un processo di stima della grandezza di variabili indipendenti casuali in base alla grandezza di una variabile dipendente statica, mentre la correlazione ci aiuta a decidere un valore particolare per esprimere l'interdipendenza tra entrambe le variabili.

Conclusione

  • L'analisi di regressione utilizza principalmente i dati per stabilire una relazione tra due o più variabili. Qui si presume che le relazioni esistenti nel passato si rifletteranno anche nel presente o nel futuro. Pochi considerano questo come un intervallo di tempo tra passato e presente / futuro.
  • Tuttavia, è una tecnica di previsione e stima ampiamente utilizzata. Sebbene coinvolga la matematica, che molti utenti potrebbero trovare difficile, la tecnica è relativamente facile da usare, specialmente quando è disponibile un modello.

Articoli interessanti...