Multicollinearità (definizione, tipi) - Primi 3 esempi con spiegazione

Cos'è la multicollinearità?

La multicollinearità è un fenomeno statistico in cui due o più variabili in un modello di regressione dipendono dalle altre variabili in modo tale che una può essere prevista linearmente dall'altra con un alto grado di precisione. È generalmente utilizzato negli studi osservazionali e meno popolare negli studi sperimentali.

Tipi di multicollinearità

Esistono quattro tipi di multicollinearità

  • # 1 - Multicollinearità perfetta - Esiste quando le variabili indipendenti nell'equazione predicono la relazione lineare perfetta.
  • # 2 - Multicollinearità elevata - Si riferisce alla relazione lineare tra due o più variabili indipendenti tra loro non perfettamente correlate.
  • # 3 - Multicollinearità strutturale - Ciò è causato dal ricercatore stesso inserendo diverse variabili indipendenti nell'equazione.
  • # 4 - Multicollineaarità basata sui dati - È causata da esperimenti mal progettati dal ricercatore.

Cause di multicollinearità

Variabili indipendenti, il cambiamento nei parametri delle variabili fa un piccolo cambiamento nelle variabili. C'è un impatto significativo sul risultato e la raccolta dei dati si riferisce al campione della popolazione selezionata presa.

Esempi di multicollinearità

Esempio 1

Supponiamo che ABC Ltd, una KPO, sia stata assunta da una società farmaceutica per fornire servizi di ricerca e analisi statistiche sulle malattie in India. Per questo, ABC ltd ha selezionato età, peso, professione, altezza e salute come parametri prima facie.

  • Nell'esempio sopra, c'è una situazione di multicollinearità poiché le variabili indipendenti selezionate per lo studio sono direttamente correlate ai risultati. Quindi sarebbe consigliabile che il ricercatore aggiustasse le variabili prima di iniziare qualsiasi progetto poiché i risultati saranno influenzati direttamente a causa delle variabili selezionate qui.

Esempio n. 2

Supponiamo che ABC Ltd sia stata incaricata da Tata Motors di comprendere che il volume delle vendite dei motori tata sarà elevato in quale categoria del mercato.

  • Nell'esempio precedente, in primo luogo, verranno finalizzate variabili indipendenti in base alle quali la ricerca deve essere completata. Può essere reddito mensile, età. Brand, la classe inferiore. Significa solo che verranno selezionati i dati, che si adatteranno a tutte queste schede per capire quante persone possono acquistare questa macchina (tata nano) senza nemmeno guardare altre auto.

Esempio n. 3

Supponiamo che ABC Ltd sia stata assunta per inviare una segnalazione per sapere quante persone sotto i 50 anni sono inclini ad attacchi di cuore. per questo i parametri sono età, sesso, anamnesi

  • Nell'esempio sopra, c'è la multicollinearità che è sorta perché la variabile indipendente "età" deve essere ottimizzata per essere sotto i 50 anni per invitare le domande dal pubblico in modo che le persone che hanno più di 50 anni di età vengano automaticamente filtrate.

Vantaggi

Di seguito sono riportati alcuni dei vantaggi

  • Relazione lineare tra le variabili indipendenti nell'equazione.
  • Molto utile nei modelli statistici e nei rapporti di ricerca preparati dalle aziende basate sulla ricerca.
  • Impatto diretto sul risultato desiderato.

Svantaggi

Di seguito sono riportati alcuni degli svantaggi

  • In alcune delle situazioni, questo problema verrebbe risolto raccogliendo più dati sulle variabili.
  • Uso scorretto di variabili fittizie, ad esempio il ricercatore potrebbe dimenticare di utilizzare le variabili fittizie ogni volta che è necessario.
  • Inserimento di 2 variabili uguali o identiche nell'equazione come kg e lbs in pesi.
  • Inserimento di una variabile nell'equazione che è una combinazione di 2.
  • È complicato eseguire calcoli poiché è la tecnica statistica e richiede calcolatori statistici per eseguire l'esecuzione.

Conclusione

La multicollinearità è uno degli strumenti statistici preferiti spesso utilizzati nell'analisi di regressione e nell'analisi statistica per database di grandi dimensioni e l'output desiderato. Tutte le principali società hanno un dipartimento statistico separato nella loro azienda per eseguire analisi di regressione statistica su prodotti o persone al fine di fornire una visione strategica del mercato al management e anche aiutarli a redigere le loro strategie a lungo termine tenendo presente questa considerazione. La presentazione grafica dell'analisi fornisce al lettore un'immagine chiara della relazione diretta, dell'accuratezza e delle prestazioni.

  • Se l'obiettivo del ricercatore è comprendere le variabili indipendenti nell'equazione, la multicollinearità sarà un grosso problema per lui.
  • Il ricercatore deve apportare le modifiche richieste nelle variabili allo stadio 0 stesso, altrimenti potrebbe avere un impatto enorme sui risultati.
  • La multicollinearità può essere ottenuta esaminando la matrice di correlazione.
  • Le misure correttive svolgono un ruolo significativo nella risoluzione dei problemi di multicollinearità.

Articoli interessanti...