Regola empirica: definizione, formula, come utilizzarla in statistica?

Qual è la regola empirica in statistica?

La regola empirica in statistica afferma che quasi tutte (95%) delle osservazioni in una distribuzione normale si trovano entro 3 deviazioni standard dalla media. Questa è una regola molto importante e aiuta nella previsione.

Formula

La formula mostra la percentuale prevista di osservazioni che rientreranno in ciascuna deviazione standard dalla media.

La regola dice che:

  • Il 68% delle osservazioni si troverà entro +/- 1 deviazione standard dalla media
  • Il 95% delle osservazioni si troverà entro +/- 2 deviazioni standard dalla media
  • Il 7% delle osservazioni si troverà entro +/- 3 deviazioni standard dalla media

Come usare?

Viene utilizzato nella tendenza di previsione di un set di dati. Quando il set di dati è ampio e diventa difficile studiare l'intera popolazione, è possibile applicare la regola empirica al campione per ottenere una stima di come reagiranno i dati nella popolazione se ti viene chiesto di trovare lo stipendio medio di tutti i contabili negli Stati Uniti. Quindi questo è un compito difficile da eseguire poiché l'insieme della popolazione è enorme. Quindi, in quel caso, puoi selezionare, diciamo, 90 osservazioni casualmente dall'intera popolazione.

Quindi ora avrai 90 stipendi. Devi trovare la media e la deviazione standard delle osservazioni. Se l'osservazione segue una distribuzione normale, questa può essere applicata e può essere effettuata una stima dello stipendio di tutti i contabili negli Stati Uniti.

Supponiamo che lo stipendio medio del campione sia $ 90.000. E la deviazione standard è di $ 5.000. Quindi, dell'intera popolazione, il 68% dei contabili percepisce uno stipendio compreso tra +/- 1 deviazioni standard dalla media. Poiché la media è $ 90.000 e la deviazione standard è $ 5.000. Quindi il 68% di tutti i contabili negli Stati Uniti viene pagato nella gamma di $ 90.000 +/- (1 * $ 5.000). Questo è compreso tra $ 85.000 e $ 95.000

Se distribuiamo un po 'di più, il 95% di tutti i contabili negli Stati Uniti viene pagato nell'intervallo della media +/- 2 deviazioni standard. $ 90.000 +/- (2 * 5000). Quindi l'intervallo è compreso tra $ 80.000 e $ 100.000.

In un intervallo più ampio, il 99,7% di tutti i contabili percepisce stipendi che vanno dalla media +/- 3 deviazioni standard. Questo è 90.000 +/- (3 * 5000). L'intervallo è compreso tra $ 75.000 e $ 105.000

Si può vedere chiaramente che senza studiare l'intera popolazione, si potrebbe fare una stima sulla popolazione. Se qualcuno ha intenzione di lavorare come contabile negli Stati Uniti, può facilmente aspettarsi che il suo stipendio vari da $ 75.000 a $ 105.000

Questo tipo di stima aiuta a facilitare il lavoro e fare previsioni per il futuro.

Esempi di regole empiriche

Il signor X sta cercando di trovare il numero medio di anni in cui una persona sopravvive dopo il pensionamento, considerando che l'età pensionabile è 60. Se gli anni di sopravvivenza media di 50 osservazioni casuali sono 20 anni e la DS è 3, scoprire la probabilità che a persona percepirà una pensione per più di 23 anni

Soluzione

La regola empirica afferma che il 68% delle osservazioni si troverà entro 1 deviazione standard dalla media. Qui la media delle osservazioni è 20.

Il 68% delle osservazioni si troverà entro 20 +/- 1 (deviazione standard), che è 20 +/- 3. Quindi l'intervallo è compreso tra 17 e 23.

C'è una probabilità del 68% che gli anni minimi di sopravvivenza di una persona dopo il pensionamento siano compresi tra 17 e 23. Ora la percentuale che si trova al di fuori di questo intervallo è (100 - 68) = 32%. 32 è distribuito equamente su entrambi i lati, il che significa una probabilità del 16% che gli anni minimi siano inferiori a 17 e una probabilità del 16% che gli anni minimi siano maggiori di 23.

Quindi la probabilità che la persona percepisca più di 23 anni di pensione è del 16%.

Regola empirica contro teorema di Chebyshev

La regola empirica viene applicata ai set di dati che seguono una distribuzione normale che significa a forma di campana. In una distribuzione normale, entrambi i lati della distribuzione hanno una probabilità del 50% ciascuno.

Se il set di dati non è distribuito normalmente, esiste un'altra approssimazione o regola che si applica a tutti i tipi di set di dati, che è il teorema di Chebyshev. Dice tre cose:

  • Almeno 3/4 th di tutte le osservazioni si troverà entro 2Standard deviazioni dalla media. È una forte approssimazione. Ciò significa che se ci sono 100 osservazioni, quindi 3/4 th delle osservazioni che sono 75 osservazioni si trovano entro +/- 2 deviazioni standard dalla media.
  • Almeno 8/9 th di tutte le osservazioni si troverà entro 3Standard deviazioni dalla media.
  • Almeno 1 - 1 / k 2 di tutte le osservazioni si trovano entro K deviazioni standard dalla media. Qui K è indicato come qualsiasi numero intero.

Quando usare?

I dati sono come l'oro nel mondo moderno. Ci sono enormi dati che fluiscono da diverse fonti e vengono utilizzati per diverse approssimazioni o previsioni. Se un set di dati segue una distribuzione normale, mostra una curva a campana; quindi, può essere utilizzata la regola empirica. Viene applicato alle osservazioni per creare un'approssimazione per la popolazione.

Una volta che si è visto che le osservazioni mostrano una struttura di distribuzione normale, si segue la Regola empirica per trovare diverse probabilità delle osservazioni. La regola è estremamente utile per molte previsioni statistiche.

Conclusione

Regola empirica è un concetto statistico che aiuta a ritrarre la probabilità di osservazioni ed è molto utile quando si trova un'approssimazione di una popolazione enorme. Va sempre notato che si tratta di approssimazioni. Ci sono sempre possibilità di valori anomali che non rientrano nella distribuzione. Quindi i risultati non sono accurati e dovrebbero essere prese misure precauzionali quando si agisce secondo le previsioni.

Articoli interessanti...