Media vs Mediana - Differenze tra i metodi utilizzati nelle statistiche

Differenza tra media e mediana

Media e Mediana sono due termini comunemente usati in matematica, la media è come la media di un dato numero e somma i numeri e li divide con il conteggio dei numeri che ci dà la media mentre la mediana d'altra parte restituisce il numero medio dall'intero set di dati e se il set di dati è pari, la mediana aggiunge i due numeri centrali e la divide per 2 dandoci la mediana.

Sono la misura della tendenza centrale e sono spesso usati nella misurazione di grandi set di dati in cui è necessario tracciare analisi e interpretare i risultati. Media, mediana e modo sono tre misure di medie che mostrano la dispersione dei dati dalla media o dalla media. Questi metodi sono ampiamente utilizzati nelle statistiche, mentre il valore medio dei dati è il metodo più utilizzato tra i tre.

Cosa significa?

La media è una semplice somma dei numeri di osservazioni in una matrice, che viene divisa per il numero di osservazioni. Ad esempio, se parliamo dell'altezza media o dell'altezza media di un gruppo composto da 5 persone. L'altezza media sarebbe calcolata sommando l'altezza di 5 persone divisa per il numero di persone, ovvero 5.

Formula

Formula media = (somma di tutte le osservazioni / numero di osservazioni)

Qual è la mediana?

La mediana, d'altra parte, è il numero medio nell'insieme della matrice di dati, che separa l'insieme più alto dei dati da quello più basso. I dati devono essere prima disposti in ordine crescente per calcolare la mediana dei dati. Quando il set di dati ha cardinalità, è necessario prendere la media dei due numeri centrali nel set di dati. Tuttavia, questi due metodi sono spesso usati in modo intercambiabile.

Formula

Formula mediana = (n + 1) / 2

quando n è un numero dispari

Mediana = ((n / 2) + ((n / 2) +1)) / 2

quando n è un numero pari

Media vs Mediana infografica

Vediamo le principali differenze tra media e mediana.

Differenze chiave media vs mediana

  • La media è semplice da usare e applicare e può essere applicata a qualsiasi set di array di dati, pari o dispari. La mediana, d'altra parte, è leggermente complessa da usare e il set di dati deve essere disposto in ordine crescente o decrescente prima del calcolo.
  • La media viene normalmente utilizzata per le distribuzioni normali, mentre la mediana viene utilizzata per il set di dati delle distribuzioni asimmetriche.
  • La media è semplice, ma non è robusta perché può contenere valori anomali nelle distribuzioni e talvolta non può fornire all'utente i risultati corretti per l'interpretazione. D'altra parte, il metodo mediano è robusto ed è più adatto all'uso poiché utilizzato per distribuzioni asimmetriche per derivare la tendenza centrale della data impostata e fornirà all'utente molti risultati accurati rispetto alla media
  • Esiste una sola formula di media che è la somma di tutte le osservazioni divisa per il numero di osservazioni. Considerando che, la mediana ha due formule, una delle dispari in cui solo i numeri centrali del set di dati diventano la mediana. Ma quando abbiamo un set di dati pari, il centro dei due valori viene scelto e viene diviso per 2, che quindi ci dà la mediana del set di dati pari.

Tabella comparativa media vs mediana

Significare Mediano
La media viene calcolata sommando tutti i valori nella matrice di dati, che viene quindi divisa per il numero di osservazioni. La mediana è il valore medio esatto del set di dati. Può essere calcolato disponendo il set di dati in ordine crescente e quindi trovando o selezionando il valore medio dal set di dati.
È più ampiamente utilizzato nel settore grazie a un facile calcolo della media e ci fornisce un numero rapido. Non è usato spesso nell'industria, ma è più completo e preciso della media, che è solo una semplice somma di numeri.
Viene utilizzato generalmente per set di dati normalmente distorti, ovvero distribuzione normale. È particolarmente utile descrivere il set di dati con un'asimmetria significativa nei dati o quando i dati hanno una lunga coda. È ampiamente utilizzato quando i contorni hanno un peso significativo nei dati, significa che non è un buon metodo di calcolo.
Non è uno strumento robusto per un calcolo per derivare la tendenza centrale. È uno strumento molto robusto in quanto determina il peso nei dati, che è generalmente elevato alle code più lunghe.
È molto sensibile ai valori anomali. È molto meno influenzato dai valori anomali.
E 'semplice da usare È di natura complessa.
Non può essere calcolato per dati categoriali, poiché i valori non possono essere sommati. Non può essere identificato per dati nominali classificati in quanto non può essere ordinato logicamente.

Conclusione

Oltre alla media e alla mediana, c'è un altro metodo che viene spesso utilizzato per misurare la tendenza centrale che è il modo. Una modalità è un valore che si verifica più frequentemente nel set di dati; la modalità ha un vantaggio rispetto alla media e alla mediana che può essere trovata per set di dati sia numerici che categorizzati.

Nonostante l'esistenza di modalità e mediana, la superiorità di risultati e analisi migliori sulla media, la media è ancora la misura più appropriata della tendenza centrale, specialmente se il set di dati è una distribuzione normale e i dati sono normalmente distorti.

Come buon analista, la tendenza centrale dovrebbe essere misurata con tutti e tre i metodi di dati, e la varianza nell'analisi dovrebbe essere ponderata e analizzata attentamente per produrre risultati migliori e più accurati nel set di dati.

Articoli interessanti...