Test del chi quadrato in Excel - Come eseguire il test del chi quadrato con l'esempio

Test chi quadrato con Excel

Il test chi-quadrato in Excel è il test non parametrico più comunemente utilizzato per confrontare due o più variabili per dati selezionati casualmente. È un tipo di test che viene utilizzato per scoprire la relazione tra due o più variabili, questo viene utilizzato nelle statistiche che è anche noto come valore P chi-quadrato, in Excel non abbiamo una funzione incorporata ma possiamo usare formule per eseguire il test chi-quadrato in Excel utilizzando la formula matematica per il test chi-quadrato.

Tipi

  1. Test chi quadrato per la bontà dell'adattamento
  2. Test del chi quadrato per l'indipendenza di due variabili.

# 1 - Test chi quadrato per la bontà dell'adattamento

Viene utilizzato per percepire la vicinanza di un campione adatto a una popolazione. Il simbolo del test Chi-quadrato è (2). È la somma di tutto il ( Conteggio osservato - Conteggio previsto) 2 / Conteggio previsto.

  • Dove k-1 gradi di libertà o DF.
  • Dove Oi è la frequenza osservata, k è la categoria ed Ei è la frequenza attesa.

Nota: - La bontà di adattamento di un modello statistico si riferisce alla comprensione del modo in cui i dati del campione si adattano a una serie di osservazioni.

Utilizza

  • L'affidabilità creditizia dei mutuatari in base alla loro fascia di età e ai prestiti personali
  • Il rapporto tra le prestazioni dei venditori e la formazione ricevuta
  • Ritorno su un singolo titolo e su azioni di un settore come quello farmaceutico o bancario
  • Categoria di spettatori e impatto di una campagna TV.

# 2 - Test del chi quadrato per l'indipendenza di due variabili

Viene utilizzato per verificare se le variabili sono autonome l'una dall'altra oppure no. Con (r-1) (c-1) gradi di libertà

Dove Oi è la frequenza osservata, r è il numero di righe, c è il numero di colonne ed Ei è la frequenza attesa

Nota: - Due variabili casuali sono chiamate indipendenti se la distribuzione di probabilità di una variabile non è influenzata dall'altra.

Utilizza

Il test di indipendenza è adatto per le seguenti situazioni:

  • C'è una variabile categoriale.
  • Esistono due variabili categoriali e sarà necessario determinare la relazione tra di loro.
  • Esistono tabulazioni incrociate e occorre trovare la relazione tra due variabili categoriali.
  • Esistono variabili non quantificabili (ad esempio, risposte a domande come, dipendenti di diverse fasce d'età scelgono diversi tipi di piani sanitari?)

Come eseguire il test chi-quadrato in Excel? (con esempio)

Il gestore di un ristorante vuole trovare il rapporto tra la soddisfazione del cliente e gli stipendi delle persone in attesa dei tavoli. In questo, imposteremo l'ipotesi di testare il Chi-quadrato

  • Prende un campione casuale di 100 clienti chiedendo se il servizio è stato eccellente, buono o scadente.
  • Quindi classifica gli stipendi delle persone in attesa come basso, medio e alto.
  • Supponiamo che il livello di significatività sia 0,05. Qui, H0 e H1 denotano l'indipendenza e la dipendenza della qualità del servizio dagli stipendi delle persone in attesa ai tavoli.
  • H 0 - la qualità del servizio non dipende dagli stipendi delle persone in attesa dei tavoli.
  • H 1 - la qualità del servizio dipende dagli stipendi delle persone in attesa dei tavoli.
  • I suoi risultati sono mostrati nella tabella seguente:

In questo, abbiamo 9 punti dati, abbiamo 3 gruppi, ognuno dei quali ha ricevuto un messaggio diverso sullo stipendio e il risultato è dato di seguito.

Ora conteremo la somma di tutte le righe e le colonne. Lo faremo con l'aiuto della formula, cioè SOMMA. Per sommare l'eccellente nella colonna del totale, abbiamo scritto = SUM (B4: D4) e quindi premere il tasto invio.

Questo ci darà 26 . Eseguiremo lo stesso con tutte le righe e le colonne.

Per calcolare il grado di libertà (DF), usiamo (r-1) (c-1)

DF = (3-1) (3-1) = 2 * 2 = 4

  • Ci sono 3 categorie di servizio e 3 categorie di stipendio.
  • Abbiamo 27 intervistati con uno stipendio medio (riga inferiore, centrale)
  • Abbiamo 51 intervistati con un buon servizio (ultima colonna, al centro)

Ora dobbiamo calcolare le frequenze attese: -

Le frequenze attese possono essere calcolate utilizzando una formula: -

  • Per calcolare l' eccellente, useremo moltiplicando il totale di Basso per il totale di Eccellente diviso per N.

Supponiamo di dover calcolare per la prima riga e la prima colonna (= B7 * E4 / B9 ) . Questo darà il numero atteso di clienti che hanno votato un servizio eccellente per gli stipendi delle persone in attesa più bassi, ovvero 8,32 .

  • E 11 = - (32 * 26) / 100 = 8,32 , E 12 = 7,02 , E 13 = 10,66
  • E 21 = 16,32 , E 22 = 13,77 , E 23 = 20,91
  • E 31 = 7,36 , E 32 = 6,21 , E 33 = 9,41

Allo stesso modo, per tutti, dobbiamo fare lo stesso e la formula viene applicata nel diagramma sottostante.

Otteniamo la tabella della frequenza prevista come indicato di seguito: -

Nota: - Supponiamo che il livello di significatività sia 0,05. Qui, H0 e H1 denotano l'indipendenza e la dipendenza della qualità del servizio dagli stipendi delle persone in attesa ai tavoli.

Dopo aver calcolato la frequenza prevista, calcoleremo i punti dati del chi quadrato utilizzando una formula.

Punti chi-quadrato = (osservato-atteso) 2 / atteso

Per calcolare il primo punto, scriviamo = (B4-B14) 2 / B14.

Copieremo e incolleremo la formula in altre celle per riempire automaticamente il valore.

Dopodiché, calcoleremo il valore chi (valore calcolato) sommando tutti i valori indicati sopra la tabella.

Abbiamo ottenuto il valore Chi come 18,65823 .

Per calcolare il valore critico per questo, usiamo una tabella del valore critico chi-quadrato di cui possiamo usare la formula fornita di seguito.

Questa formula contiene 2 parametri CHISQ.INV.RT (probabilità, grado di libertà).

La probabilità è 0,05 ed è un valore significativo che ci aiuterà a determinare se accettare o meno l' ipotesi nulla (H 0 ) .

Il valore critico del chi quadrato è 9,487729037.

Ora troveremo il valore del chi quadrato o (valore P) = CHITEST (intervallo_effettivo, intervallo_atteso)

Intervallo da = CHITEST (B4: D6, B14: D16) .

Come abbiamo visto, il valore del chi-test o valore P è = 0,00091723.

Abbiamo calcolato tutti i valori. I valori del chi-quadrato (valore calcolato) sono significativi solo quando il suo valore è uguale o superiore al valore critico 9.48, ovvero, il valore critico (valore tabulato) deve essere superiore a 18.65 per accettare l' ipotesi nulla (H 0 ) .

Ma qui Valore calcolato > Valore tabulato

X 2 (calcolato)> X 2 (tabulato)

18,65> 9,48

In questo caso, rifiuteremo l' ipotesi nulla (H 0 ) e l' alternativa (H 1 ) sarà accettata.

  • Possiamo anche usare P-Value per prevedere lo stesso, cioè, se P-value <= α (valore significativo 0,05), l'ipotesi Null verrà rifiutata.
  • Se il valore P> α , non rifiutare l' ipotesi nulla .

Qui P-value (0.0009172) < α (0.05), rifiuta H 0 , accetta H 1

Dall'esempio precedente, concludiamo che la qualità del servizio dipende dai salari delle persone in attesa.

Cose da ricordare

  • Considera il quadrato di una variabile normale standard.
  • Valuta se le frequenze osservate in diverse categorie variano in modo significativo dalle frequenze previste in base a uno specifico insieme di ipotesi.
  • Determina in che misura una distribuzione presunta si adatta ai dati.
  • Utilizza tabelle di contingenza (nelle ricerche di mercato, queste tabelle sono chiamate tabelle incrociate).
  • Supporta misurazioni a livello nominale.

Articoli interessanti...