Test chi quadrato con Excel
Il test chi-quadrato in Excel è il test non parametrico più comunemente utilizzato per confrontare due o più variabili per dati selezionati casualmente. È un tipo di test che viene utilizzato per scoprire la relazione tra due o più variabili, questo viene utilizzato nelle statistiche che è anche noto come valore P chi-quadrato, in Excel non abbiamo una funzione incorporata ma possiamo usare formule per eseguire il test chi-quadrato in Excel utilizzando la formula matematica per il test chi-quadrato.

Tipi
- Test chi quadrato per la bontà dell'adattamento
- Test del chi quadrato per l'indipendenza di due variabili.
# 1 - Test chi quadrato per la bontà dell'adattamento
Viene utilizzato per percepire la vicinanza di un campione adatto a una popolazione. Il simbolo del test Chi-quadrato è (2). È la somma di tutto il ( Conteggio osservato - Conteggio previsto) 2 / Conteggio previsto.
- Dove k-1 gradi di libertà o DF.
- Dove Oi è la frequenza osservata, k è la categoria ed Ei è la frequenza attesa.
Nota: - La bontà di adattamento di un modello statistico si riferisce alla comprensione del modo in cui i dati del campione si adattano a una serie di osservazioni.
Utilizza
- L'affidabilità creditizia dei mutuatari in base alla loro fascia di età e ai prestiti personali
- Il rapporto tra le prestazioni dei venditori e la formazione ricevuta
- Ritorno su un singolo titolo e su azioni di un settore come quello farmaceutico o bancario
- Categoria di spettatori e impatto di una campagna TV.
# 2 - Test del chi quadrato per l'indipendenza di due variabili
Viene utilizzato per verificare se le variabili sono autonome l'una dall'altra oppure no. Con (r-1) (c-1) gradi di libertà
Dove Oi è la frequenza osservata, r è il numero di righe, c è il numero di colonne ed Ei è la frequenza attesa
Nota: - Due variabili casuali sono chiamate indipendenti se la distribuzione di probabilità di una variabile non è influenzata dall'altra.Utilizza
Il test di indipendenza è adatto per le seguenti situazioni:
- C'è una variabile categoriale.
- Esistono due variabili categoriali e sarà necessario determinare la relazione tra di loro.
- Esistono tabulazioni incrociate e occorre trovare la relazione tra due variabili categoriali.
- Esistono variabili non quantificabili (ad esempio, risposte a domande come, dipendenti di diverse fasce d'età scelgono diversi tipi di piani sanitari?)
Come eseguire il test chi-quadrato in Excel? (con esempio)
Il gestore di un ristorante vuole trovare il rapporto tra la soddisfazione del cliente e gli stipendi delle persone in attesa dei tavoli. In questo, imposteremo l'ipotesi di testare il Chi-quadrato
- Prende un campione casuale di 100 clienti chiedendo se il servizio è stato eccellente, buono o scadente.
- Quindi classifica gli stipendi delle persone in attesa come basso, medio e alto.
- Supponiamo che il livello di significatività sia 0,05. Qui, H0 e H1 denotano l'indipendenza e la dipendenza della qualità del servizio dagli stipendi delle persone in attesa ai tavoli.
- H 0 - la qualità del servizio non dipende dagli stipendi delle persone in attesa dei tavoli.
- H 1 - la qualità del servizio dipende dagli stipendi delle persone in attesa dei tavoli.
- I suoi risultati sono mostrati nella tabella seguente:
In questo, abbiamo 9 punti dati, abbiamo 3 gruppi, ognuno dei quali ha ricevuto un messaggio diverso sullo stipendio e il risultato è dato di seguito.

Ora conteremo la somma di tutte le righe e le colonne. Lo faremo con l'aiuto della formula, cioè SOMMA. Per sommare l'eccellente nella colonna del totale, abbiamo scritto = SUM (B4: D4) e quindi premere il tasto invio.

Questo ci darà 26 . Eseguiremo lo stesso con tutte le righe e le colonne.

Per calcolare il grado di libertà (DF), usiamo (r-1) (c-1)
DF = (3-1) (3-1) = 2 * 2 = 4
- Ci sono 3 categorie di servizio e 3 categorie di stipendio.
- Abbiamo 27 intervistati con uno stipendio medio (riga inferiore, centrale)
- Abbiamo 51 intervistati con un buon servizio (ultima colonna, al centro)
Ora dobbiamo calcolare le frequenze attese: -
Le frequenze attese possono essere calcolate utilizzando una formula: -
- Per calcolare l' eccellente, useremo moltiplicando il totale di Basso per il totale di Eccellente diviso per N.
Supponiamo di dover calcolare per la prima riga e la prima colonna (= B7 * E4 / B9 ) . Questo darà il numero atteso di clienti che hanno votato un servizio eccellente per gli stipendi delle persone in attesa più bassi, ovvero 8,32 .
- E 11 = - (32 * 26) / 100 = 8,32 , E 12 = 7,02 , E 13 = 10,66
- E 21 = 16,32 , E 22 = 13,77 , E 23 = 20,91
- E 31 = 7,36 , E 32 = 6,21 , E 33 = 9,41
Allo stesso modo, per tutti, dobbiamo fare lo stesso e la formula viene applicata nel diagramma sottostante.

Otteniamo la tabella della frequenza prevista come indicato di seguito: -

Nota: - Supponiamo che il livello di significatività sia 0,05. Qui, H0 e H1 denotano l'indipendenza e la dipendenza della qualità del servizio dagli stipendi delle persone in attesa ai tavoli.
Dopo aver calcolato la frequenza prevista, calcoleremo i punti dati del chi quadrato utilizzando una formula.
Punti chi-quadrato = (osservato-atteso) 2 / atteso
Per calcolare il primo punto, scriviamo = (B4-B14) 2 / B14.

Copieremo e incolleremo la formula in altre celle per riempire automaticamente il valore.

Dopodiché, calcoleremo il valore chi (valore calcolato) sommando tutti i valori indicati sopra la tabella.

Abbiamo ottenuto il valore Chi come 18,65823 .

Per calcolare il valore critico per questo, usiamo una tabella del valore critico chi-quadrato di cui possiamo usare la formula fornita di seguito.
Questa formula contiene 2 parametri CHISQ.INV.RT (probabilità, grado di libertà).
La probabilità è 0,05 ed è un valore significativo che ci aiuterà a determinare se accettare o meno l' ipotesi nulla (H 0 ) .

Il valore critico del chi quadrato è 9,487729037.

Ora troveremo il valore del chi quadrato o (valore P) = CHITEST (intervallo_effettivo, intervallo_atteso)
Intervallo da = CHITEST (B4: D6, B14: D16) .

Come abbiamo visto, il valore del chi-test o valore P è = 0,00091723.

Abbiamo calcolato tutti i valori. I valori del chi-quadrato (valore calcolato) sono significativi solo quando il suo valore è uguale o superiore al valore critico 9.48, ovvero, il valore critico (valore tabulato) deve essere superiore a 18.65 per accettare l' ipotesi nulla (H 0 ) .
Ma qui Valore calcolato > Valore tabulato
X 2 (calcolato)> X 2 (tabulato)
18,65> 9,48
In questo caso, rifiuteremo l' ipotesi nulla (H 0 ) e l' alternativa (H 1 ) sarà accettata.
- Possiamo anche usare P-Value per prevedere lo stesso, cioè, se P-value <= α (valore significativo 0,05), l'ipotesi Null verrà rifiutata.
- Se il valore P> α , non rifiutare l' ipotesi nulla .
Qui P-value (0.0009172) < α (0.05), rifiuta H 0 , accetta H 1
Dall'esempio precedente, concludiamo che la qualità del servizio dipende dai salari delle persone in attesa.
Cose da ricordare
- Considera il quadrato di una variabile normale standard.
- Valuta se le frequenze osservate in diverse categorie variano in modo significativo dalle frequenze previste in base a uno specifico insieme di ipotesi.
- Determina in che misura una distribuzione presunta si adatta ai dati.
- Utilizza tabelle di contingenza (nelle ricerche di mercato, queste tabelle sono chiamate tabelle incrociate).
- Supporta misurazioni a livello nominale.