Cos'è il T-Test?
Un T-Test è un metodo utilizzato per derivare un'inferenza in statistica, che ha lo scopo di scoprire se c'è qualche differenza importante tra due mezzi in cui i due gruppi considerati possono essere correlati tra loro.
Spiegazione
- È finalizzato al test di ipotesi, che fondamentalmente viene utilizzato per testare un'ipotesi relativa a una data popolazione. Un test T considera la statistica T, i valori di distribuzione T ei gradi di libertà, che vengono utilizzati per determinare la probabilità di differenza tra due set di dati.
- Il lavoro di base dietro T-Test è che considera un campione da ciascuno dei due insiemi e costruisce un'affermazione del problema considerando un'ipotesi nulla in cui entrambe le medie sono dichiarate uguali.
- Sulla base di formule equiparate, i valori vengono disegnati e confrontati con i valori standard, il che porta ulteriormente all'accettazione o al rifiuto dell'ipotesi nulla. Il rifiuto dell'ipotesi nulla indica che il set di dati è abbastanza accurato e non a caso.

Tipi di test T.
Esistono principalmente quattro tipi di test t, che sono i seguenti:
# 1 - Test T a 1 campione
Ha lo scopo di verificare se la media del valore scelto come target è uguale alla media di una singola popolazione, ad esempio, verificare se il peso medio degli studenti della classe 5 è superiore a 45 kg
# 2 - Test T a 2 campioni
Ha lo scopo di verificare se la media del valore scelto come target è uguale alla media di due popolazioni indipendenti, ad esempio, verificare se il peso medio degli studenti maschi di Classe 5 è diverso da quello delle studentesse di Classe 5.
# 3 - T-Test accoppiato
Ha lo scopo di verificare se la media del valore che si è mirato è uguale alla media delle differenze tra le osservazioni che sono dipendenti. Ad esempio, confrontare i voti degli studenti prima e dopo aver preso le lezioni per ogni materia ci aiuta a identificare se prendere le lezioni è abbastanza significativo da migliorare i voti degli studenti.
# 4 - T-Test in output di regressione
Prende in considerazione il coefficiente nell'equazione di regressione e verifica in che misura differisce dal valore zero. Ad esempio, se il punteggio dell'esame di ammissione è un fattore significativo per determinare se uno studente otterrà un buon punteggio finale.
Presupposti del T-Test
- La prima ipotesi per un test t è correlata alla scala di misurazione. Ciò è correlato al fatto che la scala segua una scala continua o ordinale
- La seconda ipotesi può riguardare la natura casuale del campione. Ciò significa che i dati raccolti dovrebbero essere di natura puramente casuale.
- La terza ipotesi può essere che quando tracciamo i dati relativi alla distribuzione del test t, dovrebbe seguire una distribuzione normale e produrre un grafico a campana.
- La quarta ipotesi può essere che per la distribuzione t e specificamente per ottenere una forma della curva a campana, abbiamo bisogno di una dimensione del campione maggiore.
- L'assunzione finale può essere quella per il test t. La varianza dovrebbe essere di natura omogenea. e. le deviazioni standard sono quasi uguali.
Come calcolare?
Funziona in due diversi scenari, ovvero uno per il campione indipendente e un altro per il campione dipendente.
# 1 - Scenario campione indipendente
- Dobbiamo calcolare la somma, la dimensione del campione, che è determinata da "N", e il valore del punteggio per la media per ciascuno dei campioni indipendenti. Successivamente, il grado di libertà deve essere calcolato per ogni campione indipendente.
- Questo è rappresentato sottraendo il campione di uno, che indichiamo come "n-1". Successivamente, è necessario calcolare la varianza e la deviazione standard.
- Vengono aggiunti i gradi di libertà dei campioni e questo viene definito "df-total". Successivamente, dobbiamo moltiplicare il grado di libertà di ciascun campione per la varianza di ciascuno. Dobbiamo aggiungere le risultanti e quindi dividere il totale per "df-total". Il risultato ottenuto è chiamato varianza aggregata.
- La varianza aggregata viene quindi divisa per n dei campioni. Viene quindi aggiunto il risultato ottenuto per tutti i campioni. Viene presa la radice quadrata di questo, e questo è definito come l'errore standard della differenza.
- Infine, dobbiamo sottrarre la media inferiore del campione dalla media maggiore del campione. La differenza ottenuta viene quindi divisa per l'errore standard della differenza ei risultati ottenuti vengono chiamati valore T.
# 2 - Scenario di esempio dipendente
- I punteggi ottenuti da ciascuna delle coppie di set di dati vengono annotati e dobbiamo sottrarli. Le differenze ottenute vengono aggiunte e denominate "D." Le differenze di ogni campione vengono quadrate e sommate per ottenere una risultante chiamata "D-Squared". Dopodiché, dobbiamo moltiplicare la "N" o il numero di punteggi accoppiati con il "D-quadrato".
- La risultante ottenuta viene sottratta dal quadrato della "D" totale Questo risultato è ulteriormente diviso con "N-1". La radice quadrata della risultante si ottiene e viene definita divisore. Infine, dobbiamo dividere la "D" totale per il divisore, che ci dà il valore t finale.
Esempi di test T.
Consideriamo di avere punteggi per ciascuna materia nell'esame tenuto per due mandati.

Passaggio 1: sottrai la fase 1 dalla fase 2

Passaggio 2: somma tutta la differenza, ovvero -55
Passaggio 3: compensa le differenze

Passaggio 4: somma tutti i quadrati di differenza, ad esempio 983
Passaggio 5: utilizzo della formula per calcolare il valore T.
T = ((∑D) / N) / √ (∑D 2 - (∑D) 2 / N)) / (N-1) - N- = -9,16 / √ (983 - (- 55) 2 /6)) / (6-1) * 6
- = -9,16 / √15,96
- = -9,16 / 3,99
- Valore T = -2,29
Il valore T ottenuto viene quindi confrontato con il valore T ottenuto dalla tabella utilizzando il valore p e il grado di libertà. Se il valore t calcolato è maggiore del valore della tabella a uno specifico livello alfa predefinito, possiamo rifiutare l'ipotesi nulla dicendo che c'è una differenza tra le medie.
Quando viene utilizzato?
Viene utilizzato per confrontare due medie o proporzioni. Inoltre, utilizziamo un test t quando i parametri della popolazione sono sconosciuti all'utente. Esistono sostanzialmente tre casi di utilizzo dello scenario di test t, che sono i seguenti:
- Quando si desidera confrontare la media di due gruppi, viene utilizzato un test t del campione indipendente.
- Un test t di campioni accoppiati viene utilizzato quando si desidera confrontare la media dello stesso gruppo ma in diversi momenti.
- Un test t campione viene utilizzato quando è necessario controllare la media di un singolo gruppo rispetto a una media sconosciuta.
Utilizzo del T-Test in Excel
- In Excel, la prima cosa di cui abbiamo bisogno è l'installazione di un componente aggiuntivo chiamato Data Analysis. Successivamente, dobbiamo andare su "Dati" nella scheda del menu e fare clic su di esso. L'opzione "Analisi dati" sarà visibile lì.
- Per condurre un T-Test, abbiamo bisogno di avere i nostri dati in un formato colonnare. Facendo clic su "Analisi dati", otterremo una serie di test statistici che possiamo eseguire e dall'elenco, dobbiamo scegliere un test t e fare clic su "Ok".
- Viene visualizzata una finestra di dialogo in cui è necessario inserire i dati per la traccia 1 nella casella intervallo variabile 1 e anche i dati della prova 2 nelle caselle intervallo variabile 2. Per impostazione predefinita, il valore di alfa rimane a 0,05, ma può essere modificato in base alle nostre preferenze. Quando tutto va bene, fai clic su "OK".
- Ora possiamo vedere il risultato del nostro T-Test sul foglio Excel. Il valore più importante da notare qui è il valore P. Su quello che abbiamo selezionato il nostro valore alfa, se il nostro valore P in Excel è inferiore al valore alfa, possiamo concludere che c'è una differenza materiale statistica tra le medie delle nostre due serie di valori.
Conclusione
Il T-Test è finalizzato al test di ipotesi, che fondamentalmente viene utilizzato per testare un'ipotesi relativa a una data popolazione. Ci dice il livello di significatività della differenza tra i gruppi, che generalmente vengono misurati sulla base della media. Qui fondamentalmente scopriamo la differenza tra le medie della popolazione e un valore ipotizzato.