La verifica delle ipotesi viene eseguita mediante analisi statistica. La significatività statistica è stata calcolata utilizzando il p-value, che indica l'entità della probabilità dei risultati della ricerca, a condizione che determinate affermazioni (ipotesi zero) siano vere. Se il valore p è inferiore al livello di significatività predeterminato (generalmente 0,05), il ricercatore può concludere che l'ipotesi nulla non è vera e accettare l'ipotesi alternativa. Utilizzando un semplice test t, è possibile calcolare un valore p e determinare la significatività tra due diversi set di dati.
Fare un passo
Parte 1 di 3: impostazione degli esperimenti
Passaggio 1. Stabilire un'ipotesi
Il primo passo nell'analisi della significatività statistica è determinare la domanda di ricerca a cui desideri rispondere e formulare la tua ipotesi. Un'ipotesi è una dichiarazione sui tuoi dati sperimentali e spiega le possibili differenze nella popolazione dello studio. Per ogni esperimento deve essere stabilita un'ipotesi nulla e un'ipotesi alternativa. Generalmente, confronterai due gruppi per vedere se sono uguali o diversi.
- L'ipotesi nulla (H0) afferma in generale che non vi è alcuna differenza tra i due insiemi di dati. Esempio: il gruppo di studenti che ha letto il materiale prima dell'inizio della lezione non ha ottenuto voti migliori rispetto al gruppo che non ha letto il materiale.
- Ipotesi alternativa (Hun) è un'affermazione che contraddice l'ipotesi nulla e che stai cercando di supportare con dati sperimentali. Esempio: il gruppo di studenti che ha letto il materiale prima della lezione ha ottenuto voti migliori rispetto al gruppo che non ha letto il materiale.
Passaggio 2. Limitare il livello di significatività per determinare l'unicità dei dati per essere considerati significativi
Il livello di significatività (alfa) è la soglia utilizzata per determinare la significatività. Se il valore p è minore o uguale al livello di significatività, il dato è considerato statisticamente significativo.
- Come regola generale, il livello di significatività (alfa) è fissato a 0,05, il che significa che la probabilità che entrambi i gruppi di dati siano uguali è solo del 5%.
- L'utilizzo di un livello di confidenza più elevato (valore p più basso) significa che i risultati sperimentali saranno considerati più significativi.
- Se vuoi aumentare il livello di confidenza dei tuoi dati, abbassa il p-value di più a 0,01. I p-value più bassi sono comunemente usati nella produzione quando si rilevano i difetti del prodotto. Un alto livello di fiducia è essenziale per garantire che ogni parte prodotta svolga la sua funzione.
- Per gli esperimenti di verifica delle ipotesi, è accettabile un livello di significatività di 0,05.
Passaggio 3. Decidere di utilizzare un test a una coda o un test a due code
Uno dei presupposti utilizzati quando si esegue un t-test è che i dati siano normalmente distribuiti. I dati normalmente distribuiti formeranno una curva a campana con la maggior parte dei dati al centro della curva. Il t-test è un test matematico utilizzato per vedere se i tuoi dati sono al di fuori della distribuzione normale, al di sotto o al di sopra della "coda" della curva.
- Se non sei sicuro che i tuoi dati siano al di sotto o al di sopra del gruppo di controllo, usa un test a due code. Questo test verificherà il significato di entrambe le direzioni.
- Se conosci la direzione dell'andamento dei tuoi dati, usa un test unilaterale. Utilizzando l'esempio precedente, ti aspettavi che il voto di uno studente sarebbe aumentato. Pertanto, dovresti usare un test a una coda.
Passaggio 4. Determinare la dimensione del campione mediante l'analisi della potenza statistica del test
Il potere della statistica test è la probabilità che un certo test statistico possa dare il risultato corretto, con una certa dimensione del campione. La soglia di potenza di prova (o) è 80%. L'analisi della forza di un test statistico può essere complicata senza dati preliminari perché avrai bisogno di informazioni sulla media stimata di ciascun set di dati e sulla sua deviazione standard. Utilizza il calcolatore di analisi della potenza del test statistico online per determinare la dimensione del campione ottimale per i tuoi dati.
- I ricercatori generalmente conducono studi pilota come materiale per l'analisi della forza dei test statistici e come base per determinare la dimensione del campione necessaria per studi più ampi e completi.
- Se non hai le risorse per condurre uno studio pilota, stima la media in base alla letteratura e ad altre ricerche che sono state fatte. Questo metodo fornirà informazioni per determinare la dimensione del campione.
Parte 2 di 3: Calcolo della deviazione standard
Passaggio 1. Utilizzare la formula della deviazione standard
La deviazione standard (nota anche come deviazione standard) è una misura della distribuzione dei dati. La deviazione standard fornisce informazioni sulla somiglianza di ciascun punto dati nel campione. All'inizio, l'equazione della deviazione standard può sembrare complicata, ma i passaggi seguenti ti aiuteranno nel processo di calcolo. La formula della deviazione standard è s = ((xio –)2/(N-1)).
- s è la deviazione standard.
- significa che devi sommare tutti i valori di esempio che hai raccolto.
- Xio rappresenta tutti i singoli valori dei tuoi punti dati.
- è la media dei dati per ogni gruppo.
- N è il numero dei tuoi campioni.
Passaggio 2. Calcolare la media campionaria in ciascun gruppo
Per calcolare la deviazione standard, devi prima calcolare la media campionaria in ogni set di dati. La media è indicata dalla lettera greca mu o. Per fare ciò, somma tutti i valori dei punti dati del campione e dividi per il numero dei tuoi campioni.
- Ad esempio, per ottenere il punteggio medio per il gruppo di studenti che hanno letto il materiale prima della lezione, esaminiamo i dati di esempio. Per semplicità, utilizzeremo 5 punti dati: 90, 91, 85, 83 e 94.
- Somma tutti i valori di esempio: 90 + 91 + 85 + 83 + 94 = 443.
- Dividere per il numero di campioni, N = 5:443/5 = 88, 6.
- Il punteggio medio per questo gruppo era 88. 6.
Passaggio 3. Sottrarre ogni valore del punto dati campione per il valore medio
Il secondo passo è completare la parte (xio –) equazione. Sottrarre ogni valore del punto dati campione dalla media precalcolata. Continuando l'esempio precedente, devi fare cinque sottrazioni.
- (90 – 88, 6), (91-88, 6), (85 – 88, 6), (83 – 88, 6) e (94 – 88, 6).
- I valori ottenuti sono 1, 4, 2, 4, -3, 6, -5, 6 e 5, 4.
Passaggio 4. Elevare al quadrato ogni valore ottenuto e sommarli tutti
Eleva al quadrato ogni valore che hai appena calcolato. Questo passaggio rimuoverà tutti i numeri negativi. Se c'è un valore negativo dopo l'esecuzione di questo passaggio o il tempo dopo che tutti i calcoli sono stati eseguiti, potresti aver dimenticato questo passaggio.
- Utilizzando l'esempio precedente, otteniamo i valori 1, 96, 5, 76, 12, 96, 31, 36 e 29,16.
- Somma tutti i valori: 1, 96 + 5, 76 + 12, 96 + 31, 36 + 29, 16 = 81, 2.
Passaggio 5. Dividere per il numero di campioni meno 1
La formula esprime N – 1 come aggiustamento perché non stai contando l'intera popolazione; Prendi solo un campione della popolazione per fare una stima.
- Sottrarre: N – 1 = 5 – 1 = 4
- Dividi: 81, 2/4 = 20, 3
Passaggio 6. Calcola la radice quadrata
Dopo aver diviso per il numero di campioni meno uno, calcola la radice quadrata del valore finale. Questo è il passaggio finale per calcolare la deviazione standard. Esistono diversi programmi statistici in grado di calcolare la deviazione standard dopo aver inserito i dati grezzi.
Ad esempio, la deviazione standard dei punteggi per il gruppo di studenti che ha letto il materiale prima dell'inizio della lezione è: s =√20, 3 = 4, 51
Parte 3 di 3: Determinazione del significato
Passaggio 1. Calcolare la varianza tra i due gruppi di campioni
Nell'esempio precedente, abbiamo calcolato solo la deviazione standard di un gruppo. Se vuoi confrontare due gruppi, dovresti avere i dati dei due gruppi. Calcola la deviazione standard del secondo gruppo e usa i risultati per calcolare la varianza tra i due gruppi nell'esperimento. La formula per la varianza è sD = ((s1/N1) + (s2/N2)).
- SD è la varianza intergruppo.
- S1 è la deviazione standard del gruppo 1 e N1 è il numero di campioni nel gruppo 1.
- S2 è la deviazione standard del gruppo 2 e N2 è il numero di campioni nel gruppo 2.
-
Ad esempio, i dati del gruppo 2 (studenti che non leggono il materiale prima dell'inizio della lezione) hanno una dimensione del campione di 5 con una deviazione standard di 5,81. Quindi la variante:
- SD = ((s1)2/N1) + ((s2)2/N2))
- SD = √(((4.51)2/5) + ((5.81)2/5)) = √((20.34/5) + (33, 76/5)) = √(4, 07 + 6, 75) = √10, 82 = 3, 29.
Passaggio 2. Calcola il valore del t-test dei tuoi dati
Il valore del t-test ti consentirà di confrontare un gruppo di dati con un altro gruppo di dati. Il valore t consente di eseguire un test t per determinare la probabilità che i due gruppi di dati confrontati siano significativamente diversi. La formula per il valore di t è: t = (µ1 –2)/SD.
- ️1 è la media del primo gruppo.
- ️2 è il valore medio del secondo gruppo.
- SD è la varianza tra i due campioni.
- Usa la media più grande come1 quindi non ottieni valori negativi.
- Ad esempio, il punteggio medio del gruppo 2 (studenti che non leggono) è 80. Il valore t è: t = (µ1 –2)/SD = (88, 6 – 80)/3, 29 = 2, 61.
Passaggio 3. Determinare i gradi di libertà del campione
Quando si utilizza il valore t, i gradi di libertà sono determinati dalla dimensione del campione. Sommare il numero di campioni di ciascun gruppo e poi sottrarre due. Ad esempio, i gradi di libertà (d.f.) sono 8 perché ci sono cinque campioni nel primo gruppo e cinque campioni nel secondo gruppo ((5 + 5) – 2 = 8).
Passaggio 4. Utilizzare la tabella t per determinare la significatività
Le tabelle dei valori t e dei gradi di libertà possono essere trovate nei libri di statistica standard o online. Guarda la riga che mostra i gradi di libertà che hai selezionato per i tuoi dati e trova il p-value appropriato per il t-value derivato dai tuoi calcoli.
Con gradi di libertà di 8 d.f. e il valore t di 2,61, il valore p per il test a una coda è compreso tra 0,01 e 0,025. Poiché abbiamo utilizzato un livello di significatività inferiore o uguale a 0,05, i dati che utilizziamo dimostrano che i due gruppi di dati sono significativamente diverso, significativo. Con questi dati, possiamo rifiutare l'ipotesi nulla e accettare l'ipotesi alternativa: il gruppo di studenti che ha letto il materiale prima dell'inizio della lezione ha ottenuto un punteggio migliore rispetto al gruppo di studenti che non ha letto il materiale
Passaggio 5. Considera la possibilità di eseguire uno studio di follow-up
Molti ricercatori conducono piccoli studi pilota per aiutarli a capire come progettare studi più ampi. Fare ulteriori ricerche con più misurazioni aumenterà la tua fiducia nelle tue conclusioni.