Campionamento e Test d’ipotesi Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Inferenza statistica = processo che, partendo dalle informazioni contenute in un campione, consente di giungere a delle affermazioni relative alla popolazione da cui proviene quel campione. 1 Il campione deve essere rappresentativo della popolazione originaria. Se si intervistano i passanti in una determinata strada cittadina, si ottiene un campione rappresentativo della popolazione originaria? No, in quanto la probabilità di essere intervistati varia da un soggetto (unità statistica) all’altro a seconda delle abitudini personali ed è ignota. Per ottenere un campione rappresentativo, bisogna disporre di una lista di campionamento (sampling frame) da cui estrarre il campione. Devo conoscere esattamente la probabilità che un’unità statistica ha di essere estratta (campionamento di tipo probabilistico). La media campionaria è una variabile casuale. Infatti: 1) varia da un campione all’altro 2) i campioni sono estratti in modo casuale. 2 DETERMINAZIONE SPERIMENTALE della DISTRIBUZIONE di una MEDIA CAMPIONARIA - 1 POPOLAZIONE ORIGINARIA 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 …. 88 89 90 Σx=4095 µ=45,5 Σx2=247065 σ=26,12 distribuzione uniforme Estraiamo campioni di numerosità numerosità 3 75 27 4 6 26 12 35,3 57 27 69 69 41 58 21 85 87 14,7 51 56 Medie campionarie con n=3 64,3 Σx=221,3 xx =44,3 Σx2=11339,3 sx =19,6 Estraiamo campioni di numerosità numerosità 6 3 56 34 52 9 48 33,7 84 46 81 67 14 4 29 68 2 22 14 53 80 9 70 66 51 6 14 12 77 82 32 36 49,3 31,3 43,7 Medie campionarie con n=6 45,5 Σx=203,5 Σx2=8526 xx =40,7 sx =7,8 DETERMINAZIONE SPERIMENTALE della DISTRIBUZIONE di una MEDIA CAMPIONARIA - 2 1) La media delle medie (44,27 per n=3 e 40,7 per n=6) è all’incirca uguale alla media della popolazione originaria (45,5) 2) La variabilità delle medie campionarie è inferiore alla variabilità osservata nella popolazione originaria: DSx=Errore Standard = σ/√ √n numerosità campionaria n=3 n=6 valore osservato DSx = 19,63 DSx = 7,80 valore atteso 26,12/√ √3=15,08 26,12/√ √6=10,67 3) All’aumentare della numerosità campionaria, la media campionaria tende a distribuirsi normalmente indipendentemente dalla distribuzione della variabile originaria 3 Nel ‘900 falsificazione di ipotesi (Karl Popper) Nell’ ‘800 dimostrazione di ipotesi (Claude Bernard) TEST D’IPOTESI Ipotesi Nulla (H0) Ipotesi alternativa (H1) (Tutte le differenze osservate sono dovute al caso) FALSIFICARE L’IPOTESI NULLA Distribuzione teorica regione di rifiuto 160 regione di accettazione 170 regione di rifiuto Distribuzione teorica Test non-parametrici Metto i dati in ordine crescente: AAABAABBABBBABBBBB I valori del gruppo A tendono ad essere più bassi dei valori del gruppo B 180 glicemia (mg/dl) 4 IPOTESI SCIENTIFICA: Affermazione che si può sottoporre a verifica, che si può tentare di falsificare. Con una procedura che comporta delle misurazioni si può cercare di dimostrare che l’ipotesi non è vera. Un’ipotesi scientifica viene ritenuta vera finché non si dimostra il contrario. IPOTESI STATISTICA: Affermazione circa una caratteristica di una popolazione che si cerca di supportare o di rifiutare sulla base delle informazioni disponibili, in genere ricavate da un campione. TEST D’IPOTESI H0: IPOTESI NULLA Tutte le differenze osservate sono delle semplici fluttuazioni casuali H1: IPOTESI ALTERNATIVA Le differenze riscontrate nelle statistiche campionarie rispecchiano una reale differenza nei parametri delle popolazioni corrispondenti Esempio: La glicemia dei diabetici italiani è uguale alla glicemia dei diabetici americani La glicemia dei diabetici italiani è diversa dalla glicemia dei diabetici americani 5 TEST STATISTICO: Regola che consente di discriminare tra i risultati che portano a non rifiutare o a rifiutare l’ipotesi nulla (H0). Nel riportare la decisione si riporta anche la probabilità che questa sia corretta. Dati del campione Test statistico P>0,05 = la probabilità che le differenze osservate siano dovute al caso è superiore al 5% Accetto l’ipotesi nulla (H0) tutte le differenze osservate tra i campioni possono essere attribuite al caso P<0,05 = la probabilità che le differenze osservate siano dovute al caso è inferiore al 5% Accetto l’ipotesi alternativa, H1 le differenze osservate tra i campioni rispecchiano delle differenze reali tra le popolazioni 6 Test bidirezionale H0: µ italiani = µ0 H1: µ italiani ≠ µ0 Two-sided regione di rifiuto 160 regione di accettazione 170 regione di rifiuto 180 glicemia (mg/dl) Test unidirezionale H0: µ italiani ≥ µ0 H1: µ italiani < µ0 One-sided regione di rifiuto 160 regione di accettazione 170 180 glicemia (mg/dl) 7 Ipotesi Nulla (H0) vera Accetto H0 Rifiuto H0 falsa Errore Va bene del II tipo Errore del I tipo Va bene P(errore del I tipo) = α (alfa) P(errore del II tipo) = β (beta) In genere, nel test d’ipotesi la probabilità di errore del I tipo viene fissata al 5% (0,05). Pertanto in un caso su 20 si rifiuterà H0 (ovvero il test risulterà significativo) per semplice effetto del caso, anche quando H0 è vera. In termini statistici si sceglie un livello di significatività del 5%. Ad esempio, se in un test d’ipotesi P<0,01, vuol dire che posso rifiutare H0 con una probabilità di errore del I tipo inferiore all’1%; in altre parole la probabilità che le differenze osservate siano dovute al caso è inferiore all’1%. 8 Attualmente si preferisce riportare la probabilità esatta associata con un determinato test statistico. Anziché scrivere P<0,01 si preferisce riportare P=0,003. Al posto di un test d’ipotesi si esegue un test di significatività. Tuttavia, mentre P<0,01 è la probabilità prefissata che le differenze siano dovute al caso sotto H0 , P=0,003 è la probabilità di osservare quel determinato risultato o un risultato più estremo (PTOME = Probability of This Or More Extreme) sotto H0. POTENZA di un test = 1- beta = 1 - P(errore del II tipo) E’ la probabilità che un test statistico ha di falsificare l’ipotesi nulla quando l’ipotesi nulla è effettivamente falsa. In altre parole, la Potenza di un test è la sua capacità di cogliere delle differenze, quando queste differenze esistono. Il test statistico è costruito in modo da mantenere costante il livello di significatività, indipendentemente dalla numerosità campionaria. Ma questo risultato viene raggiunto a spese della potenza del test, che aumenta all’aumentare della numerosità campionaria. 9 SIGNIFICATIVITA’ STATISTICA e RILEVANZA CLINICA Un'indagine epidemiologica, condotta su un gran numero di persone, ha messo in luce che i fumatori dormono meno della popolazione generale. La differenza aveva una significatività elevata (P<0.001), ovvero ben difficilmente poteva essere attribuita al caso. La differenza consisteva in 3 minuti di sonno in meno nei fumatori rispetto ai non-fumatori. 10 ≈ significativita' statistica differenza osservata variabilita'casuale E'piu'facile evidenziare una differenza significativa E'piu'difficile evidenziare una differenza significativa Scelta del test statistico 11 All'inizio di un'elaborazione statistica la prima domanda da porsi è: Di che tipo è la variabile? Esempi Test indicati NOMINALE ORDINALE QUANTITATIVA Stato di vita (vivo/morto) Intensità del dolore Peso (Kg) Sesso (M/F) Profondità del coma Età (anni) Tipo di ventilazione (spon- Wassermann (-, -+, +, ++, Glicemia (mmol) tanea/assistita/artificiale) +++, ++++, +++++) Chi-quadrato (χ2) Test non-parametrici T di Student per dati nonappaiati o per dati appaiati Analisi della varianza Regressione e correlazione 12 Con una variabile di tipo quantitativo, qual è il test statistico da effettuare? Confronto fra soggetti diversi Misure ripetute sugli stessi soggetti Confronto fra variabili diverse ↓ ↓ ↓ ↓ 2 gruppi Più di 2 gruppi 2 misurazioni Più di 2 misurazioni ↓ ↓ ↓ ↓ ↓ t di Student ANOVA a 1 t di Student per ANOVA per Regressione e criterio dati appaiati misure ripetute Correlazione ANOVA = ANalysis Of VAriance (Analisi della varianza) 1) Viene condotto uno studio sugli studenti iscritti alla Facoltà di Farmacia. L' indice di massa corporea (peso/statura2) delle matricole viene confrontato con l' indice di massa corporea degli iscritti al terzo anno. Che tipo di test si può utilizzare per questo confronto? 2) Nello stesso studio in un gruppo di studenti l' indice di massa corporea (peso/statura2) viene misurato due volte, sia al momento dell' iscrizione che alla fine del terzo anno di corso. Che tipo di test si può utilizzare per confrontare queste due misurazioni successive? 3) Nella stessa indagine viene studiata la relazione tra peso e statura. Che tipo di test si può utilizzare? 4) Nella stessa indagine viene studiata la relazione tra colore degli occhi e colore dei capelli. Che tipo di test si può utilizzare? A) test t di Student per dati non-appaiati B) test t di Student per dati appaiati C) test del chi-quadrato D) regressione e correlazione E) altro __________________ 13 Test d’ipotesi: confronto fra due medie campionarie (x1 e x2) Esempio: 20 pazienti ipertesi vengono assegnati casualmente a due gruppi di trattamento. Il primo gruppo viene trattato con un diuretico, mentre il secondo gruppo viene trattato con un farmaco beta-bloccante. Dopo due settimane di trattamento viene rilevata la frequenza cardiaca (in battiti al minuto): Diuretico 80 Beta-bloccante 70 86 65 88 66 82 76 88 68 87 66 77 71 72 72 88 69 79 82 La frequenza cardiaca differisce in modo significativo tra i 2 gruppi? Test t di Student (per dati non-appaiati) { H0: µdiur= µBH1: µdiur≠ µBtest a due code { H0: µdiur≤ µBH1: µdiur> µBtest a una coda Livello di significatività = 5% Gradi di libertà = n1 + n2 - 2 = 10+10-2 = 18 Soglia critica = t18, 0,025 = 2,101 14 t= |x1-x2| ESx1-x2 = Σx Σx2 Diuretico 827 68675 Beta-bloc 705 49947 |x1-x2| √(1/n1+1/n2) (dev1+dev2)/ (n1+n2-2) n 10 10 Dev Var DS x 82,7 282,1 31,34 5,599 70,5 244,5 27,17 5,212 Assunzioni: 1) la frequenza cardiaca si distribuisce normalmente 2) La varianza non differisce tra i due gruppi t= |82,7-70,5|| √(1/10+1/10) (282,1+244,5)/ (10+10-2) = 12,2 12,2 = = 5,043 √5,85 2,42 t osservato (5,043) > t tabulato (2,101) Rifiuto H0 (P<0,001) Test d’ipotesi: t di Student per dati appaiati 15 A un gruppo di pazienti diabetici viene somministrato un farmaco ipoglicemizzante. Nella tabella seguente sono riportati i valori di glicemia (in mg/dl) di ciascun paziente prima e dopo il trattamento: Paziente Prima Dopo 1 224 198 2 179 167 3 149 116 4 254 229 5 112 117 6 135 108 7 218 143 8 153 133 9 167 159 10 138 131 Secondo voi la glicemia è variata in modo significativo con il trattamento? 300 glicemia (mg/dl) 250 200 valore medio 150 100 50 0 Prima Paziente 1 2 3 4 5 6 7 8 9 10 Prima 224 179 149 254 112 135 218 153 167 138 Dopo 198 167 116 229 117 108 143 133 159 131 differenza -26 -12 -33 -25 5 -27 -75 -20 -8 -7 Dopo d = -228 d2 = 9426 d = -22,8 sd = 21,67 Test t di Student per dati appaiati) { H 0: = 0 H 1: ≠ 0 test a due code Livello di significatività = 5% Gradi di libertà = n1 - 1 = 10-1 = 9 Soglia critica = t9, 0,025 = 2,262 t = d-0 = -22,8 = -22,8 = -3,327 sd/√ √n 21,67/√ √10 6,853 16 t tabulato | t osservato | > soglia critica 3,327 2,262 Rifiuto H0 La glicemia dei diabetici è diminuita in modo significativo dopo somministrazione del farmaco ipoglicemizzante (P=0,009). Distribuzione t di Student densità di probabilità ν = n-1 = gradi di libertà ν=9 -3,33 -2,262 0 2,262 17
© Copyright 2025 ExpyDoc