Lezione 1

Campionamento e Test d’ipotesi
Prof. Giuseppe Verlato
Sezione di Epidemiologia e Statistica Medica,
Università di Verona
Inferenza statistica = processo che,
partendo dalle informazioni contenute in
un campione, consente di giungere a delle
affermazioni relative alla popolazione da
cui proviene quel campione.
1
Il campione deve essere rappresentativo della popolazione originaria.
Se si intervistano i passanti in una determinata strada cittadina, si
ottiene un campione rappresentativo della popolazione originaria?
No, in quanto la probabilità di essere intervistati varia da un soggetto
(unità statistica) all’altro a seconda delle abitudini personali ed è ignota.
Per ottenere un campione rappresentativo, bisogna disporre di una lista
di campionamento (sampling frame) da cui estrarre il campione.
Devo conoscere esattamente la probabilità che un’unità statistica ha di
essere estratta (campionamento di tipo probabilistico).
La media campionaria è una variabile casuale.
Infatti:
1) varia da un campione all’altro
2) i campioni sono estratti in modo casuale.
2
DETERMINAZIONE SPERIMENTALE della
DISTRIBUZIONE di una MEDIA CAMPIONARIA - 1
POPOLAZIONE ORIGINARIA
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 …. 88 89 90
Σx=4095
µ=45,5
Σx2=247065 σ=26,12
distribuzione uniforme
Estraiamo campioni di numerosità
numerosità 3
75 27 4
6 26 12
35,3
57 27 69
69 41 58 21 85 87
14,7
51
56
Medie campionarie con n=3
64,3
Σx=221,3
xx =44,3
Σx2=11339,3 sx =19,6
Estraiamo campioni di numerosità
numerosità 6
3 56 34
52 9 48
33,7
84 46 81
67 14 4
29 68 2
22 14 53
80 9 70 66 51 6
14 12 77 82 32 36
49,3
31,3
43,7
Medie campionarie con n=6
45,5
Σx=203,5
Σx2=8526
xx =40,7
sx =7,8
DETERMINAZIONE SPERIMENTALE della
DISTRIBUZIONE di una MEDIA CAMPIONARIA - 2
1) La media delle medie (44,27 per n=3 e 40,7 per n=6) è all’incirca
uguale alla media della popolazione originaria (45,5)
2) La variabilità delle medie campionarie è inferiore alla variabilità
osservata nella popolazione originaria: DSx=Errore Standard = σ/√
√n
numerosità campionaria
n=3
n=6
valore osservato
DSx = 19,63
DSx = 7,80
valore atteso
26,12/√
√3=15,08
26,12/√
√6=10,67
3) All’aumentare della numerosità campionaria, la media campionaria tende a distribuirsi normalmente indipendentemente dalla
distribuzione della variabile originaria
3
Nel ‘900 falsificazione di ipotesi
(Karl Popper)
Nell’ ‘800 dimostrazione di
ipotesi (Claude Bernard)
TEST D’IPOTESI
Ipotesi Nulla (H0)
Ipotesi alternativa
(H1)
(Tutte le differenze osservate sono dovute al caso)
FALSIFICARE L’IPOTESI NULLA
Distribuzione teorica
regione
di rifiuto
160
regione di
accettazione
170
regione
di rifiuto
Distribuzione teorica
Test non-parametrici
Metto i dati in ordine crescente:
AAABAABBABBBABBBBB
I valori del gruppo A tendono ad essere
più bassi dei valori del gruppo B
180
glicemia (mg/dl)
4
IPOTESI SCIENTIFICA:
Affermazione che si può sottoporre a verifica, che si può tentare di
falsificare. Con una procedura che comporta delle misurazioni si
può cercare di dimostrare che l’ipotesi non è vera.
Un’ipotesi scientifica viene ritenuta vera finché non si dimostra il
contrario.
IPOTESI STATISTICA:
Affermazione circa una caratteristica di una popolazione che si
cerca di supportare o di rifiutare sulla base delle informazioni
disponibili, in genere ricavate da un campione.
TEST D’IPOTESI
H0: IPOTESI NULLA
Tutte le differenze osservate
sono delle semplici
fluttuazioni casuali
H1: IPOTESI ALTERNATIVA
Le differenze riscontrate nelle
statistiche campionarie rispecchiano
una reale differenza nei parametri
delle popolazioni corrispondenti
Esempio:
La glicemia dei diabetici
italiani è uguale alla glicemia
dei diabetici americani
La glicemia dei diabetici italiani
è diversa dalla glicemia dei
diabetici americani
5
TEST STATISTICO:
Regola che consente di discriminare tra i
risultati che portano a non rifiutare o a rifiutare
l’ipotesi nulla (H0).
Nel riportare la decisione si riporta anche la
probabilità che questa sia corretta.
Dati del campione
Test statistico
P>0,05 = la probabilità che le
differenze osservate siano dovute
al caso è superiore al 5%
Accetto l’ipotesi nulla (H0)
tutte le differenze osservate
tra i campioni possono
essere attribuite al caso
P<0,05 = la probabilità che le
differenze osservate siano dovute
al caso è inferiore al 5%
Accetto l’ipotesi alternativa, H1
le differenze osservate tra i
campioni rispecchiano delle
differenze reali tra le popolazioni
6
Test bidirezionale
H0: µ italiani = µ0
H1: µ italiani ≠ µ0
Two-sided
regione
di rifiuto
160
regione di
accettazione
170
regione
di rifiuto
180
glicemia (mg/dl)
Test unidirezionale
H0: µ italiani ≥ µ0
H1: µ italiani < µ0
One-sided
regione
di rifiuto
160
regione di
accettazione
170
180
glicemia (mg/dl)
7
Ipotesi Nulla (H0)
vera
Accetto H0
Rifiuto H0
falsa
Errore
Va bene del II tipo
Errore
del I tipo Va bene
P(errore del I tipo) = α (alfa)
P(errore del II tipo) = β (beta)
In genere, nel test d’ipotesi la probabilità di errore del I tipo viene
fissata al 5% (0,05). Pertanto in un caso su 20 si rifiuterà H0 (ovvero
il test risulterà significativo) per semplice effetto del caso, anche
quando H0 è vera. In termini statistici si sceglie un livello di
significatività del 5%.
Ad esempio, se in un test d’ipotesi P<0,01, vuol dire che posso
rifiutare H0 con una probabilità di errore del I tipo inferiore all’1%;
in altre parole la probabilità che le differenze osservate siano dovute
al caso è inferiore all’1%.
8
Attualmente si preferisce riportare la probabilità esatta
associata con un determinato test statistico.
Anziché scrivere P<0,01 si preferisce riportare P=0,003.
Al posto di un test d’ipotesi si esegue un test di
significatività.
Tuttavia,
mentre P<0,01 è la probabilità prefissata che le differenze
siano dovute al caso sotto H0 ,
P=0,003 è la probabilità di osservare quel determinato
risultato o un risultato più estremo (PTOME = Probability
of This Or More Extreme) sotto H0.
POTENZA di un test = 1- beta = 1 - P(errore del II tipo)
E’ la probabilità che un test statistico ha di falsificare
l’ipotesi nulla quando l’ipotesi nulla è effettivamente falsa.
In altre parole, la Potenza di un test è la sua capacità di
cogliere delle differenze, quando queste differenze
esistono.
Il test statistico è costruito in modo da mantenere costante
il livello di significatività, indipendentemente dalla
numerosità campionaria. Ma questo risultato viene
raggiunto a spese della potenza del test, che aumenta
all’aumentare della numerosità campionaria.
9
SIGNIFICATIVITA’ STATISTICA e
RILEVANZA CLINICA
Un'indagine epidemiologica, condotta su un
gran numero di persone, ha messo in luce che i
fumatori dormono meno della popolazione
generale.
La differenza aveva una significatività
elevata (P<0.001), ovvero ben difficilmente
poteva essere attribuita al caso.
La differenza consisteva in 3 minuti di sonno
in meno nei fumatori rispetto ai non-fumatori.
10
≈
significativita'
statistica
differenza osservata
variabilita'casuale
E'piu'facile evidenziare una differenza
significativa
E'piu'difficile evidenziare
una differenza significativa
Scelta del test statistico
11
All'inizio di un'elaborazione statistica la prima domanda da porsi è:
Di che tipo è la variabile?
Esempi
Test
indicati
NOMINALE
ORDINALE
QUANTITATIVA
Stato di vita (vivo/morto)
Intensità del dolore
Peso (Kg)
Sesso (M/F)
Profondità del coma
Età (anni)
Tipo di ventilazione (spon-
Wassermann (-, -+, +, ++,
Glicemia (mmol)
tanea/assistita/artificiale)
+++, ++++, +++++)
Chi-quadrato (χ2)
Test non-parametrici
T di Student per dati nonappaiati o per dati appaiati
Analisi della varianza
Regressione e correlazione
12
Con una variabile di tipo quantitativo,
qual è il test statistico da effettuare?
Confronto fra soggetti diversi
Misure ripetute sugli stessi soggetti
Confronto fra
variabili diverse
↓
↓
↓
↓
2 gruppi
Più di 2 gruppi
2 misurazioni
Più di 2
misurazioni
↓
↓
↓
↓
↓
t di Student
ANOVA a 1
t di Student per
ANOVA per
Regressione e
criterio
dati appaiati
misure ripetute
Correlazione
ANOVA = ANalysis Of VAriance (Analisi della varianza)
1) Viene condotto uno studio sugli studenti iscritti alla Facoltà di Farmacia.
L'
indice di massa corporea (peso/statura2) delle matricole viene confrontato con
l'
indice di massa corporea degli iscritti al terzo anno. Che tipo di test si può
utilizzare per questo confronto?
2) Nello stesso studio in un gruppo di studenti l'
indice di massa corporea
(peso/statura2) viene misurato due volte, sia al momento dell'
iscrizione che alla
fine del terzo anno di corso. Che tipo di test si può utilizzare per confrontare
queste due misurazioni successive?
3) Nella stessa indagine viene studiata la relazione tra peso e statura. Che tipo di
test si può utilizzare?
4) Nella stessa indagine viene studiata la relazione tra colore degli occhi e colore
dei capelli. Che tipo di test si può utilizzare?
A) test t di Student per dati non-appaiati
B) test t di Student per dati appaiati
C) test del chi-quadrato
D) regressione e correlazione
E) altro __________________
13
Test d’ipotesi: confronto fra
due medie campionarie (x1 e
x2)
Esempio: 20 pazienti ipertesi vengono assegnati casualmente a due
gruppi di trattamento. Il primo gruppo viene trattato con un diuretico,
mentre il secondo gruppo viene trattato con un farmaco beta-bloccante.
Dopo due settimane di trattamento viene rilevata la frequenza cardiaca
(in battiti al minuto):
Diuretico
80
Beta-bloccante 70
86
65
88
66
82
76
88
68
87
66
77
71
72
72
88
69
79
82
La frequenza cardiaca differisce in modo significativo tra i 2 gruppi?
Test t di Student (per dati non-appaiati)
{
H0: µdiur= µBH1: µdiur≠ µBtest a due code
{
H0: µdiur≤ µBH1: µdiur> µBtest a una coda
Livello di significatività = 5%
Gradi di libertà = n1 + n2 - 2 = 10+10-2 = 18
Soglia critica = t18, 0,025 = 2,101
14
t=
|x1-x2|
ESx1-x2
=
Σx
Σx2
Diuretico 827 68675
Beta-bloc 705 49947
|x1-x2|
√(1/n1+1/n2) (dev1+dev2)/ (n1+n2-2)
n
10
10
Dev Var DS
x
82,7 282,1 31,34 5,599
70,5 244,5 27,17 5,212
Assunzioni:
1) la frequenza cardiaca si distribuisce normalmente
2) La varianza non differisce tra i due gruppi
t=
|82,7-70,5||
√(1/10+1/10) (282,1+244,5)/ (10+10-2)
=
12,2
12,2
=
= 5,043
√5,85
2,42
t osservato (5,043) > t tabulato (2,101)
Rifiuto H0 (P<0,001)
Test d’ipotesi:
t di Student per dati appaiati
15
A un gruppo di pazienti diabetici viene somministrato un farmaco
ipoglicemizzante. Nella tabella seguente sono riportati i valori di
glicemia (in mg/dl) di ciascun paziente prima e dopo il trattamento:
Paziente
Prima
Dopo
1
224
198
2
179
167
3
149
116
4
254
229
5
112
117
6
135
108
7
218
143
8
153
133
9
167
159
10
138
131
Secondo voi la glicemia è variata in modo significativo con il trattamento?
300
glicemia (mg/dl)
250
200
valore medio
150
100
50
0
Prima
Paziente
1
2
3
4
5
6
7
8
9
10
Prima
224
179
149
254
112
135
218
153
167
138
Dopo
198
167
116
229
117
108
143
133
159
131
differenza
-26
-12
-33
-25
5
-27
-75
-20
-8
-7
Dopo
d = -228
d2 = 9426
d = -22,8
sd = 21,67
Test t di Student per dati appaiati)
{
H 0: = 0
H 1: ≠ 0
test a due code
Livello di significatività = 5%
Gradi di libertà = n1 - 1 = 10-1 = 9
Soglia critica = t9, 0,025 = 2,262
t = d-0 = -22,8
= -22,8 = -3,327
sd/√
√n 21,67/√
√10
6,853
16
t tabulato
| t osservato | > soglia critica
3,327
2,262
Rifiuto H0
La glicemia dei diabetici è diminuita in
modo significativo dopo somministrazione
del farmaco ipoglicemizzante (P=0,009).
Distribuzione t di Student
densità di probabilità
ν = n-1 = gradi di libertà
ν=9
-3,33 -2,262
0
2,262
17