Dove sono andati a finire i soldi

0.1
Stimatori distorti e non distorti di media e varianza
Ho supposto di conoscere che la distribuzione associata alla popolazione descritta dal numero aleatorio X faccia parte di una famiglia
F
F
;
2 ;a
2R;
2 2R
++ ;a2A
(1)
Rk
di cui conosco la struttura ma non gli speci…ci parametri ; 2 ; a (o una parte
di questi). Immagino di esaminare un campione della popolazione, costituito da
n osservazioni (Xi )i2n . Le ipotesi relative alla procedura di campionamento sono
i) che la distribuzione di ciascun numero aleatorio Xi sia quella di X, dunque
caratterizzata (oltre che dagli eventuali altri parametri raccolti nel vettore a)
dal parametro e dal parametro 2 ; e inoltre ii) che, qualunque sia n 2 N, gli
n numeri aleatori (Xi )i2n siano mutuamente indipendenti1 .
Se nessuno dei parametri mi è noto, posso comunque tentare di stimare in
funzione del campione osservato (Xi )i2n il valore ignoto (ma supposto esistente)
del parametro media , mediante la media “statistica” del campione osservato
X
1X
Xi
n i2n
(2)
P
(da questa de…nizione segue subito - occorre dirlo? - che vale i2n Xi = nX).
In altre parole, il mio procedimento di stima è descritto dalla famiglia di funzioni
G (gn )n2N , dove
gn : Rn ! R; x 7!
e0 x
1X
=
0
ee
n i2n
(3)
i
(e 2 Rn vettore2 a componenti tutte uguali ad 1).
Conoscere il parametro media corrisponderebbe a poter valutare a priori
la speranza matematica del risultato relativo a questo procedimento di stima
(del pari un numero aleatorio), usando una (qualunque) distribuzione F ; 2 ;a
scelta tra quelle per cui il parametro assume il valore conosciuto; ottenendosi
1 La prima ipotesi si esprime dunque nel modo seguente: 8
Rk ; 8i 2 n,
EF
EF
; 2 ;a
; 2 ;a
(Xi )
=
2
=
(Xi
)
2 R; 8
2
2 R++ ; 8a 2 A
2
2 Sto dunque indicando con e un vettore a dimensione variabile, che è un leggero abuso di
notazione.
1
allora
EF
; 2 ;a
X
= EF
=
=
=
; 2 ;a
1X
EF
n i2n
1X
n
1X
Xi
n i2n
; 2 ;a
!
(4)
(Xi )
i2n
Questa proprietà, cioè l’uguaglianza tra il valore “vero” (ignoto) del parametro che voglio stimare e la previsione del risultato fornito dal procedimento
di stima (più sinteticamente, del valore assunto dallo stimatore (gn )n2N ), indipendentemente (oltre che da n) dal particolare membro della famiglia di distribuzioni per cui il parametro assume il valore “vero”, si chiama proprietà di
non distorsione. In generale3 , si ha la seguente
De…nizione 1 (Assenza di distorsione) Sia F
(Fa )a2A Rk una famiglia
di distribuzioni a k parametri cui si assume appartenga la distribuzione e¤ ettiva associata ad una popolazione descritta dal numero aleatorio X; e sia G
(gn )n2N lo stimatore di uno di questi parametri, diciamo lo i-esimo..Fissato un
qualunque numero 2 i (A), risulta conseguentemente determinato l’insieme
1
A
i ( ).di tutti i vettori ammissibili di parametri a 2 A per i quali l’iesimo
è uguale ad . G si dice non distorto se 8n 2 R; 8 2 i (A) ; 8a 2 A
EF [gn (X1 ; : : : ; Xn )] =
(5)
Dunque ho appena veri…cato nella (4) che lo stimatore “media campionaria”
(3) non è distorto.
Posso poi stimare in funzione del campione osservato (Xi )i2n anche il parametro varianza di una distribuzione appartenente ad una famiglia F; questo può
accadere sia quando il parametro media della distribuzione mi sia già conosciuto
per altra via, sia quando questo a sua volta venga da me stimato (in modo non
distorto come ho visto) dalla media campionaria X.
Uno stimatore plausibile nel primo caso è H = (hn )n2N con
hn : Rn ! R+ ; x 7!
kx
2
ek
e0 e
e nel secondo caso H0 = (h0n )n2N con
h0n : Rn ! R+ ; x 7!
kx
=
1X
(
n i2n
2
x Xe
gn (x) ek
=
0
ee
e0 e
2
i
2
=
)
1X
n i2n
i
X
2
3 Considero qui media
e varianza 2 inserite come componenti particolari del vettore
di parametri a 2 A anziché trattarle esplicitamente ed autonomamente da eventuali altri
parametri come ho fatto prima. La presenza di media e varianza tra i parametri di una
famiglia di distribuzioni a k 2 parametri è pressoché universale. Se F è una famiglia ad un
parametro, questo è generalmente la media, o una funzione semplice della media.
2
Il primo si rivela non distorto, mentre il secondo risulta distorto ma facilmente
sostituibile con uno stimatore simile e non distorto.
Infatti, in primo luogo
"
#
h
i
1X
1X
1X 2
n 2
2
2
EF
(Xi
) =
EF (Xi
) =
= 2
=
n i2n
n i2n
n i2n
n
In secondo luogo,
"
1X
EF
Xi
n i2n
X
2
#
=
=
=
1
EF
n
1
EF
n
1
EF
n
"
"
"
X
Xi2
i2n
X
2
X
Xi2
Xi2
2nXX + nX
nX
2
i2n
X
2
i2n
i2n
i2n
X
Xi X +
X
#
2
#
#
A questo punto manipolo algebricamente l’espressione ottenuta in modo da farvi
2
comparire (Xi
) al posto di Xi2 , quindi aggiungendo e togliendo i termini
2
2Xi e
. Poiché ciò avviene per ciascun i, posso dare alle quantità che
aggiungo e tolgo le due forme alternative
X
2Xi
=
2 nX
i2n
X
2
2
= n
i2n
Riprendo dunque dall’ultima espressione cui sono pervenuto, raggruppando per
prima cosa i 2 (iniziali) + 4 (2 coppie di aggiunti e tolti) addendi della somma
in cui l’ho trasformata
#
"
X
1
2
2
EF
Xi nX =
n
i2n
=
=
=
=
1
EF
n
"
X
i2n
Xi2
X
2Xi +
i2n
X
i2n
2
!
"
#
X
1
2
2
EF
(Xi
)
n X
n
i2n
(
"
#
h
X
1
2
EF
(Xi
)
nEF
X
n
i2n
1
n
n
2
n V arFa X
3
+
EF
2
nX + 2
X
2
i
)
nX
n
2
#
Ma4
n V arFa X = n V arFa
1X
Xi
n i2n
!
=
1
n X
V arFa (Xi ) = n
n2 i2n
n
2
=
2
e in de…nitiva
EF
"
1X
Xi
n i2n
X
2
#
=
1
n
n
2
2
=
n
1
2
n
Pertanto lo stimatore H0 sottostima la varianza 2 di un (modesto per n grande)
n 1
n
fattore
. Basta pertanto correggerlo col reciproco
del fattore di
n
n 1
n
h0 :
distorsione, cioè de…nendo la famiglia K (kn )n2N con kn
n 1 n
n
kn : R ! R+ ; x 7!
kx
2
x Xe
gn (x) ek
=
e0 e 1
e0 e 1
2
=
1
n
1
X
i2n
La non distorsione di K è a questo punto di immediata veri…ca
#
#
"
"
n
1 X
1X
2
2
EF
Xi X
=
EF
Xi X
=
n 1 i2n
n 1
n i2n
4 Questo
passaggio è il punto principale da me perso di vista l’altro giorno.
4
X
i
2
2