0.1 Stimatori distorti e non distorti di media e varianza Ho supposto di conoscere che la distribuzione associata alla popolazione descritta dal numero aleatorio X faccia parte di una famiglia F F ; 2 ;a 2R; 2 2R ++ ;a2A (1) Rk di cui conosco la struttura ma non gli speci…ci parametri ; 2 ; a (o una parte di questi). Immagino di esaminare un campione della popolazione, costituito da n osservazioni (Xi )i2n . Le ipotesi relative alla procedura di campionamento sono i) che la distribuzione di ciascun numero aleatorio Xi sia quella di X, dunque caratterizzata (oltre che dagli eventuali altri parametri raccolti nel vettore a) dal parametro e dal parametro 2 ; e inoltre ii) che, qualunque sia n 2 N, gli n numeri aleatori (Xi )i2n siano mutuamente indipendenti1 . Se nessuno dei parametri mi è noto, posso comunque tentare di stimare in funzione del campione osservato (Xi )i2n il valore ignoto (ma supposto esistente) del parametro media , mediante la media “statistica” del campione osservato X 1X Xi n i2n (2) P (da questa de…nizione segue subito - occorre dirlo? - che vale i2n Xi = nX). In altre parole, il mio procedimento di stima è descritto dalla famiglia di funzioni G (gn )n2N , dove gn : Rn ! R; x 7! e0 x 1X = 0 ee n i2n (3) i (e 2 Rn vettore2 a componenti tutte uguali ad 1). Conoscere il parametro media corrisponderebbe a poter valutare a priori la speranza matematica del risultato relativo a questo procedimento di stima (del pari un numero aleatorio), usando una (qualunque) distribuzione F ; 2 ;a scelta tra quelle per cui il parametro assume il valore conosciuto; ottenendosi 1 La prima ipotesi si esprime dunque nel modo seguente: 8 Rk ; 8i 2 n, EF EF ; 2 ;a ; 2 ;a (Xi ) = 2 = (Xi ) 2 R; 8 2 2 R++ ; 8a 2 A 2 2 Sto dunque indicando con e un vettore a dimensione variabile, che è un leggero abuso di notazione. 1 allora EF ; 2 ;a X = EF = = = ; 2 ;a 1X EF n i2n 1X n 1X Xi n i2n ; 2 ;a ! (4) (Xi ) i2n Questa proprietà, cioè l’uguaglianza tra il valore “vero” (ignoto) del parametro che voglio stimare e la previsione del risultato fornito dal procedimento di stima (più sinteticamente, del valore assunto dallo stimatore (gn )n2N ), indipendentemente (oltre che da n) dal particolare membro della famiglia di distribuzioni per cui il parametro assume il valore “vero”, si chiama proprietà di non distorsione. In generale3 , si ha la seguente De…nizione 1 (Assenza di distorsione) Sia F (Fa )a2A Rk una famiglia di distribuzioni a k parametri cui si assume appartenga la distribuzione e¤ ettiva associata ad una popolazione descritta dal numero aleatorio X; e sia G (gn )n2N lo stimatore di uno di questi parametri, diciamo lo i-esimo..Fissato un qualunque numero 2 i (A), risulta conseguentemente determinato l’insieme 1 A i ( ).di tutti i vettori ammissibili di parametri a 2 A per i quali l’iesimo è uguale ad . G si dice non distorto se 8n 2 R; 8 2 i (A) ; 8a 2 A EF [gn (X1 ; : : : ; Xn )] = (5) Dunque ho appena veri…cato nella (4) che lo stimatore “media campionaria” (3) non è distorto. Posso poi stimare in funzione del campione osservato (Xi )i2n anche il parametro varianza di una distribuzione appartenente ad una famiglia F; questo può accadere sia quando il parametro media della distribuzione mi sia già conosciuto per altra via, sia quando questo a sua volta venga da me stimato (in modo non distorto come ho visto) dalla media campionaria X. Uno stimatore plausibile nel primo caso è H = (hn )n2N con hn : Rn ! R+ ; x 7! kx 2 ek e0 e e nel secondo caso H0 = (h0n )n2N con h0n : Rn ! R+ ; x 7! kx = 1X ( n i2n 2 x Xe gn (x) ek = 0 ee e0 e 2 i 2 = ) 1X n i2n i X 2 3 Considero qui media e varianza 2 inserite come componenti particolari del vettore di parametri a 2 A anziché trattarle esplicitamente ed autonomamente da eventuali altri parametri come ho fatto prima. La presenza di media e varianza tra i parametri di una famiglia di distribuzioni a k 2 parametri è pressoché universale. Se F è una famiglia ad un parametro, questo è generalmente la media, o una funzione semplice della media. 2 Il primo si rivela non distorto, mentre il secondo risulta distorto ma facilmente sostituibile con uno stimatore simile e non distorto. Infatti, in primo luogo " # h i 1X 1X 1X 2 n 2 2 2 EF (Xi ) = EF (Xi ) = = 2 = n i2n n i2n n i2n n In secondo luogo, " 1X EF Xi n i2n X 2 # = = = 1 EF n 1 EF n 1 EF n " " " X Xi2 i2n X 2 X Xi2 Xi2 2nXX + nX nX 2 i2n X 2 i2n i2n i2n X Xi X + X # 2 # # A questo punto manipolo algebricamente l’espressione ottenuta in modo da farvi 2 comparire (Xi ) al posto di Xi2 , quindi aggiungendo e togliendo i termini 2 2Xi e . Poiché ciò avviene per ciascun i, posso dare alle quantità che aggiungo e tolgo le due forme alternative X 2Xi = 2 nX i2n X 2 2 = n i2n Riprendo dunque dall’ultima espressione cui sono pervenuto, raggruppando per prima cosa i 2 (iniziali) + 4 (2 coppie di aggiunti e tolti) addendi della somma in cui l’ho trasformata # " X 1 2 2 EF Xi nX = n i2n = = = = 1 EF n " X i2n Xi2 X 2Xi + i2n X i2n 2 ! " # X 1 2 2 EF (Xi ) n X n i2n ( " # h X 1 2 EF (Xi ) nEF X n i2n 1 n n 2 n V arFa X 3 + EF 2 nX + 2 X 2 i ) nX n 2 # Ma4 n V arFa X = n V arFa 1X Xi n i2n ! = 1 n X V arFa (Xi ) = n n2 i2n n 2 = 2 e in de…nitiva EF " 1X Xi n i2n X 2 # = 1 n n 2 2 = n 1 2 n Pertanto lo stimatore H0 sottostima la varianza 2 di un (modesto per n grande) n 1 n fattore . Basta pertanto correggerlo col reciproco del fattore di n n 1 n h0 : distorsione, cioè de…nendo la famiglia K (kn )n2N con kn n 1 n n kn : R ! R+ ; x 7! kx 2 x Xe gn (x) ek = e0 e 1 e0 e 1 2 = 1 n 1 X i2n La non distorsione di K è a questo punto di immediata veri…ca # # " " n 1 X 1X 2 2 EF Xi X = EF Xi X = n 1 i2n n 1 n i2n 4 Questo passaggio è il punto principale da me perso di vista l’altro giorno. 4 X i 2 2
© Copyright 2024 ExpyDoc