Convocazione Consigli di Classe marzo 2015.pdf

Il Campionamento
p
Seconda Università degli studi Napoli
Facoltà di Economia
P l i statistica
Popolazione
i i
Una v.c. X caratterizzata da una
Funzione di ripartizione F(X)
Distribuzioni campionarie
C i statistico
Campione
t ti ti
Il campione casuale
Rappresenta una
v.c. congiunta
R. Lombardo, I. Camminatiello
Di i
Dipartimento
di EEconomiai
Distribuzione campionaria
St ti ti e momenti
Statistica
ti campionari.
i
i


Siano X1…Xn n v.c. i.i.d. con funzione
di distribuzione detta di densità congiunta
f (X1…Xn)=f(X1)*…*f(Xn)
Allora X1…Xn è definito campione casuale (con reintroduzione)
di ampiezza n estratto da una popolazione X.
Le caratteristiche dei campioni estratti da
una popolazione sono sintetizzate attraverso
una funzione detta statistica


Se dda una popolazione
S
l i
X sii estraggono
t
tutti
t tti i possibili
ibili campioni
i i
di ampiezza n e per ogni campione si calcola la statistica di
interesse,, definita come funzione delle sole osservazioni
campionarie e non dipendente da nessun parametro incognito, si
ottiene un insieme di valori ognuno dei quali è candidato ad
essere una stima del parametro incognito della popolazione.
popolazione
Il modo in cui la statistica varierà da un campione ad un altro
determina la distribuzione di probabilità della statistica
considerata ossia la distribuzione campionaria della statistica.
A seconda della specificazione della statistica possiamo avere la
distribuzione campionaria della media, della mediana, della
varianza e così via.
Teorema sulla distribuzione della Media campionaria
Siano X1…Xn n osservazioni campionarie
p
i.i.d. estratte da una Popolazione
p
X con funzione di densità f(X)
( ) con media  e
2
Varianza 
X X n
i
E(X )  
Media campionaria
Si dimostra
2
Var ( X ) 
n
Media campionaria
Sia data una certa popolazione X con funzione di densità
f (X , , )
Considerando tutte le medie campionarie ed associando ad ogni media distinta la sua
probabilità, si ottiene la distribuzione di probabilità della media campionaria
Var ( X )  
n
Di t i
Dimostrazione
 n X  1
E ( X )  E   i  
 i 1 n  n
n

i 1
E(X i ) 
1
n
n

i 1
1
n  
n
Si noti che la distribuzione della Media campionaria tende, al crescere di n a concentrarsi attorno alla media della
Popolazione
Distribuzione della media
Media campionaria:
Campionamento senza reintroduzione
Nel caso in cui le v.c. X1…Xn siano dipendenti Il campionamento è detto senza reintroduzione:
Se X 1 ,, X n è un campione casuale estratto
2
X

N
(

,

) ssi haa cchee
da una
u a popolazione
popo a o e
X  N (  ,  2 n)
e
Z
X 

n
 N (0,1)
La probabilità che un elemento della popolazione entri a far
Parte del campione è influenzata dal risultato delle estrazioni precedenti!!!
Si dimostra che
E(X )  
e la varianza
Var ( X ) 
2 N  n
n N 1
Si noti che quando la popolazione è infinita i due schemi di
Campionamento
p
coincidono!!!
In generale la varianza ottenuta da uno schema senza reimmissione è minore di quella ottenuta da un campionamento
con reimmissione
Teorema di De MoivreMoivre-Laplace
p
Teorema del Limite Centrale
Date n v.c. X1…Xn i.i.d. con media  e Varianza 2 e sia:
Zn 
X n  E(X n )
Var ( X n )

Xn  
/ n
Allora per n che tende ad infinito la distribuzione di Zn converge
alla Normale standardizzata.
Regola empirica: per n>30 l’approssimazione è accettabile.
Il teorema è importante perché grazie ad esso, la distribuzione campionaria della v.c. Media campionaria, si riconduce, per
n grande, ad una distribuzione Normale, qualunque sia la forma
della funzione di distribuzione della Popolazione dalla quale il campione è estratto!!
Se consideriamo una popolazione X descritta da una v.c. di Bernoulli, la v.c.
numero di successi in n prove
Sn  X1    X n
g una distribuzione binomiale con
segue
E ( S n )  np
Var ( S n )  npq
Consideriamo
Yn 
S n  E S n  S n  np

varS n 
npq
Al tendere di n all'infinito la distribuzione di Yn tende alla distribuzione Normale
standardizzata.
Il teorema vale anche pper la v.c. pproporzione
p
campionaria
p
Teorema di De MoivreMoivre-Laplace:
Laplace:
osservazioni
i i
• La rapidità con la quale la distribuzione binomiale converge a
quella gaussiana dipende dal valore di p
• Agli effetti pratici l’approssimazione è ritenuta accettabile se np
e nq sono entrambi
t bi maggiori
i i o ugualili a 55.
• Per migliorare l’approssimazione si ricorre alla cosiddetta
correzione per continuità.
• Poiché la binomiale è discreta e la gaussiana è continua, ai fini
del calcolo approssimato si considera ogni valore intero x come
centro dell’intervallo ( x-0,5; x+0,5 ).
Sn n
Esercizio

Una moneta ben equilibrata viene lanciata
500 volte. Si calcoli la probabilità che il
p
tra 240 e 260.
numero di teste sia compreso