Clicca qui - SAP

Capitolo 2
Variabili aleatorie
2.1
Numeri aleatori
Si dice variabile aleatoria una qualsiasi caratteristica di un esperimento aleatorio che vari in funzione dell’esito sperimentale in modo da descrivere eventi.
Formalmente, se (⌦, A, P) `e uno spazio di probabilit`
a che modella l’esperimento aleatorio ed E `e un insieme, munito di una trib`
u E, i cui elementi
rappresentano le diverse modalit`
a con cui la caratteristica pu`
o esprimersi,
si dice variabile aleatoria o elemento aleatorio ogni funzione Y : ⌦ ! E che
soddisfi la condizione di misurabilit`
a : Y 1 (B) 2 A, per ogni B 2 E, dove
1
Y (B) = {! 2 ⌦ : Y (!) 2 B} denota la controimmagine di B tramite Y .
Si verifica subito, usando le propriet`
a della controimmagine, che la classe
(Y ) = {Y 1 (B) | B 2 E} `e una trib`
u su ⌦; diremo che (Y ) `e la trib`
u
generata da Y . Chiaramente, la condizione di misurabilit`
a equivale a richiedere (Y ) ✓ A. A parole, quello che chiediamo `e che gli eventi esprimibili
mediante Y siano, in e↵etti, eventi. Va da s´e che questo `e scontato nel caso
in cui A = }(⌦), cio`e nel caso di uno spazio di probabilit`
a discreto. Si noti
che P non gioca alcun ruolo nella misurabilit`
a di Y e che, almeno in linea di
principio, lo stesso elemento aleatorio pu`
o essere considerato sotto diverse
probabilit`
a (diverse valutazioni soggettive).
Diremo spazi misurabili le coppie insieme-trib`
u come (⌦, A) ed (E, E) e
la notazione Y : (⌦, A) ! (E, E) esprimer`
a in modo conciso il fatto che Y `e
un elemento aleatorio, definito sullo spazio misurabile (⌦, A) di un qualche
spazio di probabilit`
a (⌦, A, P), a valori nello spazio misurabile (E, E). Dopo
di che scriveremo per brevit`
a {Y 2 B} invece di {! 2 ⌦ : Y (!) 2 B},
limitando l’uso del pi`
u arido Y 1 (B).
La misurabilit`
a di un elemento aleatorio Y permette di definirne la distribuzione o legge come immagine di P tramite Y : LY (B) = P{Y 2 B},
B 2 E. Si verifica subito, usando le propriet`
a della controimmagine, che LY
`e una probabilit`
a e dunque (E, E, LY ) `e uno spazio di probabilit`
a. Diremo
che (E, E, LY ) `e lo spazio immagine di Y (indotto da Y ).
43
44
Luca La Rocca (10 novembre 2014)
Costruire un elemento aleatorio Y equivale a costruirne lo spazio immagine (E, E, LY ), sul quale eventualmente si pu`
o ridefinire Y (e) = e, e 2 E,
essendo la funzione identit`
a banalmente misurabile. Grazie a questa costruzione canonica, nella quale Y viene definito come funzione identit`
a del suo
stesso spazio immagine, potremo ritenere ben definito un elemento aleatorio
ogni qual volta ne sia ben definita la legge. In pratica, quando interessino
gli eventi esprimibili mediante Y , cio`e la trib`
u (Y ), lo spazio base di Y ,
cio`e lo spazio (⌦, A, P) su cui Y `e definito, sar`
a messo in ombra dallo spazio
immagine di Y , a prescindere dal fatto che i due spazi coincidano o meno.
Nell’Esempio 16 abbiamo sei ipotetici pazienti giapponesi, identificati
con i numeri da 1 a 6, ognuno dei quali presenta con proprie modalit`
a quattro
caratteristiche di interesse: sesso, religione, morale e temperatura corporea
(in gradi Celsius). In generale, un collettivo statistico `e un insieme di unit`
a
statistiche, senz’altro identificabili con i numeri da 1 a n, ognuna delle quali
presenta con proprie modalit`
a k caratteristiche di interesse (k 2 N). Diremo
caratteri statistici le funzioni Xj : {1, . . . , n} ! Ej che associano a ogni
unit`
a statistica la modalit`
a con cui essa presenta la j-esima caratterisitica,
j = 1, . . . , k, rappresentata da un elemento di Ej (insieme dei possibili valori
di Xj ). La matrice di dati in Tabella 1, contenente una riga per ogni unit`
a
e una colonna per ogni carattere, definisce X1 = “sesso”, X2 = “religione”,
X3 = “morale” e X4 = “temperatura” per il collettivo dell’Esempio 16,
una volta che, per esempio, si prenda E1 = {m, f}, E2 = {s, c, b, a}, E3 =
{b, m, a} ed E4 = Q. Si noti che abbiamo ritenuto opportuno, in linea di
principio, prevedere la possibilit`
a che la religione sia un’altra (eventualmente
nessuna) e che la temperatura venga misurata con un numero arbitrario (ma
necessariamente finito) di decimali; definire un carattere statistico richiede
in primo luogo di individuarne l’insieme dei possibili valori.
Un carattere si dice un fattore quando possa assumere un numero finito di
valori; si dice dicotomico quando possa assumerne solo due. Nell’Esempio 16
i caratteri X1 , X2 e X3 (non X4 ) sono fattori; di questi solo X1 `e dicotomico.
Un carattere si dice misurato su scala ordinale quando sull’insieme dei suoi
possibili valori sia definita una relazione d’ordine, altrimenti si dice misurato
su scala nominale. Nell’Esempio 16 sono misurati su scala ordinale X3 e X4 ,
mentre X2 `e misurato su scala nominale; a meno che non si voglia prendere
sul serio l’adagio secondo il quale i giapponesi nascono scintoisti, si sposano
cristiani e muoiono buddisti, nel qual caso verrebbero al contempo meno le
ragioni per prevedere altre modalit`
a. Il carattere X1 `e anch’esso misurato
su scala nominale, ma per caratteri dicotomici questa distinzione `e meno
interessante. Un carattere a valori reali (necessariamente misurato su scala
ordinale) si dice numerico. L’unico carattere numerico nell’Esempio 16 `e X4 ,
se lo si pensa a valori reali, cio`e lo si compone con l’immersione canonica
di Q in R per ottenere C : {1, . . . , n} ! R (sfruttando l’inclusione Q ⇢ R).
Nulla vieta, per`
o, di codificare X1 , X2 e X3 come S = g1 (X1 ), R = g2 (X2 )
ed M = g3 (X3 ), introducendo le codifiche gj : Ej ! R, j = 1, 2, 3.
Canovaccio delle Lezioni di Statistica ed Elementi di Probabilit`
a
45
Un carattere numerico Y con zero assoluto si dice misurato su scala
di rapporti, perch´e il rapporto Y (i)/Y (`) non dipende dall’unit`
a di misura,
comunque si prendano due unit`
a statistiche i ed ` in {1, . . . , n}; un carattere
numerico con zero convenzionale, come C, si dice invece misurato su scala
a intervalli, perch´e solo i rapporti di di↵erenze non dipendono dall’unit`
a di
misura. Per esempio, visto che C(1) = 40.0 e C(2) = 39.0, mentre C(3) =
39.5 e C(4) = 37.5, si pu`
o dire che C(3) C(4) `e due volte C(1) C(2),
mentre non si pu`
o dire che C(1) `e del 6.7% maggiore di C(4). Infatti, per il
carattere in gradi Fahrenheit
9
F = C + 32,
5
troveremmo F (1) = 104 ed F (4) = 99.5, quindi F (1) sarebbe del 4.5%
maggiore di F (4). Entrambe le percentuali sono prive di significato concreto.
Se si vuole misurare la temperatura su scala di rapporti, si pu`
o ricorrere ai
Kelvin, cio`e si pu`
o considerare il carattere K = C + 273.16. Per un gas
perfetto, lo zero Kelvin corrisponde all’ipotetico arresto delle sue molecole
e il raddoppio della temperatura in Kelvin, a volume costante, corrisponde
a un incremento “unitario” della sua entropia. Nell’Esempio 16, troviamo
K(1) = 313.16 e K(4) = 310.66, quindi la temperatura del paziente 1 `e dello
0.8% maggiore di quella del paziente 2.
Se selezioniamo un’unit`
a a caso da un collettivo statistico e osserviamo
il valore assunto da un certo carattere sull’unit`
a selezionata, otteniamo una
variabile aleatoria. Formalmente, prenderemo ⌦ = {1, . . . , n} e P uniforme
su }(⌦), quindi Ej = }(Ej ), j = 1, . . . , k, essendo la misurabilit`
a di Xj
banalmente garantita. Ogni carattere statistico potr`
a dunque vedersi come
un elemento aleatorio, la cui legge sar`
a detta distribuzione del carattere nel
collettivo. Nel caso specifico dell’Esempio 16, troveremo P{X1 = f} = 1/2,
P{X2 = s} = 1/3, P{X3 = a} = 1/6 e P{X4 = 37.0} = 0, limitandoci per
brevit`
a ad alcuni singoli valori. D’altra parte, ragionando in astratto, potremo vedere la legge di un qualsiasi elemento aleatorio come la distribuzione
di un ipotetico carattere statistico definito su un collettivo infinito.
Sono di particolare interesse gli elementi aleatori a valori reali, cio`e le
variabili Y : (⌦, A) ! (R, B), dove B `e la classe dei boreliani di R, alle
quali daremo il nome di numeri aleatori. Per verificare la misurabilit`
a di un
numero aleatorio Y `e sufficiente (oltre che banalmente necessario) verificare
la condizione {Y  t} 2 A, per ogni t 2 R. Infatti, le propriet`
a della controimmagine mostrano che la classe {B 2 B : Y 1 (B) 2 A} `e una trib`
u, mentre
sappiamo gi`
a che la classe {] 1, t] | t 2 R} genera B. Baster`
a quindi che
siano eventi le controimmagini delle semirette sinistre chiuse, perch´e lo siano
anche quelle degli intervalli, dei plurintervalli e dei loro limiti monotoni (pi`
u
in generale di tutti i boreliani di R). Equivalentmente, potremo verificare la
condizione {Y > t} 2 A, per ogni t 2 R, visto che {Y  t} = ⌦ \ {Y > t} e
A `e una trib`
u. Abbiamo cos`ı un criterio di misurabilit`
a basato su semirette.
46
Luca La Rocca (10 novembre 2014)
La legge LY di un numero aleatorio Y `e caratterizzata dalla sua funzione
di ripartizione FY (t) = P{Y  t}, t 2 R, nel senso che LY = FY . In virt`
u
di quanto abbiamo visto, FY sar`
a crescente, continua da destra e propria;
inoltre, data F : R ! [0, 1] con queste tre propriet`
a, sar`
a univocamente
definita la probabilit`
a F su (R, B) sotto la quale l’identit`
a Y (t) = t, t 2 R,
sar`
a un numero aleatorio con FY = F ed LY = F . Costruire un numero
aleatorio equivarr`
a pertanto ad assegnare la sua funzione di ripartizione.
Per esempio, comunque presi a e b in R, con a < b, mediante la funzione
8
t<a
< 0
(t a)/(b a) a  t < b
Fa,b (t) =
:
1
t b
definiremo la legge uniforme su ]a, b[, caratterizzata dall’assegnare ai sottointervalli di ]a, b[ probabilit`
a proporzionale alla loro lunghezza; scriveremo
Y ⇠ U (a, b) per indicare un numero aleatorio che segue tale legge. Si noti
che, se U ⇠ U(0, 1), allora Y = a + (b a)U ⇠ U(a, b); infatti
P{Y  t} = P{a + (b
a)U  t} = P{U  (t
a)/(b
a)},
t 2 R,
quindi FY (t) = FU ({t a}/{b a}) = F0,1 ({t a}/{b a}) = Fa,b (t).
Possono vedersi come numeri aleatori i caratteri numerici, quali sono
C, F e K nell’Esempio 16. La misurabilit`
a `e banalmente soddisfatta, nel
caso di collettivo finito, mentre il caso di collettivo infinito non `e altro che
il caso generale di numero aleatorio qualsiasi. Anche i caratteri codificati,
quali sono S = g1 (X1 ), R = g2 (X2 ) ed M = g3 (X3 ) nell’Esempio 16, possono
vedersi come numeri aleatori; le loro leggi dipenderanno dalle codifiche scelte
e quindi presenteranno un certo grado di arbitrariet`
a.
Nel caso del sesso, possiamo porre g1 (m) = 0 e g1 (f) = 1, ottenendo
il numero aleatorio S = I{2,4,6} . Si tratta del tipo pi`
u semplice di numero
aleatorio: l’indicatrice di un’evento. La funzione di ripartizione di S sar`
a
FS (t) = (1
p)I[0,+1[ (t) + pI[1,+1[ (t),
t 2 R,
dove p = P{S = 1} = P{2, 4, 6} = 1/2. Pi`
u in generale, quella esposta sar`
a
l’espressione della funzione di ripartizione dell’indicatrice di A, comunque
si prenda A 2 A con P(A) = p. Se p 2
/ Q, ci vorr`
a un collettivo infinito.
Data
una
parte
I
di
{1,
.
.
.
,
n},
la
codifica
scelta
consente
di interpretare
P
S(i)
come
conteggio
delle
unit`
a
femmina
in
I.
In
alternativa
potremmo
i2I
P
porre g1 (m) = 1 e g1 (f) = 0, nel qual caso i2I S(i) conterebbe le unit`
a
maschio in I. Sceglieremo senz’altro una delle due codifiche che consentono
questa interpretazione, ogni qual volta avremo a che fare con un carattere
dicotomico; quale delle due preferiremo, in un caso specifico, dipender`
a dalla
modalit`
a su cui vorremo accendere i riflettori e sar`
a in definitiva frutto di una
decisione arbitraria. Si noti che l’evento {S = 0} non esprime l’assenza della
caratteristica misurata da X1 pi`
u di quanto non faccia l’evento {S = 1}.
Canovaccio delle Lezioni di Statistica ed Elementi di Probabilit`
a
47
Nel caso della religione, possiamo porre g2 (s) = 1, g2 (c) = 2, g2 (b) = 3 e
g2 (a) = 4, ottenendo R = g2 (X2 ) = 1I{1,2} + 2I{3,4} + 3I{5,6} , la cui funzione
di ripartizione sar`
a
1
1
1
FR (t) = I[1,+1[ (t) + I[2,+1[ (t) + I[3,+1[ (t),
3
3
3
t 2 R.
Si tratta di un numero aleatorio semplice, in quanto assume e↵ettivamente
solo un numero finito di valori: |R(⌦)| < 1. Questa propriet`
a `e per altro
inevitabile per un carattere empirico (definito su un collettivo finito). Non
`e invece inevitabile, nel codificare X2 , avere g2 (s) < g2 (c) < g2 (b) < g2 (a);
l’ordine indotto dalla codifica g2 su E2 `e del tutto arbitrario. Quindi, per
esempio, al momento di interpretare l’evento {R 2} converr`
a riformularlo
come {X2 6= s}, in modo da riportarlo al suo significato concreto.
Nel caso del morale, possiamo porre g3 (b) = 1, g3 (m) = 2 e g3 (a) = 3,
ottenendo M = g3 (X3 ) = 1I{1,5,6} + 2I{3,4} + 3I{2} . In questo caso
1
1
1
FM (t) = I[1,+1[ (t) + I[2,+1[ (t) + I[3,+1[ (t),
2
3
6
t 2 R,
sar`
a la funzione di ripartizione del carattere codificato e, avendo scelto g3 in
modo da rispettare l’ordinamento di X3 , potremo dare alle probabilit`
a che
essa fornisce un significato concreto. In generale, si richiede senz’altro che la
codifica di un carattere misurato su scala ordinale ne rispetti l’ordinamento.
Infine, la funzione di ripartizione del carattere numerico C sar`
a
6
FC (t) =
1X
I[C(i),+1[ (t),
6
i=1
t 2 R,
dove vale la pena osservare che il termine I[38.0,+1[ (t) compare due volte:
una prima come I[C(5),+1[ (t) e una seconda come I[C(6),+1[ (t). Quella esposta `e la generica espressione della funzione di ripartizione di un carattere
empirico (eventualmente codificato) se solo si sostituisca 6 con n; parleremo
di funzione di ripartizione empirica determinata da C(1), . . . , C(n).
Una scrittura alternativa per la funzione di ripartizione di C `e
FC (t) =
5
X
j=1
pj I[cj ,+1[ (t),
t 2 R,
dove c1 = 37.5, . . . , c5 = 40.0 sono i cinque valori distinti assunti da C e
pj = P{C = j}, j = 1, . . . , 5, le probabilit`
a con cui C rispettivamente li
assume; in concreto p2 = P{C = 38.0} = 2/6 = 1/3 e pj = 1/6 per j 6= 2.
Sostituendo 5 con m = |C(⌦)|, otterremo la generica funzione di ripartizione
di un numero aleatorio semplice con C(⌦) = {c1 , . . . , cm }. Si noti che servir`
a
un collettivo infinito per ottenere probabilit`
a irrazionali.
48
Luca La Rocca (10 novembre 2014)
Detta funzione di probabilit`
a (della legge) di un numero aleatorio Y
la funzione FY (y) = FY (y) FY (y) = P{Y = y}, y 2 R, diremo che
y 2 R `e un atomo (della legge) di Y quando FY (y) > 0 e denoteremo
con AY = {y 2 R : FY (y) > 0} l’insieme degli atomi (della legge) di Y .
Sappiamo che AY `e numerabile, perch´e vi sono al pi`
u n 1 atomi
y con
P
P{Y = y} > 1/n, n 2 N. Possiamo allora scrivere P{Y 2 AY } = y FY (y),
dove resta sottinteso che la sommatoria si estende ai soli elementi di AY ,
coerentemente col fatto che FY `e identicamente nulla al di fuori di AY . Si
noti che AY `e un boreliano, in quanto `e unione numerabile di singoletti.
Se P{Y 2 AY } = 1, diremo che Y `e un numero aleatorio discreto (con
legge discreta). In tal caso, comunque preso B 2 B, troveremo P(B) =
¯Y ✓ A
¯ Y e P(A
¯ Y ) = 0, quindi potremo scrivere
P(B \ AP
e B\A
Y ), perch´
P(B) = y2B FY (y), restando sottinteso che la sommatoria si estende ai
soli elementi
P del boreliano numerabile B \ AY . In particolare, scriveremo
FY (t) = yt FY (y), t 2 R, per la funzione di ripartizione (della legge)
di Y . Diremo che FY `e la densit`
a discreta di Y (di LY ).
Si dice che il numero aleatorio Y ammette p : R ! R come
a
P densit`
discreta se {y 2 R : p(y) 6= 0} `e numerabile e P{Y 2 B} =
y2B p(y),
B 2 B, restando sottinteso che la sommatoria si estende ai soli elementi
y di R con p(y) 6= 0. Chiaramente p(y) = P{Y = y}, y 2 R, quindi la
densit`
a discreta,P
se esiste, `e unica e coincide con la funzione di probabilit`
a.
Inoltre p
0 e y p(y) = 1 (probabilit`
a dell’evento certo). In e↵etti, un
numero aleatorio ammette densit`
a discreta se e solo se la sua funzione di
probabilit`
a somma a uno, cio`ePse si tratta di un numero aleatorio
Pdiscreto.
In generale, data p
0 con y p(y) = 1, la funzione F (t) = yt p(y),
t 2 R, sar`
a crescente, continua da destra e propria, per cui p si potr`
a vedere
come densit`
a discreta di un numero aleatorio Y (con FY = F ).
Un numero aleatorio discreto sar`
a finitamente discreto, se l’insieme dei
suoi atomi ha cardinalit`
a finita, infinitamente discreto, altrimenti. In tutti
e due i casi, sePne potr`
a estendere la legge alla trib`
u discreta di R ponendo
P{Y 2 B} = y2B FY (y), B 2 }(R), fatto che giustifica la terminologia
adottata. Esempi di numeri aleatori finitamente discreti sono quelli con
leggi ipergeometriche, quelli con leggi binomiali, le indicatrici di eventi, alle
cui leggi si d`
a il nome di leggi di Bernoulli, i numeri aleatori semplici e
in particolare i caratteri empirici. Esempi di numeri aleatori infinitamente
discreti sono quelli con leggi di Poisson e quelli con leggi geometriche.
Se P{Y 2 AY } = 0, cio`e FY ⌘ 0, ovvero FY `e continua, il numero
aleatorio Y si dice continuo (con legge continua). Per esempio, sono continui
i numeri aleatori con legge uniforme su un intervallo e quelli che seguono leggi
esponenziali. Se P{Y 2 AY } 2 ]0, 1[, il numero aleatorio Y si dice misto. In
questo caso potremo scrivere FY (t) = P{Y 2 AY }FY (t) + P{Y 2
/ AY }FY (t),
t 2 R, dove FY (t) = P({Y  t}|{Y 2 AY }) individua la componente discreta
di LY , mentre FY (t) = P({Y  t}|{Y 2
/ AY }) ne individua la componente
continua; diremo che LY `e mistura (combinazione convessa) di FY e FY .