Capitolo 2 Variabili aleatorie 2.1 Numeri aleatori Si dice variabile aleatoria una qualsiasi caratteristica di un esperimento aleatorio che vari in funzione dell’esito sperimentale in modo da descrivere eventi. Formalmente, se (⌦, A, P) `e uno spazio di probabilit` a che modella l’esperimento aleatorio ed E `e un insieme, munito di una trib` u E, i cui elementi rappresentano le diverse modalit` a con cui la caratteristica pu` o esprimersi, si dice variabile aleatoria o elemento aleatorio ogni funzione Y : ⌦ ! E che soddisfi la condizione di misurabilit` a : Y 1 (B) 2 A, per ogni B 2 E, dove 1 Y (B) = {! 2 ⌦ : Y (!) 2 B} denota la controimmagine di B tramite Y . Si verifica subito, usando le propriet` a della controimmagine, che la classe (Y ) = {Y 1 (B) | B 2 E} `e una trib` u su ⌦; diremo che (Y ) `e la trib` u generata da Y . Chiaramente, la condizione di misurabilit` a equivale a richiedere (Y ) ✓ A. A parole, quello che chiediamo `e che gli eventi esprimibili mediante Y siano, in e↵etti, eventi. Va da s´e che questo `e scontato nel caso in cui A = }(⌦), cio`e nel caso di uno spazio di probabilit` a discreto. Si noti che P non gioca alcun ruolo nella misurabilit` a di Y e che, almeno in linea di principio, lo stesso elemento aleatorio pu` o essere considerato sotto diverse probabilit` a (diverse valutazioni soggettive). Diremo spazi misurabili le coppie insieme-trib` u come (⌦, A) ed (E, E) e la notazione Y : (⌦, A) ! (E, E) esprimer` a in modo conciso il fatto che Y `e un elemento aleatorio, definito sullo spazio misurabile (⌦, A) di un qualche spazio di probabilit` a (⌦, A, P), a valori nello spazio misurabile (E, E). Dopo di che scriveremo per brevit` a {Y 2 B} invece di {! 2 ⌦ : Y (!) 2 B}, limitando l’uso del pi` u arido Y 1 (B). La misurabilit` a di un elemento aleatorio Y permette di definirne la distribuzione o legge come immagine di P tramite Y : LY (B) = P{Y 2 B}, B 2 E. Si verifica subito, usando le propriet` a della controimmagine, che LY `e una probabilit` a e dunque (E, E, LY ) `e uno spazio di probabilit` a. Diremo che (E, E, LY ) `e lo spazio immagine di Y (indotto da Y ). 43 44 Luca La Rocca (10 novembre 2014) Costruire un elemento aleatorio Y equivale a costruirne lo spazio immagine (E, E, LY ), sul quale eventualmente si pu` o ridefinire Y (e) = e, e 2 E, essendo la funzione identit` a banalmente misurabile. Grazie a questa costruzione canonica, nella quale Y viene definito come funzione identit` a del suo stesso spazio immagine, potremo ritenere ben definito un elemento aleatorio ogni qual volta ne sia ben definita la legge. In pratica, quando interessino gli eventi esprimibili mediante Y , cio`e la trib` u (Y ), lo spazio base di Y , cio`e lo spazio (⌦, A, P) su cui Y `e definito, sar` a messo in ombra dallo spazio immagine di Y , a prescindere dal fatto che i due spazi coincidano o meno. Nell’Esempio 16 abbiamo sei ipotetici pazienti giapponesi, identificati con i numeri da 1 a 6, ognuno dei quali presenta con proprie modalit` a quattro caratteristiche di interesse: sesso, religione, morale e temperatura corporea (in gradi Celsius). In generale, un collettivo statistico `e un insieme di unit` a statistiche, senz’altro identificabili con i numeri da 1 a n, ognuna delle quali presenta con proprie modalit` a k caratteristiche di interesse (k 2 N). Diremo caratteri statistici le funzioni Xj : {1, . . . , n} ! Ej che associano a ogni unit` a statistica la modalit` a con cui essa presenta la j-esima caratterisitica, j = 1, . . . , k, rappresentata da un elemento di Ej (insieme dei possibili valori di Xj ). La matrice di dati in Tabella 1, contenente una riga per ogni unit` a e una colonna per ogni carattere, definisce X1 = “sesso”, X2 = “religione”, X3 = “morale” e X4 = “temperatura” per il collettivo dell’Esempio 16, una volta che, per esempio, si prenda E1 = {m, f}, E2 = {s, c, b, a}, E3 = {b, m, a} ed E4 = Q. Si noti che abbiamo ritenuto opportuno, in linea di principio, prevedere la possibilit` a che la religione sia un’altra (eventualmente nessuna) e che la temperatura venga misurata con un numero arbitrario (ma necessariamente finito) di decimali; definire un carattere statistico richiede in primo luogo di individuarne l’insieme dei possibili valori. Un carattere si dice un fattore quando possa assumere un numero finito di valori; si dice dicotomico quando possa assumerne solo due. Nell’Esempio 16 i caratteri X1 , X2 e X3 (non X4 ) sono fattori; di questi solo X1 `e dicotomico. Un carattere si dice misurato su scala ordinale quando sull’insieme dei suoi possibili valori sia definita una relazione d’ordine, altrimenti si dice misurato su scala nominale. Nell’Esempio 16 sono misurati su scala ordinale X3 e X4 , mentre X2 `e misurato su scala nominale; a meno che non si voglia prendere sul serio l’adagio secondo il quale i giapponesi nascono scintoisti, si sposano cristiani e muoiono buddisti, nel qual caso verrebbero al contempo meno le ragioni per prevedere altre modalit` a. Il carattere X1 `e anch’esso misurato su scala nominale, ma per caratteri dicotomici questa distinzione `e meno interessante. Un carattere a valori reali (necessariamente misurato su scala ordinale) si dice numerico. L’unico carattere numerico nell’Esempio 16 `e X4 , se lo si pensa a valori reali, cio`e lo si compone con l’immersione canonica di Q in R per ottenere C : {1, . . . , n} ! R (sfruttando l’inclusione Q ⇢ R). Nulla vieta, per` o, di codificare X1 , X2 e X3 come S = g1 (X1 ), R = g2 (X2 ) ed M = g3 (X3 ), introducendo le codifiche gj : Ej ! R, j = 1, 2, 3. Canovaccio delle Lezioni di Statistica ed Elementi di Probabilit` a 45 Un carattere numerico Y con zero assoluto si dice misurato su scala di rapporti, perch´e il rapporto Y (i)/Y (`) non dipende dall’unit` a di misura, comunque si prendano due unit` a statistiche i ed ` in {1, . . . , n}; un carattere numerico con zero convenzionale, come C, si dice invece misurato su scala a intervalli, perch´e solo i rapporti di di↵erenze non dipendono dall’unit` a di misura. Per esempio, visto che C(1) = 40.0 e C(2) = 39.0, mentre C(3) = 39.5 e C(4) = 37.5, si pu` o dire che C(3) C(4) `e due volte C(1) C(2), mentre non si pu` o dire che C(1) `e del 6.7% maggiore di C(4). Infatti, per il carattere in gradi Fahrenheit 9 F = C + 32, 5 troveremmo F (1) = 104 ed F (4) = 99.5, quindi F (1) sarebbe del 4.5% maggiore di F (4). Entrambe le percentuali sono prive di significato concreto. Se si vuole misurare la temperatura su scala di rapporti, si pu` o ricorrere ai Kelvin, cio`e si pu` o considerare il carattere K = C + 273.16. Per un gas perfetto, lo zero Kelvin corrisponde all’ipotetico arresto delle sue molecole e il raddoppio della temperatura in Kelvin, a volume costante, corrisponde a un incremento “unitario” della sua entropia. Nell’Esempio 16, troviamo K(1) = 313.16 e K(4) = 310.66, quindi la temperatura del paziente 1 `e dello 0.8% maggiore di quella del paziente 2. Se selezioniamo un’unit` a a caso da un collettivo statistico e osserviamo il valore assunto da un certo carattere sull’unit` a selezionata, otteniamo una variabile aleatoria. Formalmente, prenderemo ⌦ = {1, . . . , n} e P uniforme su }(⌦), quindi Ej = }(Ej ), j = 1, . . . , k, essendo la misurabilit` a di Xj banalmente garantita. Ogni carattere statistico potr` a dunque vedersi come un elemento aleatorio, la cui legge sar` a detta distribuzione del carattere nel collettivo. Nel caso specifico dell’Esempio 16, troveremo P{X1 = f} = 1/2, P{X2 = s} = 1/3, P{X3 = a} = 1/6 e P{X4 = 37.0} = 0, limitandoci per brevit` a ad alcuni singoli valori. D’altra parte, ragionando in astratto, potremo vedere la legge di un qualsiasi elemento aleatorio come la distribuzione di un ipotetico carattere statistico definito su un collettivo infinito. Sono di particolare interesse gli elementi aleatori a valori reali, cio`e le variabili Y : (⌦, A) ! (R, B), dove B `e la classe dei boreliani di R, alle quali daremo il nome di numeri aleatori. Per verificare la misurabilit` a di un numero aleatorio Y `e sufficiente (oltre che banalmente necessario) verificare la condizione {Y t} 2 A, per ogni t 2 R. Infatti, le propriet` a della controimmagine mostrano che la classe {B 2 B : Y 1 (B) 2 A} `e una trib` u, mentre sappiamo gi` a che la classe {] 1, t] | t 2 R} genera B. Baster` a quindi che siano eventi le controimmagini delle semirette sinistre chiuse, perch´e lo siano anche quelle degli intervalli, dei plurintervalli e dei loro limiti monotoni (pi` u in generale di tutti i boreliani di R). Equivalentmente, potremo verificare la condizione {Y > t} 2 A, per ogni t 2 R, visto che {Y t} = ⌦ \ {Y > t} e A `e una trib` u. Abbiamo cos`ı un criterio di misurabilit` a basato su semirette. 46 Luca La Rocca (10 novembre 2014) La legge LY di un numero aleatorio Y `e caratterizzata dalla sua funzione di ripartizione FY (t) = P{Y t}, t 2 R, nel senso che LY = FY . In virt` u di quanto abbiamo visto, FY sar` a crescente, continua da destra e propria; inoltre, data F : R ! [0, 1] con queste tre propriet` a, sar` a univocamente definita la probabilit` a F su (R, B) sotto la quale l’identit` a Y (t) = t, t 2 R, sar` a un numero aleatorio con FY = F ed LY = F . Costruire un numero aleatorio equivarr` a pertanto ad assegnare la sua funzione di ripartizione. Per esempio, comunque presi a e b in R, con a < b, mediante la funzione 8 t<a < 0 (t a)/(b a) a t < b Fa,b (t) = : 1 t b definiremo la legge uniforme su ]a, b[, caratterizzata dall’assegnare ai sottointervalli di ]a, b[ probabilit` a proporzionale alla loro lunghezza; scriveremo Y ⇠ U (a, b) per indicare un numero aleatorio che segue tale legge. Si noti che, se U ⇠ U(0, 1), allora Y = a + (b a)U ⇠ U(a, b); infatti P{Y t} = P{a + (b a)U t} = P{U (t a)/(b a)}, t 2 R, quindi FY (t) = FU ({t a}/{b a}) = F0,1 ({t a}/{b a}) = Fa,b (t). Possono vedersi come numeri aleatori i caratteri numerici, quali sono C, F e K nell’Esempio 16. La misurabilit` a `e banalmente soddisfatta, nel caso di collettivo finito, mentre il caso di collettivo infinito non `e altro che il caso generale di numero aleatorio qualsiasi. Anche i caratteri codificati, quali sono S = g1 (X1 ), R = g2 (X2 ) ed M = g3 (X3 ) nell’Esempio 16, possono vedersi come numeri aleatori; le loro leggi dipenderanno dalle codifiche scelte e quindi presenteranno un certo grado di arbitrariet` a. Nel caso del sesso, possiamo porre g1 (m) = 0 e g1 (f) = 1, ottenendo il numero aleatorio S = I{2,4,6} . Si tratta del tipo pi` u semplice di numero aleatorio: l’indicatrice di un’evento. La funzione di ripartizione di S sar` a FS (t) = (1 p)I[0,+1[ (t) + pI[1,+1[ (t), t 2 R, dove p = P{S = 1} = P{2, 4, 6} = 1/2. Pi` u in generale, quella esposta sar` a l’espressione della funzione di ripartizione dell’indicatrice di A, comunque si prenda A 2 A con P(A) = p. Se p 2 / Q, ci vorr` a un collettivo infinito. Data una parte I di {1, . . . , n}, la codifica scelta consente di interpretare P S(i) come conteggio delle unit` a femmina in I. In alternativa potremmo i2I P porre g1 (m) = 1 e g1 (f) = 0, nel qual caso i2I S(i) conterebbe le unit` a maschio in I. Sceglieremo senz’altro una delle due codifiche che consentono questa interpretazione, ogni qual volta avremo a che fare con un carattere dicotomico; quale delle due preferiremo, in un caso specifico, dipender` a dalla modalit` a su cui vorremo accendere i riflettori e sar` a in definitiva frutto di una decisione arbitraria. Si noti che l’evento {S = 0} non esprime l’assenza della caratteristica misurata da X1 pi` u di quanto non faccia l’evento {S = 1}. Canovaccio delle Lezioni di Statistica ed Elementi di Probabilit` a 47 Nel caso della religione, possiamo porre g2 (s) = 1, g2 (c) = 2, g2 (b) = 3 e g2 (a) = 4, ottenendo R = g2 (X2 ) = 1I{1,2} + 2I{3,4} + 3I{5,6} , la cui funzione di ripartizione sar` a 1 1 1 FR (t) = I[1,+1[ (t) + I[2,+1[ (t) + I[3,+1[ (t), 3 3 3 t 2 R. Si tratta di un numero aleatorio semplice, in quanto assume e↵ettivamente solo un numero finito di valori: |R(⌦)| < 1. Questa propriet` a `e per altro inevitabile per un carattere empirico (definito su un collettivo finito). Non `e invece inevitabile, nel codificare X2 , avere g2 (s) < g2 (c) < g2 (b) < g2 (a); l’ordine indotto dalla codifica g2 su E2 `e del tutto arbitrario. Quindi, per esempio, al momento di interpretare l’evento {R 2} converr` a riformularlo come {X2 6= s}, in modo da riportarlo al suo significato concreto. Nel caso del morale, possiamo porre g3 (b) = 1, g3 (m) = 2 e g3 (a) = 3, ottenendo M = g3 (X3 ) = 1I{1,5,6} + 2I{3,4} + 3I{2} . In questo caso 1 1 1 FM (t) = I[1,+1[ (t) + I[2,+1[ (t) + I[3,+1[ (t), 2 3 6 t 2 R, sar` a la funzione di ripartizione del carattere codificato e, avendo scelto g3 in modo da rispettare l’ordinamento di X3 , potremo dare alle probabilit` a che essa fornisce un significato concreto. In generale, si richiede senz’altro che la codifica di un carattere misurato su scala ordinale ne rispetti l’ordinamento. Infine, la funzione di ripartizione del carattere numerico C sar` a 6 FC (t) = 1X I[C(i),+1[ (t), 6 i=1 t 2 R, dove vale la pena osservare che il termine I[38.0,+1[ (t) compare due volte: una prima come I[C(5),+1[ (t) e una seconda come I[C(6),+1[ (t). Quella esposta `e la generica espressione della funzione di ripartizione di un carattere empirico (eventualmente codificato) se solo si sostituisca 6 con n; parleremo di funzione di ripartizione empirica determinata da C(1), . . . , C(n). Una scrittura alternativa per la funzione di ripartizione di C `e FC (t) = 5 X j=1 pj I[cj ,+1[ (t), t 2 R, dove c1 = 37.5, . . . , c5 = 40.0 sono i cinque valori distinti assunti da C e pj = P{C = j}, j = 1, . . . , 5, le probabilit` a con cui C rispettivamente li assume; in concreto p2 = P{C = 38.0} = 2/6 = 1/3 e pj = 1/6 per j 6= 2. Sostituendo 5 con m = |C(⌦)|, otterremo la generica funzione di ripartizione di un numero aleatorio semplice con C(⌦) = {c1 , . . . , cm }. Si noti che servir` a un collettivo infinito per ottenere probabilit` a irrazionali. 48 Luca La Rocca (10 novembre 2014) Detta funzione di probabilit` a (della legge) di un numero aleatorio Y la funzione FY (y) = FY (y) FY (y) = P{Y = y}, y 2 R, diremo che y 2 R `e un atomo (della legge) di Y quando FY (y) > 0 e denoteremo con AY = {y 2 R : FY (y) > 0} l’insieme degli atomi (della legge) di Y . Sappiamo che AY `e numerabile, perch´e vi sono al pi` u n 1 atomi y con P P{Y = y} > 1/n, n 2 N. Possiamo allora scrivere P{Y 2 AY } = y FY (y), dove resta sottinteso che la sommatoria si estende ai soli elementi di AY , coerentemente col fatto che FY `e identicamente nulla al di fuori di AY . Si noti che AY `e un boreliano, in quanto `e unione numerabile di singoletti. Se P{Y 2 AY } = 1, diremo che Y `e un numero aleatorio discreto (con legge discreta). In tal caso, comunque preso B 2 B, troveremo P(B) = ¯Y ✓ A ¯ Y e P(A ¯ Y ) = 0, quindi potremo scrivere P(B \ AP e B\A Y ), perch´ P(B) = y2B FY (y), restando sottinteso che la sommatoria si estende ai soli elementi P del boreliano numerabile B \ AY . In particolare, scriveremo FY (t) = yt FY (y), t 2 R, per la funzione di ripartizione (della legge) di Y . Diremo che FY `e la densit` a discreta di Y (di LY ). Si dice che il numero aleatorio Y ammette p : R ! R come a P densit` discreta se {y 2 R : p(y) 6= 0} `e numerabile e P{Y 2 B} = y2B p(y), B 2 B, restando sottinteso che la sommatoria si estende ai soli elementi y di R con p(y) 6= 0. Chiaramente p(y) = P{Y = y}, y 2 R, quindi la densit` a discreta,P se esiste, `e unica e coincide con la funzione di probabilit` a. Inoltre p 0 e y p(y) = 1 (probabilit` a dell’evento certo). In e↵etti, un numero aleatorio ammette densit` a discreta se e solo se la sua funzione di probabilit` a somma a uno, cio`ePse si tratta di un numero aleatorio Pdiscreto. In generale, data p 0 con y p(y) = 1, la funzione F (t) = yt p(y), t 2 R, sar` a crescente, continua da destra e propria, per cui p si potr` a vedere come densit` a discreta di un numero aleatorio Y (con FY = F ). Un numero aleatorio discreto sar` a finitamente discreto, se l’insieme dei suoi atomi ha cardinalit` a finita, infinitamente discreto, altrimenti. In tutti e due i casi, sePne potr` a estendere la legge alla trib` u discreta di R ponendo P{Y 2 B} = y2B FY (y), B 2 }(R), fatto che giustifica la terminologia adottata. Esempi di numeri aleatori finitamente discreti sono quelli con leggi ipergeometriche, quelli con leggi binomiali, le indicatrici di eventi, alle cui leggi si d` a il nome di leggi di Bernoulli, i numeri aleatori semplici e in particolare i caratteri empirici. Esempi di numeri aleatori infinitamente discreti sono quelli con leggi di Poisson e quelli con leggi geometriche. Se P{Y 2 AY } = 0, cio`e FY ⌘ 0, ovvero FY `e continua, il numero aleatorio Y si dice continuo (con legge continua). Per esempio, sono continui i numeri aleatori con legge uniforme su un intervallo e quelli che seguono leggi esponenziali. Se P{Y 2 AY } 2 ]0, 1[, il numero aleatorio Y si dice misto. In questo caso potremo scrivere FY (t) = P{Y 2 AY }FY (t) + P{Y 2 / AY }FY (t), t 2 R, dove FY (t) = P({Y t}|{Y 2 AY }) individua la componente discreta di LY , mentre FY (t) = P({Y t}|{Y 2 / AY }) ne individua la componente continua; diremo che LY `e mistura (combinazione convessa) di FY e FY .
© Copyright 2025 ExpyDoc