Esercitazione di riepilogo

Esercitazione - CLAMEP
Statistica per l’analisi dei dati
Esercizio 1
Si considerino due variabili Y : atteggiamo nei confronti di un decreto del governo (favorevole,
indifferente, contrario) e X: livello di istruzione (laurea, licenza superiore, licenza media)
X
X
Y
laurea
lic.superiore
lic.media
favorevole
12
15
3
indifferente
2
10
10
contrario
32
19
2
1a) costruire la tabella Y |X;
Si costruiscono i profili riga
X
X
Y
laurea
lic.superiore
lic.media
favorevole
0.26
0.34
0.20
indifferente
0.04
0.23
0.67
contrario
0.70
0.43
0.13
1b) scrivere la distribuzione marginale della variabile X e quella della variabile Y ;
Y
laurea
lic.superiore
lic.media
X
X
TOT
favorevole
indifferente
contrario
30
22
53
TOT
46
44
15
105
1c) costruire la tabella di perfetta indipendenza.
X
X
Y
laurea
lic.superiore
lic.media
favorevole
13.14
12.57
4.29
indifferente
9.64
9.22
3.14
contrario
23.22
22.21
7.57
Esercizio 2
2a) Rappresentare la tabella precedente ignorando coloro che hanno la licenza media e che
hanno un atteggiamento indifferente verso il decreto del governo. Verificare se in questa
tabella 2 × 2 le variabili X ed Y sono indipendenti.
X
favorevole
12
15
Y
laurea
lic.superiore
1
contrario
32
19
Utilizziamo l’odds ratio per cui
12 ∗ 19
θ
= log
= −0.745;
32 ∗ 15
da cui l’intervallo di confidenza al 95%
XY
r
SE =
1
1
1
1
+
+
+
= 0.484
12 32 15 19
(−0.745 − 1.96 ∗ 0.484; −0.745 + 1.96 ∗ 0.484) = (−1.69; 0.20)
per cui si accetta l’ipotesi X⊥⊥Y
Consideriamo ora la tabella precedente condizionata all variabile Z relativa al genere
(maschi, femmine) degli individui.
X
Y
laurea
superiore
Z: maschi
favorevole contrario
4
15
5
10
Z: femmine
favorevole contrario
.
8
17
10
9
2b) verificare se il genere e l’atteggiamento verso il decreto del governo sono marginalmente
indipendenti;
Y
favorevole contrario
maschi
9
25
Z femmine
18
26
da cui
r
9 ∗ 26
θ
= log
= −0.65;
18 ∗ 25
da cui l’intervallo di confidenza al 95%
ZY
SE =
1
1
1
1
+
+
+
= 0.50
9 25 18 26
(−0.65 − 1.96 ∗ 0.50; −0.65 + 1.96 ∗ 0.50) = (−1.63; 0.33)
per cui si accetta l’ipotesi Z⊥⊥Y
2c) verificare se condizionatamente al titolo di studio, il genere e l’atteggiamento verso il
decreto del governo sono indipendenti.
Z
Y
maschio
femmina
X: laurea
favorevole contrario
4
15
8
17
X: superiore
favorevole contrario
.
5
10
10
9
da cui gli odds ratio condizionati sono
4 ∗ 17
=
= −0.57, SE =
8 ∗ 15
da cui l’intervallo di confidenza al 95%
log θ1ZY
r
1
1
1
1
+
+ +
= 0.71
4 15 8 17
(−0.57 − 1.96 ∗ 0.71; −0.57 + 1.96 ∗ 0.71) = (−1.96; 0.82)
per cui si accetta l’ipotesi Z⊥⊥Y |X = laurea. Inoltre
5∗9
=
= −0.80, SE =
10 ∗ 10
da cui l’intervallo di confidenza al 95%
log θ2ZY
r
1
1
1
1
+
+
+ = 0.71
5 10 10 9
(−0.80 − 1.96 ∗ 0.71; −0.80 + 1.96 ∗ 0.71) = (−2.19; 0.59)
per cui si accetta l’ipotesi Z⊥⊥Y |X = superiore
2
Esercizio 3
Si consideri un vettore X = (X1 , X2 ) di due variabili casuali che ha distribuzione multinormale
con media µ = (0.5, 0.2) e matrice di varianza e covarianza
12 10
. 11
Σ=
!
.
Calcolare:
3a) la matrice di concentrazione Σ−1 ;
−1
Σ
0.34 −0.31
.
0.38
=
!
.
3b) la media e la varianza della variabile casuale ottenuta come combinazione lineare W =
AX + b, dove




−1
1
−2




0.5  , b =  0 
A= 0
2
−0.4 0
.




−0.9
16 −6 3.2




µW = Aµ + b =  0.1  , ΣW = AΣAT =  . 2.75 −2 
1.8
.
.
1.92
Esercizio 4
Si consideri un vettore X = (X1 , X2 , X3 ) di quattro variabili casuali che ha distribuzione multinormale con media µ = (1.32, 2.80, 4.21) e matrice di varianza e covarianza


7.66 −1.28 −0.11


0.62 −0.63 
Σ= .
.
.
1.03
Calcolare:
4a) i parametri della distribuzione marginale (X2 , X3 );
2.80
4.21
µ23 =
!
,
Σ23 =
0.62 −0.63
.
1.03
!
4b) i parametri della distribuzione condizionata (X2 , X3 |X1 ) con X1 = 1. Siano X1 = X1 e
X 2 = (X2 , X3 ) due blocchi di variabili e siano µ1 = 1.32 e µ2 = (2.80, 4.21) le loro medie,
rispettivamente. Secondo lo stesso principio anche la matrice di varianza-covarianza è
composta da 4 blocchi, Σ11 = σ12 , Σ22 , Σ12 e Σ21 . Da cui,
µ2|1 =
µ2 +Σ21 Σ−1
11 (X1 −µ1 )
=
2.85
4.21
!
,
Σ2|1 =
Σ22 −Σ21 Σ−1
11 Σ12
=
0.41 −0.65
.
1.03
4c) la matrice di concentrazione della distribuzione condizionata (X2 , X3 |X1 ).
Σ−1
2|1
=
−5150 −3250
.
−2050
3
!
!