1章 データの整理 - Econom01 Web Site, Sophia

3章 確率変数とその分布
3.5 同時確率関数
壺の例(テキスト)
2個取り出す
赤2, 青2, 緑2
赤の個数 X (X =0,1,2)
青の個数 Y (Y=0,1,2)
0≦X + Y≦2
その同時確率 P ( X = x, Y = y )
P( X  x  Y  y)
2 C x  2 C y  2 C 2 x  y

6 C2
( x  0,1,2; y  0,1,2; x  y ≦ 2)
壺問題の同時確率関数 p(x, y)
p(x, y)
x
y
0
1
2
行和 p(x)
0
1 / 15 4 / 15 1 / 15
6 / 15
1
4 / 15 4 / 15
0
8 / 15
2
1 / 15
0
1 / 15
0
列和 p(y) 6 / 15 8 / 15 1 / 15
15 / 15
離散確率変数 X, Y の
同時確率関数と周辺確率関数
同時確率関数: X, Y の同時分布
P ( X  xi , Y  y j )  p( xi , y j )
(i  1,, n, j  1,, m )
周辺確率関数: X または Y の周辺分布
m
p( xi )   p( xi , y j )
( i  1, , n)
j 1
n
p( y j )   p( xi , y j )
i 1
( j  1, , m )
壺問題 X, Y の平均・分散(周辺分布)
この問題の X, Y は同一の周辺分布を持つ。
x
0
1
2
Σ
p(x)
6 / 15
8 / 15
1 / 15
1
x p(x)
0
8 / 15
2 / 15
2/3
x2 p(x)
0
8 / 15
4 / 15
4/5
= E[X] = μx
= E[X2]
σx2 = V[X] = E[X2] – μx2 = 16 / 45
■共分散 (Covariance)
2変量間の関係の強さの尺度
Cov( X , Y )  E[( X   x )(Y  Y )]
 E[ XY   xY  XY   x Y ]
 E[ XY ]   x Y
μX = E[X ], μY = E[Y ]
n
m
E[ XY ]   xi yi p( xi yi )
i 1 j 1
例:壺問題の共分散
xy
x
0
1
2
0
0
0
0
y
1
0
1
2
2
0
2
4
×
y
p(x, y)
0
1
2
0 1 / 15 4 / 15 1 / 15
x 1 4 / 15 4 / 15 0
2 1 / 15
0
0
E[ XY ] = 4 / 15
Cov[X, Y] = E[ XY ] – E[ X ]E[ Y ]
= (4 / 15) – (2 / 3)2
= – 8 / 45
■相関 (Correlation)
標準化された2変量間の
関係の強さの尺度(無単位)
相関係数(Correlation Coefficient)
 X   X   Y  Y
Cov[ X , Y ]
 

 E 
V [ X ]V [Y ]
  X    Y
 1 ≦  ≦1
壺の例
ρ = Cov[ X, Y ] / ( σX σY )
= ( – 8 / 45 ) / ( 16 / 45 )
=–1/2



■(統計的)独立性
(Independency)
P ( X  xi  Y  y j )
 P ( X  xi ) P (Y  y j )
p( xi , y j )  p( xi ) p( y j )
乗法定理
(独立な時)
同時確率=
周辺確率の積
壺の確率関数 … 独立ではない
独立なら⇒共分散・相関ともゼロ
(逆は不成立)
独立な同時分布の例
サッカーの得点(ポアソン分布)
p(x, y)
0
1%
2%
2%
1%
1
3%
6%
5%
3%
1%
ブラジルのゴール数 y
E[Y] = λY ≒ 2.7
2
3
4
5
5% 4% 3% 2%
8% 7% 5% 3%
6% 6% 4% 2%
3% 3% 2% 1%
1% 1% 1%
0
日本の
1
ゴール
2
数x
3
E[X] =
4
λX
5
≒1.6
6
p(y)
7% 18% 24% 22% 15% 8%
四捨五入した値が 1% 未満の欄は空白表示
日本が勝つ確率
=緑の合計≒ 22%
引分けの確率
=白の合計≒ 17%
p(x)
6
1%
1%
1%
1%
7
19%
32%
26%
14%
6%
2%
1%
4% 1%
ブラジルが勝つ確率
=黄の合計≒ 61%
■条件つき確率関数
(Conditional Probability Function)
p( x | y ), p( y | x )
上智大学生 男子 283人 の身長と体重の同時度数分布
\
身長
\ (cm)
体重(kg)
45~49
50~54
55~59
60~64
65~69
70~74
75~79
80~84
85~89
90~94
周辺分布
(身長)
160
163
166
169
172
175
178
181
184
~162 ~165 ~168 ~171 ~174 ~177 ~180 ~183 ~186
1
3
1
1
6
4
9
9
6
2
30
1
6
13
10
1
1
32
1
4
20
18
2
1
1
47
5
24
24
5
5
1
1
65
2
14
17
14
6
1
1
55
2
10
12
3
3
1
31
1
3
4
1
2
2
1
14
周辺分布
(体重)
1
7
29
84
89
41
17
9
5
1
1
3
283
1
1
身長と体重の同時分布(中央部)と
周辺分布(上端:身長、右端:体重)
標準化された身長(x)と体重(y )
y
5
体重分布
184 ~186
181 ~183
178 ~180
175 ~177
172 ~174
169 ~171
166 ~168
163 ~165
160 ~162
布
分 4
長 ~ 9 89
身 90 ~ 4
8 5 0~ 8 7 9
8 5~ 7 4
7 0~ 6 9
7 5~ 6 4
6 0~ 5 9
体重(kg) 6 5 5~~ 5 4 9
5 0 5~ 4
4
x=ρy
4
3
身長(cm)
2
y=ρx
1
0
-3
-2
-1
-1
x
0
1
2
3
-2
-3
相関係数 ρ = 0.57