1章 データの整理

3章 確率変数とその分布
3.4 基本的な分布関数 3回目
■変数変換とベキ乗型分布
(テキスト: ■一様分布)
F ( x)  x , f ( x)  c x
c
c = 0.5
c  0,
c 1
0 ≦ x ≦1
2
2
1.5
1.5
f(x) = 0.5 x - 0.5 
F(x) = x 0.5 x
1
1
0.5
0.5
0
0
1
2 x
1.5
1
0.5
0
-0.5
1.5
1
0.5
0
-0.5
c=1
2
2
1.5
1.5
1
1
0.5
0.5
0
0
1.5
1.5
f(x) = 2 x 1  2 x
F(x) = x 2
1
1
0.5
0.5
0
0
1.5
2
1
2
0.5
0
-0.5
1.5
1
0.5
0
-0.5
c=2
f(x) = 1 x 0  1
F(x) = x 1  x
1.5
1
0.5
0
-0.5
1.5
1
0.5
0
-0.5
変域の変換 x: [ 0, 1 ] ⇒ y: [ a, b ]
F(x)
1
f(x)
2
1
0
-1
0
x
0
1
2
3
4
-1
x
0
横幅→広 勾配→緩
G(y)
1
1
2
3
4
面積 =1
g(y)
2
c / (b - a)1
0
-1
0
y
0
a1
2
3b
4
-1
y
0
1a
2
3b
4
変数変換 x ⇒ y
ya
y  (b  a ) x  a , x 
ba
a ≦ y ≦ b 
分布関数
 ya   ya 
G( y)  F ( x )  F 


 ba   ba 
c  0, a ≦ y ≦ b 
c
密度関数
 dx  d
d
  dx 
g( y )  F ( x )    F ( x )     f ( x )
dy
  dy 
 dy  dx
c  y a 



ba  ba 
c 1
c  0,
a ≦ y ≦ b
λ = np と置き、p = λ / n と表した二項確率
区間 [a, b] の一様分布
1
0
ya
G y  
ba
b
a
y
1
g y  
ba
y
a
b
一様分布の平均・分散
E[ y]  E[(b  a) x  a]
ba
 (b  a) E
[
x
]

a


2
 1/ 2
V [ y ]  V [(b  a ) x  a ]
(b  a )
 (b  a ) V
[ x] 
12
 1 / 12
2
2
■正規分布
標本&確率
密度
0.08
上智大学生の身長(男子)
2002年統計学受講者、283人
標本密度
正規分布密度
0.06
0.04
0.02
x
0.00
189
186
183
180
177
174
171
168
165
162
159
156
cm
標本&確率
密度
0.08
上智大学生の身長(女子)
2002年統計学受講者、121人
標本密度
正規分布密度
0.06
0.04
0.02
x
0.00
177
174
171
168
165
162
159
156
153
150
147
144
141
cm
二項分布(p =1/2, n =100) と
同平均・同標準偏差の正規分布
確率 &
確率密度
0.10
二項分布
正規分布
0.08
0.06
0.04
0.02
0.00
66
62
58
54
50
46
42
38
34
x
ポアソン分布( λ =50)と
同平均・同標準偏差の正規分布
確率 &
確率密度
0.06
ポアソン分布
正規分布
0.04
0.02
0.00
75
70
65
60
55
50
45
40
35
30
25
x
標準正規分布 の 密度関数
( 平均 μ = 0 標準偏差 σ = 1 )
f (z) 
1
2π

exp  z
exp A  e
1
2
2

(  z  )
f(z)
0.5
A
1
≒ 0.4
2
0.4
0.3
0.2
面積
=1
0.1
z
0
-4
-3
-2
-1
0
1
2
3
4
標準正規分布表
(テキスト付表4の数値 – 0.5)

z0
0
1
2π
exp( z ) dz
1
2
2
z
例 z0 = 1.45
zo
N(0,1)
-4 -3 -2 -1
0
1z o 2
3
4
小数第 2 位
.00
.01
.02
.03
.04
.05
.06
.07
.08
.09
1.2 .3849 .3869 .3888 .3907 .3925 .3944 .3962 .3980 .3997 .4015
1.3 .4032 .4049 .4066 .4082 .4099 .4115 .4131 .4147 .4162 .4177
1.4 .4192 .4207 .4222 .4236 .4251 .4265 .4279 .4292 .4306 .4319
1.5 .4332 .4345 .4357 .4370 .4382 .4394 .4406 .4418 .4429 .4441
1.6 .4452 .4463 .4474 .4484 .4495 .4505 .4515 .4525 .4535 .4545
(一般の)正規分布 の 密度関数
( 平均 μ 標準偏差 σ )
g(x)
面積 = 1
-4σ -3σ -2σ -σ
変数変換
x
μ +σ + 2σ +3σ +4σ
x   z  , z 
x

分布関数
 x μ
G( x)  F ( z)  F 

 σ 
密度関数
d
 dz  d
  dz 
g( x ) 
F ( z )    F ( z )     f ( z )
dx
 dx  dz
  dx 
 x 
 f

   
1
2

1
1 x  

e xp 
 
 2
 2    
(   x  )
■正規確率変数の標準化と
標準正規分布表の使い方
例1: 「上智大学生の身長(男子)」
180cm以上の人の割合の正規近似
μ の推定値 = 172.5 cm、σ の推定値 = 5.14 cm
x0 = 180 cm
x0   180  172 .5
z0 

≒ 1.46

5.14
P z0 ≦ Z   1  P Z  z0   1  (0
.4279
  0.5)
z0 1.46
 0.0721
答) 約7% (データの相対度数は約10%)
例2: 「上智大学生の身長(女子)」
160cm以上170cm未満の人の割合の正規近似
μ の推定値 = 158.7cm、 σ の推定値 = 5.24cm
x1 = 160 cm、 x2 = 170 cm 答) 約39%
x1  
160  158 .7
z1 

≒ 0.25

5.24
x 2   170  158 .7
z2 

≒ 2.16

5.24
(データの
相対度数は
約 40% )
P z1 ≦ Z  z2   P Z  z2   P Z  z1 

 

   0.0987 0.5   0.3859
  0
.4846

0
.
5


 z



 2 2.16
  z1 0.25
