1章 データの整理

3章 確率変数とその分布
3.1 離散確率変数と確率関数
■確率変数(Random Variable)
定義
標本空間において
事象が数で表される時、
その値を表す変数を
「確率変数」という。
例1
コイン投げ: 表⇒ 1、 裏⇒ 0
確率変数 x :
P( x = 1 ) = 1/2, P( x = 0 ) = 1/2
2個のサイコロ投げの標本空間
例2
(根元事象の確率はすべて1/36)
2つのサイコロを 事象: {目の和 = x} (x = 2, 3, …, 12)
(1,6) (2,6) (3,6) (4,6) (5,6) (6,6) 目の和
投げて、
サ (1,5) (2,5) (3,5) (4,5) (5,5) (6,5)
12
イ
(1,4) (2,4) (3,4) (4,4) (5,4) (6,4)
11
コ
出た目の和
(1,3) (2,3) (3,3) (4,3) (5,3) (6,3)
10
確率変数 x:
P( x) 
6 7 x
36
ロ
2 (1,2) (2,2) (3,2) (4,2) (5,2) (6,2)
(1,1) (2,1) (3,1) (4,1) (5,1) (6,1)
サイコロ1
( x  2,3, ,12)
9
8
7
6
5
4
3
2
■確率関数 (Probability Function)
確率関数 p(x)
確率変数 x の確率値を表す関数
(定義されていない x の値: p(x) = 0 )
2つのサイコロの目の和
p (x ) 確率
0.20
6/36
5/36
0.15
5/36
4/36
4/36
3/36
0.10
3/36
2/36
0.05
2/36
1/36
1/36
0.00
2
3
4
5
6
7
目の和
8
x
9
10
11
12
■累積確率分布関数
(Cumulative Probability Distribution Function)
j
累積確率分布関数:
(「分布関数」と略される)
F ( x )  PX ≦ x   p( xi )
i 1
ただし j は xj ≦ x となる最大の添え字。
2つのサイコロの目の和
F(x) 累積確率
33/36
1.00
35/36 36/36
30/36
26/36
0.75
21/36
15/36
0.50
10/36
6/36
0.25
1/36
3/36
0.00
1
2
3
4
5
6
7
目の和
8
x
9
10
11
12
13
3.2 連続型確率変数と密度関数
1. ある区間に実数は無限に存在する。
各値を取る確率がすべて正なら、
確率の合計は無限大。
2. 「特定の値を取る確率はゼロ」とし、
「区間」に対してのみ正の確率を考える。
3. 連続確率変数の確率法則:
累積確率分布関数(略して分布関数)
によって定義。
コンピュータ シミュレーション
区間 [0, 1] の実数を
ランダムに発生する。
←結果を階級区分して
集計する。
縦軸:標本密度
=相対度数/級幅
←累積相対度数
のグラフ
■分布関数
(Distribution Function)
確率変数 X が
任意の実数 x より小さいか等しい確率。
F ( x )  P{ X ≦ x}
分布関数:
(連続変数では右辺の等号の
有無は無関係)
■密度関数
(Density Function)
確率密度関数:
(「密度関数」と略される)
d
f ( x) 
F ( x)
dx
P x  X ≦ x  x

 F ( x  x )  F ( x )  f ( x )x
F ( x)  
x

f (t )dt
例 区間 [0,1] の一様分布:
F ( x)  x, f ( x)  1 (0 ≦ x ≦1)
d
d
F ( x) 
x  1  f ( x ) (0 ≦ x ≦ 1)
dx
dx

x
0
x
f (t )dt   1 dt  [t ]  x  0  x  F ( x )
x
0
0
分布関数 F(x ) = x
F(x ) 累積確率
(実数区間 [0,1] の一様分布)
数
1.00
密度関数 f (x ) = 1
f(x ) 確率密度 (実数区間 [0,1] の一様分布)
1.5
0.75
1.0
0.50
0.5
0.25
x
0.00
0
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
1
x
0.0
0
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
1
例 区間 [0,1] の右上り三角分布:
F ( x)  x , f ( x)  2 x (0 ≦ x ≦1)
2
d
d 2
F ( x) 
x  2 x  f ( x ) (0 ≦ x ≦ 1)
dx
dx

x
0
x
f (t )dt   2t dt  [t 2 ]0x  x 2  0  x 2  F ( x )
0
分布関数 F(x ) = x
F(x ) 累積確率
(実数区間 [0,1] の右上り三角分布)
1.00 数
密度関数 f (x ) = 2x
f(x ) 確率密度 (実数区間 [0,1] の右上り三角分布)
2.0
0.75
1.5
0.50
1.0
0.25
0.5
2
x
0.00
0
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
1
x
0.0
0
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
1
例 区間 [0,1] の山形二次曲線分布:
F ( x)  3 x  2 x , f ( x)  6 x(1  x) (0 ≦ x ≦1)
2
3
d
d
F ( x) 
(3 x 2  2 x 3 )  3(2 x )  2(3 x 2 )  6 x (1  x )  f ( x )
dx
dx

x
0
x
f (t )dt   6t (1  t ) dt  [3t 2 ]0x  [2t 3 ]0x  3 x 2  2 x 3  F ( x )
0
密度関数 f (x ) = 6x (1 -- x )
f(x ) 確率密度 (実数区間 [0,1] の二次曲線分布)
1.5
2
3
F(x ) 累積確率 分布関数 F(x ) = 3x - 2x
(実数区間 [0,1] の二次曲線分布)
1.00 数
0.75
1.0
0.50
0.5
0.25
x
0.00
0
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
1
x
0.0
0
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
1