PowerPoint プレゼンテーション

土木計画学
第4回(10月26日)
調査データの統計処理と分析2
担当:榊原 弘之
本日の内容
観測データに基づいてパラメータを
推定する方法について説明する.
1.平均・分散の不偏推定量
2.点推定(最尤推定法)
3.区間推定
母集団:直接すべて調べることができない集団
母数:
母集団の特性値
(平均,分散など)
正確に
真の母数を
知ることはできない
標本:調査可能な,限られた数の集団
母集団の一部
統計的推計手法:標本から母数を推定するための手法
確率的推定の前提:大数の法則と中心極限定理
大数の法則(Law of Large Numbers)
前回説明
同一の確率分布(期待値μ,標準偏差σ)に従うn個の
確率変数X1,X2,…,Xnの標本平均は,nが大きくなれば,
限りなくμに近づく.
観測数を増やせば,より正確な期待値の推定が可能となる.
中心極限定理(Central Limit Theorem)
前回説明
同一の確率分布(期待値μ,標準偏差σ)に従うn個の
確率変数X1,X2,…,Xnの標本平均は,nが大きくなれば,
正規分布N(μ,σ2/n)に従う.
X1,X2,…,Xnがどのような確率分布に従う場合も成立する.
不偏推定量
期待値が母数に一致するような推定量
=何度も標本抽出して当該の値を求めることを多数回
繰り返せば目的とする母数に近づいてゆくような推定量
xi

x
母平均の不偏推定値=標本平均
n
母分散の不偏推定値
S
2
(x  x)


i
n 1
2
点推定
母数をある一つの値として推定する
最尤推定法(Maximum Likelihood Estimation)
観測値:x1,x2,…,xn
母数がθの場合に, 観測値の組(x1,x2,…,xn)が
実現する確率
L( )  f ( x1; ) f ( x2 ; )... f ( xn ; ) 
母数θのもっともらしさ...尤度関数
n
 f ( xi ; )
L( )
i 1
L(1)  L( 2 )
 2 よりも  1 の方が標本が生起する確率が大きい
 1 の方が母数として現実的(もっともらしい)
「もっともらしさ」が最大となる母数θを求める(尤度関数の最大化)
最尤推定法
対数尤度関数
 n
 n


lnL( )   ln
f ( xi ; )  
ln f ( xi ; ) 


 i 1
 i 1

実際は対数尤度関数を最大化

区間推定
母数がある区間に入っているように推定する
正規母集団の場合
1.母平均の区間推定(母分散がわかっているとき)
2.母平均の区間推定(母分散がわからないとき)
3.母分散の区間推定(母平均がわかっているとき)
4.母分散の区間推定(母平均がわからないとき)
基本的な考え方
統計量の分布
(分布形は既知)

個別の標本の側から見ると...
2
標本
(実現値)
1
1.母平均の区間推定(母分散がわかっているとき)
必要な値
標本平均値
標本数 n
z
x
x
( / n )
母分散
2
は標準正規分布N(0,1)に従う.
1
信頼区間
  
  
z 
z 
2 n 2 n

2
分散
の
n
正規分布

2 X 2
  
  
X  z 
   X  z 
2 n
2 n
正規分布(ガウス分布)(normal distribution)
2

1
(x  ) 

exp  
確率密度関数 p X ( x) 
2
2
2 


期待値

N ( , )
2
 x2 
p X ( x) 
exp   
2
 2
1
期待値0,分散1の場合
標準正規分布 N (0,1)
正規分布の
分布関数の値
分散
x   を正規分布表に当てはめる

配布資料参照
95%信頼区間(α=0.05)
1.96

n
1.96
0.025

n
0.025
X
X  1.96

n
   X  1.96

n
2.母平均の区間推定(母分散がわからないとき)
必要な値
標本平均値
標本数 n
t
x
不偏分散
S2
X 
2
S /n
は自由度n-1のt分布に従う
  S
  S
x  t n 1  
   x  t n 1  
2 n
2 n
3.母分散の区間推定(母平均がわかっているとき)
必要な値
母平均
2 


標本数
n
( X i  )2
i

(x  )
i
 n ( / 2)
2
は自由度nのカイ2乗分布に従う
2
2

2
(x  )


2
i
 n (1   / 2)
2
4.母分散の区間推定(母平均がわからないとき)
必要な値
標本平均値
2 

標本数
x
( X i  x)2
i

は自由度n-1のカイ2乗分布に従う
2
(x  x)
2
i
 n1 ( / 2)
2
n
 
2
(x  x)
2
i
 n 1 (1   / 2)
2
二項母集団の場合(P86,P89例題5.1の2)
母比率の推定
z
P p
p(1  p) / n
 
 z  
2
は標準正規分布N(0,1)に従う.
 
 z 
p(1  p) / n
2
P p
 
 
p  z   p(1  p) / n  P  p  z   p(1  p) / n
2
2