PowerPoint プレゼンテーション

土木計画学
第5回(11月2日)
調査データの統計処理と分析3
担当:榊原 弘之
基本的な考え方
統計量の分布
(分布形は既知)

個別の標本の側から見ると...
2
標本
(実現値)
1
1.母平均の区間推定(母分散がわかっているとき)
必要な値
標本平均値
標本数 n
z
x
x
( / n )
母分散
2
は標準正規分布N(0,1)に従う.
1
信頼区間
  
  
z 
z 
2 n 2 n

2
分散
の
n
正規分布

2 X 2
  
  
X  z 
   X  z 
2 n
2 n
2.母平均の区間推定(母分散がわからないとき)
必要な値
標本平均値
標本数 n
t
x
不偏分散
S2
X 
2
S /n
は自由度n-1のt分布に従う
  S
  S
x  t n 1  
   x  t n 1  
2 n
2 n
3.母分散の区間推定(母平均がわかっているとき)
必要な値
母平均
2 


標本数
n
( X i  )2
i

(x  )
i
 n ( / 2)
2
は自由度nのカイ2乗分布に従う
2
2

2
(x  )


2
i
 n (1   / 2)
2
4.母分散の区間推定(母平均がわからないとき)
必要な値
標本平均値
2 

標本数
x
( X i  x)2
i

は自由度n-1のカイ2乗分布に従う
2
(x  x)
2
i
 n1 ( / 2)
2
n
 
2
(x  x)
2
i
 n 1 (1   / 2)
2
二項母集団の場合(P86,P89例題5.1の2)
母比率の推定
z
P p
p(1  p) / n
 
 z  
2
は標準正規分布N(0,1)に従う.
 
 z 
p(1  p) / n
2
P p
 
 
p  z   p(1  p) / n  P  p  z   p(1  p) / n
2
2
本日の内容
パラメータの妥当性を検定する手法
(統計的検定)について説明する.
1.帰無仮説(Null Hypothesis)
2.有意水準(Level of Significance)
3.第1種・第2種の過誤(type I and II errors)
4.クロス集計の独立性検定(カイ2乗検定)
・期待値
・信頼区間
結果の予測
確率モデル
・パラメータ推定
・妥当性検証(検定)
観測データ
パラメータ推定:母数(平均,分散,比率等)の値を推測する.
検定(statistical test):母数が仮定した値かどうかを検討する.
どちらも統計量の確率分布を利用
統計的検定が必要とされる状況の例(1)
1.局所的な地震災害が全国に及ぼす影響を知るために,
被災地からやや離れたA県内のある地点における高速
道路の交通量を測定した.地震前の平均は50000台/日
であったが,地震後10日間の平均は49500台/日であった.
交通量が減少したといえるか?
2.地球温暖化の影響で,異常気象が増加するといわれる.
ある地域において,過去10年間の平均年降水量は,
50年前に比べて500mm増加したという.降水量が増加
したといえるか?
統計的検定が必要とされる状況の例(2)
3.A市では,B市と比較して交通事故対策を重視
している.A市における人口当たり交通事故
発生率は0.1%,B市においては0.2%である.
A市の交通事故対策は,交通事故の減少に
寄与しているのか?
「違い」があるか否かの判断基準を提供する
環境の変化
存在の有無を明らかにする
政策の効果
仮説検定の手順(P87)(両側検定「仮説より大きいか小さいか?」
の場合)
1.帰無仮説(Null Hypothesis)H0をたてる.
2. H0を検定するための統計量(パラメータ推定の場合と同じ)T
を選び,その分布を特定する.
P{T  T1( )orT  T2 ( )}  
となる T1( ), T2 ( ) を求める.
3.有意水準αを決め,
4.標本データの下でのTを求める.
5. T
 T1( )orT  T2 ( )
であればH0を棄却,そうでなければ
棄却せず.
T1 ( )
T2 ( )
あわせてα
仮説検定の手順 (片側検定「仮説よりも小さいか?」の場合)
1.帰無仮説(Null Hypothesis)H0をたてる.
2. H0を検定するための統計量(パラメータ推定の場合と同じ)T
を選び,その分布を特定する.
3.有意水準αを決め,
P{T  T ( )}  
となる T ( ) を求める.
4.標本データの下でのTを求める.
5.
T  T ( )
であればH0を棄却,そうでなければ
棄却せず.
T ( )
α
仮説検定の手順(片側検定「仮説より大きいか」の場合)
1.帰無仮説(Null Hypothesis)H0をたてる.
2. H0を検定するための統計量(パラメータ推定の場合と同じ)T
を選び,その分布を特定する.
3.有意水準αを決め,
となる
T ( )
P{T  T ( )}  
を求める.
4.標本データの下でのTを求める.
5.
T  T ( )
であればH0を棄却,そうでなければ
棄却せず.
T ( )
α
第1種の過誤(Type I Error)
帰無仮説H0が正しいにも関わらず,棄却してしまう誤り
確率α
第2種の過誤(Type II Error)
帰無仮説H0が誤りであるにも関わらず,棄却しない誤り
確率β
αを小さくすると
βが大きくなってしまう
β
第2種の過誤
α
第1種の過誤
1.母平均の検定(母分散がわかっているとき)
必要な値
標本平均値
標本数 n
有意水準

x
母分散
の下で,
1.帰無仮説:「母平均は
2.
T
2
x
( / n )
3.正規分布表から
 である.」
(標準正規分布N(0,1)に従う.)
T1 ( ), T2 ( ), T ( )
を求める
2.母平均の検定(母分散がわからないとき)
必要な値
標本平均値
標本数 n
有意水準

x
T
S2
の下で,
1.帰無仮説:「母平均は
2.
不偏分散
x
 である.」
(自由度n-1のt分布に従う)
2
S /n
3.自由度(n-1)のt分布表から T1 ( ), T2 ( ), T ( )
を求める
3.母分散の検定(母平均がわかっているとき)
必要な値
母平均
有意水準


標本数
n
の下で,
2
1.帰無仮説:「母分散は である.」
2.
T
(X
i
 )
i

2
(自由度nのカイ2乗分布に従う)
2
3.自由度nのカイ2乗分布表から T1 ( ), T2 ( ), T ( )
を求める
4.母分散の検定(母平均がわからないとき)
必要な値
標本平均値
有意水準

標本数
x
n
の下で,
2
1.帰無仮説:「母分散は である.」
2.
T
(X
i
 x)
i

2
(自由度n-1のカイ2乗分布に従う)
2
3.自由度nのカイ2乗分布表から T1 ( ), T2 ( ), T ( )
を求める