統計学

統計学入門2 第11回
比率の検定
2母集団の比較
レポート課題

検定を行うような事例を各自で考え、下記のよう
な内容のレポートを作成

分析目的






帰無仮説
対立仮説
データの概略の説明(小さなデータの場合はデータ)
分析結果
解釈
様式:A4用紙2枚以内
今日の内容

検定の手順(復習と確認)



平均の検定
複数の平均の比較
比率の検定
問題1

一世帯あたりの一ヶ月あたりの平均支出
金額が20万円であるかどうかを調べたい
と思った。いまある母集団が設定してあり、
その母集団から大きさ1600の標本を抽出
したところ、平均が22万円で、標準偏差が
5万円だったとする。このとき、平均支出金
額が20万円でないと結論付けられるか。
帰無仮説と対立仮説

帰無仮説


母平均 = 20万円
対立仮説

母平均 ≠ 20万円
検定統計量と有意水準

検定統計量



検定を行う場合に使用する統計量
帰無仮説の下での(標本)分布を基に、有
意水準に対応する棄却域を設定
検定統計量の実現値に対応する p値を求
め、有意水準と比較
平均の標本分布
(1)
(2)
x の平均は、母集団の平均m
2
x の分散は、  / n
(3a) n が大きいとき、 x の分布は正規分布
(3b) 母集団分布が正規分布であれば、x の
分布は正規分布
帰無仮説と対立仮説

帰無仮説


母平均 = 20万円
対立仮説

母平均 ≠ 20万円
平均の標本分布
(1)
(2)
x の平均は、母集団の平均20万
2
x の分散は、  / n
(3a) n が大きいとき、 x の分布は正規分布
(3b) 母集団分布が正規分布であれば、x の
分布は正規分布
検定統計量

平均の検定の場合
x  m0
Z
s/ n
m0
は帰無仮説での母平均
検定統計量

平均の検定の場合(大きな標本の場合)
x  m0
Z
s/ n
帰無仮説の下で、
平均0、分散1の正規分布
検定統計量

平均の検定の場合(大きな標本の場合)
x  m0
Z
s/ n
帰無仮説が正しくなければ、
平均が0でなく、分散1の正規分布
検定の手順





仮説の設定
検定方法(統計量)の決定
有意水準の設定
検定統計量の計算
棄却域との比較(p値の算出)
t 検定

母集団の分布が正規分布であれば…
(標本の大きさに関係なく)
x  m0
Z
s/ n
は帰無仮説の下で自由度(n -1)の t 分布
棄却域

有意水準が5%の場合

自由度(n-1)の t 分布の両側5%点
p 値( p - value ; 有意確率)


帰無仮説の下での分布における、検定統
計量の実現値のパーセント点
あらかじめ決められた有意水準と比較を行
い、検定の結論を下す
正規検定

平均の検定の場合(大きな標本の場合)
x  m0
Z
s/ n
帰無仮説の下で、
平均0、分散1の正規分布
t 検定

母集団の分布が正規分布であれば…
(標本の大きさに関係なく)
x  m0
Z
s/ n
は帰無仮説の下で自由度(n -1)の t 分布
検定の選択

標本が大きいとき


分布が正規分布であるとき


正規検定
t 検定
どちらでもない場合

ノンパラメトリック検定(省略)
複数のグループの比較

2つの場合


2標本検定(p.89-)
t 検定(正規検定)
3つ以上の場合

分散分析(p.94-)
帰無仮説と対立仮説

2グループの場合



帰無仮説:2つの母集団の平均が同じ
対立仮説:2つの母集団の平均が異なる
3グループ以上の場合


帰無仮説:すべての母集団の平均が同じ
対立仮説:いずれかの母集団の平均が
他の母集団の平均と異なる
Excelにおける検定の実践方法

1標本

2標本


t 検定、
3標本以上

分析ツールの分散分析
分析ツール:t 検定
分析ツール:t 検定
第1標本の
データ
第2標本の
データ
有意水準
分析ツールの出力
t-検定 : 等分散を仮定した2標本による検定
検定統計量の値
両側検定の場合のp値
平均
分散
観測数
プールされた分散
仮説平均との差異
自由度
t
P(T<=t) 片側
t 境界値 片側
P(T<=t) 両側
t 境界値 両側
変数 1
変数 2
1.857143 3.571429
0.809524 2.952381
7
7
1.880952
0
12
-2.33845
0.018745
1.782287
0.037491
2.178813
分析ツール:分散分析
分析ツール:分散分析
行列形式で
データを入力し
その範囲を指定
列方向に
1グループの
データが並ん
でいる場合
例:分散分析(表5.4, p.95)
例:分散分析(表5.4, p.95)
例:分散分析(表5.4, p.95)
分散分析表
分散分析表
変動要因
変動
グループ間 20750.07
グループ内 9733.8
合計
30483.87
p値
自由度
分散観測された分散比P-値
2 10375.03 28.77868 2.03E-07
27 360.5111
29
検定統計量
2.03E-7 の意味

「E-7」は10のマイナス7乗

すなわち、
7
2.0310
 0.000000203
仮説




統計的に調べたいと思っている命題
平均が×××である
視聴率が○○○である
A薬とB薬は同じ有効率である
問題2

ある番組の視聴率調査を行うことになった。
無作為に抽出された400人に調査を行った
とき、200人がその番組を見ていた。母集
団の視聴率が、40%以上であると結論付
けられるか。
帰無仮説と対立仮説

帰無仮説


母比率 = 40%
対立仮説

母比率 > 40%
(母比率 ≦ 40%)
検定統計量

比率の検定の場合
p  P0
Z
P0 (1  P0 ) / n
P0
は帰無仮説での母比率
検定統計量

比率の検定の場合(大きな標本の場合)
p  P0
Z
P0 (1  P0 ) / n
帰無仮説の下で、
平均0、分散1の正規分布
検定統計量

比率の検定の場合(大きな標本の場合)
p  P0
Z
P0 (1  P0 ) / n
帰無仮説が正しくなければ、
平均が0でない正規分布
検定統計量の分布
対立仮説の
下での分布
帰無仮説の
下での分布
-3
-2
-1
0
1
2
3
4
5
6
棄却域の設定


有意水準(α%)と整合する棄却域を設定
する
帰無仮説の下での分布の両側α%点を棄
却域とする
検定統計量

比率の検定の場合(大きな標本の場合)
p  P0
Z
P0 (1  P0 ) / n
帰無仮説の下で、
平均0、分散1の正規分布
例題の解答


帰無仮説:母比率 = 40%(母比率≦40%)
対立仮説:母比率 > 40%
Z
p  P0
P0 (1  P0 ) / n
p  0 .4

0.4(1  0.4) / n
0 .5  0 .4

 4.08
0.4(1  0.4) / 400
棄却域

有意水準が5%の場合

平均0, 分散1の正規分布の両側5%点
±1.96
検定統計量の分布
対立仮説の
下での分布
帰無仮説の
下での分布
-3
-2
-1
0
1
2
3
4
5
6
検定の手順





仮説の設定
検定方法(統計量)の決定
有意水準の設定
検定統計量の計算
棄却域との比較(p値の算出)
p 値( p - value ; 有意確率)


帰無仮説の下での分布における、検定統
計量の実現値のパーセント点
あらかじめ決められた有意水準と比較を行
い、検定の結論を下す
比率の検定

比率の検定の場合(大きな標本の場合)
p  P0
Z
P0 (1  P0 ) / n
帰無仮説の下で、
平均0、分散1の正規分布
複数のグループの比較

2つの場合

2標本の比率の検定

2つの集団の比較



男女間で支持率が違う
男女間で購買する割合が違う
…
2標本の比率の比較
H 0 : PA  PB
H1 : PA  PB
t
p A  pB
 1
1 
p * (1  p*)  
 n A nB 
n A p A  nB p B
p* 
n A  nB
検定方法(p値の計算方法)

検定統計量の帰無仮説での分布は
標準正規分布なので、
p値は標準正規分布に基づいて算出
両側検定の場合;
=(1-NORMSDIST(統計量の値))*2 ;
複数のグループの比較

3つ以上の場合

クロス表の検定で...(最後の講義で)
練習問題1(正しい説明はどれか)
1.
2.
3.
4.
5.
有意水準はできるだけ小さくすべきであ
る
有意確率が有意水準より大きいと帰無仮
説を棄却する
有意水準は収集されたデータを見ながら
決定する
検定の方法はあらかじめ決めておく
第2種の過誤の確率が有意確率である
練習問題2(正しいのはどれか)
2つの番組の視聴率に差があるかどうかの検定を
行い、有意確率が0.01であった。有意水準は
5%とする。
1.
帰無仮説は棄却できない。
2.
有意確率が0.01なので、信頼できる結果があ
られていない
3.
差があると判断する
4.
差があるとはいえない
5.
第2種の過誤の確率が0.01