統計学入門2 第11回 比率の検定 2母集団の比較 レポート課題 検定を行うような事例を各自で考え、下記のよう な内容のレポートを作成 分析目的 帰無仮説 対立仮説 データの概略の説明(小さなデータの場合はデータ) 分析結果 解釈 様式:A4用紙2枚以内 今日の内容 検定の手順(復習と確認) 平均の検定 複数の平均の比較 比率の検定 問題1 一世帯あたりの一ヶ月あたりの平均支出 金額が20万円であるかどうかを調べたい と思った。いまある母集団が設定してあり、 その母集団から大きさ1600の標本を抽出 したところ、平均が22万円で、標準偏差が 5万円だったとする。このとき、平均支出金 額が20万円でないと結論付けられるか。 帰無仮説と対立仮説 帰無仮説 母平均 = 20万円 対立仮説 母平均 ≠ 20万円 検定統計量と有意水準 検定統計量 検定を行う場合に使用する統計量 帰無仮説の下での(標本)分布を基に、有 意水準に対応する棄却域を設定 検定統計量の実現値に対応する p値を求 め、有意水準と比較 平均の標本分布 (1) (2) x の平均は、母集団の平均m 2 x の分散は、 / n (3a) n が大きいとき、 x の分布は正規分布 (3b) 母集団分布が正規分布であれば、x の 分布は正規分布 帰無仮説と対立仮説 帰無仮説 母平均 = 20万円 対立仮説 母平均 ≠ 20万円 平均の標本分布 (1) (2) x の平均は、母集団の平均20万 2 x の分散は、 / n (3a) n が大きいとき、 x の分布は正規分布 (3b) 母集団分布が正規分布であれば、x の 分布は正規分布 検定統計量 平均の検定の場合 x m0 Z s/ n m0 は帰無仮説での母平均 検定統計量 平均の検定の場合(大きな標本の場合) x m0 Z s/ n 帰無仮説の下で、 平均0、分散1の正規分布 検定統計量 平均の検定の場合(大きな標本の場合) x m0 Z s/ n 帰無仮説が正しくなければ、 平均が0でなく、分散1の正規分布 検定の手順 仮説の設定 検定方法(統計量)の決定 有意水準の設定 検定統計量の計算 棄却域との比較(p値の算出) t 検定 母集団の分布が正規分布であれば… (標本の大きさに関係なく) x m0 Z s/ n は帰無仮説の下で自由度(n -1)の t 分布 棄却域 有意水準が5%の場合 自由度(n-1)の t 分布の両側5%点 p 値( p - value ; 有意確率) 帰無仮説の下での分布における、検定統 計量の実現値のパーセント点 あらかじめ決められた有意水準と比較を行 い、検定の結論を下す 正規検定 平均の検定の場合(大きな標本の場合) x m0 Z s/ n 帰無仮説の下で、 平均0、分散1の正規分布 t 検定 母集団の分布が正規分布であれば… (標本の大きさに関係なく) x m0 Z s/ n は帰無仮説の下で自由度(n -1)の t 分布 検定の選択 標本が大きいとき 分布が正規分布であるとき 正規検定 t 検定 どちらでもない場合 ノンパラメトリック検定(省略) 複数のグループの比較 2つの場合 2標本検定(p.89-) t 検定(正規検定) 3つ以上の場合 分散分析(p.94-) 帰無仮説と対立仮説 2グループの場合 帰無仮説:2つの母集団の平均が同じ 対立仮説:2つの母集団の平均が異なる 3グループ以上の場合 帰無仮説:すべての母集団の平均が同じ 対立仮説:いずれかの母集団の平均が 他の母集団の平均と異なる Excelにおける検定の実践方法 1標本 2標本 t 検定、 3標本以上 分析ツールの分散分析 分析ツール:t 検定 分析ツール:t 検定 第1標本の データ 第2標本の データ 有意水準 分析ツールの出力 t-検定 : 等分散を仮定した2標本による検定 検定統計量の値 両側検定の場合のp値 平均 分散 観測数 プールされた分散 仮説平均との差異 自由度 t P(T<=t) 片側 t 境界値 片側 P(T<=t) 両側 t 境界値 両側 変数 1 変数 2 1.857143 3.571429 0.809524 2.952381 7 7 1.880952 0 12 -2.33845 0.018745 1.782287 0.037491 2.178813 分析ツール:分散分析 分析ツール:分散分析 行列形式で データを入力し その範囲を指定 列方向に 1グループの データが並ん でいる場合 例:分散分析(表5.4, p.95) 例:分散分析(表5.4, p.95) 例:分散分析(表5.4, p.95) 分散分析表 分散分析表 変動要因 変動 グループ間 20750.07 グループ内 9733.8 合計 30483.87 p値 自由度 分散観測された分散比P-値 2 10375.03 28.77868 2.03E-07 27 360.5111 29 検定統計量 2.03E-7 の意味 「E-7」は10のマイナス7乗 すなわち、 7 2.0310 0.000000203 仮説 統計的に調べたいと思っている命題 平均が×××である 視聴率が○○○である A薬とB薬は同じ有効率である 問題2 ある番組の視聴率調査を行うことになった。 無作為に抽出された400人に調査を行った とき、200人がその番組を見ていた。母集 団の視聴率が、40%以上であると結論付 けられるか。 帰無仮説と対立仮説 帰無仮説 母比率 = 40% 対立仮説 母比率 > 40% (母比率 ≦ 40%) 検定統計量 比率の検定の場合 p P0 Z P0 (1 P0 ) / n P0 は帰無仮説での母比率 検定統計量 比率の検定の場合(大きな標本の場合) p P0 Z P0 (1 P0 ) / n 帰無仮説の下で、 平均0、分散1の正規分布 検定統計量 比率の検定の場合(大きな標本の場合) p P0 Z P0 (1 P0 ) / n 帰無仮説が正しくなければ、 平均が0でない正規分布 検定統計量の分布 対立仮説の 下での分布 帰無仮説の 下での分布 -3 -2 -1 0 1 2 3 4 5 6 棄却域の設定 有意水準(α%)と整合する棄却域を設定 する 帰無仮説の下での分布の両側α%点を棄 却域とする 検定統計量 比率の検定の場合(大きな標本の場合) p P0 Z P0 (1 P0 ) / n 帰無仮説の下で、 平均0、分散1の正規分布 例題の解答 帰無仮説:母比率 = 40%(母比率≦40%) 対立仮説:母比率 > 40% Z p P0 P0 (1 P0 ) / n p 0 .4 0.4(1 0.4) / n 0 .5 0 .4 4.08 0.4(1 0.4) / 400 棄却域 有意水準が5%の場合 平均0, 分散1の正規分布の両側5%点 ±1.96 検定統計量の分布 対立仮説の 下での分布 帰無仮説の 下での分布 -3 -2 -1 0 1 2 3 4 5 6 検定の手順 仮説の設定 検定方法(統計量)の決定 有意水準の設定 検定統計量の計算 棄却域との比較(p値の算出) p 値( p - value ; 有意確率) 帰無仮説の下での分布における、検定統 計量の実現値のパーセント点 あらかじめ決められた有意水準と比較を行 い、検定の結論を下す 比率の検定 比率の検定の場合(大きな標本の場合) p P0 Z P0 (1 P0 ) / n 帰無仮説の下で、 平均0、分散1の正規分布 複数のグループの比較 2つの場合 2標本の比率の検定 2つの集団の比較 男女間で支持率が違う 男女間で購買する割合が違う … 2標本の比率の比較 H 0 : PA PB H1 : PA PB t p A pB 1 1 p * (1 p*) n A nB n A p A nB p B p* n A nB 検定方法(p値の計算方法) 検定統計量の帰無仮説での分布は 標準正規分布なので、 p値は標準正規分布に基づいて算出 両側検定の場合; =(1-NORMSDIST(統計量の値))*2 ; 複数のグループの比較 3つ以上の場合 クロス表の検定で...(最後の講義で) 練習問題1(正しい説明はどれか) 1. 2. 3. 4. 5. 有意水準はできるだけ小さくすべきであ る 有意確率が有意水準より大きいと帰無仮 説を棄却する 有意水準は収集されたデータを見ながら 決定する 検定の方法はあらかじめ決めておく 第2種の過誤の確率が有意確率である 練習問題2(正しいのはどれか) 2つの番組の視聴率に差があるかどうかの検定を 行い、有意確率が0.01であった。有意水準は 5%とする。 1. 帰無仮説は棄却できない。 2. 有意確率が0.01なので、信頼できる結果があ られていない 3. 差があると判断する 4. 差があるとはいえない 5. 第2種の過誤の確率が0.01
© Copyright 2024 ExpyDoc