演習II(Rの勉強) 第5回 11月6日 木下直人 分散分析 t検定 2つの(標本)平均値の差を比較して、相違として認められる のかについて推測する方法 3つ以上の(標本)平均値の差については、分散分析を用い なければならない。 1要因の分散分析(対応なし・対応あり)について。 対応あり・なし 対応のない2群 標本を選んできた母集団が独立している ex.) ある学校の3年1組と3年2組の化学のテストの成績 対応のある2群 標本を選んできた母集団が独立していない 1つの母集団から標本を選んでいる ex.) ある学校の3年1組の、補習を受ける前と受けた後の 化学のテストの成績。 【前回】t検定(対応なし) A市とB市から無作為にそれぞれ15人の住民を選び出 し睡眠時間を調べたところ、次に示した表のような結果 が得られた。2つの市の睡眠時間に違いがあるといえる か(対応がない2群の平均値の差の検定)。 A市 B市 9 7 8 9 8 9 6 9 8 7 8 7 10 9 10 5 6 9 6 9 8 6 5 7 5 7 6 6 7 7 分散分析(対応なし) A市とB市とC市から無作為にそれぞれ15人の住民を選 び出し睡眠時間を調べたところ、次に示した表のような 結果が得られた。2つの市の睡眠時間に違いがあるとい えるか(対応がない3群の平均値の差の検定)。 A市 B市 C市 9 7 8 9 8 5 6 9 6 9 7 6 7 8 6 9 6 9 8 7 8 6 5 7 5 6 5 7 8 8 7 10 9 5 7 6 6 7 9 10 5 6 10 7 8 帰無仮説と対立仮説 帰無仮説 対立仮説 帰無仮説と対立仮説 帰無仮説 A市、B市、C市における睡眠時間の平均に差はない。 さらに言うと、 A市、B市、C市のうち任意の2市を選んだとき、その睡眠時 間の平均に差はない。 対立仮説 A市、B市、C市のいずれかの2市の間に、睡眠時間の平均 の差がある。 R Commanderでの操作 Excelでデータを作る データをインポート データ→アクティブデータセット内の変数の管理 →数値変数を因子に変換 市の変数を、「水準名を指定」で変換 1→A city 2→B city 3→C city など 分散の等質性について ルビーンの検定を行う 統計量→分散→ルビーンの検定 中心的傾向は「平均」 正規分布から得た標本についての等分散の検定では、 バートレットの検定が最も良いが、バートレット検定は非 正規性に敏感なため、正規性を気にしないですむルビー ンの検定を行うのが一般的らしい。 ここで分散が等質でないと判断された場合、クラスカル・ ウォリス検定が用いられる。 統計量→平均→1元配置分散分析 グループ:city 目的変数:hour 2組ずつの平均の比較(多重比較) A市とB市、B市とC市、A市とC市の組み合わせについて分 析してくれる。 analysis of variance:分散分析 F値 P値 1%水準で有意 平均 標準偏差 多重比較 1要因の分散分析(対応あり)について http://mizumot.com/handbook/?page_id=219 外国語教育研究ハンドブックによると… Rcommanderを使う場合 Rcommander では,データ入力方法を変更しない限りで きないため, ここでは説明を省略する。詳しくはHP参照。
© Copyright 2025 ExpyDoc