Lesson 11. 記述疫学 §C. 仮説の設定 記述疫学の3要素 • 人(だれが):疾患がどのような特性を持った 人に起こったか – 生物学的要因(性、年齢、など) – 社会的要因(職業、生活水準、など) • 時(いつ):疾患がいつ起こったか – 時間経過、変動、要因との時間的関係など • 場所(どこで):疾患がどの場所に多いか – 地域差、環境要因(気候、風土、文化、など) 記述疫学の3要素 推定 仮説の設定 分析疫学 統計学的 手法 仮説の検定 仮 説 • 求めたい事実が「AならばBという結果にな る」ならば、「Aを持っているC群(曝露群、 介入群)と持っていないD群(非曝露群、対 照群)ではBとなる結果に差がある」という のと同じ • 従って、知りたいのは「C群のBとD群のB に差がある」、つまり「C≠D」 • これの証明は統計学的(確率論的)に困難 仮 説(続き) • 「C≠D」を証明するかわりに「C=D」を否定 する • 「C=D」:帰無仮説 Null Hypothesis:H0 • 「C≠D」:対立仮説 Alternative Hypothesis :H1 • 検定の目的は帰無仮説を否定、つまり棄却 reject すること 過 誤 • 仮説検定は標本集団で行われる。(対 象者が無数の母集団では不可能) • 母集団での真実とは異なる可能性が ある。 • 母集団の結果と異なる可能性、つまり 真実が誤られる可能性を過誤 Error という。 第1種の過誤 Type Ⅰ Error • 本当は(母集団で)正しい(真実である)帰 無仮説を棄却してしまう(従って、誤って対 立仮説を採用する)=第1種の過誤 • この過誤が生じる確率=危険率α • αは確率pで表される。 • 20回抽出した標本のうち1回に過誤が生じ る確率はp=0.05、これ以下ならp<0.05 • αは有意水準 Significance level 第2種の過誤 Type ⅡError • 本当は(母集団で)誤っている(真実でな い)帰無仮説を棄却できずに採用してしま う(従って、誤って対立仮説を否定する) =第2種の過誤 • この過誤が生じる確率=危険率β • 判断が正しくてこの過誤が生じない確率 =1-β検出力 Power • 検出力は分析の能力(通常は80%以上に 設定) 第1種と第2種の過誤の関係 母集団の真の結果 差がある (H0は誤り) 仮説 検定 の 結果 差がある 正しい (H0を棄却) (1-β、検出力) 差があると はいえない (H0を採用) 第2種の過誤 (β) H0は帰無仮説 差がない (H0は正しい) 第1種の過誤 (α、有意水準) 正しい 区間推定 • 仮説の検定の最終目標は、標本集団の結 果より母集団の結果を推測すること • 点推定 Point Estimation – ひとつの値を推定 – はずれる危険が大きい • 区間推定 Interval Estimation – ある幅(区間)を持って推定 – 確率的にその幅に母集団の値がある可能性 区間推定(続き) • 標本集団の代表値(平均値など)は正規分 布(分布と標準誤差を参照) • 95%の確率で母集団の値がその区間にあ る=5%の確率で誤り(p=0.05) • つまり、有意水準は母集団の区間推定が 誤りである確率 • 区間推定で求める値の幅 =信頼区間 Confidence Interval:CI 信頼区間 • 平均値の信頼区間 m 1.96 SE mは標本平均、SEは標準誤差 • 比率の信頼区間 p (1 p ) p 1.96 N pは標本の比率、Nは標本数
© Copyright 2024 ExpyDoc