東京大学医学系研究科特任助教倉橋一成 1  1. 2. 3. 4. 背理法を使った理論展開帰無仮説（H0、差がない）が真であると仮定 H0の下で「今回得られたデータ」以上の値が観測できる確率（P値）を計算 P値が5%未満：「H0の下で今回のデータが得られる可能性が低い」「H0は間違っている」：H0を棄却し対立仮説（H1、差がある）が真であると判断する ※検定やサンプルサイズ設計の概念を説明するのはいつもチャレンジングなのです。。。 2 検定統計量の分布（検定をするために計算する指標） H1 H0 P値= x2 δ 0 得られたデータ ※検定統計量は多くの場合「何かの平均値」という形をしているので正規近似出来る事が多い 3 分布のばらつきが小さくなる →P値が小さくなる →差（δ）が同じでも有意になりやすい H1 H0 P値= x2 δ 0 得られたデータ 4 設定する必要のある値 1. αエラー（通常5%） 2. βエラー（通常20%） 3. δ（臨床情報を加味） 4. n（試験の規模） H0 αエラー= n=100 H1 x2 δ βエラー= 20% 2.5% 0 期待される値 5 設定する必要のある値 1. αエラー（通常5%） 2. βエラー（通常20%） 3. δ（臨床情報を加味） 4. n（試験の規模） n=1000 H1 H0 αエラー= x2 δ βエラー= 20% 2.5% 0 期待される値 6  wiki ◦ 平均への回帰（へいきんへのかいき、または平均回帰、回帰効果）とは、1回目の試験結果が偏っていた（特別に良かった、悪かったなど）対象について2回目の試験結果（時間的には逆でもよい）を調べると、その平均値は1回目の測定値よりも1回目全体の平均値に近くなるという統計学的現象をいう。 ◦ 回帰の誤謬（regression fallacies）とは、平均回帰に気づかずにデータの収集と解釈を行い、さも科学的根拠があるような誤った結論（改善効果があった、悪化が見られる、等）を出してしまうことをいう。  ある薬が成績を増すかどうかをテストしたい。まず生徒にテストをさせ、点数が最下位10%だった生徒たちに薬を与え、再度別のテストをさせる。すると平均成績が顕著に上がったという結果が得られる。しかしこれは薬の効果について何もいったことにならない。 7  平均分散尖度歪度  樽の法則    ◦ 変数変換為の法則 ※結果変数は正規性が保たれていることが望ましいが、説明変数は必ずしもそうではない ◦ 説明変数に「正規分布に従う誤差」を仮定することは少ない 8  シャピロ・ウィルク検定 ◦ shapiro.test() 9   今回は概念的に難しいです。。。並べ替え検定（permutation test） ◦ 「条件付き（conditional）」検定 ◦ ランダム化試験でない研究・データでの解析  観察研究 ◦ ランダム化試験であっても「母集団からのサンプリング」という概念が馴染まない研究・データ 10  roomwidth（再） ◦ 学生44人に講堂の幅をメートルであて推量させる ◦ 同じ部屋で別の69人にフィートであて推量させる ◦ 真の部屋の幅は13.1メートル（43.0フィート）  suicides ◦ 自殺しようとしている人に対する冷やかしと時期（月）の関係  Lanza ◦ 関節炎患者へのミソプロストール投与のランダム化臨床試験×4  anomalies ◦ 胎生期に抗てんかん薬に曝露された新生児 ◦ 2人の小児外科医（MD）と研究助手（RA）が奇形の個数を評価 ◦ 2人の評価がどれほど一致しているか 11  通常の統計的検定 ◦ 母集団からランダムに抽出された標本に対する議論 ◦ この仮定は現実的ではない！  臨床試験 ◦ ある疾患にかかっている全ての患者からランダム標本を抽出することは不可能 ◦ 通常は、病院スタッフ・縁故者・病院にやってきた患者を対象とする  条件付き検定 ◦ ランサムサンプリングを仮定しない ◦ モデル等の仮定も何もない ◦ 帰無分布はデータのランダムな全ての並べ替えを条件付けて計算 12   並べ替え検定条件付きWilcoxon順位和検定 ◦ y：連続値、x：カテゴリ（治療等） ◦ yにタイ（同順位）データがない場合は通常の順位和検定と同じ  Fisherの正確検定 ◦ y：カテゴリ、x：カテゴリ  Cochran-Mantel-Haenzel検定 ◦ y：カテゴリ、x：カテゴリ、z：カテゴリ（層の因子） ◦ 層別の分割表データ  周辺均一性の検定 ◦ McNemar検定の一般化 13 14