Excel で χ2 検定

2 つの群の観測結果に、有意の差が認められるか?
現状改善の工夫に、効果があったか?
3 月 2 日(木) pm5:45 ∼ 7:00
老年学情報センター2 階会議室
1
χ2 検定は、こんなときに使う
理論的に計算される数値と、実際に観察された実測値とがよく一致しているかどうか。
注射薬のボトルの破損件数は、月によって差があるかどうか。
7 つの病棟でとったあるアンケート結果で、病棟間で回答に違いがあるといえるか。
ある YES・NO 式のアンケートをとった。その回答パターンに、男女で差が見られるか。
狭心症の新薬を服用した人と、プラセボ(偽薬)を服用した人の発作の出現回
数を比べて、新薬に効果があったかどうかをみる。
プロ野球と J リーグのどっちが好きかという質問で、年齢層による違いが見ら
れるか。
公務員 130 人・政治家 103 人・タレント 89 人の血液型(A・B・O・AB)を調
べた。職種によって血液型の比率に違いがあるか。
Excel でχ2 検定を行う方法は、2 通りあります
●CHIDIST 関数を使う方法
●CHITEST 関数を使う方法
CHIDISUT:カイ・スクエアド・ディストリビューション
CHITEST:カイ・スクエアド・テスト
CHIDIST 関数を
使う場合
CHITEST 関数を
使う場合
Excel で表をつくる① 数値(実測値)を集計表にする
仮説を立てる:帰無仮説・対立仮説を立てる
自由度を計算する
(自由度の計算は不用)
有意水準(α)を決める: 5%(α=0.05)にするか、1%(α=0.01)にするか
Excel で表をつくる② 理論値を表にする。
Excel で表をつくる③ χ2 を計算する
(χ2 値の計算は不用)
関数を使ってp値を計算する。
判定 p値が有意水準αより小さいかどうかを見る
p値がα(0.05 か 0.01)より小さい場合
帰無仮説は棄却され、対立仮説が採択される。有意な差が認められる。
p値がα(0.05 か 0.01)より大きい場合
帰無仮説は棄却できない。有意な差があるとはいえない。
2
χ2 検定の基本的な手順
●CHIDIST 関数を使う方法
CHIDIST:カイ・スクエアド・ディストリビューション
例題 1)出産は人為的にコントロールされているか?
1982∼1983 年生まれの大学生の誕生日が何曜日だったかを調べ、曜日ごとの人数を集計して、
表にまとめた。もし出産が人為的にコントロールされているとしたら、曜日ごとの人数の分布に有
意の差がみられるはず・・・
帰無(きむ)仮説と 対立仮説を立てる。
帰無仮説・・・誕生日には、曜日の偏りはない。
対立仮説・・・誕生日には、曜日の偏りがある。
帰無仮説とは?
偏り・差があることを証明したい(検定したい)場合、まず反対の意味の差はないと
いう仮説をたてます。これを帰無仮説といいます。
・ 検定の結果、帰無仮説が棄却(否定)されれば、反対の意味の仮説「偏り・差があ
る」が採択されます。この場合の、反対の仮説を対立仮説といいます。
・ 検定の結果、帰無仮説が棄却できなければ、偏り・差はないといえます。
自由度を計算する。
χ2 検定の関数で使う自由度という数値を算出。
計算式: 自由度=ヨコの項目の数−1
例題の表の場合は、7−1=6
有意水準(α)を、5%か1%に決める
一般的には 5%(α=0.05)を使う。より厳密な検定をしたい場合は、1%(α=0.01)にする。
表をつくり、理論値を計算する。
理論値とは、帰無仮説が正しいとして、理論的に計算される値
例題の場合は、「曜日によって、偏りがない」なので、各曜日の理論値はどれも、
単純に合計人数÷7(曜日)で計算。
↑どの曜日も、341÷7=48.71
表をつくり、χ2 値を公式で計算する
χ2 値は、実測値と理論値のずれの大きさを表す数値
上記の同様の表をつくり、各曜日のセルに、次の計算式で出した値を入れる。その合計がχ2 値。
χ2 値を算出する表で使う計算式 ・・・・・・ (実測値―理論値)2÷理論値
Excel の計算式では ・・・・・・・・・・・・・・・・・・ (実測値―理論値)^2/理論値
※「^」の記号は、キーボード右上の「へ」キーで入力します。
3
χ2 値を求めるための表
χ2 値
CHIDIST 関数で、p値を求める
p値とは、帰無仮説が正しい場合に、算出したχ2 値以上の差異が偶然に誤差として生じる確率
p値を表示させたいセルをアクティブにする。
ツールバーの fx(関数ボタン)をクリック。
統計 を選択。
CHIDIST を選択。
X は、χ2 値のセル番号、または、値を入力。
自由度は、自分で計算した値を入力。
OK をクリック。
p値が表示される。
p値とα(0.05 または 0.01)を比べて、どっちの仮説を採択するか判定
p値=帰無仮説が正しい場合に、実際のデータのような差異が偶然生じる確率
p値がもし 5%より低い確率(p<0.05)なら、「偶然には、めったに起こらないこと」と考える。
=実測値に現れた差異は、偶然の誤差とはいえない。有意の差がある。
=帰無仮説は正しくない。帰無仮説を棄却する。
p値がαより小さければ・・・以下のように判定します。
有意水準 5%(あるいは 1%)で帰無仮説は棄却され、対立仮説が採択される。
曜日ごとの誕生日の分布に有意の差がみられる。
曜日によって偏りがある=出産日は人為的にコントロールされていた。
p値がαより大きければ・・・以下のように判定します。
帰無仮説は棄却できない。
曜日ごとに偏りがあるとはいえない。
このデータからは、出産日に人為的なコントロールがあるとはいえない。
4
ヨコ 2 項目×タテ 2 項目の表でのχ2 検定
●CHIDIST 関数を使う方法
CHIDIST:カイ・スクエアド・ディストリビューション
例題 2)テープ剥離による皮膚かぶれを防ぐ工夫は効果があったか?
テープ剥離に用いるベンジンが皮膚かぶれの原因と考え、剥離材にオリーブ油を使ってみた。
剥離材のちがいと皮膚かぶれの発生は関連があるか。オリーブ油で、皮膚かぶれは減ったのか?
帰無仮説と対立仮説を立てる。
帰無仮説・・・ベンジンとオリーブ油のちがいと、かぶれの有無は関連がない。
対立仮説・・・ベンジンとオリーブ油のちがいと、かぶれの有無は関連がある。
自由度を計算する。
計算式: 自由度=(ヨコの項目の数−1)×(タテの項目の数−1)
例題の場合は、(2−1)×(2−1)=自由度 1
有意水準(α)を、5%か1%に決める
一般的には 5%(α=0.05)を使う。より厳密な検定をしたい場合は、1%(α=0.01)に。
表をつくり、理論値を計算する。
実測値の表を使って、下記の計算式で理論値を計算します。
理論値 a=x×v÷N
理論値b=x×w÷N
理論値c=y×v÷N
理論値d=y×w÷N
理論値 a=x×v÷N
理論値計算の考え方
帰無仮説「項目 A・B の違いは、項目 1・2 の数値には関連しない。項目 A と B とで有意の
差はない。」 なら・・・項目 A でも B でも、それぞれの項目 1 と 2 の数値は、項目 A・B それぞ
れの合計値xあるいはyを、v:w の比率に分けた数になるはず。
5
理論値の表
表をつくり、χ2 値を公式で計算する
理論値の表と同様の表をつくり、セルに下の計算式で計算した値を入れる。その合計がχ2 値。
公式 (実測値―理論値)2÷理論値
Excel の計算式の場合 (実測値―理論値)^2/理論値
χ2 値を求めるための表
χ2 値
CHIDIST 関数で、p値を出す
p値とα(0.05 か 0.01)を比べて、判定する
p値がαより小さければ・・・次のように判定します。
有意水準 5%(あるいは 1%)で帰無仮説は棄却され、対立仮説が採択される。
ベンジンとオリーブ油のちがいと、かぶれの有無には関連がある。
オリーブ油で「かぶれなし」は約 80%。ベンジンは約 57%。この差はたまたま・偶然・誤差
の範囲ではない、と判定された。よって、ベンジンからオリーブ油に変えたことには効果があっ
たといえる。
p値がαより大きければ・・・次のように判定します。
帰無仮説は棄却できない。
この実測データからは、ベンジンとオリーブ油とで、かぶれの有無に違いがあるとはいえない。
6
ヨコ数項目×タテ数項目の表でのχ2 検定
●CHITEST 関数を使う方法で
CHITEST:カイ・スクエアド・テスト
例題 3)3つの病院で、ボトル破損件数を比較
注射薬のボトル破損件数を、A 病院・B 病院・C 病院について、4∼7 月の期間に調べた。
病院によって、ボトルの破損件数に違いがあるといえるか?
帰無仮説と対立仮説を立てる。
帰無仮説・・・ボトルの破損件数に、病院ごとのちがいはない。
対立仮説・・・ボトルの破損件数に、病院ごとのちがいがある。
有意水準(α)を、5%か1%に決める
一般的には 5%(α=0.05)を使う。より厳密な検定をしたい場合は、1%(α=0.01)に。
表をつくり、理論値を計算する。
実測値の表を使って、理論値の表をつくる。
理論値の計算式は、2×2 の表と同様。
CHITEST 関数で、p値を出す
p値を表示させたいセルをアクティブにする。
ツールバーの fx(関数ボタン)をクリック。
7
統計 を選択。
CHITEST を選択。
OK をクリック。
実測値範囲は、実測値表の数値部分をドラッグ。
期待値範囲は、理論値表の数値部分をドラッグ。
p値が表示される。
p値とα(0.05 か 0.01)を比べて、判定する
p値がαより小さければ・・・次のように判定します。
有意水準 5%(あるいは 1%)で帰無仮説は棄却され、対立仮説が採択される。
4∼7 月の期間では、ボトルの破損件数に病院ごとのちがいがある。
p値がαより大きければ・・・次のように判定します。
帰無仮説は棄却できない。
4∼7 月の期間では、ボトルの破損件数に病院ごとのちがいはない。
この場合のχ2 値を求めるには
χ2 値を表示させたいセルをアクティブにする。
ツールバーの fx(関数ボタン)をクリック。
統計 を選択
CHIINV を選択。
CHIINV:カイ・スクエアド・インバース
確率に、p値を入力。
自由度に、自分で計算した自由度を入力。
自由度は(タテ項目数-1)×(ヨコ項目数-1)で計算。
OK をクリック。
8
注意
χ2 検定に必要なデータ数
理論値は必ず 5 以上であること。そのためには、実測値が 20∼30 以上になるように、データを集める。
参考文献など
図書
田久浩志・岩本晋 統計解析なんかこわくない データ整理から学会発表まで 医学書院 2004
山田覚 医療・看護のためのやさしい統計学 基礎編 東京図書 2002
櫻井広幸・神宮英夫 使える統計 Excel で学ぶ実践心理統計 ナカニシヤ出版 2003
ホームページ
早稲田大学人間科学部向後千春研究室 ハンバーガー統計学にようこそ カイ 2 乗検定
http://kogolab.jp/elearn/hamburger/chap3/sec0.html
9