確率と統計2008 第11日目

確率と統計2008
第11日目
平均値の差の検定
• 今日の問題意識:
前回の「平均の差の検定(あるいは平均の優
位差の検定)」では、母分散がが事前に知ら
れている、あるいは、標本分散で近似できる
ことが前提条件であった。
だが、その条件が成り立たない、あるいは、
成り立つかどうかわからない場合はどうすれ
ばいいのだろうか?
代表的な手法
1. t検定
2. 分散分析法
t検定の考え方
• 2つの平均m1とm2との差maーmbに注目し、
その差は本来ゼロであるが、測定値上の差
は誤差の分だけと考えたとき、差が誤差の何
倍に当たるかの値tを計算し、理論上tがその
ような値を取る確率を調べ、あまりにも小さけ
れば「本来差がない」という仮説を棄却する。
計算式
t
| ma  mb |
s s
n 1
2
a
2
b
maとmb: 2つの標本のそれぞれの平均
SaとSb:2つの標本のそれぞれの標準偏差
n:標本におけるデータ数
• t値と自由度とを計算し、t分布表をみて、確率
を知る。
例
データの個数n
平均m
標準偏差s
条件A
条件B
6
48.0
14.5
6
70.0
12.9
1. t値を計算する。
2. 自由度を計算する。
– 自由度 df = (Na – 1) + (Nb – 1)
3. t分布表を調べ、当該t値の出現確率を求め
る。
4. 有意性を判定する。
• P>0.1 「有意ではない」
• 0.05 < p < 0.10 「有意傾向である」
• P<0.05 「有意である」(有意水準5%)
• P<0.01 「有意である」 (有意水準1%)
先ほどの例に適用してみよう。
データに対応がある場合のt検定
例
被検者No
条件A
条件B
1
2
3
4
5
6
7
112
95
103
90
124
100
108
125
105
98
97
125
105
113
平均
標準偏差
その差(A-B)
1. t値の計算
t
| 差の平均 |
2
s
n 1
2.自由度dfの計算
• df=N-1
3.t分布表を調べる。
4.有意性の判断をする。