第6章 2つの平均値を比較する - Welcome to Sirai`s

第6章 2つの平均値を比較する
2つの平均値を比較する方法の説明
独立な2群の平均値差の検定
対応のある2群の平均値差の検定
6.1 2つの平均値を比較するケース
2つの平均値を比較することが必要となる場合
「指導法データ」を例に考えると...
独立な2群のt検定
– 男女で心理学テストの平均値に差があるかどうか
– 統計の好き嫌いで統計テストの平均値に差があ
るか
対応のある2群のt検定
– 指導法の違いが成績に影響があるかどうか
6.2 独立な2群のt検定
独立な2群のt検定の例(再掲)
・男女で平均値に差があるかどうか
・統計が好き・嫌いで統計テストの平均値に差
があるかどうか
男と女、統計が好きな人と嫌いな人、というよう
に2群はそれぞれ別々の標本から得られたデー
タ・・・2群が「独立」
6.2 独立な2群のt検定
平均値差の標本分布 X1  X 2
:
N(μ1 - μ2, σ2(1/n1+1/n2))
に従う
これを以下のように標準化すると N(0,1) に従う
( X 1  X 2 )  ( 1   2) / (σ 1/n1 + 1/n 2 )
ただしこれには、検定統計量の分母に未知の値の母
標準偏差σが含まれている。これは𝜎2pooledによって推定
2
2
(
n

1
)
σ

(
n

1
)
σ
1
1
2
2
𝜎2pooled =
n1  n 2  2
𝜎12 と𝜎2 2はそれぞれの群の不偏分散、n1とn2はそれぞれの群のサンプルサイズ
6.2 続き
t=
( X1  X 2 )
ˆ 12  ( n 2  1)σ
ˆ 22
(n1 - 1)σ
n1  n 2  2
 1
1 

n  n 

2 
 1
帰無仮説H0: μ1=μ2 のもとで、
自由度 df=n1+n2-2 のt分布に従う
この検定統計量を用いて2つ群の平均値の差
に関する検定を行う
6.2 独立な2群のt検定
例題
「統計テスト1」の得点の平均値に男女で有意
な差があるかどうかを 有意水準5%、両側検
定で検定
例題の検定
(1)帰無仮説と対立仮説の設定
帰無仮説H0: μ1=μ2
対立仮説H1: μ1≠μ2
(2)検定統計量の選択:これは自由度df=n1+n2-2のt分布に従う
t 
X1 X 2
ˆ 12  ( n 2  1)σ
ˆ 22 1
(n1 - 1)σ
1
(

)
n1  n 2  2
n1
n2
(3)有意水準αの決定
有意水準5% α=0.05とする。
(4)検定統計量の実現値を求める
まず平均と不偏分散を求め、次に「プール標準偏差」を求
める。最後に検定統計量の実現値を計算
>統計1男<-c(6,10,6,10,5,3,5,9,3,3)
> 統計1女<-c(11,6,11,9,7,5,8,7,7,9)
> mean(統計1男)
[1] 6
> mean(統計1女)
[1] 8
> var(統計1男)
[1] 7.777778
> var(統計1女)
[1] 4
> プール標準偏差<-sqrt(((length(統計1男)-1)*var(統計1男)+(length(統計1女)-1)*var(統計1
女))/(length(統計1男)+length(統計1女)-2))
>プール標準偏差
[1] 2.426703
Rで動かす・・・
> t分母<-プール標準偏差*sqrt(1/length(統計1男)+1/length(統計1女))
> t分子<-mean(統計1男)-mean(統計1女)
> t統計量<-t分子/t分母
> t統計量
[1] -1.842885
検定統計量の実現値がt = -1.84と求まった。
例題の続き
(5)帰無仮説の棄却or採択の決定
帰無仮説のもとで自由度10+10-2=18のt分布にしたがい、有
意水準は5%、両側検定の時の棄却域を求める。
Rで棄却域を求めると
> qt(0.025,18)
[1] -2.100922
> qt(0.025,18,lower.tail=FALSE)
[1] 2.100922
よって棄却域は、t< -2.10、t> 2.10 となる。
今回の検定統計量の実現値はt= -1.84 であったので、
帰無仮説は棄却されない。
検定の結果は「5%水準で有意差が見られなかった」となる。
p値を直接求めることも可能
> pt(-1.842885,18)
[1] 0.04093903
両側検定からこれを2倍した結果から、同様の結論が得られる
> 2*pt(-1.842885,18)
[1] 0.08187807
5章の t.test によっても簡単に求められる:
> t.test(統計1男,統計1女,var.equal=TRUE)
Two Sample t-test
data: 統計1男 and 統計1女
t = -1.8429, df = 18, p-value = 0.08188
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-4.2800355 0.2800355
sample estimates:
mean of x mean of y
6
8
6.3 t検定の前提条件
t 検定を実行するには3つの条件が必要
1. 標本が無作為に行われていること(無作為抽
出)
2. 母集団の分布が正規分布にしたがっているこ
と(正規性)
3. 2つの母集団の分散が等質であること(分散の
等質性)
6.3.1 分散の等質性
分散の等質性の検定ーRでは var.test
> クラスA<-c(54,55,52,48,50,38,41,40,53,52)
> クラスB<-c(67,63,50,60,61,69,43,58,36,29)
> var.test(クラスA,クラスB)
F test to compare two variances
data: クラスA and クラスB
F = 0.2157, num df = 9, denom df = 9, p-value = 0.03206
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.05356961 0.86828987
sample estimates:
ratio of variances
0.2156709
6.3.2 Welchの検定
母分散が等質でないときは、t検定は使えないので
Welch検定を使う
> t.test(クラスA,クラスB,var.equal=FALSE)
Welch Two Sample t-test
data: クラスA and クラスB
t = -1.1191, df = 12.71, p-value = 0.2838
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-15.554888 4.954888
sample estimates:
mean of x mean of y
48.3 53.6
6.4 対応のあるt検定
独立な2群、もしくは対応のない2群
ランダムに割り振った2群
対応のあるデータ
・あらかじめ似ている被験者2人をぺアにして、ペアの一方を第1群
に、他方を第2群に割り当てるという方法で分けられた2群のデー
タ
・同じ被験者について複数の測定が行われている場合
例 統計の指導を受ける前と後のテスト得点である「統計テスト1」
と「統計テスト2」
対応あるデータについては、独立な2群のt検定ではないべつの方法
が必要
6.4 対応のあるt検定
対応のあるデータでは「変化量(あるいは差得
点)」を考える。
統計テスト1の得点をX1、統計テスト2の得点を
X2、変化量(差得点)をDとすれば
D = X2 - X1
さらに、これらの標本平均 X 1 X 2 D の間には
D  X 2  X1
という関係がなりたつ。
続き
差得点 D~N(μD,σD2) と仮定すれば
標本平均 D ~N(μD,σD2/n) と表せる。
この標本分布を次式により標準化
D μD
Z=
σD / n
これはN(0,1)に従う
ここで検定統計量の分母にあるσDは未知。
これを標本から求めた標準偏差𝜎 で代用すると、
D μD は 自由度df=n-1のt分布にしたがう
𝐷
t
ˆ D/ n
σ
例題
「指導法データ」の統計テスト1と統計テスト2
の得点について、指導の前後で統計テストの
得点が変化したかどうかを、有意水準5%、
両側検定で検定
対応のあるt検定
(1)帰無仮説と対立仮説の設定
帰無仮説H0:μD=0(得点の変化の母平均は0である)
対立仮説H1:μD≠0 (得点の変化の母平均は0でない)
(2)検定統計量の選択
D
t
検定統計量:
を検定統計量とする。
ˆ D/ n
σ
自由度 df=n-1
(3)有意水準の決定
有意水準は5%、つまりα=0.05。両側検定。
(4)検定統計量の実現値を求める
(5)帰無仮説の棄却or採択の決定
Rで動かすと・・・
>統計テスト1<- c(6,10,6,10,5,3,5,9,3,3,11,6,11,9,7,5,8,7,7,9)
> 統計テスト2<- c(10,13,8,15,8,6,9,10,7,3,18,14,18,11,12,5,7,12,7,7)
> 変化量<- 統計テスト2-統計テスト1
> sd(変化量)
[1] 2.772041
> 分母t <-sd(変化量)/sqrt(length(変化量))
> 分子t <- mean(変化量)
> t統計量<- 分子t/分母t
> t統計量
[1] 4.839903
検定統計量の実現値は t= 4.84
続き(帰無仮説の棄却or採択の決定)
> qt(0.025,19)
#自由度df=n-1=19、有意水準5%/2 = 0.025
[1] -2.093024
> qt(0.025,19,lower.tail=FALSE)
[1] 2.093024
棄却域は t< -2.093 , t> 2.093となる。
検定統計量の実現値であるt= 4.84は棄却域に入る
⇒ 帰無仮説は棄却
結果:
「指導の前後で、統計テスト1と統計テスト2の得点の平均値に
5%水準で有意差が見られた」と報告
t.test関数を用いた場合
> t.test(変化量)
One Sample t-test
data: 変化量
t = 4.8399, df = 19, p-value = 0.0001138
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
1.702645 4.297355
sample estimates:
mean of x
3
t.test関数を用いた場合2
> t.test(統計テスト1,統計テスト2,paired=TRUE)
Paired t-test
data: 統計テスト1 and 統計テスト2
t = -4.8399, df = 19, p-value = 0.0001138
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-4.297355 -1.702645
sample estimates:
mean of the differences
-3
上記の方法は対応のあるt検定の場合に使える。
差得点を定義しない分、少ない手順でできる。
続き
なお、同じデータを対応なしとみなして、独立な2群のt検定を実行した場合。
まず、分散の等質性の検定
> var.test(統計テスト1,統計テスト2)
F test to compare two variances
data: 統計テスト1 and 統計テスト2
F = 0.3913, num df = 19, denom df = 19, p-value = 0.04733
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.1548830 0.9886112
sample estimates:
ratio of variances
0.3913043
P値が 0.047 となり、有意水準5%より小さいので、Weichの検定を実行する。
Welchの検定
> t.test(統計テスト1,統計テスト2,var.equal=FALSE)
Welch Two Sample t-test
data: 統計テスト1 and 統計テスト2
t = -2.763, df = 31.895, p-value = 0.00943
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-5.2119742 -0.7880258
sample estimates:
mean of x mean of y
7
10
このデータでは、独立な2群とみなして検定を行っても5%水準で有意差ありという結
果は変わらない。
しかし、p値を比較すると、対応ありは0.0001、対応なしは0.0094となる
対応ありと分析した方が小さなp値が得られることが確認できる。