第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明 独立な2群の平均値差の検定 対応のある2群の平均値差の検定 6.1 2つの平均値を比較するケース 2つの平均値を比較することが必要となる場合 「指導法データ」を例に考えると... 独立な2群のt検定 – 男女で心理学テストの平均値に差があるかどうか – 統計の好き嫌いで統計テストの平均値に差があ るか 対応のある2群のt検定 – 指導法の違いが成績に影響があるかどうか 6.2 独立な2群のt検定 独立な2群のt検定の例(再掲) ・男女で平均値に差があるかどうか ・統計が好き・嫌いで統計テストの平均値に差 があるかどうか 男と女、統計が好きな人と嫌いな人、というよう に2群はそれぞれ別々の標本から得られたデー タ・・・2群が「独立」 6.2 独立な2群のt検定 平均値差の標本分布 X1 X 2 : N(μ1 - μ2, σ2(1/n1+1/n2)) に従う これを以下のように標準化すると N(0,1) に従う ( X 1 X 2 ) ( 1 2) / (σ 1/n1 + 1/n 2 ) ただしこれには、検定統計量の分母に未知の値の母 標準偏差σが含まれている。これは𝜎2pooledによって推定 2 2 ( n 1 ) σ ( n 1 ) σ 1 1 2 2 𝜎2pooled = n1 n 2 2 𝜎12 と𝜎2 2はそれぞれの群の不偏分散、n1とn2はそれぞれの群のサンプルサイズ 6.2 続き t= ( X1 X 2 ) ˆ 12 ( n 2 1)σ ˆ 22 (n1 - 1)σ n1 n 2 2 1 1 n n 2 1 帰無仮説H0: μ1=μ2 のもとで、 自由度 df=n1+n2-2 のt分布に従う この検定統計量を用いて2つ群の平均値の差 に関する検定を行う 6.2 独立な2群のt検定 例題 「統計テスト1」の得点の平均値に男女で有意 な差があるかどうかを 有意水準5%、両側検 定で検定 例題の検定 (1)帰無仮説と対立仮説の設定 帰無仮説H0: μ1=μ2 対立仮説H1: μ1≠μ2 (2)検定統計量の選択:これは自由度df=n1+n2-2のt分布に従う t X1 X 2 ˆ 12 ( n 2 1)σ ˆ 22 1 (n1 - 1)σ 1 ( ) n1 n 2 2 n1 n2 (3)有意水準αの決定 有意水準5% α=0.05とする。 (4)検定統計量の実現値を求める まず平均と不偏分散を求め、次に「プール標準偏差」を求 める。最後に検定統計量の実現値を計算 >統計1男<-c(6,10,6,10,5,3,5,9,3,3) > 統計1女<-c(11,6,11,9,7,5,8,7,7,9) > mean(統計1男) [1] 6 > mean(統計1女) [1] 8 > var(統計1男) [1] 7.777778 > var(統計1女) [1] 4 > プール標準偏差<-sqrt(((length(統計1男)-1)*var(統計1男)+(length(統計1女)-1)*var(統計1 女))/(length(統計1男)+length(統計1女)-2)) >プール標準偏差 [1] 2.426703 Rで動かす・・・ > t分母<-プール標準偏差*sqrt(1/length(統計1男)+1/length(統計1女)) > t分子<-mean(統計1男)-mean(統計1女) > t統計量<-t分子/t分母 > t統計量 [1] -1.842885 検定統計量の実現値がt = -1.84と求まった。 例題の続き (5)帰無仮説の棄却or採択の決定 帰無仮説のもとで自由度10+10-2=18のt分布にしたがい、有 意水準は5%、両側検定の時の棄却域を求める。 Rで棄却域を求めると > qt(0.025,18) [1] -2.100922 > qt(0.025,18,lower.tail=FALSE) [1] 2.100922 よって棄却域は、t< -2.10、t> 2.10 となる。 今回の検定統計量の実現値はt= -1.84 であったので、 帰無仮説は棄却されない。 検定の結果は「5%水準で有意差が見られなかった」となる。 p値を直接求めることも可能 > pt(-1.842885,18) [1] 0.04093903 両側検定からこれを2倍した結果から、同様の結論が得られる > 2*pt(-1.842885,18) [1] 0.08187807 5章の t.test によっても簡単に求められる: > t.test(統計1男,統計1女,var.equal=TRUE) Two Sample t-test data: 統計1男 and 統計1女 t = -1.8429, df = 18, p-value = 0.08188 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -4.2800355 0.2800355 sample estimates: mean of x mean of y 6 8 6.3 t検定の前提条件 t 検定を実行するには3つの条件が必要 1. 標本が無作為に行われていること(無作為抽 出) 2. 母集団の分布が正規分布にしたがっているこ と(正規性) 3. 2つの母集団の分散が等質であること(分散の 等質性) 6.3.1 分散の等質性 分散の等質性の検定ーRでは var.test > クラスA<-c(54,55,52,48,50,38,41,40,53,52) > クラスB<-c(67,63,50,60,61,69,43,58,36,29) > var.test(クラスA,クラスB) F test to compare two variances data: クラスA and クラスB F = 0.2157, num df = 9, denom df = 9, p-value = 0.03206 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.05356961 0.86828987 sample estimates: ratio of variances 0.2156709 6.3.2 Welchの検定 母分散が等質でないときは、t検定は使えないので Welch検定を使う > t.test(クラスA,クラスB,var.equal=FALSE) Welch Two Sample t-test data: クラスA and クラスB t = -1.1191, df = 12.71, p-value = 0.2838 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -15.554888 4.954888 sample estimates: mean of x mean of y 48.3 53.6 6.4 対応のあるt検定 独立な2群、もしくは対応のない2群 ランダムに割り振った2群 対応のあるデータ ・あらかじめ似ている被験者2人をぺアにして、ペアの一方を第1群 に、他方を第2群に割り当てるという方法で分けられた2群のデー タ ・同じ被験者について複数の測定が行われている場合 例 統計の指導を受ける前と後のテスト得点である「統計テスト1」 と「統計テスト2」 対応あるデータについては、独立な2群のt検定ではないべつの方法 が必要 6.4 対応のあるt検定 対応のあるデータでは「変化量(あるいは差得 点)」を考える。 統計テスト1の得点をX1、統計テスト2の得点を X2、変化量(差得点)をDとすれば D = X2 - X1 さらに、これらの標本平均 X 1 X 2 D の間には D X 2 X1 という関係がなりたつ。 続き 差得点 D~N(μD,σD2) と仮定すれば 標本平均 D ~N(μD,σD2/n) と表せる。 この標本分布を次式により標準化 D μD Z= σD / n これはN(0,1)に従う ここで検定統計量の分母にあるσDは未知。 これを標本から求めた標準偏差𝜎 で代用すると、 D μD は 自由度df=n-1のt分布にしたがう 𝐷 t ˆ D/ n σ 例題 「指導法データ」の統計テスト1と統計テスト2 の得点について、指導の前後で統計テストの 得点が変化したかどうかを、有意水準5%、 両側検定で検定 対応のあるt検定 (1)帰無仮説と対立仮説の設定 帰無仮説H0:μD=0(得点の変化の母平均は0である) 対立仮説H1:μD≠0 (得点の変化の母平均は0でない) (2)検定統計量の選択 D t 検定統計量: を検定統計量とする。 ˆ D/ n σ 自由度 df=n-1 (3)有意水準の決定 有意水準は5%、つまりα=0.05。両側検定。 (4)検定統計量の実現値を求める (5)帰無仮説の棄却or採択の決定 Rで動かすと・・・ >統計テスト1<- c(6,10,6,10,5,3,5,9,3,3,11,6,11,9,7,5,8,7,7,9) > 統計テスト2<- c(10,13,8,15,8,6,9,10,7,3,18,14,18,11,12,5,7,12,7,7) > 変化量<- 統計テスト2-統計テスト1 > sd(変化量) [1] 2.772041 > 分母t <-sd(変化量)/sqrt(length(変化量)) > 分子t <- mean(変化量) > t統計量<- 分子t/分母t > t統計量 [1] 4.839903 検定統計量の実現値は t= 4.84 続き(帰無仮説の棄却or採択の決定) > qt(0.025,19) #自由度df=n-1=19、有意水準5%/2 = 0.025 [1] -2.093024 > qt(0.025,19,lower.tail=FALSE) [1] 2.093024 棄却域は t< -2.093 , t> 2.093となる。 検定統計量の実現値であるt= 4.84は棄却域に入る ⇒ 帰無仮説は棄却 結果: 「指導の前後で、統計テスト1と統計テスト2の得点の平均値に 5%水準で有意差が見られた」と報告 t.test関数を用いた場合 > t.test(変化量) One Sample t-test data: 変化量 t = 4.8399, df = 19, p-value = 0.0001138 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: 1.702645 4.297355 sample estimates: mean of x 3 t.test関数を用いた場合2 > t.test(統計テスト1,統計テスト2,paired=TRUE) Paired t-test data: 統計テスト1 and 統計テスト2 t = -4.8399, df = 19, p-value = 0.0001138 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -4.297355 -1.702645 sample estimates: mean of the differences -3 上記の方法は対応のあるt検定の場合に使える。 差得点を定義しない分、少ない手順でできる。 続き なお、同じデータを対応なしとみなして、独立な2群のt検定を実行した場合。 まず、分散の等質性の検定 > var.test(統計テスト1,統計テスト2) F test to compare two variances data: 統計テスト1 and 統計テスト2 F = 0.3913, num df = 19, denom df = 19, p-value = 0.04733 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.1548830 0.9886112 sample estimates: ratio of variances 0.3913043 P値が 0.047 となり、有意水準5%より小さいので、Weichの検定を実行する。 Welchの検定 > t.test(統計テスト1,統計テスト2,var.equal=FALSE) Welch Two Sample t-test data: 統計テスト1 and 統計テスト2 t = -2.763, df = 31.895, p-value = 0.00943 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -5.2119742 -0.7880258 sample estimates: mean of x mean of y 7 10 このデータでは、独立な2群とみなして検定を行っても5%水準で有意差ありという結 果は変わらない。 しかし、p値を比較すると、対応ありは0.0001、対応なしは0.0094となる 対応ありと分析した方が小さなp値が得られることが確認できる。
© Copyright 2024 ExpyDoc