第七回の目的 心理学統計研究法 (第七回) 平均値の差の検定 遊間 義一 二つの異なる母集団 (例1) 対応がない 1. 少年院処遇を行ったグループ 2. 少年院処遇を行わなかったグループ (例2) 対応がある 常習累犯窃盗犯に対して,次の二つの処遇 を行う。 1. 認知行動療法を行う 2. 職業訓練を行う 対応のある場合 二つの異なる母集団の平均値μ1とμ2の間に 差があるかを, それらから得られた標本の平均値や不偏分 散に基づき, t検定を行う方法を, 1)対応のある場合と, 2)対応のない場合について, 使い分けられるようにする。 対応のない場合 対応がないとは? →二つの標本の間に,関係がない場合 (例) 1. 少年院処遇を行ったグループ 2. 少年院処遇を行わなかったグループ t検定の条件 1. 標本が母集団から無作為に抽出されてい る。 2. 母集団が正規分布している。 3. (二つの母集団の分散が等しい。ただし, Welchのt検定では,この前提は不要) 1 ^ 考え方 対応がない場合のt値の求め方 グループ1:平均値X1,標本数n1 ,不偏分散σ^12 グループ2:平均値X2,標本数n2 ,不偏分散σ^22 以降の説明の一部は,以下の HPを参考にした。講義では省 略するが,SPSSの使い方まで 示されている。 http://psy.isc.chubu.ac.jp/~oshiolab/teac hing_folder/datakaiseki_folder/03_folder /da03_03.html (2014.11.4) 例 20名の被験者をA群とB群に分けて実験を 行い,以下のようなデータを得た。A群とB 群の(母集団の)平均には相違があるとい えるか? ただし以下のデータでは,0をA群,1をB 群としている。 SPSSの出力 ウェルチ(Welch)の方法 F値が,有意でなければ,等分散を仮定で きる。 2 等分散の仮定が満たされない別の例 (社会秩序への信頼が,男女で異なる か) 男女別の度数分布で分散の違いを確認すると, こちらの数値を使う。 二つの変数(x1とx2)の差のt検定 をする場合の前提条件 x1とx2の分散が等しい。 ① x1とx2がそれぞれ独立で正規分布している。 ②x1とx2の分散が等しい。 →等しくない場合は,ウェルチのt検定( Welch‘s t test )を用いる。 前提条件をもし検定するなら, (検定の多重性の問題からしないほうがよいという 研究者も多い) : ウェルチのt検定( Welch‘s t test) (等分散の仮定を必要としない。) 参考 http://aoki2.si.gunma-u.ac.jp/lecture/mbarc/arc043/12857.html 正規分布: コルモゴロフ-スミルノフ検定 シャピロ-ウィルク検定 など 等分散性: (自由度v) 自由度が整数にならない。 F検定 ルベーン検定 バートレット検定 など 3 等分散の仮定が満たされない別の例 (社会秩序への信頼が,男女で異なる か) 対応がある場合 (例) 10名に対してある授業を行った前と後にテ ストを行い,成績を算出した。授業前後で 成績が伸びているといえるか。 整数でない。 番号 授業前 授業後 1 5 7 2 4 6 3 5 8 4 4 7 5 3 6 6 4 6 7 3 5 8 6 9 9 5 9 10 6 8 SPSSの出力 対応のあるt検定 対応のあるt検定 対応のある二つの変数(x1とx2)の母平 均に差があるか? 対応のある二つの変数(x1とx2)の母平 均に差があるか? df=n-1 D:ペア同士の差 4 考え方 Rによるt検定(ttest1.txt) 対応がない場合 # dataforttestを読み込む dataforttest<read.table("dataforttest.csv", header=TRUE, sep=",", na.strings="NA", dec=".", strip.white=TRUE) attach(dataforttest) str(dataforttest) 'data.frame': 20 obs. of 3 variables: $ 番号: num 1 2 3 4 5 6 7 8 9 10 ... $ 群 : num 0 0 0 0 0 0 0 0 0 0 ... $ 結果: num 1 2 2 3 7 7 5 6 5 4 ... 群<-as.factor(群) str(群) Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ... by (結果, 群, summary ) boxplot ( 結果 ~ 群) > by (結果, 群, summary ) 群: 0 Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 2.25 4.50 4.20 5.75 7.00 --------------------------------------------------------群: 1 Min. 1st Qu. Median Mean 3rd Qu. Max. 4 6 7 7 8 9 > 5 # 分散の等質性の検定(H0:両群の分散は等 しい)(今回は検定のやり方だけを説明する。 F検定及びF分布については,次回説明する) var.test( 結果 ~ 群 ) F test to compare two variances data: 結果 by 群 F = 1.8909, num df = 9, denom df = 9, p-value = 0.3565 (検定統計量 分子の自由度 分母の自由度) alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.4696751 7.6127890 sample estimates: ratio of variances 1.890909 # 平均値の差の検定 (H0:両群の平均値 は等しい)分散は等しくない場合でも可 ウ エルチの検定 t.test ( 結果 ~ 群, var.equal=FALSE ) Welch Two Sample t-test data: 結果 by 群 t = -3.3308, df = 16.439, p-value = 0.004108 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -4.578208 -1.021792 sample estimates: mean in group 0 mean in group 1 4.2 7.0 # 平均値の差の検定 (H0:両群の平均値 は等しい)分散は等しいことを前提 t.test ( 結果 ~ 群, var.equal=TRUE ) Two Sample t-test data: 結果 by 群 t = -3.3308, df = 18, p-value = 0.003719 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -4.566108 -1.033892 sample estimates: mean in group 0 mean in group 1 4.2 7.0 Rによるt検定 対応がある場合 # dataforttest2を読み込む dataforttest2<read.table("dataforttest2.csv", header=TRUE, sep=",", na.strings="NA", dec=".", strip.white=TRUE) attach(dataforttest2) summary (dataforttest2) > summary (dataforttest2) 番号 授業前 授業後 Min. : 1.00 Min. :3.0 Min. :5.0 1st Qu.: 3.25 1st Qu.:4.0 1st Qu.:6.0 Median : 5.50 Median :4.5 Median :7.0 Mean : 5.50 Mean :4.5 Mean :7.1 3rd Qu.: 7.75 3rd Qu.:5.0 3rd Qu.:8.0 Max. :10.00 Max. :6.0 Max. :9.0 > 6 =10-7 boxplot (授業前, 授業後) # 平均値の差の検定 (H0:二つの変数の平 均値は等しい) t.test (授業前, 授業後, paired=TRUE) Paired t-test data: 授業前 and 授業後 t = -11.7589, df = 9, p-value = 9.151e-07 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -3.100182 -2.099818 sample estimates: mean of the differences -2.6 7
© Copyright 2024 ExpyDoc