7回目

第七回の目的
心理学統計研究法
(第七回)
平均値の差の検定
遊間
義一
二つの異なる母集団
(例1) 対応がない
1. 少年院処遇を行ったグループ
2. 少年院処遇を行わなかったグループ
(例2) 対応がある
常習累犯窃盗犯に対して,次の二つの処遇
を行う。
1. 認知行動療法を行う
2. 職業訓練を行う
対応のある場合
 二つの異なる母集団の平均値μ1とμ2の間に
差があるかを,
それらから得られた標本の平均値や不偏分
散に基づき,
t検定を行う方法を,
1)対応のある場合と,
2)対応のない場合について,
使い分けられるようにする。
対応のない場合
対応がないとは?
→二つの標本の間に,関係がない場合
(例)
1. 少年院処遇を行ったグループ
2. 少年院処遇を行わなかったグループ
t検定の条件
1. 標本が母集団から無作為に抽出されてい
る。
2. 母集団が正規分布している。
3. (二つの母集団の分散が等しい。ただし,
Welchのt検定では,この前提は不要)
1
^
考え方
対応がない場合のt値の求め方
グループ1:平均値X1,標本数n1 ,不偏分散σ^12
グループ2:平均値X2,標本数n2 ,不偏分散σ^22
以降の説明の一部は,以下の
HPを参考にした。講義では省
略するが,SPSSの使い方まで
示されている。
http://psy.isc.chubu.ac.jp/~oshiolab/teac
hing_folder/datakaiseki_folder/03_folder
/da03_03.html
(2014.11.4)
例
20名の被験者をA群とB群に分けて実験を
行い,以下のようなデータを得た。A群とB
群の(母集団の)平均には相違があるとい
えるか?
ただし以下のデータでは,0をA群,1をB
群としている。
SPSSの出力
ウェルチ(Welch)の方法
F値が,有意でなければ,等分散を仮定で
きる。
2
等分散の仮定が満たされない別の例
(社会秩序への信頼が,男女で異なる
か)
男女別の度数分布で分散の違いを確認すると,
こちらの数値を使う。
二つの変数(x1とx2)の差のt検定
をする場合の前提条件
x1とx2の分散が等しい。
① x1とx2がそれぞれ独立で正規分布している。
②x1とx2の分散が等しい。
→等しくない場合は,ウェルチのt検定( Welch‘s t test
)を用いる。
前提条件をもし検定するなら,
(検定の多重性の問題からしないほうがよいという
研究者も多い)
:
ウェルチのt検定( Welch‘s t test)
(等分散の仮定を必要としない。)
参考 http://aoki2.si.gunma-u.ac.jp/lecture/mbarc/arc043/12857.html
正規分布:
コルモゴロフ-スミルノフ検定
シャピロ-ウィルク検定 など
等分散性:
(自由度v)
自由度が整数にならない。
F検定
ルベーン検定
バートレット検定 など
3
等分散の仮定が満たされない別の例
(社会秩序への信頼が,男女で異なる
か)
対応がある場合
(例)
10名に対してある授業を行った前と後にテ
ストを行い,成績を算出した。授業前後で
成績が伸びているといえるか。
整数でない。
番号
授業前
授業後
1
5
7
2
4
6
3
5
8
4
4
7
5
3
6
6
4
6
7
3
5
8
6
9
9
5
9
10
6
8
SPSSの出力
対応のあるt検定
対応のあるt検定
対応のある二つの変数(x1とx2)の母平
均に差があるか?
対応のある二つの変数(x1とx2)の母平
均に差があるか?
df=n-1
D:ペア同士の差
4
考え方
Rによるt検定(ttest1.txt)
対応がない場合
# dataforttestを読み込む
dataforttest<read.table("dataforttest.csv",
header=TRUE, sep=",",
na.strings="NA", dec=".",
strip.white=TRUE)
attach(dataforttest)
str(dataforttest)
'data.frame': 20 obs. of 3 variables:
$ 番号: num 1 2 3 4 5 6 7 8 9 10 ...
$ 群 : num 0 0 0 0 0 0 0 0 0 0 ...
$ 結果: num 1 2 2 3 7 7 5 6 5 4 ...
群<-as.factor(群)
str(群)
Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
by (結果, 群, summary )
boxplot ( 結果 ~ 群)
> by (結果, 群, summary )
群: 0
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.00 2.25 4.50 4.20 5.75 7.00
--------------------------------------------------------群: 1
Min. 1st Qu. Median Mean 3rd Qu. Max.
4
6
7
7
8
9
>
5
# 分散の等質性の検定(H0:両群の分散は等
しい)(今回は検定のやり方だけを説明する。
F検定及びF分布については,次回説明する)
var.test( 結果 ~ 群 )
F test to compare two variances
data: 結果 by 群
F = 1.8909, num df = 9, denom df = 9, p-value = 0.3565
(検定統計量 分子の自由度 分母の自由度)
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.4696751 7.6127890
sample estimates:
ratio of variances
1.890909
# 平均値の差の検定 (H0:両群の平均値
は等しい)分散は等しくない場合でも可 ウ
エルチの検定
t.test ( 結果 ~ 群, var.equal=FALSE )
Welch Two Sample t-test
data: 結果 by 群
t = -3.3308, df = 16.439, p-value = 0.004108
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-4.578208 -1.021792
sample estimates:
mean in group 0 mean in group 1
4.2
7.0
# 平均値の差の検定 (H0:両群の平均値
は等しい)分散は等しいことを前提
t.test ( 結果 ~ 群, var.equal=TRUE )
Two Sample t-test
data: 結果 by 群
t = -3.3308, df = 18, p-value = 0.003719
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-4.566108 -1.033892
sample estimates:
mean in group 0 mean in group 1
4.2
7.0
Rによるt検定 対応がある場合
# dataforttest2を読み込む
dataforttest2<read.table("dataforttest2.csv",
header=TRUE, sep=",",
na.strings="NA", dec=".",
strip.white=TRUE)
attach(dataforttest2)
summary (dataforttest2)
> summary (dataforttest2)
番号
授業前
授業後
Min. : 1.00 Min. :3.0 Min. :5.0
1st Qu.: 3.25 1st Qu.:4.0 1st Qu.:6.0
Median : 5.50 Median :4.5 Median :7.0
Mean : 5.50 Mean :4.5 Mean :7.1
3rd Qu.: 7.75 3rd Qu.:5.0 3rd Qu.:8.0
Max. :10.00 Max. :6.0 Max. :9.0
>
6
=10-7
boxplot (授業前, 授業後)
# 平均値の差の検定 (H0:二つの変数の平
均値は等しい)
t.test (授業前, 授業後, paired=TRUE)
Paired t-test
data: 授業前 and 授業後
t = -11.7589, df = 9, p-value = 9.151e-07
alternative hypothesis: true difference in means is not
equal to 0
95 percent confidence interval:
-3.100182
-2.099818
sample estimates:
mean of the differences
-2.6
7