7章 分散分析(2)

7章 分散分析:第2部
第1部 一元配置分散分析: 1つの条件に
よる母平均の違いの検定
第2部: 2つの条件の組み合わせによる二元
配置分散分析
温度の違い
例題:表7.4 銘柄の違い
A①冷蔵庫
B①イカ
アン
A②常温
B②ボス B③ビ
B①イカ
ビック
ビッテル アン
B②ボス B③ビ
ビック
ビッテル
6
4
5
10
8
10
11
12
12
5
4
2
7
6
5
12
8
5
3
2
8
9
10
10
2
2
4
3
6
4
表7.4 ミネラルウォーターのおいしさの評定に関する実験
データ
7.3.1 主効果と交互作用効果
要因: 母平均に違いをもたらす原因
水準: ある要因の中に含まれる個々の条件
例題 では...
要因
温度の違い
銘柄の違い
水準
冷蔵、常温
イカアン、ボスビック、ビビッテル
主効果と交互作用効果
二元配置分散分析では、
主効果と交互作用効果
という2種類の効果を考える
主効果: それぞれの要因ごとの効果
一元配置分散分析のときに考えた効果と同じ
交互作用効果: 2つ以上の要因が組み合わされたとき
に生じる効果。
2つの要因の効果の単純な足し算では説明でき
ない効果
表7.6 交互作用効果のない平
均値のパターンの例
B1
B2
B3
A1
4
3
6
A2
6
5
8
表7.7 交互作用効果のある平均
値のパターンの例
B1
B2
B3
A1
4
3
6
A2
4
6
7
> データ1 <- c(4,3,6, 6,5,8)
> 要因A <- factor(c(rep("水準A1",3),rep("水準A2",3)))
> 要因B <- factor(rep(c(rep("水準B1",1),rep("水準B2",1),rep("水
準B3",1)),2))
> interaction.plot(要因A,要因B,データ1)
> interaction.plot(要因B,要因A,データ1)
> データ2 <- c(4,3,6, 4,6,7)
> interaction.plot(要因A,要因B,データ2)
> interaction.plot(要因B,要因A,データ2)
8
8
要因B
5
6
7
水準A2
水準A1
4
5
6
mean of データ1
7
水準B3
水準B1
水準B2
3
3
4
mean of データ1
要因A
水準A1
水準A2
要因A
表7.2 交互作用効果のない平
均値のプロットの例(1)
水準B1
水準B2
水準B3
要因B
表7.3 交互作用効果のない平
均値のプロットの例(2)
7
7
要因A
要因B
6
4
5
mean of データ2
6
5
4
3
3
mean of データ2
水準A2
水準A1
水準B3
水準B2
水準B1
水準A1
水準A2
要因A
表7.4 交互作用効果のある平
均値のプロットの例(1)
水準B1
水準B2
水準B3
要因B
表7.5 交互作用効果のある平
均値のプロットの例(2)
7.3.2 二元配置分散分析(対応なし)
(1)帰無仮説と対立仮説の設定
(2)検定統計量の選択
分散分析では、検定統計値としてFを利用
(3)有意水準αの決定
有意水準は5%、つまりα=0.05とする。この検定は片
側検定
(4)検定統計量の実現値を求める
aov関数を用いて実現値を求める
(5)帰無仮説の棄却or採択の決定
(1) 帰無仮説と対立仮説の設定
要因A(温度の違い)の主効果
帰無仮説H0:温度が違ってもおいしさ得点の母平均は等しい(要因A
の主効果はない)
対立仮説H1:温度が違いによっておいしさ得点の母平均は異なる(要
因A の主効果がある)
要因B(銘柄の違い)の主効果
帰無仮説H0:銘柄が違ってもおいしさ得点の母平均は等しい(要因B
の主効果はない)
対立仮説H1:銘柄が違いによっておいしさ得点の母平均は異なる(要
因B の主効果がある)
要因Aと要因Bの交互作用効果
帰無仮説H0:温度と銘柄の組み合わせに相性の良し悪しはない(要因Aと
要因Bの交互作用効果はない)
対立仮説H1:温度と銘柄の組み合わせに相性の良し悪しがある(要因Aと
要因Bの交互作用効果がある)
> 味 <- c(6,4,5,3,2,10,8,10,8,9,11,12,12,10,10,5,4,2,2,2,7,6,5,4,3,12,8,5,6,4)
>味
[1] 6 4 5 3 2 10 8 10 8 9 11 12 12 10 10 5 4 2 2 2 7 6 5 4 3 12 8 5
> summary(aov(味~温度*銘柄))
6 4
Df Sum Sq Mean Sq F value Pr(>F)
> 温度 <- factor(c(rep("冷蔵庫",15),rep("常温",15)))
1 67.5 67.500 21.3158 0.00011 ***
> 温度 温度
[1] 冷蔵庫
冷蔵庫 77.500
冷蔵庫 冷蔵庫
冷蔵庫 1.608e-06
冷蔵庫 冷蔵庫
銘柄冷蔵庫 冷蔵庫
2 155.0
24.4737
***
冷蔵庫温度:銘柄 2 15.0
7.500
2.3684 0.11515
[11] 冷蔵庫 冷蔵庫 冷蔵庫 冷蔵庫 冷蔵庫 常温 常温 常温 常温 常温
Residuals 24 76.0
3.167
[21] 常温 常温 常温 常温 常温 常温 常温 常温 常温 常温
Levels: --常温 冷蔵庫
codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> 銘柄 Signif.
<- factor(rep(c(rep("イカアン",5),rep("ボスビック",5),rep("ビビッテル
",5)),2))
> 銘柄 > summary(aov(味~温度+銘柄+温度:銘柄))
[1] イカアン イカアン イカアン イカアン イカアン ボスビック
> 67.5000+155.000+15.000+76.000
[7] ボスビック ボスビック ボスビック ボスビック ビビッテル ビビッテル
[1] 313.5
[13] ビビッテル
ビビッテル ビビッテル イカアン イカアン イカアン
> sum((味-mean(味))^2)
#全体平方和
[19] イカアン
イカアン ボスビック ボスビック
ボスビック ボスビック
[25] ボスビック
ビビッテル ビビッテル ビビッテル ビビッテル ビビッテル
[1] 313.5
Levels: イカアン ビビッテル ボスビック
(5)帰無仮説の棄却or採択の決定
温度の主効果:5%水準で有意な効果がある
(p = 0.0011)
銘柄の主効果:5%水準で有意な効果がある
(p =0.0000016)
温度と銘柄の交互作用効果:5%水準で有意な効果
はない(p =0.115)
interction.plot(横軸にとる要因、もう一方の要因、平
均値を求める変数)
> interaction.plot(温度,銘柄,味)
> interaction.plot(銘柄,温度,味)
> interaction.plot(温度,銘柄,味)
8
6
4
mean of 味
10
銘柄
直線が完全に平行ではないので
多少の交互作用はある
常温
冷蔵庫
(が有意な差はない) 温度
ビビッテル
ボスビック
イカアン
> interaction.plot(銘柄,温度,味)
6
8
冷蔵庫
常温
4
mean of 味
10
温度
イカアン
ビビッテル
銘柄
ボスビック
7.3.3 一元配置と見なして分散分析
• 例題に対し、二元配置分散分析に含まれる2
つの要因のうち、一方を無視して一元配置分
散分析を行なってみる
一元配置vs二元配置分散分析
一元配置
> summary(aov(味~温度))
Df Sum Sq Mean Sq F value Pr(>F)
温度
1 67.5 67.500 7.6829 0.009797 **
Residuals 28 246.0
8.786
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
F値がかなり小さい
二元配置
> summary(aov(味~温度*銘柄))
Df Sum Sq Mean Sq
温度
1 67.5 67.500
銘柄
2 155.0 77.500
温度:銘柄 2 15.0
7.500
Residuals 24 76.0
3.167
F value
21.3158
24.4737
2.3684
Pr(>F)
0.00011 ***
1.608e-06 ***
0.11515
一元配置vs二元配置分散分析
一元配置
> summary(aov(味~銘柄))
Df Sum Sq Mean Sq F value Pr(>F)
銘柄
2 155.0 77.50 13.202 0.0001003 ***
Residuals 27 158.5
5.87
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1
F値がかなり小さい
二元配置
> summary(aov(味~温度*銘柄))
Df Sum Sq Mean Sq
温度
1 67.5 67.500
銘柄
2 155.0 77.500
温度:銘柄 2 15.0
7.500
Residuals 24 76.0
3.167
F value
21.3158
24.4737
2.3684
Pr(>F)
0.00011 ***
1.608e-06 ***
0.11515
一元配置vs二元配置分散分析
(平均平方和に注目)
二元配置分散分析の「銘柄」「温度:銘柄」「Residua
ls」の平方和を足すと
155.000 + 15.000 + 76.000 = 246.000
一元配置と見なしたときの残差の平方和と一致
このように、二元配置分散分析は
2つの要因について同時に検討するだけでなく、
残差のばらつき(平方和)を減らすことで、それぞれ
の要因について有意な結果が得られやすくする
(検定力を高める)
という利点がある
7.4二元配置分散分析(2要因とも対応あり)
統計的仮説検定の一般的手順のうち
(1)帰無仮説と対立仮説の設定
(2)検定統計量の選択
(3)有意水準αの決定
は、対応のない二元配置分散分析のときと同じ
対応のない場合と異なるのは
検定統計量の計算方法
ここではaov関数を使う
温度の違い
例題:表7.8 銘柄の違い
A①冷蔵庫
B①イ
カアン
B②ボ
スビッ
ク
村松
6
10
川崎
4
井口
A②常温
B①イ
カアン
B②ボ
スビッ
ク
B③ビ
ビッテ
ル
11
5
7
12
8
12
4
6
8
5
10
12
2
5
5
松中
3
8
10
2
4
6
城島
2
9
10
2
3
4
評定者
B③ビ
ビッテ
ル
表7.8 ミネラルウォーターのおいしさの評定に関する実験
同じ評定者
データ
7.4二元配置分散分析(2要因とも対応あり)
> 人1 <- factor(rep(c("村松","川崎","井口","松中","城島"),6))
> 人1
[1] 村松 川崎 井口 松中 城島 村松 川崎 井口 松中 城島 村松 川崎 井口 松中
[15] 城島 村松 川崎 井口 松中 城島 村松 川崎 井口 松中 城島 村松 川崎 井
口
[29] 松中 城島
Levels: 井口 松中 城島 川崎 村松
> 数字ID1 <- factor(rep(1:5,6))
> 数字ID1
[1] 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
Levels: 1 2 3 4 5
7.4二元配置分散分析(2要因とも対応あり)
summary(aov(味~温度*銘柄
+Error(人1+人1:温度+人1:銘柄+人1:温度:銘柄)))
「味~温度*銘柄」までは対応のない二元配置分散分析と同じ
+Error(人1+人1:温度+人1:銘柄+人1:温度:銘柄)
が追加されている
対応のない分散分析で「残差」としてまとめられていたものを
人1
人1:温度
人1:銘柄
人1:温度:銘柄
の4つの要素に分ける
「温度」の主効果
「銘柄」の主効果
「温度」と「銘柄」の交互作用効果
温度の違い
例題:表7.9 銘柄の違い
A①冷蔵庫
A②常温
B①イカ B②ボ B③ビ
評定 アン
スビッ ビッテ 評定
者
ク
ル
者
B①イ B②ボ B③ビ
カアン スビッ ビッテ
ク
ル
村松
6
10
11
斉藤
5
7
12
川崎
4
8
12
和田
4
6
8
井口
5
10
12
寺原
2
5
5
松中
3
8
10
杉内
2
4
6
城島
2
9
10
新垣
2
3
4
7.5二元配置分散分析(1要因のみ対応あり)
> A1条件 <- rep(c("村松","川崎","井口","松中","城島"),3)
> A2条件 <- rep(c("斉藤","和田","寺原","杉内","新垣"),3)
> 人2 <- factor(c(A1条件,A2条件))
> 人2
[1] 村松 川崎 井口 松中 城島 村松 川崎 井口 松中 城島 村松 川崎 井口 松中
[15] 城島 斉藤 和田 寺原 杉内 新垣 斉藤 和田 寺原 杉内 新垣 斉藤 和田 寺原
[29] 杉内 新垣
Levels: 井口 寺原 松中 城島 新垣 杉内 斉藤 川崎 村松 和田
> 数字ID2 <- factor(c(rep(1:5,3),rep(6:10,3)))
> 数字ID2
[1] 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 6 7 8 9 10 6 7 8
[24] 9 10 6 7 8 9 10
Levels: 1 2 3 4 5 6 7 8 9 10
7.5二元配置分散分析(1要因のみ対応あり)
summary(aov(味~温度*銘柄
+Error(人2:温度+人2:温度:銘柄)))
「味~温度*銘柄」までは対応のない二元配置分散分析と同じ
+Error(人2:温度+人2:温度:銘柄)
が追加されている
対応のない分散分析で「残差」としてまとめられていたものを
人2:温度
人2:温度:銘柄 という要因に分解
各評定者は同じ温度の条件で3種類の銘柄を飲んでいる⇒個人差の要因
だから、個人差の要因である「人2」と温度の違いの要因をあらわす「温度」
が関係する組み合わせだけを指定
「温度」の主効果
「銘柄」の主効果
「温度」と「銘柄」の交互作用効果
拡張
同様に、三元配置、四元配置、...要因を増やして
分析することが可能
ただし、要因の数が多いと、分析が複雑になり、結
果の解釈が困難になることがあるので注意
分散分析は:基本的に平均値の比較の検定
主効果や交互作用効果の観点からデータにおけ
る値のばらつきの分析が可能