7章 分散分析:第2部 第1部 一元配置分散分析: 1つの条件に よる母平均の違いの検定 第2部: 2つの条件の組み合わせによる二元 配置分散分析 温度の違い 例題:表7.4 銘柄の違い A①冷蔵庫 B①イカ アン A②常温 B②ボス B③ビ B①イカ ビック ビッテル アン B②ボス B③ビ ビック ビッテル 6 4 5 10 8 10 11 12 12 5 4 2 7 6 5 12 8 5 3 2 8 9 10 10 2 2 4 3 6 4 表7.4 ミネラルウォーターのおいしさの評定に関する実験 データ 7.3.1 主効果と交互作用効果 要因: 母平均に違いをもたらす原因 水準: ある要因の中に含まれる個々の条件 例題 では... 要因 温度の違い 銘柄の違い 水準 冷蔵、常温 イカアン、ボスビック、ビビッテル 主効果と交互作用効果 二元配置分散分析では、 主効果と交互作用効果 という2種類の効果を考える 主効果: それぞれの要因ごとの効果 一元配置分散分析のときに考えた効果と同じ 交互作用効果: 2つ以上の要因が組み合わされたとき に生じる効果。 2つの要因の効果の単純な足し算では説明でき ない効果 表7.6 交互作用効果のない平 均値のパターンの例 B1 B2 B3 A1 4 3 6 A2 6 5 8 表7.7 交互作用効果のある平均 値のパターンの例 B1 B2 B3 A1 4 3 6 A2 4 6 7 > データ1 <- c(4,3,6, 6,5,8) > 要因A <- factor(c(rep("水準A1",3),rep("水準A2",3))) > 要因B <- factor(rep(c(rep("水準B1",1),rep("水準B2",1),rep("水 準B3",1)),2)) > interaction.plot(要因A,要因B,データ1) > interaction.plot(要因B,要因A,データ1) > データ2 <- c(4,3,6, 4,6,7) > interaction.plot(要因A,要因B,データ2) > interaction.plot(要因B,要因A,データ2) 8 8 要因B 5 6 7 水準A2 水準A1 4 5 6 mean of データ1 7 水準B3 水準B1 水準B2 3 3 4 mean of データ1 要因A 水準A1 水準A2 要因A 表7.2 交互作用効果のない平 均値のプロットの例(1) 水準B1 水準B2 水準B3 要因B 表7.3 交互作用効果のない平 均値のプロットの例(2) 7 7 要因A 要因B 6 4 5 mean of データ2 6 5 4 3 3 mean of データ2 水準A2 水準A1 水準B3 水準B2 水準B1 水準A1 水準A2 要因A 表7.4 交互作用効果のある平 均値のプロットの例(1) 水準B1 水準B2 水準B3 要因B 表7.5 交互作用効果のある平 均値のプロットの例(2) 7.3.2 二元配置分散分析(対応なし) (1)帰無仮説と対立仮説の設定 (2)検定統計量の選択 分散分析では、検定統計値としてFを利用 (3)有意水準αの決定 有意水準は5%、つまりα=0.05とする。この検定は片 側検定 (4)検定統計量の実現値を求める aov関数を用いて実現値を求める (5)帰無仮説の棄却or採択の決定 (1) 帰無仮説と対立仮説の設定 要因A(温度の違い)の主効果 帰無仮説H0:温度が違ってもおいしさ得点の母平均は等しい(要因A の主効果はない) 対立仮説H1:温度が違いによっておいしさ得点の母平均は異なる(要 因A の主効果がある) 要因B(銘柄の違い)の主効果 帰無仮説H0:銘柄が違ってもおいしさ得点の母平均は等しい(要因B の主効果はない) 対立仮説H1:銘柄が違いによっておいしさ得点の母平均は異なる(要 因B の主効果がある) 要因Aと要因Bの交互作用効果 帰無仮説H0:温度と銘柄の組み合わせに相性の良し悪しはない(要因Aと 要因Bの交互作用効果はない) 対立仮説H1:温度と銘柄の組み合わせに相性の良し悪しがある(要因Aと 要因Bの交互作用効果がある) > 味 <- c(6,4,5,3,2,10,8,10,8,9,11,12,12,10,10,5,4,2,2,2,7,6,5,4,3,12,8,5,6,4) >味 [1] 6 4 5 3 2 10 8 10 8 9 11 12 12 10 10 5 4 2 2 2 7 6 5 4 3 12 8 5 > summary(aov(味~温度*銘柄)) 6 4 Df Sum Sq Mean Sq F value Pr(>F) > 温度 <- factor(c(rep("冷蔵庫",15),rep("常温",15))) 1 67.5 67.500 21.3158 0.00011 *** > 温度 温度 [1] 冷蔵庫 冷蔵庫 77.500 冷蔵庫 冷蔵庫 冷蔵庫 1.608e-06 冷蔵庫 冷蔵庫 銘柄冷蔵庫 冷蔵庫 2 155.0 24.4737 *** 冷蔵庫温度:銘柄 2 15.0 7.500 2.3684 0.11515 [11] 冷蔵庫 冷蔵庫 冷蔵庫 冷蔵庫 冷蔵庫 常温 常温 常温 常温 常温 Residuals 24 76.0 3.167 [21] 常温 常温 常温 常温 常温 常温 常温 常温 常温 常温 Levels: --常温 冷蔵庫 codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 > 銘柄 Signif. <- factor(rep(c(rep("イカアン",5),rep("ボスビック",5),rep("ビビッテル ",5)),2)) > 銘柄 > summary(aov(味~温度+銘柄+温度:銘柄)) [1] イカアン イカアン イカアン イカアン イカアン ボスビック > 67.5000+155.000+15.000+76.000 [7] ボスビック ボスビック ボスビック ボスビック ビビッテル ビビッテル [1] 313.5 [13] ビビッテル ビビッテル ビビッテル イカアン イカアン イカアン > sum((味-mean(味))^2) #全体平方和 [19] イカアン イカアン ボスビック ボスビック ボスビック ボスビック [25] ボスビック ビビッテル ビビッテル ビビッテル ビビッテル ビビッテル [1] 313.5 Levels: イカアン ビビッテル ボスビック (5)帰無仮説の棄却or採択の決定 温度の主効果:5%水準で有意な効果がある (p = 0.0011) 銘柄の主効果:5%水準で有意な効果がある (p =0.0000016) 温度と銘柄の交互作用効果:5%水準で有意な効果 はない(p =0.115) interction.plot(横軸にとる要因、もう一方の要因、平 均値を求める変数) > interaction.plot(温度,銘柄,味) > interaction.plot(銘柄,温度,味) > interaction.plot(温度,銘柄,味) 8 6 4 mean of 味 10 銘柄 直線が完全に平行ではないので 多少の交互作用はある 常温 冷蔵庫 (が有意な差はない) 温度 ビビッテル ボスビック イカアン > interaction.plot(銘柄,温度,味) 6 8 冷蔵庫 常温 4 mean of 味 10 温度 イカアン ビビッテル 銘柄 ボスビック 7.3.3 一元配置と見なして分散分析 • 例題に対し、二元配置分散分析に含まれる2 つの要因のうち、一方を無視して一元配置分 散分析を行なってみる 一元配置vs二元配置分散分析 一元配置 > summary(aov(味~温度)) Df Sum Sq Mean Sq F value Pr(>F) 温度 1 67.5 67.500 7.6829 0.009797 ** Residuals 28 246.0 8.786 --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 F値がかなり小さい 二元配置 > summary(aov(味~温度*銘柄)) Df Sum Sq Mean Sq 温度 1 67.5 67.500 銘柄 2 155.0 77.500 温度:銘柄 2 15.0 7.500 Residuals 24 76.0 3.167 F value 21.3158 24.4737 2.3684 Pr(>F) 0.00011 *** 1.608e-06 *** 0.11515 一元配置vs二元配置分散分析 一元配置 > summary(aov(味~銘柄)) Df Sum Sq Mean Sq F value Pr(>F) 銘柄 2 155.0 77.50 13.202 0.0001003 *** Residuals 27 158.5 5.87 --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 F値がかなり小さい 二元配置 > summary(aov(味~温度*銘柄)) Df Sum Sq Mean Sq 温度 1 67.5 67.500 銘柄 2 155.0 77.500 温度:銘柄 2 15.0 7.500 Residuals 24 76.0 3.167 F value 21.3158 24.4737 2.3684 Pr(>F) 0.00011 *** 1.608e-06 *** 0.11515 一元配置vs二元配置分散分析 (平均平方和に注目) 二元配置分散分析の「銘柄」「温度:銘柄」「Residua ls」の平方和を足すと 155.000 + 15.000 + 76.000 = 246.000 一元配置と見なしたときの残差の平方和と一致 このように、二元配置分散分析は 2つの要因について同時に検討するだけでなく、 残差のばらつき(平方和)を減らすことで、それぞれ の要因について有意な結果が得られやすくする (検定力を高める) という利点がある 7.4二元配置分散分析(2要因とも対応あり) 統計的仮説検定の一般的手順のうち (1)帰無仮説と対立仮説の設定 (2)検定統計量の選択 (3)有意水準αの決定 は、対応のない二元配置分散分析のときと同じ 対応のない場合と異なるのは 検定統計量の計算方法 ここではaov関数を使う 温度の違い 例題:表7.8 銘柄の違い A①冷蔵庫 B①イ カアン B②ボ スビッ ク 村松 6 10 川崎 4 井口 A②常温 B①イ カアン B②ボ スビッ ク B③ビ ビッテ ル 11 5 7 12 8 12 4 6 8 5 10 12 2 5 5 松中 3 8 10 2 4 6 城島 2 9 10 2 3 4 評定者 B③ビ ビッテ ル 表7.8 ミネラルウォーターのおいしさの評定に関する実験 同じ評定者 データ 7.4二元配置分散分析(2要因とも対応あり) > 人1 <- factor(rep(c("村松","川崎","井口","松中","城島"),6)) > 人1 [1] 村松 川崎 井口 松中 城島 村松 川崎 井口 松中 城島 村松 川崎 井口 松中 [15] 城島 村松 川崎 井口 松中 城島 村松 川崎 井口 松中 城島 村松 川崎 井 口 [29] 松中 城島 Levels: 井口 松中 城島 川崎 村松 > 数字ID1 <- factor(rep(1:5,6)) > 数字ID1 [1] 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 Levels: 1 2 3 4 5 7.4二元配置分散分析(2要因とも対応あり) summary(aov(味~温度*銘柄 +Error(人1+人1:温度+人1:銘柄+人1:温度:銘柄))) 「味~温度*銘柄」までは対応のない二元配置分散分析と同じ +Error(人1+人1:温度+人1:銘柄+人1:温度:銘柄) が追加されている 対応のない分散分析で「残差」としてまとめられていたものを 人1 人1:温度 人1:銘柄 人1:温度:銘柄 の4つの要素に分ける 「温度」の主効果 「銘柄」の主効果 「温度」と「銘柄」の交互作用効果 温度の違い 例題:表7.9 銘柄の違い A①冷蔵庫 A②常温 B①イカ B②ボ B③ビ 評定 アン スビッ ビッテ 評定 者 ク ル 者 B①イ B②ボ B③ビ カアン スビッ ビッテ ク ル 村松 6 10 11 斉藤 5 7 12 川崎 4 8 12 和田 4 6 8 井口 5 10 12 寺原 2 5 5 松中 3 8 10 杉内 2 4 6 城島 2 9 10 新垣 2 3 4 7.5二元配置分散分析(1要因のみ対応あり) > A1条件 <- rep(c("村松","川崎","井口","松中","城島"),3) > A2条件 <- rep(c("斉藤","和田","寺原","杉内","新垣"),3) > 人2 <- factor(c(A1条件,A2条件)) > 人2 [1] 村松 川崎 井口 松中 城島 村松 川崎 井口 松中 城島 村松 川崎 井口 松中 [15] 城島 斉藤 和田 寺原 杉内 新垣 斉藤 和田 寺原 杉内 新垣 斉藤 和田 寺原 [29] 杉内 新垣 Levels: 井口 寺原 松中 城島 新垣 杉内 斉藤 川崎 村松 和田 > 数字ID2 <- factor(c(rep(1:5,3),rep(6:10,3))) > 数字ID2 [1] 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 6 7 8 9 10 6 7 8 [24] 9 10 6 7 8 9 10 Levels: 1 2 3 4 5 6 7 8 9 10 7.5二元配置分散分析(1要因のみ対応あり) summary(aov(味~温度*銘柄 +Error(人2:温度+人2:温度:銘柄))) 「味~温度*銘柄」までは対応のない二元配置分散分析と同じ +Error(人2:温度+人2:温度:銘柄) が追加されている 対応のない分散分析で「残差」としてまとめられていたものを 人2:温度 人2:温度:銘柄 という要因に分解 各評定者は同じ温度の条件で3種類の銘柄を飲んでいる⇒個人差の要因 だから、個人差の要因である「人2」と温度の違いの要因をあらわす「温度」 が関係する組み合わせだけを指定 「温度」の主効果 「銘柄」の主効果 「温度」と「銘柄」の交互作用効果 拡張 同様に、三元配置、四元配置、...要因を増やして 分析することが可能 ただし、要因の数が多いと、分析が複雑になり、結 果の解釈が困難になることがあるので注意 分散分析は:基本的に平均値の比較の検定 主効果や交互作用効果の観点からデータにおけ る値のばらつきの分析が可能
© Copyright 2025 ExpyDoc