分散分析における
平方和の分解
ばらつきを分解する
• 分散分析の基本発想
データ全体のばらつき(全体平方和)
=①集団間のばらつき(群間平方和)
+②集団内の個体差によるばらつき(群内平方和)
• 数式で書くと...
J
n
J
J
n
j =1
j =1 i =1
2
2
2
−
=
−
+
−
(
y
y
)
n
(
y
y
)
(
y
y
)
∑∑ ij .. ∑ j . j .. ∑∑ ij . j
j =1 i =1
全平方和
=
①群間平方和 +
②群内平方和
平方和の分解
J
n
J
J
n
j =1
j =1 i =1
2
2
2
−
=
−
+
−
y
y
n
y
y
y
y
(
)
(
)
(
)
∑∑ ij .. ∑ j . j .. ∑∑ ij . j
j =1 i =1
↑
SS total
全平方和
=
↑
SS between
↑
+
SS within
= 群間平方和 + 群内平方和
ここで…
yij:集団jのi番目の個体、nj:集団jの個体数、
y.j:集団jの平均値、y..:全体の平均値
分散分析表
平方和
(SS)
変動因
自由度
(df)j
SSBetween
dfBetween
SSWithin
dfWithin
群間
J
2
)
(
n
y
−
y
∑
(Between) j =1 j ⋅ j ⋅⋅
群内
(Within)
∑ ∑ (y
全体
(Total)
SSTotal
∑ ∑ (y
J
n
j =1 i =1
J
ij
n
j =1 i =1
ij
− y⋅ j
− y ⋅⋅
集団数-1
)
2
)
2
データ数-
集団数
dfTotal
データ数―1
平均平方
(MS)
MSBetween
SSBetween
=
dfBetween
MSWithin
SSwithin
=
dfwithin
F値
MSBetween
MSWithin
グループ別にみた場合
グループを無視した場合
グループ別にみた場合
グループを無視した場合
グループ内変動の意味
グループ間の変動の意味
平方和の分解
J
n
J
J
n
j =1
j =1 i =1
2
2
2
=
−
+
−
y
−
y
n
y
y
y
y
(
)
(
)
(
)
∑∑ ij .. ∑ j . j .. ∑∑ ij . j
j =1 i =1
平方和
(SS)
変動因
自由度
(df)j
SSBetween
dfBetween
群間
J
集団数-1
2
)
(
n
y
y
−
j
⋅j
⋅⋅
(Between) ∑
j =1
SSWithin
群内
(Within)
∑ ∑ (y
全体
(Total)
SSTotal
∑ ∑ (y
J
n
j =1 i =1
J
ij
n
j =1 i =1
ij
− y⋅ j
− y ⋅⋅
)
2
)
2
dfWithin
データ数-
集団数
dfTotal
データ数―1
平均平方
(MS)
MSBetween
SSBetween
=
dfBetween
MSWithin
SSwithin
=
dfwithin
F値
MSBetween
MSWithin