応用統計学第7回 - 明治薬科大学 薬学部/大学院

第7回 独立多群の差の検定
教科書p148~169
問題例1
出産までの週数によって新生児を3群に分け、新生児期黄疸の
強さを調べたところ次のようなデータを得た。在胎週数によって
黄疸の強さに差があるといってよいか。
在胎週数
黄疸の強さ(データ) データ数
平均値 分散
(週)
(ni) (mi)
(si2)
~36
13 11 6
3
10
13
~38
11 10 7 7 5
5
8
6
~40
8 7 5 5 4 3 3
7
5
11/3
帰無仮説:在胎週数によって黄疸の強さに差がない
H0:s12 = s22 = s32、 m1=m2=m3= μ
対立仮説:在胎週数によって黄疸の強さに差がある
H1:s12 ≠ s22 ≠ s32 、 m1 ≠ m2 ≠ m3
有意水準5%で検定
一元配置分散分析法
要因
Ai
A1
A2
・
Ak
測定データ
xij
x11 x12 ・x1n1
x21 x22 ・・・x2n2
・・・・・・・・・・・・
xk1 xk2 ・・ xknk
データ数 平均値 分散
ni
mi
s i2
n1
m1
s 12
n2
m2
s 22
・
・
nk
mk
sk2
全データ数
k
N   ni
i 1
帰無仮説:要因によって平均値に差がない
=>同じ母集団からの標本である:分散は等しい
H0:μ1 = μ2 =・= μk、s12 = s22 =・= sk2
要因A1標本
s1
m1
母集団
測定
s2
要因A2標本
m2
要因Ak標本
sk
mk
要因
Ai
A1
A2
・
Ak
測定データ
xij
x11 x12 ・x1n1
x21 x22 ・・・x2n2
・・・・・・・・・・・・
xk1 xk2 ・・ xknk
データ数 平均値 分散
ni
mi
si 2
n1
m1
s1 2
n2
m2
s2 2
・
・
nk
mk
sk2
xij  m  mi  m   xij  mi 
xij  m  mi  m   xij  mi 
総変動
群間変動
偏差平方和
k ni
 x
i 1 j 1
ij
群内変動
 m    ni mi  m    xij  mi 
2
k
i 1
2
k
ni
i 1 j 1
2
群間変動と群内変動
k
全体の平均: m 
n m
i 1
k
i
i
n
i 1
i
総変動の偏差平方和: ST   xij  m 
ni
k
2
dfT=N-1
i 1 j 1
k
群間変動の偏差平方和: S A   ni mi  m 
2
dfA=k-1
sA
dfE=N-k
sE
i 1
群内変動の偏差平方和:S E   xij  mi 
k
ni
2
i 1 j 1
k
  ni  1si
2
i 1
2
分散比: u 
sA
2
sE
F分布:f(u:k-1,N-k)
ST=SA+SE
2
2
SA

df A
SE

df E
分散の均一性の検定(Bartlett検定)
分散の偏り度: M  ( N  k ) log e sE   (ni  1) log e si
2
k
i 1
データ数に対する補正係数:
1  k 1
1 
 

C  1

3(k  1)  i 1 ni  1 N  k 
M
C
2

S E   xij  mi 
k
ni
2
i 1 j 1
k
  ni  1si
2
i 1
sE2 =
SE
N-k
自由度k-1のχ2分布
χ2α=5%=5.991
πx≧1.2367>α
帰無仮説を採択
分散は均一と見なしてよい
k
S A   ni mi  m 
2
i 1
S E   xij  mi 
k
ni
2
i 1 j 1
在胎週数 黄疸の強さ(データ)
データ数
(週)
(ni)
~36
13 11 6
3
~38
11 10 7 7 5
5
~40
8 7 5 5 4 3 3
7
F(2,12)α=5%=3.89
πF≧5.0<α
平均値 分散
(mi)
(si2)
10
13
8
6
5
11/3
k
  ni  1si
i 1
帰無仮説を棄却
在胎週数によって黄疸の強さに差がある
2
問題例2
集団検診で肥満者14名を抜き出し、体重によって3群に分けて、
血中の中性脂肪濃度を調べた。各群間で中性脂肪濃度に差が
あるといえるか。有意水準5%で検定しなさい。
中性脂肪濃度は非正規分布
帰無仮説:肥満群間で中性脂肪濃度に差がない
H0:順位は各群にばらつく
対立仮説:肥満群間で中性脂肪濃度に差がある
H1:順位が群間で偏りがある
Kruskal-Wallis検定(ノンパラメトリック法)
Kruskal-Wallisの統計量
2
k
Ri
12
H
 3N  1

N N  1 i 1 ni
Kruskal-Wallis検定表
K=3かつN=n1+n2+n3≦17の場合
Kruskal-Wallis検定表
n1 n2 n3 P<0.05
・ ・ ・
4 5 5 5.666
・ ・ ・
πH≧5.96<α
帰無仮説を棄却
群間で測定値に差がある
教科書付録(p362)
問題例3
健常成人32名について血中ホルモン値Aを測定し、その年齢別
分布を見た。Aの値には年齢差があるといえるか。有意水準5%
 
 
k
M  ( N  k ) log e sE   (ni  1) log e si
i 1
 2 4
2
1  k 1
1 
 

C  1

3(k  1)  i 1 ni  1 N  k 
Kruskal-Wallis検定:大標本の場合
分散は一
様か
2
πx≧14.44<α
yes
パラメトリック法
分散分析:F分布
no
Hは自由度k-1のχ2分布に従う
帰無仮説を棄却
:分散は一様ではない
 2 4 0.05  9.488
2
k
Ri
12
H
 3( N  1)

N (n  1) i 1 ni
df=k-1=4,χ2α=5%=9.488
πx≧5.59>α
帰無仮説を棄却できない
血中ホルモン値Aの値には年齢差があるとは言えない
χ2=5.59
演習7.1
血中物質Aの濃度を日を変えて3~5回測定した。
(1)個体間変動は個体内変動に比べて有意に大きいとみなせるか。
(2)標準偏差で見たときの個体間変動に対する個体内変動の比を求めよ。