応用統計学第13回

教科書p240~249
第13回 順序尺度による相関
i=
1
x1
y1
2
x2
y2
・・・
・・・
・・・
n
xn
yn
i=
1
rx1
ry1
2
rx2
ry2
・・・
・・・
・・・
n
rxn
yyn
変数xi
変数yi
順位rxi
順位ryi
Spearmanの順位相関係数
(Spearman’s correlation coefficient)
rs 
(xn,yn)
 r  r r  r 
 r  r   r  r 
xi
x
yi
y
2
xi
rs 
y
S rx ry
S rx rx S ry ry
-1≦rs≦1
(xi,yi)
2
yi
(x2,y2)
(x1,y1)
x1 x2・・・・・・・・・・・・・・xi ・ xn
x
i=
1
rx1
ry1
d1
順位rxi
順位ryi
ランク差di
n
・・・
・・・
・・・
・・・
2
rx2
ry2
d2
n
rxn
yyn
dn
n
 di =0
2
6 d i
rs=1
正の完全相関
i 1
i 1
3
n
rs  1 
2
(3,3)
i 1
3
n n
rs=-1
負の完全相関
ry
(n,n)
2
2
n n
ry
6 d i
(1,n) (2,n-1)
di=i-(n-i+1)
(3,n-2) (4,n-3)
(4,4)
(2,2)
(n,1)
(1,1)
rx
rx
2変量の順位に一貫性がない場合 <rs>=0
Spearmanの順位相関係数
検定表:rsの有意点、n≦30
片側確率
P<0.025
P<0.005
両側確率
P<0.05
P<0.01
n=5
1.000
---
6
.886
1.000
7
.786
.929
8
.738
.881
9
.700
.833
10
.648
.794
n>30の場合
rsの標準誤差:
1  rs
s rs 
n2
2
rの標準化
rs
n2
t
 rs
2
srs
1  rs
自由度n-2のt-分布
例1:8人の患者で血中の中性脂肪とコレステロールを測定し、
下記のデータを得た。Spearmanの順位相関係数を求め、
その有意性を判定せよ。
H0:中性脂肪値とコレステロール値の間に相関はない
n
rs  1 
6 di
i 1
3
片側確率
P<0.025
P<0.005
両側確率
P<0.05
P<0.01
n=5
1.000
---
6
.886
1.000
7
.786
.929
8
.738
.881
9
.700
.833
10
.648
.794
2
n n
1
6  36
6  36
3

1


1

 0.5714
3
8 8
8  63
7
<n=8、5%有意水準値0.738
H0を棄却できない
例2:7種の銘柄の酒を3人の審査員が順位を付けたところ
次のようになった。順位に一貫性があると判断してよいか。
銘柄
審査員
a
b
c
d
e
f
g
X
1
2
3
4
5
6
7
Y
4
2
3
1
7
6
5
Z
2
1
5
6
3
7
4
Ri
7
5
11
11
15
19
16
データ数n=3
要因数k=7
H0:順位に一貫性がない
(審査員が同様な基準で判断できる順位がない)
Kendallの一致係数:W (順序尺度による重相関)
関連多群
デ
ー
タ
要因
i=1
2
3
・・
・・
k
j=1
1
・
3
・
k
・
2
4
・
3
k
・
6
・
2
1
k
6
3
7
n
7
・
・
k
・
1
Ri
R1
R2
・
Ri
・
Rk
要因間順位
(行ごとに順位をつける)
列毎に付けられた順位の和
要因毎の順位和
S   Ri  R 
k
2
i 1
W
12 S
n2 k 3  k


 k

  Ri 
k
2
  Ri   i 1 
k
i 1
0≦W≦1
2
Friedman検定の統計量
 r 2  nk  1W
k≦4:Friedman検定表
k>4:自由度k-1のχ2分布
データ数n=3
要因数k=7


R


i
k
2
  Ri   i 1 
k
i 1
k
S   R  R 
k
2
i
i 1
12 S
W 2 3
n k k


2
=150
=0.595
 r  nk  1W = 10.71<  r df  6,   0.05  12.592
2
2
H0を棄却できない
分類尺度による相関
Oij:観測データ
l×m分割表
A1
A2
・
・
Al
計
B1
O11
O21
・
・
Ol1
C1
m
・・・ Bm
・・・ O1m
・・・ O2m
・・・
・・・
・・・Olm
Cm
B2
O12
O22
・
Oij
・
l
 2  
O
ij  Eij 
j 1 i 1
2
E ij
計
R1
・
・
Rl
N
A1
A2
・
・
Al
計
B1
E11
E21
・
・
El1
C1
C
N q  1
Bm
E1m
E2m
・
・
Elm
Cm
計
R1
Rl
N
期待値: Eij= Ri ×Cj
N
自由度df=(l-1)(m-1) データ数に依存
クラメールのC係数
2
B2 ・・・
E12 ・・・
E22 ・・・
・ ・・・
Eij ・・・
・ ・・・
q=min(l.m), 0≦C≦1
例3:ある臓器の癌の症例をその組織型(A1,A2,A3)と主たる
転移巣(B1,B2,B3)によって分類した。
A1
A2
A3
計
B1
20
21
9
50
B2
7
15
8
30
B3
3
4
13
20
計
30
40
30
100
A1
A2
A3
計
B1
15
20
15
50
m
B2
9
12
9
30
l
 2  
j 1 i 1
O
B3
6
8
6
20
ij  Eij 
計
30
40
30
100
2
E ij
 17.0889
自由度df=(l-1)(m-1)=(3-1)(3-1)=4
2
17 .09
C

 0.0850
N q  1 100  2
2×2分割表
A1
A2
計
B1
a
c
C1
計
R1
R2
N
B2
b
d
C2
N=R1+R2=C1+C2
2
2
2
2








a

E
b

E
c

E
d

E
a
b
c
d
2 



Ea
Eb
Ec
Ed
2
2


ad  bc  N
ad  bc  N


a  b c  d a  c b  d  R1R2C1C2
Φ係数=
2
N

ad  bc 2
R1 R2C1C2

ad  bc
R1R2C1C2
-1≦φ≦1
ユールの連関係数(Yule’s coefficient of association)
ad-bc
Q係数= ad+bc
-1≦Q≦1
演習13.1
ある疾患の妊婦についてTBG蛋白とT4ホルモンを測定した。
Spearmanの順位相関係数を求め、その有意性を判定せよ。
TBG
43
39
49
42
35
31
36
34
27
T4
22
21
19
18
16
15
13
11
9
演習13.2
健常人6人に登山前後の血中GOTの動き
を経時的調べた。運動前後に血中GOTの
変動の一貫性をKendallの一致係数を用
いて表せ。