相関分析

相関分析の応用
散布図
共分散
相関係数
順位相関係数
散布図(Scatter-gram,正の関
係)
GDPとMS(兆円)
MS
700
600
500
400
300
300
400
500
GDP
600
散布図(負の相関関係)
貯蓄と世帯数の関係
世帯数
1000
800
600
400
200
0
0
500
1000 1500 2000 2500 3000
貯蓄
無相関の例
統計学の前期と後期の試験点数(n=10)
後期
90
80
70
60
50
40
30
20
10
0
0
20
40
前期
60
80
Xの分散とYの分散
変数 x1 , x2 ,  xn と変数 y1 , y2 ,   yn の
それぞれの分散が次のように定義される。
n
S xx 
 (x  x)
i 1
i
n
n
2
S yy 
 ( y  y)
i 1
i
n
2
共分散(Covariance)
xi と y i
について
n
S xy 
 (x
i 1
i
 x )( yi  y )
n
で定義される S xy を x i と yi の共分散
といい、Cov(x, y)と書く。
Xとyの変動と共分散の符号
Xとyの増減変化の方向が一致であれば、
S xy の値がプラスになり、xとyが正の相関
関係が存在する。
Xとyの増減変化の方向が逆であれば、
S xy の値がマイナスになり、xとyが負の相
関関係をもつ。
相関係数
相関係数は次式で定義される。
 xy 
S xy
S xx  S yy

S xy
Sx  S y
n

 ( x  x )( y  y ) / n
i 1
i
 (x  x)
i
i
2
/n
 ( y  y)
i
2
/n
共分散と相関係数の関係
相関係数はxとyの共分散
Sで基準化したものである。
x , Sy
 xy
S xy を標準偏差
( x  x )( y  y )


i
i
nSx S y
xi  x yi  y
(
)(
)

Sx
Sy
i 1
n

n
相関係数の性質
相関係数  xyは共分散 S xy と同じ符号をもち、
常に 1   xy  1 の範囲にある。
 xy =1ならば、すべての観測値が正の傾きを持つ
同一直線上に並ぶ。
 xy =-1ならば、すべての観測値が負の傾きを持つ
同一直線上に並ぶ。
 xy は0に近ければ、XとYの間に相関はない。
相関係数の計算式
 xy 
n xi yi   xiΣyi
n x  ( x ) n y  ( y ) 
2
i
2
i
2
i
2
i
順位相関係数
2つの変数を質的基準によって順位づけて、
2変数の質的基準による順位相関関係を
示す指標。
n
 s  1
6 d 2
i 1
2
n( n  1)
2
d
 は2変数の質的基準による順位にお
ける差の平方和を意味する。