共分散と相関係数

相関関係と共分散
2つの変数の関係
1
関連する2つの値
身長と体重
気温と売上
広告と売上
従業員数と利益
研究開発費とシェア
親の収入と子供の収入
株価と顧客満足度
2
正の相関関係
2つの変数の組を考え、i番目の値を
(xi,yi)と する。
xi が大きいとき、 yi も大きい
xi が小さいとき、 yi も小さい
という関係があるとき、 xi と yi は正
の相関関係にあるという。
3
負の相関関係
2つの変数の組を考え、i番目の値を
(xi,yi)と する。
xi が大きいとき、 yi は小さい
xi が小さいとき、 yi は大きい
という関係があるとき、 xi と yi は負
の相関関係にあるという。
4
平均からの偏差
x の平均からの偏差
xi  x 
y の平均からの偏差
 yi  y 
5
平均からの偏差を使った表現
xi  x 
xi  x 
が大きいと
が小さいと
 yi  y 
 yi  y 
が大きい
が小さい
正の相関関係がある。
6
平均からの偏差を使った表現
xi  x 
xi  x 
が小さいと
が大きいと
 yi  y 
 yi  y 
が大きい
が小さい
負の相関関係がある。
7
正の相関関係
 yi  y 
x の偏差が正
かつ
y の偏差が正
xi  x 
x の偏差が負
かつ
y の偏差が負
8
負の相関関係
 yi  y 
x の偏差が負
かつ
y の偏差が正
xi  x 
x の偏差が正
かつ
y の偏差が負
9
xi  x  yi  y 
 yi  y 
偏差の積は負
偏差の積は正
xi  x 
偏差の積は正
偏差の積は負
10
偏差の積の平均値
n
Vxy 
 x  x  y
i 1
i
i
 y
n
この値 Vxy を共分散と呼ぶ。
共分散は2つの変数の関係性を表す指
標である。
11
問題
右辺を展開し、整理しなさい。
n
Vxy 
 x  x  y
i 1
i
i
 y
n
12
答え
n
 x  x  y
i 1
i
n
i
n
 y

x y
i
i 1
n
i
 xy
13
相関係数
共分散を x , y それぞれの標準偏差で割り
 xy 
Vxy
 x y
を求める。
このρxyを相関係数と呼ぶ。
相関係数も2変数間の関連を表す指標である。
14
相関係数の範囲
相関係数は、その範囲が
 1   xy  1
に限定される。
15