情報処理応用Ⅱ(前期)

第6章 相関係数
相関係数(correlation coefficient)とは、2 つの変数の間の
相関(類似性の度合い)を示す統計学的指標である。原
則、単位は無く、-1 から 1 の間の実数値をとり、1 に近い
ときは2 つの変数には正の相関があるといい、-1 に近け
れば負の相関があるという。0 に近いときはもとの変数の
相関は弱い。因みに 1 もしくは -1 となる場合は 2 つの変
数は線形従属の関係にある。
1
第6章 相関係数
たとえば、先進諸国の失業率と実質経済成長率は強い負
の相関関係にあり、相関係数を求めれば比較的に -1 に近
い数字になる。
相関係数は、あくまでも変数の線形関係を計測しているに過
ぎない。また、変数間の因果関係を説明するものでもない。
相関係数は順序尺度であり間隔尺度ではないので、例えば
「相関係数が0.2と0.4であることから、後者は前者より2倍の
相関がある」などと言うことはできない。
2
第6章 相関係数
2つの変数(A,B)間に相関が見られる場合、偶然による相関を除
けば、次の3つの可能性が想定される(相関と因果の違いに関す
る誤解・誤用において目立つのは、3番目の場合である)。
A が B を発生させる
B が A を発生させる
第3の変数C が A と B を発生させる
(この場合、AとBの間に因果関係はなく擬似相関と呼ばれる)
3
第6章 相関係数
1. 計算式
2 組の数値からなるデータ列
があたえられたとき、相関係数は以下のように求められる。
ただし、
はそれぞれデータの算術平均である。
また、この式は共分散をそれぞれの標準偏差で割ったものに等しい。
4
第6章 相関係数
2. 相関係数の評価
5
第6章 相関係数
6
第6章 相関係数
7
第6章 相関係数
8
第6章 相関係数
9
第6章 相関係数
10
第6章 相関係数
11
第6章 相関係数
12
第6章 相関係数
13
第6章 相関係数
14
第6章 相関係数
15
第6章 相関係数
3. 計算例
16
第6章 相関係数
17
第6章 相関係数
18
第6章 相関係数
19
第6章 相関係数
20
第6章 相関係数
4. 相関分析回帰分析
相関分析とは 2 変数の間に線形関係があるかどうか、
およびその強さについての分析であり、2つの変数の間
に質的な区別を仮定しない。それに対し回帰分析とは、
変数の間にどのような関係があるか(具体的な関数の
形)についての分析であり、また説明変数によって目的
変数を予測するのを目的としている。
21
第6章 相関係数
5. 練習例
22