II-3.2分散・共分散行列の活用

3.2 分散・共分散行列の活用
分散・共分散行列の作り方、分散・共分散行列・分散行列、相関行列の機能と意味が分か
ったので、その応用展開を考えたいのですが、実は、どんなものがあるのかよくわかりま
せん。筆者は、応用数学については素人なので、詳しく知らないのです。やってみないと
わからないというのが、正直なところです。そこで、どんなことが考えられるのかをメモ
のように書いておきます。
長々しい説明の結果、我々が手にした道具は、
1
という関係式と
𝒙𝒙 = 𝜮𝜮2 𝑿𝑿
𝜮𝜮 = 𝜆𝜆1 𝒆𝒆𝟏𝟏 𝒆𝒆𝟏𝟏 ′ + 𝜆𝜆2 𝒆𝒆𝟐𝟐 𝒆𝒆𝟐𝟐 ′ + ⋯ + 𝜆𝜆𝑝𝑝 𝒆𝒆𝒑𝒑 𝒆𝒆𝒑𝒑 ′
というスペクトル分解の技術です。努力量の割に得たものは少ないと感じるかもしれませ
んが、結構強力な道具ではないかと思います。
まず考えられるのは、
1
𝑿𝑿 = 𝜮𝜮−2 𝒙𝒙
として、実データから、確率空間上の点に変換することがありそうです。応用的にはいろ
いろ考えられますが、たとえば
実際に𝒂𝒂と𝒃𝒃と言うデーターが得られているとします。ほかにもデータがあって分散・共分
散行列が計算できます。あるいは何らかの方法で分散・共分散行列があるとします。この
データーが同時得られる確率が高いという意味で、似かよっているのかという問題があり
ます。この場合、確率空間で距離が近ければ似かよいの程度が高いということになります
し、同時に得られる確率を推定することができます。この確率分布をたとえば正規分布に
するか、2項分布にするか、それとも、他の分布の仕方を考えるかはともかくとして、と
にかく、実データーを使って、その確率的な距離を考えるということです。
𝒂𝒂, 𝒃𝒃をベクトルとして、実際の測定値(平均値を差し引いたもの)をつかって、たとえば
𝑎𝑎1
𝑏𝑏1
𝐚𝐚 = �𝑎𝑎2 �、𝐛𝐛 = �𝑏𝑏2 �
𝑎𝑎3
𝑏𝑏3
としたとき、この距離とは、ベクトル𝒂𝒂 − 𝒃𝒃の長さのことです。
𝑎𝑎1 − 𝑏𝑏1
𝐚𝐚 − 𝐛𝐛 = �𝑎𝑎2 − 𝑏𝑏2 �
𝑎𝑎3 − 𝑏𝑏3
|𝐚𝐚 − 𝐛𝐛| = �(𝒂𝒂 − 𝒃𝒃)′ (𝒂𝒂 − 𝒃𝒃)
= �(𝑎𝑎1 − 𝑏𝑏1
𝑎𝑎2 − 𝑏𝑏2
𝑎𝑎1 − 𝑏𝑏1
𝑎𝑎3 − 𝑏𝑏3 ) �𝑎𝑎2 − 𝑏𝑏2 �
𝑎𝑎3 − 𝑏𝑏3
�(𝑎𝑎1 − 𝑏𝑏1 )2 + (𝑎𝑎2 − 𝑏𝑏2 )2 + (𝑎𝑎3 − 𝑏𝑏3 )2
これが距離です。考えたいのは、このベクトルに置かれている空間に、𝑨𝑨という変換が行わ
れたとき、変換された 2 つのベクトルというか、ベクトルの先端の 2 点の間の距離はどう
なるのかといえば、𝑨𝑨𝒂𝒂と𝑨𝑨𝑨𝑨の距離だから、
|𝑨𝑨𝒂𝒂 − 𝑨𝑨𝑨𝑨| = |𝑨𝑨(𝒂𝒂 − 𝒃𝒃)|
距離の式を使うと
′
= ��𝑨𝑨(𝒂𝒂 − 𝒃𝒃)� 𝑨𝑨(𝒂𝒂 − 𝒃𝒃)
�(𝑎𝑎1 − 𝑏𝑏1
𝑎𝑎2 − 𝑏𝑏2
𝑎𝑎1 − 𝑏𝑏1
𝑎𝑎3 − 𝑏𝑏3 )𝑨𝑨′𝑨𝑨 �𝑎𝑎2 − 𝑏𝑏2 �
𝑎𝑎3 − 𝑏𝑏3
となります。いちいちルートを書くのが面倒なので、両辺を 2 乗して
2
|𝐀𝐀(𝐚𝐚 − 𝐛𝐛)| = (𝑎𝑎1 − 𝑏𝑏1
𝑎𝑎2 − 𝑏𝑏2
𝑎𝑎1 − 𝑏𝑏1
𝑎𝑎3 − 𝑏𝑏3 )𝑨𝑨′𝑨𝑨 �𝑎𝑎2 − 𝑏𝑏2 �
𝑎𝑎3 − 𝑏𝑏3
|(𝐚𝐚 − 𝐛𝐛)𝐀𝐀|2 = (𝐚𝐚 − 𝐛𝐛)′𝑨𝑨𝑨𝑨′(𝐚𝐚 − 𝐛𝐛)
となります。すこし、話を単純化しましょう。𝐚𝐚 − 𝐛𝐛 = 𝒙𝒙とします。
ベクトルなんだから、方向と長さだけがあって、位置は関係ないので、𝐚𝐚 − 𝐛𝐛のベクトルの
起点を原点に移したという言い方が、図形的な意味です。
𝒙𝒙′𝑨𝑨𝑨𝑨′𝒙𝒙
今説明しようとしている変換は
1
𝑿𝑿 = 𝜮𝜮−2 𝒙𝒙
で
1
𝑨𝑨 = 𝜮𝜮−2
ですから
1
′
1
1
1
|𝑿𝑿| = √𝑿𝑿′ 𝑿𝑿 = ��𝜮𝜮−2 𝒙𝒙� 𝜮𝜮−2 𝒙𝒙
1 ′
1
= �𝒙𝒙′ �𝜮𝜮−2 � 𝜮𝜮−2𝒙𝒙 = �𝒙𝒙′ 𝜮𝜮−2 𝜮𝜮−2 𝒙𝒙 = �𝒙𝒙′ 𝜮𝜮−𝟏𝟏 𝒙𝒙
1
1
′
1
(𝜮𝜮−2 は対称行列だから、�𝜮𝜮−2 � = 𝜮𝜮−2 です。
この、分散・共分散行列の逆行列で変換された距離をマハラノビスの汎距離といい、実デ
ーター上の2点(2つのベクトル)のマハラノビスの汎距離 D を
𝐷𝐷𝒂𝒂−𝒃𝒃 = �(𝒂𝒂 − 𝒃𝒃)′𝜮𝜮−1 (𝒂𝒂 − 𝒃𝒃)
(𝜮𝜮は分散共分散行列です。
)
式 83
と計算します。マハラノビスの汎距離 D は返還前の空間での距離(ユークリッド距離と言
います。)と同じ、ある空間での距離ですから、長さや面積など、距離にかかわる計算方法
をそのまま使えます。分散や共分散の影響を考慮しなければならないデーターでは、ユー
クリッド距離ではなくて、マハラノビスの距離を使うべきですから、この式は覚えておき
ましょう。
マハラノビスの距離と判別分析を組み合わせれば、確率的な意味で、データーのグループ
化ができると思います。
また、原点からその点までのマハラノビスの距離を、相関が高い二つ以上の測定項目を使
った、ある種の指標(インデックス)のように使う手はありそうです。(ただし、具体例を
知りません。ないかもしれません。
)
1
距離にしないで、単独に𝑿𝑿 = 𝜮𝜮−2 𝒙𝒙を使うこともありそうに思いますが、私にはアイデアが
ありません。
スペクトル分解、𝜮𝜮 = 𝜆𝜆1 𝒆𝒆𝟏𝟏 𝒆𝒆𝟏𝟏 ′ + 𝜆𝜆2 𝒆𝒆𝟐𝟐 𝒆𝒆𝟐𝟐 ′ + ⋯ + 𝜆𝜆𝑝𝑝 𝒆𝒆𝒑𝒑 𝒆𝒆𝒑𝒑 ′
の使い方としてすぐ思いつくのは、
次のような使い方でしょう
1
だから
1
1
1
𝜮𝜮−2 = 𝜆𝜆1 −2 𝒆𝒆𝟏𝟏 𝒆𝒆𝟏𝟏 ′ + 𝜆𝜆2 −2 𝒆𝒆𝟐𝟐 𝒆𝒆𝟐𝟐 ′ + ⋯ + 𝜆𝜆𝑝𝑝 −2 𝒆𝒆𝒑𝒑 𝒆𝒆𝒑𝒑 ′
1
1
1
1
𝑿𝑿 = 𝜮𝜮−2 𝒙𝒙 = 𝜆𝜆1 −2 𝒆𝒆𝟏𝟏 𝒆𝒆𝟏𝟏 ′ 𝒙𝒙 + 𝜆𝜆2 −2 𝒆𝒆𝟐𝟐 𝒆𝒆𝟐𝟐 ′ 𝒙𝒙 + ⋯ + 𝜆𝜆𝑝𝑝 −2𝒆𝒆𝒑𝒑 𝒆𝒆𝒑𝒑 ′ 𝒙𝒙
のように使えば、それぞれ直交するベクトル空間でそれぞれのデーターがどの様な位置づ
けになるかわかるし、成分同士の関係を取り出して論ずることもできるでしょう。
ベクトルの向きによって、データー項目間のグループ化をすることも考えられます。