特異値分解による時系列データのノイズ除去

特異値分解による時系列データのノイズ除去
千葉豪
平成 26 年 9 月 12 日
文献 [1] に述べられている、特異値分解法を用いた時系列データのノイズ除去方法について、以
下、簡単にまとめる。
Nd 個の観測時系列データ(x(ti ), i = 1, 2, · · · , Nd )が与えられたとき、系の動力学的性質は遅
れ座標系で再構築された運動軌道の幾何学的性質を解析することで調べることができる。埋め込
み空間次元を n とし、その空間内の運動軌道の各点を時系列データから以下のように与える。
x(ti )T = [x(ti ), x(ti+1 ), · · · , x(ti+n−1 )]
(1)
Takens の埋め込み定理によると、このように遅れ時間座標系で表された運動軌道は、時系列デー
タを生み出した現実の位相空間上の運動軌道と位相同系な軌道となる。
ここで、xi で構成される行列 X を
1
X = √ (x(t1 ), x(t2 ), · · · , x(tN ))
N
(2)
と定義し、さらに共分散行列 C を次のように定義する。
1X
x(ti )x(ti )T
N
N
C = XXT =
(3)
i=1
ここで、N = Nd − n + 1 である。さらに、行列 C の固有値を σi2 (σi は X の特異値に対応)、固
有ベクトルを vi と書いたとき、以下の行列方程式が成り立つ。
CV = VT Σ
(4)
ここで、V = (v1 , v2 , · · · , vn )、Σ = diag(σ12 , σ22 , · · · , σn2 ) であり、σ12 > σ22 > · · · > σn2 とする。
共分散行列は実対称行列であることから、固有ベクトルは正規直交系を構成する。すなわち、
viT vj = δij
(5)
である。ここで、δij はクロネッカーのデルタを示す。
さて、埋め込み空間内の運動軌道を固有ベクトル vm で以下のように展開することを考える。
x(ti ) =
n
X
ϕm (ti )vm
(6)
m=1
ここで、展開係数 ϕm (ti ) は以下のように書ける。
T
ϕm (ti ) = vm
x(ti )
1
(7)
また、式 (6) を用いることにより、元の観測時系列データを以下のように書くことができる。
x(ti ) =
n
X
ϕm (ti )vm,1
(8)
m=1
ここで、vm,1 はベクトル vm のひとつめの成分である。この式から、元の時系列データは展開係
数 ϕm (ti ) の重ね合わせで表現できることが分かる。
なお、tN 以降のデータについては、
x(tN +i ) =
n
X
ϕm (tN )vm,i+1
(9)
m=1
で得ることが出来る。
さて、式 (4) より、以下の式を得ることが出来る。
Cvl = σi2 vl
(10)
T を乗じることにより、以下の式が得られる。
この式の両辺の左側から vm
T
vm
Cvl = σl2 δlm
これに式 (3) を代入することにより、以下を得る。
1X
x(ti )x(ti )T
N
N
T
vm
(11)
!
vl = σl2 δlm ,
(12)
N
1X T
vm x(ti ) x(ti )T vl = σl2 δlm ,
N
(13)
i=1
1
N
i=1
N
X
x(ti )T vl = σl2 δlm ,
(14)
1X
ϕm (ti )ϕl (ti ) = σl2 δlm
N
(15)
1X
2
ϕm (ti )2 = σm
N
(16)
x(ti )T vm
i=1
N
i=1
l = m のとき
N
i=1
が得られる。すなわち、時系列データの m 成分の大きさは、共分散行列 C の m 番目の固有値の
大きさと対応していることが分かる。時系列データに混入するノイズは、主要な成分と比べてそ
の大きさが小さい、すなわち対応する固有値が小さいと考えられることから、式 (8) において考慮
する成分を以下のように対応する固有値が大きいもののみに限定することで、時系列データから
ノイズを除去することが可能となる。
n0 (<n)
x
˜(ti ) =
X
ϕm (ti )vm,1
(17)
m=1
参考文献
[1] M. Tsuji, Y. Shimazu, ‘Evaluation of Decay Ratio of BWRs using Singular Value Decomposition Method,’ J. Nucl. Sci. Technol., 42, p. 169-182 (2005).
2