グラフィカルラッソによるプローブ未観測リンクの交通状態推定

第二回データ同化の研究会@山梨大学
20150330
グラフィカルラッソによる
プローブ未観測リンクの交通状態推定
東北大学
原 祐輔
(共同研究者: 花岡洋平,片岡駿,桑原雅夫)
1. 研究の背景
•  途上国におけるプローブカーによる交通モニタリング
2013/9/31 13:00-13:05
バンコク中心部の交通状態
・観測道路数が最も多い
時間帯で約53%の道路が
未観測
–  エリア全体の交通状態を把握することは困難
–  固定観測(感知器)をネットワーク全体に広げることは非効率
–  時間帯・道路リンクごとに取得にばらつきのある データを補間推定することが望まれる
本日の流れ
1.  研究の背景と目的
2.  多次元正規分布による補間アプローチ
3.  パラメータ推定のための2つの戦略
4.  バンコク中心部におけるケーススタディ
5.  精度検証
6.  推定されたパラメータの解釈
7.  本研究のまとめと今後の課題
本研究の目的
•  本研究の目的
–  プローブカーのみから得られる観測データを 用いてエリア全体の交通状態を正確に把握する
•  課題とアプローチ
1.  ある単位時間には未観測リンクが多く存在
•  過去データから統計モデルを構築し,補間
2.  過去データにも未観測リンクが多く存在
•  部分観測データから統計モデルを学習できるよう 拡張
3.  予測精度の高い統計モデルの構築方法
•  分析者が強い仮定を置かない柔軟なモデリング
2.本研究における統計モデルの仮定
•  ネットワーク上の各方向別道路リンクは交通状態をもつ
–  本研究では具体的には5分単位の平均リンク速度とする
–  本研究では各リンク間の空間的相関のみを対象
–  各時刻別に独立に交通状態が観測されると仮定
•  (=大変強い仮定: 時系列相関は今後の課題)
x2
正規分布で良いのか?
•  交通状態の表現に1つの多次元正規分布でいいのか?
–  もちろんベストではない(別の分布とか,混合分布とか)
–  しかし,多次元正規分布は扱いやすい
–  また,補間という観点では柔軟性がある
e.g. x1, x2がリンク1, 2のリンク平均速度とする
x4
P(x2)
x3
x1
周辺化分布
x2
x5
•  ネットワーク上の各道路リンク単位の交通状態は ただ一つの多次元正規分布によって生成されていると仮定
–  多次元正規分布の平均ベクトルµと 分散共分散行列 Σ(精度行列Σ-1=Θ) によって ネットワーク交通状況の相関構造を表現
x2
x1
観測されたx1が
傾向をもつ場合の
条件付き分布
P(x2)
P(x1)
x2
x2
未観測リンクの補間手法
3.多次元正規分布のパラメータ推定
(Gaussian Markov Random Field)
•  補間手法は以降,共通のため最初に説明
•  多次元正規分布(=モデル)のパラメータµ, Θは既知#
•  ネットワーク全体の交通状態をx = (x1,…,xL)とし, 観測された道路リンクをxo, 未観測リンクをxuで表す!
•  このとき,未観測リンクの周辺事後分布は
p(x u | x o , µ, Θ) =
∫
N(x | µ, Θ )∏ δ (yi − xi ) dx o
−1
xo
i∈O
−1
= N(x u | µu − Θ−1
uuΘuo (x o − µ o ), Θuu )
平均ベクトル
=条件付き分布
(1)
分散共分散行列
−1
x̂ u = arg max N(x u | µu − Θ−1
uuΘuo (x o − µ o ), Θuu )
xu
! µ $
" Θ
Θou %
' µ = # u & δ (⋅)
ここで Θ = $ uu , , はディラックのデルタ関数
#" µo &%
$# Θuo Θoo '&
1.  標本平均,標本分散共分散行列を計算(=ナイーブ)
–  パラメータ数に対してデータ数が十分に得られていない場合, 推定パラメータが学習データに過剰に適合(過学習)
–  精度行列が正則という保障なし
☹
2.  分析者が構造化したGaussian Graphical Model (GGM)
(花岡ら, 2014; Kataoka et al., 2014)!
–  モデル構造の設計の段階でパラメータ数を削減
–  精度行列は正則になるよう設計
–  構造化がうまく交通現象を説明できているかは不明
3.  実データから精度行列の構造を推定
(Graphical Lasso; GL)!
–  正則化により1.の問題を解決
–  構造をデータから学習することで2.の問題を解決
☹
zd i ∈ U
z = {xu , y}
d
j∈O
ln p(z d |θ)
y
d
(i, j)
Ω
i, j ∈ O
#2
ηϵ ! dd 2 η ! "1 d
1 T −1 j ∈|V|
d
i∈U
Odln η + const
ln p(z |θ) = β z −
z
−
z
−
z
−
β
Θ
β
−
i
j
d
i, j ∈ Ud2
2 Ω
2 (i, j)∈E i
2η
2
i∈V
2つのアプローチの違い
Ω
Ωd1
(i, j)
(i, j)
Ωd2
d
3
•  2.構造化GGMによるアプローチ
zd
– 
xd
i, j ∈ Od
i, j ∈ Ud
p(xdu |y d , θ) exp
$!
i∈Ud
βi (xu )i −
2
i∈Ud
(4.26)
Θ=
(xdu )i −
Dempster et al.12)
(i, j)∈Ω1
z
:"0
12)
EM
&
GGM(4.24)|Ud |
p(xdu |y d , θ) =
η
EM
θ̂
p(xu |y, θ)
xu
#T
"
##
det Θud z " η " d
d
ln
p(z|θ)
exp
−
x
−
µ
Θ
d
d xu − µud
u
U
u
d
Θ = |U |
2
xu
(2π)
ln p(z|θ)
z
Mstep
–  Graphical Lasso
(Friedman et al., !
2007)によって推定
θ̂
Mstep
θ new
mdi :=β
ydj
i+ J
Mstep
j∈∂(i),Ωd1
θ0
Estep
Mstep
Mstep
θ new
1 −1 d
old
µud := Θud m
Q(θ,
θ
)
η
θ0
Estep Mstep
Estep
Estep
Estep
2
η
(4.28)
i
θ old
27
|V|
zxidu y−d y d
zi − z j − β Θ β −
ln η + const
d
2(4.26)
2 (i, j)∈E (4.28)
2η Q(θ|θ old2)
i∈V
Estep
d d dd
p(xp(x
|y |y
, θ), θ)
(4.26)
– Mstep
E-step
Q(θ|θ )
4.3.2
Q(θ|θ# old
$!
% )%
$!
28
d !
!!
!!
d !
"
"
!
!
2 #2
"
#
η
ϵ
η
η
η
ϵ
η
η
2
ηϵd d d 2 η d d d d
1d dT) )d2−1−2 |V| (xd ) −
d dd d
d
T d β (x
d (yd(y
p(x
,|θ)
θ), exp
)i −
(x )i −
) j du ) j
θ)
exp
−
)i(x
−du(x
(4.25)
j u ) j )β−
i uconst
lnp(x
p(z
=Estep
β
z −i βui (x
−
z
−
β
Θ
−
ln
η
+
u |yu |y
u(x
u(x
i −i (x
u )i z−
u )iz−
i2 − y u(x
i
j
2 2 d d 2η
2 22 d d
2 2
i∈Udi∈U
(i,j)∈Ω
(i,j)∈Ω
θ i∈Udi∈Ud 2 i∈V
(i,j)∈Ω
(i,j)∈Ω
(i,dj)∈E
xd
1
p(xdu |y d , θ)
3
1
i
u
u i
old
2 y
i∈Ud & &
i∈Ud
–  Q関数のパラメータ偏微分
|U |
θu
i
2
i
(i, j)∈Ωd1
u j
2
du i
(i, j)∈Ωd3
4.4.1
u j
28
ln p(Θ, µ) =
∂η
(i,j)∈E
D
d
2η
2
i∈V
D
d
2η2
⎧
µ
(4.1)
Σ
! 1
T
"
D
1# d
log det Θ −
(x − µ)T Θ(xd − µ) + const
2
2
(4.1)
Σ
(4.2)
d
Θ
d
(5)
Θ∗xd==arg
log
(4.31)
d
(xd1 , xmax
, ..., xd|V|
) det Θ − tr(SΘ) − ρ||Θ||1
2Θ
D
|V| |V|
D
1# d
ln ∑
p(Θ,
µ) = log det Θ −
(x − µ)T Θ(x
2
µ,
µ d − µ) + const
=∑
ΘΘ
–  ここで はL1ノルム項
DΘ!
2
! j |Θiji j | # 2
||Θ||11 " |V|×|V|
µ
d
i
i, j=1
L(β, η) :=
ln p xd |β, η
L1正則化イメージ
15
D
d=1xd
D d
(4.7)
Θ
ΘD2 D
D 目的関数の等高線
D
) "
* ηϵ ") "
* η ") "
*
1
1
1
T
d xd = (xd , xd , ..., xd ) d 2
d
d 2
=β
x
−
(x
)
−
(x
−
x
)
2
i
j
(4.31) 2 1
L1
D
D |V| i
2
D
d=1
2
i∈V
(i, j)∈E
d=1
制約なし時の最適解
d=1
µ, Θ
1
N4.3.2
− β T Θ−1 β − ln det η + const
L1ノルム正則化時の最適解
2η
2
15
d dold
d
old
p(x
|y |y
,uθ)
=
p(x
, θ)
d
d
j∈∂(i),Ω
j∈∂(i),Ω
1
1
29
•  に対して,正則化項を加えた最適化問題を解く
GGM
x
D
D d
• 
(4.29a)
−1
1
Θ
d
d|
" η" " η "
#T #T " "
## ##
det
ΘuΘ
d
η|U
det
d
p(xd |y d , θ)η !
d d%
$ !
%
oldu exp
!
" exp
# du x−$duµ−
(4.28)
d xdu x
−udµuN
(4.28)
d UΘ
d
η|β
, ηold
)−−12−x
∂Q(β, η|β u, ηu ) =∂Q(β,
(4.27)
uΘ
U −uµ
1udµ!
1!
1
1 Θi j = 0
d|
1 (2π)
|U
|Ud |
2
(2π)
Ed [zi z (4.29a)
−
−
(ϵ%+ |∂(i)|
Ed [zi 2 ] + 2 β T Θ−1 β
$! ∝
Ed [zi ] − Θ ∝!
β
j ]!
はclosed
formで導出可能
d !
"2η 2
#2
i
D
D
2η
η
η
D η ϵ ∂η d
∂βi
d
(i,j)∈E
d
p(xdu |y d , θ) exp
βi (xdu )i − d
(xu )i −
(ydi − (xddu ) j )2 −
(xdu )i − (xi∈V
u) j
2
2
2
d
d
d
d
i∈U
i∈U
(i, j)∈Ω1
(i, j)∈Ω3
&
d
(4.29b)
" η!
" !
#T
"
##
η|U | det Θ
$
%
$
%
ud
old old
d d
d!
d
!
!
!
Fridman et
d
d
∂Q(β, η|β , η )
x
−
µyudd Θ2Ud xu −1µud T −1 (4.27)
(4.28)
dexp −
1 p(xu |y , θ) = N 1|Ud | mi m:=β
1
u
+
J
y
:=β
+
J
i
i 2
j E
j [z ] +
∝
Ed [zi z j ] − (2π)
−
(ϵi + |∂(i)|
β Θ β
d i
xd
2
p(x|µ, Θ) :=
exp − (x − µ) Θ(x − µ)
•  多次元正規分布 の
Z(Θ)
2
尤度関数
(4.2)
4.3.2
3
old
i1
! 1
"
exp − (x − µ)T Θ(x − µ)
Z(Θ)
2
1
Q(θ, θ old )
"
#
(4.27)
(4.26)
)
•  E-step
M step Q(θ|θ
∂Q(β, η|β , η )
1 ! (4.27)
$!
% −1 β
∝
E [z ] − Θ
d !
!
!
old
η ϵ max
η
η D " d d i d #2
i
∂β
d d
d θ̂ = arg
d
d
d
2
i
Q(θ|θ
)
–  Q関数を最大化する
d (x ) −
p(x |y , θ) exp
β (x ) −
(y − (x ) ) −
(x ) − (x )
old
Θ = Σ−1
µ := Θ β
3.2
3.2 Graphical
η Lassoの概要
Q(θ, θ old )
(4.25)
ln p(z d |θ)
z
(4.25)
u u
Estep
Mstep
dold
観測リンクydが与えられたもとでの未観測リンクx
の事後確率
2
GGM
µ
p(x|µ, Θ) :=
4.4
27 27
d "
d #d
d
=ηϵ ! Estep
ln p(z
|θ)p(x
|y2 , θ old
Mstep
η !
1 )dx
d2
d ud
T u −1
(4.25)
xd xd
⎧
⎪
Kataoka et al.
∂(i)
D
D
⎪
⎪ϵ +d |∂(i)|
i ∈ Ud "d d d "
ln
|θ)
⎪
ln p(z
|θ) |Θ)
Q(θ|θ old⎪
)⎪ =z z d
...
lnp(z
p(z
p(xdu |y d , θ old )dx1u dx2u . . . dxD
データ欠損のためEMアルゴリズムを利用
⎪
u
⎪
xu1 xu2
xuD
27
⎪
d=1
d=1
⎨ !!!
!
!
" " D d #2 #2 1 1 D
!
!
!
d
ηϵ
η
ηϵ
η
Θ
:=
|V|
d
2
|V|
⎪
2
u T z dT −⎪
d d
d"
d −1# d d (i, j) ∈
d d or
i)T"
∈T−1Θ
Ωβ−13−β − ln ηln+ηconst
E step
ln p(z
|θ) |θ)
=β
zi z−
z3j zddj−d(d−j, β
Θ
ln p(z
= β z⎪
−
−
zΩ
β
+ const
i
dzi −
d d 2d
i −
old (4)
1
2
D
⎪
2η
2 i∈V . . ln
2 (i,j)∈E
⎪
p(z
|θ)p(x
, θ2ηold )dx
(4.25)
Q(θ|θ old ) =
.2 (i,j)∈E
ln
p(z
p(x
u |y |Θ)
u u |y ,2θ )dxu dxu . . . dxu
⎪2= i∈V
⎪
–  Q関数
d
D
⎪
du1d xu2xu
d
x
x
u
⎪
d=1p(z |θ)
d=1
z
ln
⎪
⎪0# !
(4.26)
(4.26)
otherwise
⎩
–  完全データの対数尤度関数
ln p(z d |θ) = β T z d −
j
i= j
⎪
GGMGGM
⎪
–  道路ネットワークは他のリンクとたかだか数本しか (4.19)
x
⎪
⎪
⎨
接続していないので非常にスパースな行列を仮定している
Θ = (i,
Σ−1j) ∈2 E or ( j, i) ∈ E
Θµij = ⎪
−1
⎪
⎪
⎪
⎪
–  モデルのパラメータ数はたかだかV+2
(オリジナルはV + V2/2)!
⎪
4.1
⎪
⎪
⎪
⎪
⎪
otherwise
⎩0
3.2
{β, η}
θ old
⎧
構造化GGMのパラメータ推定
Estep
Q(θ, θ )
⎪
⎪
!
⎪ ! !
i
4.1
(4.19)
と変形できるのでこの式は多次元正規分布である
GGM(4.11)
Θ
4.2
GGM
α
old
• 
• 
!
#
ηϵ "
η "
3.1exp構造化GGMの概要
βx −
x −
(x − x )
⎪
⎪
2
⎪
• 4.1精度行列の0成分
⎪
ϵ + |∂(i)|
⎪
⎪
p(xu |y, θ)
0"Estep
Estep
µ
4
(4.27)
y
•  3.実データから精度行列の構造を推定するアプローチ
GGM(4.24)
Dempster et al.
EM
–  全ての要素について推定し,推定の過程で0を増加
Θ
2
(i, j)∈Ω3
EM
(4.15)
GGM
i
2" #i∈V
∞
GGM
!1
! 21 (i, j)∈E
"
T −1
Z(β, γ, α) = exp β
Θ
β
exp
− (x
− µ)T Θ(x
(4.16)
•  交通状態xを表現する確率モデル
" − µ)# dx
!
#
η"
2!
2
−∞
2 "
"
! −
#
= exp βx
ϵ
+
|∂(i)|
x
+
η
x
x
(4.20)
i
j
ηϵ
ηi
T 2
2
p(x|β, η) ∝ exp β(3.2)(3
x −i∈V
x2i −
(xj)∈E
(4.19)
(2)
i − x j)
(i,
(2))
2 i∈V
2 (i, j)∈E
! η
η T −1 #
%4
!
"
T
%
ε + ∂(i)
(x 1−βµ)
−(2π)
µ) +
β Θ
i=γ,
=exp
j!α) =−exp
T Θ(x
−1
N det(Θ
−1 ) β
'
Z(β,
Θ
β
(4.17)
2
2
1
β ' −1
η
µ2 ≡ Θ−1β ∂(i) はリンクiと接続するリンク集合
(i, j) E!
Θij ≡ &
η
'
0
otherwise!
(4.16)
(4.17)
'
ϵ
(
とすると
4.1
$
!
" #
N
!
1 det C
1η
η
T T
4.2(4.19)
GGM
p(x|β, γ,
α)(4.11)
= η)%=
exp
−− (x(x−−µ)µ)
Θ(x
− µ)
(4.18)
ηϵ
p(x|β,
exp
Θ(x
−
µ)
(3) γi
N
22
(2π)−1 )
(2π)N det(Θ
G(V, E)
%
#2
η ! d
η ! " d
d
2
d
(yi − (xu ) j ) − y
(xu )i − (xu ) j
2
2
d
d
ln p(z)
ηd ϵ !
d
∞
4–2
(4.19)
z
y Ωd
(i, j)
隣接する道路同士のみ値をもつ精度行列を定義
3
ln p(z)
p(xdu |y d , θ)
z
23
! 1 $
"
1$ 2 $
Z(β, γ, α) =
exp − (
βi xi −
γi xi +
αij xi x j dx
2
2
−∞
i∈V
i∈V
(i,j)∈E
T d
d
#
xi
Θ1
al.
Graphical Lasso
(4.2)
µ
(4.21)
Θ−1 − S − ρ Γ = 0 L1
(4.31)
Σ = Θ−1
4.3.2
W
Θ,W
Σ = Θ Lassoの概要
W
3.2 Graphical
!
−1
"
!
"
30
30
30
(4.33)
!
4.4.2
Θ,W
30
GL
(4.21)
"
W11 w12
S11 s12
11 θ12
•  Θ
L1正則化は重要でないパラメータを0に追いや
Θ= T
,W
Ssign(Θ
= i jT) Θi j = 0
Γ = Θi j !T0
Γi, j, =
Γi j ∈ [−1,(4.34)
1]
θ22"
s12
l.
Lasso
! θることができ,スパースな解が得られる
!w12 w22 "
! s22 "
12Graphical
(4.32)
Θ11–  モデラーが仮定せず,データからスパースな解を得る
θ12
W11 w(4.31)
S11 s12
12
Θ= T
,W =
,S = T
(4.34)
T
θ12 , w12 , s12 θ –  しかし,L1ノルムは微分不可能なので扱いづらい
θ
w
w
s
s
22
22
22
12
12
12
, w22 , s22
Θ−1 − S − ρ Γ = 0
θ12 , w12 , s12 θ22
•  共分散構造問題に対して,データのノイズに対
して安定した解が得られるアルゴリズムとして
Σ = Θ−1
W
Θ,W
(4.33)
GL
θ22 , wFriedman
et al. (2007)がGraphical Lassoを提案!
22 , s22
S
(4.33)
β
w12 β ∈ R
|V|−1
(4.33)
S
SS S
(4.34)
# $ Θ = θ12T
∂
1
1/2
•  本研究でも観測された道路リンク交通状態から
W β − b + ρ||β||1 = 0
(4.35)
s12
∂β θ122, w12,11
リンク間の共分散構造の推定にGLを利用
#GL$
%2
&
θ22 , w22 , s22
∂
1
1/2
L1
β =(4.35)
W β − b + ρ||β|| = 0
∂β 2
b=
(4.33)
11
GL
w12(4.35)
− s12 − ρ(4.31)
γ12 = 0 Θ
(4.34)
(4.36)
(4.33)
T
12
i,j
(4.31)
(4.31)
(4.31)
ij
Θi j i j= 0
ij
Γi jij∈ [−1, 1]
(4.31)
Θ
ij
(4.32)
(4.32)
(4.32)
∂
(6)
Γ=0
ln p(Θ) = Θ−1 − S − ρρ Γ
∂Θ
−1−1 −1
ΘΘ
−
S
−
ρ
Γ
=
0
==
00
Θ− S
−−
S ρ− Γ
ρΓ
•  ここでSは標本分散共分散行列,Γは以下の行列
−1
Σ
=
Θ
W
%' sign(Θ )
if Θij ≠ 0# −1−1 −1
ij
ΣΣ=Σ
W
Γ ij = &
=Θ=
ΘΘ
WW
(' ∈ [−1,1]
(4.32)
if Θij = 0#
W11
w T12
GL
GLGL
GL
31
31
w22
Graphical
Lassoの導出
L1 L1
−1
θ12 = −θ22 W11
w12 = −θ22 β
β β
ββ
L1L1
−1
β = W11
w12
(4.36)
−1/2
β ≡ W11−1w12 ," b ≡ W11−1/2 s12
−1−1 −1 •  新たな変数を定義
|V|−1
|V|−1
(4.36)
−1/2−1/2
|V|−1
W
w
β
∈
R
b
=
W
s
W
ww12
β
∈
R
b
=
W
s
12
12
12
−1/2
−1
W
β
∈
R
b
=
W
s
11
11
−1
|V|−1
11
11
12 β ∈ R
β = W bw=
(4.36)
11
12 W 11 s 12
W w
12
(4.34)
(4.34)
(4.34)
(4.34)
12
# $ θ = −θ%2 %W
& & −θ β
−1
∂# #∂$1 #$ 1 $ 1/2
% 2 11 w&12& =
12
22
%
2 222+ ρ||β||
∂
1
1/2
W
β
−
b
1/2
∂ 1 W
1 1 ==00
W
β b− b + ρ||β||
+ ρ||β||
1/2
11
β
−
=
0
11
1
2
∂β
W
β
−
b
+
ρ||β||
=
0
∂β 2 11
1
∂β∂β2 2 11 θ12 = −θ22 W11−1 w12 = −θ22 β
11
(4.33)
(4.33)
(4.33)
(4.33)
Θ,W
Θ,W
Θ,W
Θ,W
!
"-1*をWとし,以下のように分割
!
"
!
"
•  上式の最適解Θ
Θ11 θ12
W11 w12
S11 s12
31
31
(4.38)
(4.38)
(4.35)
(4.35)
(4.35)
(4.35)
(4.38)
(4.38)
31
βββ===
β=
β=W w
(4.36)
•  βを用いて式(7),
(8)を以下のように変形
(4.35)
(4.34)
(4.33)
W11 β − s12
−
ρ γ12 = 0
(4.35)
(4.34)
(4.33)
(4.35)
(4.34)
(4.33)
11
−1
11
(4.35)
12
11
12
W11 β − s12 −
•  式(6)の右上ブロックから式(7)が成り立つ
W11
ij
θ12 = −θ22 W11−1 w12 = −θ22 β
−1/2
W11
s12
Graphical Lassoの導出
Γi, j i,=
sign(Θi j )i j
j
Γij ∈ [−1, 1]
Γ Γ= sign(Θ
Γ Γ ∈ ∈[−1,
Γ Θ Θ! 0! 0
= sign(Θ) ) Θ Θ= =0 0
[−1,1]1]
(4.31)
(4.32)
L1
正則化付き対数尤度とGL
ΓΓ
(4.33)
(4.33)
(4.33)
(4.33)
30
L1
β=
# $
%2
&
∂ 1
1/2
(4.35)
(4.34)
(4.33)
W
β
−
b
+
ρ||β||
=
0
(4.35)
1
Γ
Θij ! 0
Γi, j = sign(Θ
Θij = 0
Γij ∈ [−1, 1]
11
ij )
∂β 2
−1/2
|V|−1
β∈R
b = W11 s12
β
L1
β=
•  正則化項付き対数尤度関数の最適化が (4.31)
(4.32)
β
=
W11−1 w12
.21)
L1
−1/2
−1
|V|−1
W
w
β
∈
R
b
=
W
s
L1正則化付き回帰問題に帰着できることを示す
12
12
11
11
(4.35)
(4.34)
(4.33)
Θi j !
0
ij
Θij = 0
" " ,"S =
!! !
"" "
" =! ! !
Θ =!Θ!ΘT!Θθ θ" θ" , W
T 11
w
ST11ss1212
WW
ww
SS11s11
12 12
11
11W
1212
θ111211 1112
θ22
w
w
ss2212
22,12
12
12
,
W
=
,
S
=
Θ=
,
W
=
,
S
=
ΘΘ
==
,
W
=
S
=
Tθ T θ T θ θ
T Tw T w w
s22s22
θ12
ww
w
ssT12T12sT12s22
1222 22 22
12 θ
1212 12 2222 22
θ12 , w12 , s12
w
w
,12s1212, s12
θ12θ,12w,θ12
– 12,12,s上記の分割は各行列から1列のみ取り出している
θ22 , w22 , s22
, sw,22s2222, s22
, 22
w
22,22
θ22θ,22wθ
w
"
!
"
!
"
θ12
W11 w12
S11 s12
,
W
=
,
S
=
%θ2 22
&12T w22
w
sT12 s22
1
Γi, j = sign(Θij )
•  正則化項付き対数尤度関数をΘで微分
–  最適化問題をL1正則化項付き回帰問題に帰着!
!
GL
Θ11
Θij ! 0
Γ
W11 β − s12(4.34)
ρ Wγ
=s120−−ρ ργ12γ12= =0(9)0
11
12β −
(4.33)(4.39)
(4.39)
(4.39)
(4.39)
Θ−1
θ22 > 0
sign(θ12 )
∂
θ12 = −θ22 W
(4.38)
Θ w12 = −θ22 β θ22 > (10)
0
sign(θ
(6
)
12 ) =
Γ=0
(4.33)
W Θln=p(Θ)
I = Θ−1 − S − ρρ Γ
(4.32)
Θ 11
θ22 > 0
sign(θ12 ) =
∂Θ
w12 − s12 − ρ γ12 = 0
(4.36)
−1 −1
w12 s− s−
−ρ γ =0
(4.36)
w1212) )==−sign(β)
(4.36)
(4.36)
−sign(W
−sign(β)
(4.39)(4.39)
11 11−1w
(7) "
12 −
γ12 = 0
(4.36)
Θ−sign(W
θ221212−12−ρ>ρργγ120γ1212=12==000
sign(θ(4.36)
) =
"!
" ! w12 − s12 − ρ
!
"
12
−sign(W
w12 ) = −sign(β)
(4.39)
ww
12 − s12
11
• 
元の最適化問題の見方を変えると
T
w12 Θ11 θ12
W11 Θ11 + w12 θ12 W
θ
+
θ
w12
I
0
11 12
22
!
"
"
"
W Θ =Σ
I = Θ−1
=
(4.37)
W = 0T Θ,W
TT
W
Θγ=
I ∂∂∂ ! 111ββ
T
T
T
T
T + ρ||β||
T T s12
−
ρ
=
W
β−β−β−
β
−1
1
w22 θ12
θ• 22WΘ=Iより以下が成り立つ
θ12
W + θw
w12
θ + w22 θ22
1 "
W11W
β1111−ββs−W
−
ρ=
W
Θ
=
I1212=
W
−W
s12
−
ργγ
=
βT W
β11
sβ
12
1111
12 +sρ||β||
12s
12
12 + 1ρ||β||
1
Θ
I
w12 ) = −sign(β)
(4.39)
2
∂β
!
"!
" 12!
" ! −sign(W
∂β 2
WΘ = I
w12
w22
W Θ = I W11
"!
T
w12
w12
w22
T
Θ11 θ12
W11 Θ11 + w12 θ12
W11 θ12 + θ22 w12
I 0
=
= T
T
T
T
T
θ12 θ22
θ12 W + θw12
w12
θ + w22 θ22
0 1
11
(4.37)β =
"!
" ∂β! ! 2##
" !
" " "
−1
T $2 $2 $2
W11
w12 ! ! !W11 "w
"!!12 Θ(4.36)
" !! ∂∂ !W
" 1!−1! 2−1
! 11# Θ1/21/2
+ wW
Wβ11TβθsT12s++β+θTβ
I "0+" ρ||β||
1/2
Tw12
1/2
11 " "θ12! =
11ββ
12
22
TTθ
∂ 11Θ
1W
! W
"
!
" 1−"W
=W
W+
s1/2
s−12
s1212
s12
1/2
w
Θ
θ
w−−Wθ
W
θ 12+12θT w12
Is s+102"ρ||β||
12 − −
T !W
−11 2 1
" !
" !
"
T
Θ11 θ
W"11 Θ11 +! w12 θ12
W
I W011 β − s12 − ρ
! 12 –  右上ブロックから
" 11 θ12 !+ θ22 w12"
(4.37)
Θ =θ T
W11T w12 T
S11 s12 = T
T
θΘ
θ 11 12 θ,12
W
w
θ= + w
0 1 (4.34)
W
=+ θwT22
,S
22 θ22
(8)
W
0
12 = 22T
12wW
12
11 θ12 + θ
12 11=
T
=0
θ12 θ22
w12 w22θ12 + θ22w12 s
s22
12
θ12 , w12 , s12
=
"
11
120
=
=1112 −
(4.37)
12
11 Tθ12
12
112Θ
12
11
12
22
1111
11
W1111w
w
W
+w
w
W
θ
+
θ
I
Tθ"
12
11
11
12−
11
2212w12
=
W
β
W
s
−
β
s
+
β
s
s
+
ρ||β||
2
∂β
2
2
∂β
T 1212 ΘΘ11
T11
T11W
T12
T0 W
!
12
1
12
W
θ
W
Θ
+
θ
θ
+
θ
w12
I
=
=
(4.37)
12
11+
11 11 T
11 T w 12 w2211 T θ 12 θ22
11 T 2
12 θw
12 θ +22w22 θ22
θ11
= T0 2 1 11(4.37)
(4.37)
T12
12θ == ∂β
12+ w θ
#W
$2$12
"w
#12 W
2
T
T
T"θ
wT∂ 121
w22 θ
θ!!T1211W
+
θw
w
22
Tθ∂∂Tθ
Tθ12 θ
T 12
T2 12
+
θw
w
θ
+
w22θ2222θ2222 = 00T0T11 1(4.40)
1/2
22− β=
1/2
212
!
#
$
"
θ
W
+
θw
w
θ
+
w
12
12
12
2
W
β
−
b
+
ρ||β||
=
0
γ12 w
=w12T 1212 ww2222β TθW
β
s
+
ρ||β||
22
22
=
W
β
−
b
+
ρ||β||
=
0
(4.40)
(11)
1
11
12
1
12
12
12 1
∂β
1/212 = 0
W11 β −
s∂1212221− W
ρ1111γ
(4.39) (4.40)
∂β 2
= ∂β
β − b + ρ||β||21 = 0
11
∂β
2
! #
$
"
2
(4.35)
βに対するL1正則化付き回帰問題
(4.35)1/2
∂ 1
1
1/2
=
W11 β −(4.35)
W11 s12ΣW11 θ−12β+TθWs2212w12+=β0T s12 − Ww11−1 s212 β+ ρ||β||1
Θ
θ
>
0
sign(θ
) =
12
W11
+ θ22 w
0
22
12β
2
∂β 2
Σθ
W12 =
w12
θ12
θw
12
22 w
WW
θ12
+ +θ22
==
00
1111
12 12
! #
$2
"
L1
β
Σ 2 (4.35)
w12
β
1
−1
L1
(4.35)W
1/2
−sign(W11
w12 )== ∂
−sign(β)
(4.39)β
W
β
−
b
+
ρ||β||
=
0
(4.40)
−1
1
11 w12
β=W
w12
wii = sii + ρ
Graphical Lassoの導出
•  以上より,L1正則化回帰問題を順次解く
step. 1 初期値をW = S + ρIとする
step. 2 Wを分割し,式(11)をβについて解く.
w12 = W11β̂ を用いる
最適解 β̂ が得られたら,
ŵ
ことにより 12 を得る
step. 3 step.2を各列について繰り返し,
Wが収束したら終了
本研究による拡張
4.4
•  実際に得られるデータは未観測リンクを含む
–  Graphical Lassoをそのまま適用することはできない
4.4.1
•  EMアルゴリズムを適用
–  Estep:対数尤度関数の期待値を計算
(4.2)
Q(Θ | Θold ) =
w12
W11
∫
xu
ln p(x u , y | Θ)p(x u | y, Θold )dx u
–  Mstep:GLの枠組みでL1制約付き対数尤度最大化
w22
Θ∗ = arg max log det Θ − tr(SΘ) − ρ||Θ||1
w T12
(
Θ
•  GLがWを正則に保ちつつ更新していくことは
Mizumder and Hastie (2012)に示されている
!|V|×|V| Θ ← Θold
–  収束していなければ としてEstepへ
||Θ||1
i, j=1
|Θi j |
(4.7)
4. バンコク中心部でのケーススタディ
•  バンコク中心部を対象としてネットワーク作成
–  道路リンク数:1183個
–  平均リンク長:64m
–  MVNのパラメータ数: 2*1183 + 1183*1182/2
•  データセット
70万!
Θ
バンコク中心部の日常(4.31)
Θi j = 0
L1
4.3.2
Fridman et al.
Graphical Lasso
–  2013/9/1-7, 10/14-11/5
の30日間のプローブデータ
14)
–  6:00∼20:00を抽出
–  マップマッチングし,
道路リンクごとに 5分間平均リンク速度を算出
–  データ数は5040
–  各データの平均欠損率71%
(=未観測リンク数/1183)
GL
GL
5.1.3
5
41
バンコク中心部のリンク欠損率
道路種別ごとの平均速度の傾向
3
43
(
(
5–5)
幹線道路の例
700
(
600
1000
700
500
700
300
600
200
500
100
400
400
300
200
200
0
1
10 2 20 3 30 4 40 5 50 6 60 7 70 8 80 9 9010 10011
100
speed (km/h)
100
0
0
1
10
– 5–5
2
20
3
30
4
40
5
50
6
0
60 7 70 8 80 9 90 10 10011
0
1
10 2 20 3 30 4 40 5 50 6 60 7 70 8 80 9 9010 10011
speed (km/h)
140 – 5–4
speed (km/h)
細街路の例
– 5–5
120
100
freqency
43
600
400
800
freqency
freqency
900
3000
バンコク中心部は
同一リンクであっても
100
分散が大きい傾向
140
80
5–7
60
120
freqency
40
20
高速道路・幹線道路はプローブ観測率高い
高速道路の例
5–6)
500
freqency
0-5%
5-10%
10-50%
50-100%
5–4)
0
0
1
10 2 20 3 30 4 40 5 50 6 60 7 70 8 80 9 9010 10011
speed (km/h)
– 5–2
– 5–6
80
60
40
20
0
0
1
10 2 20 3 30 4 40 5 50 6 60 7 70 8 80 9 9010 10011
speed (km/h)
400
350
5. 精度検証方法
– 5–6
予測前(実観測データ)
•  8-fold クロスバリデーション
– 
– 
– 
80 km/h over
60-80 km/h
40-60 km/h
20-40 km/h
0-20 km/h
300
5040個のデータを学習用(4410)+検証用(630)に分割
リ 250
学習用データ:交通状態予測モデルのパラメータ推定に使用
ン
検証用データ:モデルによる速度の予測精度評価に使用
ク 200
数 150
•  検証方法
–  学習・検証用データに真値がわからない道路リンクが存在
100
–  検証用データを未観測リンク率が8割になるようランダムに欠損
50
–  欠損部を予測し,欠損させた道路の真値とその予測値を比較
0
•  精度検証イメージ
0 1 10 2 20 3
検証用データ
観測リンク
30
4
40
5
50
6
60
7
70
8
80
9
90
10100 11
欠損率(%)
未観測リンク
ランダムに
– 5–3 欠損割合を8割に
推定された
モデルで補間
欠損させた部分は
真値がわかっている
ので,予測値と比較
9月1日 13:55-14:00 データの欠損率を8割としたデータ
予測精度検証結果
予測後(実観測+予測データ)
80 km/h over
60-80 km/h
40-60 km/h
20-40 km/h
0-20 km/h
•  真値と予測値の比較
9月1日 13:55-14:00 予測結果
•  予測精度
GGMと本手法の比較
6. GGMが仮定する共分散構造
上位10%
上位20%
上位30%
対象リンク
46
•  計算時間
計算時間(hour)
30
GGM: 25時間42分
25
20
15
10
5
0
0.1
0.05
0.01
正則化パラメータρ
0.005
0.001
→ GGMと比較して学習時間が短縮し,高精度な予測が可能に
– 5–9
同心円状に共分散が小さくなる構造
Graphical Lassoが学習した共分散構造
上位10%
上位20%
上位30%
負
対象リンク
GLが推定した共分散構造の解釈に向けて
•  クラスター順に分散共分散行列を並べ替え
1. 高速道路クラスター
2
分散共分散行列をk-means法により3つのクラスターに分類
1:高速道路クラスター
2:幹線道路クラスター
3:細街路クラスター
平均速度を用いていないにもかかわらず,
3つの道路種別をそれぞれ多く含むクラスターに分類された
空間的に離れた道路の相関もデータから推定
1
GLが推定した共分散構造の解釈に向けて
3
ODや経路選択行動を反映した学習
•  クラスター分けされたネットワークの一部を抜粋
2. 幹線道路クラスター
3. 細街路クラスター
0.1 over
0.1 ~ 0.05
-0.01 ~ -0.02
-0.02 under
–  各道路種別間での関連性の強さは,種別ごとに異なる
–  並行路線を似た共分散構造を持った道路リンクとして学習
–  ODや経路選択行動の交通特性をデータから学習
7. 本研究の成果と今後の課題
•  本研究の成果!
1.  プローブ未観測リンクの補間手法の提案!
2.  ネットワーク構造を仮定するGGMによるアプローチ
とデータから共分散構造を学習するGraphical Lassoの
アプローチから予測モデルの構築を行った!
3.  部分観測データに対してEMアルゴリズムを適用し, GGM, GLのEM拡張を行った!
4.  分析者が強い仮定を置かないデータオリエンテッド
なモデリングの方がより高精度な予測が可能である
ことが示された!
5.  GLが推定した分散共分散行列の解釈可能性
•  今後の課題
–  時系列相関の考慮
–  多次元正規分布→潜在変数による混合分布
参考文献
1.  Kataoka, S., Yasuda, M., Furtlehner, C., and Tanaka, K., : Traffic
data reconstruction based on Markov random field modeling,
Inverse Problems, 30025003, 2014.!
2.  Freedman, J., Hastie, T. and Tibshirani, R., :Sparse inverse
covariance estimation with the graphical lasso, Biostatistics, 9, 3,
pp. 432-441, 2008.!
3.  Mazumder, R., and Hastie, T. : The graphical lasso: New insights
and alternatives. Electronic journal of statistics, 6, pp. 2125-2149,
2012. !
4.  Dempster, A. P., Laird, N. M., and Rubin, D. B., :Maximum
Likelihood from Incomplete Data via the EM Algorithm, Journal
of the Royal Statistical Society. Series B (Methodological), 39, 1,
pp.1-38, 1977.!
5.  花岡洋平, 原祐輔, 片岡駿, 桑原雅夫: バンコクにおける長期
間プローブデータを用いた交通状態推定とその検証, 第12回
ITSシンポジウム2014 Peer-Review Proceedings, CD-ROM,
2014.