状態空間モデルと時系列モデルの比較検討

交通量の分析
交通量分析における状態空間
モデルと時系列モデルの比較
• 北川の提案する状態空間表現による時系列
モデルによる日交通量の分析
– トレンド,曜日変動,自己回帰,ノイズ
• 北川らの提案するベイズ型時系列モデルを2周期に拡
張して時間交通量の分析
– トレンド成分,1週間周期の変動,1日周期の変動,及びノイ
ズに分解
• 時系列モデルの適用
山梨大学 鈴木康平 佐々木邦明
– SARIMAモデルとGARCHモデルの併用
データ概要
交通量の自己相関性
kotsuryo
3000
1000
1000
2000
3000
4000
5000
5000
(台)
2006/4/1~2010/2/28の中央自動車道八王子IC→河口湖IC間
(下り)の日交通量
トレンドや周期的な変動を除去するために階差を取って定常化
0
200
400
600
800
Time
1000
1200
1400
(日)
自己相関係数
交通量の偏自己相関係数
交通量
自己相関係数
上図:全期間(4年)
下図:はじめの1ヶ月間
•
•
(日)
時間の経過と共に関係性が薄れていく
周期的に関係性の強い時点が現れる
6,7,8(の倍数)で影響大
3,4,5(の倍数)で影響小
⇒1週間前,同じ曜日で関係性が強い
4年間の推移
30日間の推移
6
(日)
状態空間モデル(日交通量)
•
•
–
日交通量の状態空間モデル
•
∑
•
∑
•
∑
トレンド(階差1)
曜日成分(周期7)
自己回帰(有色ノイズ)
推計精度
3000
2000
1000
estimate value
4000
5000
日交通量の成分分解
・
・・
・
・・・・
・・
・・
・
・
・
・・・・
・・・
・・・・
・・・
・・・・
・
・
・
・
・・
・・・・・
・・・・
・・・・・
・・・・
・・・・・
・
・
・
・
・・
・・・・・・
・・・・
・・・・・
・・・・・
・・・・・
・
・
・
・
・・・
・・・・・
・・・・・
・・・・・
・・・・・
・・・・
・
・
・
・・・・・
・・・・
・・・・・
・・・・
・・・・・
・・・・
1000
2000
3000
4000
・
・・
一日あたりの平均誤差
最大誤差
誤差の標準偏差
r²
ρ²
5000
4.6152
‐40.7169
6.6971
0.99994
0.99972
data
時系列モデル
• SARIMAモデル
– ARIMA(p,d,q)モデルと、季節(周期)階差(周期的変動)に関する
ARIMA(P,D,Q)モデルを組み合わせる.周期分の階差を取って周
期変動を取り除いた時系列にARIMAモデルを適用
• GARCHモデル
– GARCHモデルは時間経過により、誤差の平均や分散が変化す
る系列を説明するモデル
–
残差の変動
時系列モデル SARIMAとGARCH
•
•
•
~
0,1
∑
∑
(ボラティリティ)
モデルの推定結果
‐500
‐1000
残差の発生要因
残差
2141.8220
1652.2370
1610.4940
1526.4100
1525.9380
1459.4820
1458.1580
1433.4320
1410.6260
1392.8420
1380.7110
1305.7140
1274.4360
1190.4710
1177.0300
1175.6090
1169.0380
1156.4190
1128.4160
1120.5990
1095.8060
1064.8780
1054.1140
1040.4250
1033.9860
1023.5250
1012.0510
2000
1500
0
0
500
500
155996
-10533
21087
天気八河 ryo
晴晴
5199
晴晴
4548
晴晴
3799
晴晴
3944
晴晴
5030
晴晴
5245
晴晴
3843
晴晴
3915
晴晴
4836
雲晴
4489
晴晴
2591
晴雲
3708
雲雲
2845
晴晴
3659
晴晴
3002
晴晴
3037
晴晴
3161
晴晴
3432
晴晴
3333
雲晴
3686
晴晴
4199
晴晴
3392
晴晴
3183
晴晴
2883
雲晴
4467
晴晴
4212
晴晴
3750
kotsuryo2.sarima$residuals
1000
18
曜日
日
日
水・祝
日・祝
月・祝
日・祝
火・祝
金
土
月・祝
日
水・祝
月・祝
金
水
日
金・祝
日
日
日・祝
日
月・祝
火・祝
日
土
日・祝
日
(台)
2000
1500
パラメータのt値やAIC
(赤池情報量基準)など
によって次数を決定
符号
+:この時点の交通量(残差)多→当日の交通量多
-:この時点の交通量(残差)多→当日の交通量少
day
2009/11/15
2010/1/10
2009/4/29
2007/2/11
2009/5/4
2009/5/3
2009/11/3
2009/5/1
2009/5/9
2009/9/21
2007/1/7
2007/5/2
2007/7/16
2009/1/2
2008/1/2
2009/1/11
2009/3/20
2009/4/26
2006/11/12
2008/5/4
2008/11/2
2009/11/23
2008/9/23
2009/3/15
2006/7/15
2008/11/23
2007/4/29
• SARIMA(1,1,2)(3,1,3)7の残差
1000
曜日の影響を考慮して
周期sは7,階差数d,Dは
1
‐1500
-500
残差の分散
最大対数尤度
AIC
推定値 標準誤差
0.200
0.075
-0.636
0.076
-0.245
0.060
-0.330
0.033
-0.918
0.025
0.060
0.030
-0.564
0.022
0.631
0.019
-0.936
0.027
-1000
SARIMA(1,1,2)(3,1,3)7
(1日前の交通量)
(1日前の残差)
(2日前の残差)
Φ (1週間前の交通量)
Φ (2週間前の交通量)
Φ (3週間前の交通量)
Θ (1週間前の残差)
Θ (2週間前の残差)
Θ (3週間前の残差)
-1500
SARIMA(1,1,2)(3,1,3)7
残差の分析
0
50
100
150
200
(週間)
Time
最大誤差
一日あたりの平均誤差
誤差の標準偏差
自由度調整済み決定係数r^2
2141.822
393.857
393.982
0.711
2009(H21)/3/28~
休日特別割引の導入
(料金半額,上限千円)
19
この前後で変動幅が異なる
GARCHモデルの推定結果
残差に対して標準的なGARCH(1,1)モデルをあてはめる
day
2007/1/6
2009/10/25
2009/8/15
2007/5/6
2008/2/3
2009/5/17
2009/12/5
2009/1/9
2009/5/6
2007/9/6
2009/8/30
2009/11/24
2008/6/29
2009/5/24
曜日
土
日
土
日
日
日
土
金
水・祝
木
日
木
日
日
天気八河 ryo
残差
雨雪
1406 -1407.3020
雲雲
2398 -1251.9270
晴晴
3490 -1251.2470
雨雨
1361 -1185.6170
雪雲
426 -1156.9620
雲晴
2437 -1151.9730
雲雨
2551 -1110.5420
雨雪
925 -1083.5690
雲雲
1849 -1066.0740
雲雨
984 -1060.7700
雲雲
3050 -1033.4400
雲雲
1919 -1023.7860
雨雲
1543 -1012.5280
雲雲
2315 -1004.9420
garch(1,1)
推定値
標準誤差
-1.339
9.051
(定数項)
(定数項)
77440
7945
(1日前の残差の2乗)
0.404
0.056
(1日前のボラティリティ)
0.141
0.058
最大対数尤度
-10494
式にすると…
=‐1.339+
E(
)=
=77440+0.404
+0.141
まとめ
(台 )
ボラティリティの推定値
2009(H21)/3/28~
休日特別割引の
導入後に大きく
なっている
→トレンドからの
変動が大きくなった
• SARIMAモデルによる交通量のモデル化は,
状態空間モデルと比較して大きな残差が出る
– 天候等による変動が影響する
• ボラティリティは先のモデルと同様に,休日特
別割引以降の拡大を示した
平均は2008年度から
2009年度で34.2%拡大
交通量の変動が大きく
なり所要時間の信頼性が
低下している可能性がある
(日)
平均
最大
最小
分散
2006
2007
143394
144884
1061428
802091
90121
90554
1.15E+10 9.62E+09
2008
157018
687462
90228
1.04E+10
2009
210746
1975416
90654 (台 )
4.26E+10
22