(小田急電鉄):決定木をもちいた列車遅延原因の分析

平成 27 年電気学会産業応用部門大会
5-27
決定木をもちいた列車遅延原因の分析
学生員
増間義樹∗
非会員
落合
康文∗∗
正
員
富井
規雄∗∗∗
Analysis of the Causes of Train Delays based on Decision Trees
Yoshiki Masuma∗ , Student Member, Yasufumi Ochiai∗∗ , Non-member, Norio TOMII∗∗∗ , Member
In urban railways, trains are running densely. Thus, once there occurs delay, even if it is small, the delay easily
propagates to other trains and the delay tends to expand. In order to regain punctuality, railway companies are now
making various kinds of efforts. In this process, it would be helpful if we can know what is a good driving, in other
words a driving which reduces delays and what is a bad driving meaning a driving which increases delays. If we can
know the difference between ”good” and ”bad” driving, we can give pieces of advice to drivers to drive better. Our
algorithm intoduced in this paper detects the factors which discriminate ”good” and ”bad” driving. The input of our
algorithm is the records of track occupation. Our algorithm is designed based on the decision tree and by giving the
”bad” examples and ”good” examples, it produces the factors which are influencial to devide the two groups.
キーワード:鉄道, 軌道回路, 決定木
Keywords: railway, track circuit, decision tree
1.
一方で,現状の各種データを分析することにより,現状に
はじめに
おいて列車運行上の問題となっている課題を洗い出し,改
都市圏の鉄道においては,利用者の需要に応えるために,
善策を講じるというアプローチもありうる。さらに,同様
列車が稠密に運転されている。そのため,小規模の遅延で
の状況でありながら問題をうまく解決しているケースがあ
あっても,それが後続の列車に容易に伝播する傾向がある。
るのであれば,それを探し出すことで,問題を解決する手
例えば,ある列車のある駅での停車時間がなんらかの理由
がかりとすることができると考えられる。
によって超過したとき,後続の列車が駅の手前で停止する
本稿では,後者のアプローチを取ることで,列車運行上発
こととなってしまい(機外停止)
,これによる減速・加速に
生している問題を解決することを試みる。具体的には,列
かかる時間のロスから,駅間で停車している時間の分だけ
車の日々の運行実績データから,各軌道回路の落下時刻,こ
後続列車が遅れることとなり,遅延が拡大することとなる。
う上時刻を取得し,そこから,列車の遅延に着目して,軌
そして,これは,さらに後続の列車に波及する 。
道回路から得られた列車の日々のデータを「望ましい運転
(1)
そのため,鉄道会社には小規模のダイヤ乱れの発生を抑
が行なわれたケース」
「望ましくない運転が行なわれたケー
え,遅延の拡大・波及を防ぎたいという考えがあり,機外停
ス」に分類する。その分類されたデータに対して教師あり
止をなるべく避けるなどして定時性を向上するために,列
学習の手法の一つである決定木を適用することにより,分
車ダイヤの改善,設備(信号・軌道・車両等)の改善,適
類に寄与した因子の特定を行なう。これにより,
「望ましい
切な機外停止位置の指定,運転士に対する操縦方法の指示
運転」
「望ましくない運転」を決定づける運転方法の差異を
などを行なっている。
見いだす。
このような施策がどのような効果を挙げているのかを分
2.
析するために,現実的な運転士の取扱を考慮したマイクロ
軌道回路占有情報
シミュレーションを用いて分析を行なう研究 (2) や,列車運
軌道回路とは,一定区間内のレールを電気回路の一部と
行の可視化を行うことで遅延の発生や波及状況の分析を行
して利用し,車両が回路に進入した際に,その車輪を利用
なう研究 (3) (4) (5) が提案されている。
して二本のレールを短絡することにより,電気回路が短絡
∗
し,列車を検知することができる回路のことである。軌道
千葉工業大学大学院 情報科学専攻
Graduate School of Information and Computer Science, Chiba
Institute of Technology
∗∗∗
∗∗
回路に列車が進入したことを「
(軌道回路の)落下」
,列車が
回路から進出したことを「
(軌道回路の)こう上」
,と呼ぶ。
千葉工業大学 情報科学部 情報工学科
軌道回路で検知した落下時刻やこう上時刻のデータは,信
Department of Computer Science, Faculty of Information and
Computer Science, Chiba Institute of Technology
号機の現示などの状況とともに,データとして保存される。
本研究では,これら軌道回路の落下時刻,軌道回路のこ
小田急電鉄(株)
Odakyu Electric Railway Co. Ltd.
う上時刻等を記録したデータを用いる。以下,このデータ
[ V - 227 ]
Ⓒ 2015 IEE Japan
平成 27 年電気学会産業応用部門大会
5-27
を待ってから後続列車が信号機 X を通過すれば,後続列車
を「軌道回路占有情報」と呼ぶこととする。
3.
は注意信号現示を見てこの信号機を通過することができ,
列車の運転方法に起因する遅延の増大
速度を上げることができるため,遅延を吸収できる可能性
本稿では,駅間で 2 本の列車が比較的接近して走行する
がある。しかし,他方で,後続列車の運転士が信号機 X の
場合の後続列車の運転方法の差異による,後続列車の前方
現示が変化することを予測して,そこに至るまでの走行速
駅到着遅延の違いの原因を分析の対象とする。
度を低く押さえた運転をした場合には,その手前での低速
Fig.1 の点線のように,先行列車に遅延が発生したことに
より,後続列車がさらに遅延した場合と,Fig.2 のように,
運転が原因となって,かえってこの駅への到着が遅れてし
先行列車は遅れたが後続列車への遅延の伝播が抑えられた
は遅延を吸収するためには,その時の状況に応じた適切な
場合を考える。
運転をすることが必要である。
まう可能性もある。すなわち,遅延の伝播を防ぐ,あるい
Fig. 3. A 駅配線図
Fig. 1. A-B 駅間で遅延が発生し,遅延が伝播
Fig. 4. 後続列車が警戒信号で進入
Fig. 2. A-B 駅間で遅延が発生したが,遅延は伝播し
ていない
A 駅の配線が Fig.3 のようになっているとする。今,上
り線(図の左側への方向)において,先行列車が引上線に進
Fig. 5. 後続列車が注意信号で進入
入しきる前に後続列車が進入してくると,Fig.4(上り方向
の配線のみ示す)に示すように,後続列車は警戒信号現示
で A 駅に進入することとなるため,速度を上げることがで
そのため,どのような運転方法が適切であるかの分析を
きず,結果的に駅への到着が遅れてしまう場合がある。一
行なうためには,列車の駅間での挙動や信号現示のデータ
方,Fig.5 に示すように,先行列車が引上線に進入しきるの
が必要となる。
[ V - 228 ]
Ⓒ 2015 IEE Japan
平成 27 年電気学会産業応用部門大会
5-27
4.
している。同様に X1 <= 45 ではない場合は,X2 < 25
決定木分析による列車遅延原因の分析
〈4・1〉 決定木分析と CART 法
がデータ群 bad の分類に最も寄与した因子であることがわ
決定木分析とは,教
かる。
師あり学習の一つであり,樹木状のモデルを用いて,何ら
かの結果が記録されたデータセットを分類することで,そ
の結果に影響を与えたであろう要因の分析を行ない,その
分類結果を利用し,分析を行なう手法である。
決定木分析は,出力を木構造で視覚的に出力することが
できる。分類に寄与した因子の特定を行う際に,決定木分
析の手法として CART 法を用いる。CART 法は決定木によ
る分類アルゴリズムのうちの一つであり,目的変数といく
つかの説明変数があるときに,枝を分岐させることによっ
Fig. 6. 決定木の例
て,分岐後のそれぞれの枝の純度が増加するような分岐点
を探し出すことにより分類を行なう。
また,CART 法は,二分岐の決定木であるため,ユーザー
が結果を見た際に視覚的にも,どの地点が分類に寄与した
因子かの特定が行ないやすいという特長がある。
順
決定木は教師あり学習であるた
め,入力されるデータを何かの指標で分けておく必要があ
る。本稿では,列車が稠密に運転される区間で,先行列車
と後続列車があったときに,手前の駅での列車間隔がほぼ
〈4・2〉 決定木をもちいた列車遅延原因の
同じであるにもかかわらず前方駅に到着したときには列車
分析アルゴリズム
〈4・2・1〉 入力データ
〈4・2・3〉 手
入力である軌道回路占有情報
は,次の情報を含んでいる。
間隔が開いてしまった場合と,列車間隔が開かなかった場
合の2パターンに分けておく。
軌道回路占有情報のうちの先行列車と後続列車の軌道回
• 列車番号
• 軌道回路名称
• 軌道回路の落下時刻
• 軌道回路のこう上時刻
路の占有時間を使用することで,先行列車に問題があるの
か後続列車に問題があるのかを判断しつつ,走行方法に問
題のある区間の特定を行なうことができる。
軌道回路占有情報から先行列車と後続列車のペアを見つ
5.
け出し,軌道回路のこう上時刻から落下時刻を減算するこ
とにより,各軌道回路の占有時間を求め,Table1 のような
フォーマットに変換する。Xn(n=1.2.3...) は軌道回路の占有
時間である。
実 行 例
〈5・1〉 対象線区
対象とする線区は B 駅から A 駅
(Fig.3)間の上り線とした。また,使用するデータは,2013
年 6 月 1 日から 2013 年 7 月 31 日までの朝のラッシュ時
の列車のペアであり,横軸を B 駅を出発した時間の差,縦
軸を A 駅に到着した時間の差で散布図を作成すると Fig.7
Table 1. 各軌道回路の占有時間とデータの区別
列車番号
X1
X2
...
good or bad
1001 and 1002
50
60
...
good
2020 and 3012
40
45
...
good
3010 and 1051
68
72
..
bad
3017 and 1051
77
81
..
bad
..
..
..
..
..
のようになり,A 駅に到着した時間の差がおおむね 130 秒
以下では,A 駅に到着する時間の差が縮まらないことがわ
かる。
実際に使用するのは Xn(n=1.2.3...) と good,bad の区分
のみである。
〈4・2・2〉 出力の例
例として,データ群 good(50 例)
とデータ群 bad(60 例) を入力として与えたときに,Fig.6 の
ような決定木が生成されたとする。
決定木分析の結果から得られる分析モデルは,影響力の
強い要素から順番に親ノードから子ノードへとデータ群が
分類される形で表現される。そのため,Fig.6 の場合では,
X1 が最も分類に最も大きな影響を与えた要素であること
がわかり,そのうち,X1 <= 45 の場合は,X5 < 30 が
データ群 good の分類に最も寄与した因子であることを示
[ V - 229 ]
Fig. 7. B 駅の出発時刻の差と A 駅の到着時刻の差の
散布図
そこで,B 駅に列車が到着した時間の差が最も縮まって
Ⓒ 2015 IEE Japan
平成 27 年電気学会産業応用部門大会
5-27
いるような運転をされている列車のある Fig.7 の赤い四角
の地点である,B 駅を出発した時刻の差がおおむね 130 秒
であるデータに対して,A 駅の到着時刻の差が開いていな
いものをデータ群 good,到着時刻の差が開いてしまってい
るものをデータ群 bad とする。
なお,データ群 good のデータの個数は 49 個,データ群
bad のデータの個数は 55 個である。
Fig.8 の結果が得られた。
Fig.8 を見ると,X21 <= 48.5 かつ,X5 > 16.5 かつ,
X20 <= 31.5 の場合に,データ群 bad は 3/55 ,データ群
good は 33/49 に分類できることがわかる。よって,望ま
しい運転を行うためには X21 と X20 の値を小さくし,X5
の値を大きくするとよいことがわかる。決定木の出力結果
と軌道回路名の対応は Table2 のようになっている。すなわ
ち,後続列車は軌道回路 8T と軌道回路 7T を高速で走行し,
先行列車は軌道回路 3T は低速で走行するとよいと解釈で
きる。
Table 2. 軌道回路名称との対応
決定木の出力結果 軌道回路名称
列車の番号
X5
3T
1
X19
6T
2
X20
7T
2
X21
8T
2
データ群 good のデータのひとつを Fig.9 に,データ群
bad のデータのひとつを Fig.10 に示す。横幅を軌道回路の
落下時刻からこう上時刻,縦幅を終着駅から各軌道回路の
距離とする長方形を,終着駅から軌道回路境界までの距離
Fig. 8. CART で生成された決定木
の位置に表示している。
Fig.9Fig.10 を見ると,後続列車の 8T・7T の軌道回路の
占有時間が,データ群 good よりデータ群 bad のほうが伸
びていることが確認でき,これは,決定木による分析結果
と一致している。
6.
おわりに
本研究では,長期間に渡る軌道回路の落下・こう上時刻
のデータをもとに,各軌道回路の占有時間を求め,
「望まし
い運転が行なわれたケース」と「望ましくない運転が行なわ
れたケース」に分類した後,決定木をもちいてその分類に
寄与した因子の特定を行なうことを試みた。その結果,そ
の差異を決定づけていると考えられる理由を発見すること
Fig. 9. データ群 good の一例
ができた。引き続き,他の事例についても提案手法を適用
し,有効性を確認していく。
なお,本研究は科研費(24510199)の助成を受けたもの
である。
文
Fig. 10. データ群 bad の一例
〈5・2〉 結
果
CART 法で決定木を生成すると,
[ V - 230 ]
献
( 1 ) 富井規雄著:「鉄道ダイヤのつくりかた」,オーム社,2012 年.
( 2 ) 落合康文,富井規雄:
「運転士の取扱を考慮したマイクロシミュレー
ションによるラッシュ時の列車運行の分析」,電気学会 交通・電気
鉄道研究会,2014 年 10 月.
( 3 ) 山村明義,足立茂章,牛田貢平,富井規雄:
「首都圏稠密運転路線に
おける遅延改善策の検証」,J-Rail2012-第 19 回鉄道技術連合シンポ
ジウム,2012 年 12 月.
( 4 ) 山村明義,足立茂章,牛田貢平,富井規雄:
「首都圏稠密運転路線に
おける遅延改善策―東京地下鉄東西線での実施例とその検証結果」
,
電気学会交通・電気鉄道研究会,2012 年 10 月.
( 5 ) 増間義樹, 富井規雄,落合康文:「軌道回路占有情報の可視化によ
る詳細な列車運行状況の把握」,平成 26 年電気学会全国大会, 2014
年 3 月.
Ⓒ 2015 IEE Japan