ij - 筑波大学

Real Estate & Spatial Statistics Laboratory
重力モデルに基づく
ODフローの空間詳細化
筑波大学 大学院システム情報工学研究科
社会システム・マネジメント専攻2年
爲季和樹
Real Estate & Spatial Statistics Laboratory
Real Estate & Spatial Statistics Laboratory
背景と目的
• データの空間詳細化
得られたデータより詳細な空間単位での予測
面データ:
 面補間法
観測単位
フローデータ:
 方法論に関する研究はほぼ皆無
 フローの空間詳細化とは?
対象単位
目的 フローにおける空間詳細化の特徴を考慮
面補間法を応用した方法論を提案
2
Real Estate & Spatial Statistics Laboratory
Real Estate & Spatial Statistics Laboratory
ODフローの空間詳細化
• ケース1 都道府県間OD → 市町村間OD
• ケース2 各市町村の発生・集中量 → 市町村間OD
3
Real Estate & Spatial Statistics Laboratory
Real Estate & Spatial Statistics Laboratory
既存研究:ケース1
Boyle and Feng (2002)
• Migration and commuting data (British census 1981)
1. パラメータ推定
inter ward flows(集計ゾーン間)
y ij ~ Po (ij )
ij  exp(  0  1 ln Pi   2 ln Pj   3 ln d ij )
2. 予測
inter Enumeration District flows(詳細ゾーン間)
yˆ AB ~ Po (ˆ AB )
ˆ AB  exp( ˆ0  ˆ1 ln PA  ˆ 2 ln PB  ˆ3 ln d AB )
3. 調整
y ij   Ai  B j yˆ AB
“adjusted proportionally so that they were
constrained to aggregate back to the
known 1981 intra- and inter-ward flows”
4
Real Estate & Spatial Statistics Laboratory
Real Estate & Spatial Statistics Laboratory
分布の再生性
• 独立な確率変数 y1, y2
y1 ~ Po (1 )
⇒
詳細ゾーン間
集計
y 2 ~ Po ( 2 )
y1  y 2 ~ Po (1   2 )
 AB  exp(  0  1 ln PA   2 ln PB   3 ln d AB )
ij   Ai  B j  AB
集計ゾーン間
ij  exp(  0  1 ln Pi   2 ln Pj   3 ln d ij )
?
Boyle and Feng (2002) は分布の再生性を考慮していない
5
Real Estate & Spatial Statistics Laboratory
Real Estate & Spatial Statistics Laboratory
既存研究:ケース2
分布交通量予測(交通工学)
• 現在パターン法(e.g.フレーター法)
* D*

Dj
O
Oi
j 1
*
i
y ij  y ij
Oi D j 2   j y ij D *j / D j  i y ij Oi* / Oi





*:将来
初期値(基準値)に詳細ゾーン間のODデータが必要
• 重力モデル



無制約 y ij  kVi W j d ij

二重制約 y ij  Ai B j Oi D j d ij
パラメータ推定に詳細ゾーン間のODデータが必要
過去のODデータを利用しなければならない
6
Real Estate & Spatial Statistics Laboratory
Real Estate & Spatial Statistics Laboratory
統計学的アプローチによる
欠損値の補間
1. 対象のデータ生成過程 DGP を仮定
y ~ N ( μ, Σ )
y ~ Po ( λ)
・・・
2. モデルを構築 y  Xβ  ε
3. モデルのパラメータを推定 y obs  Xβˆ  ε
4. 観測値が与えられた下での欠損値の
条件付き期待値を用い欠損値を予測
E ( y mis | y obs )
7
Real Estate & Spatial Statistics Laboratory
Real Estate & Spatial Statistics Laboratory
ODフローの空間詳細化
• ケース1 都道府県間OD → 市町村間OD
体積保存則:
YIJ   iI  jJ y ij
条件付き期待値
E ( y ij | YIJ )
体積保存則の制約が1つ
⇒ 従来の面補間と同様の手法が適用可能
8
Real Estate & Spatial Statistics Laboratory
Real Estate & Spatial Statistics Laboratory
ODフローの空間詳細化
• ケース2 各市町村の発生・集中量 → 市町村間OD
体積保存則:
Oi   j y ij
D j   i y ij
条件付き期待値
E ( y ij | Oi , D j )
体積保存則の制約が2つ
⇒ 面データでは想定されないフロー特有のケース
9
Real Estate & Spatial Statistics Laboratory
Real Estate & Spatial Statistics Laboratory
モデル構築
y ij ~ Po (ij )
• 対象単位間フローのDGP:ポアソン分布
 ポアソン重力モデル (Flowerdew and Aitkin, 1982)
E[ y ij ]  ij  exp(  1 xi   2 x j   3 ln d ij )
 exp( X ij β )
ポアソン分布の再生性
y1 ~ Po (1 )
y 2 ~ Po ( 2 )
⇒ y1  y 2 ~ Po (1   2 )
• ケース1
• ケース2
集計ゾーン間
E[   y ij ]    exp( X ij β )
iI j J
iI j J
発生・集中量の集計モデル
E[  j y ij ]   j exp( X ij β )
E[  i y ij ]   i exp( X ij β )
10
Real Estate & Spatial Statistics Laboratory
Real Estate & Spatial Statistics Laboratory
対象単位間フローの予測
条件付き期待値の導出(ケース1)
• 集計ゾーン間フロー YIJ が与えられた下での
詳細ゾーン間フロー yij の条件付き期待値
• 確率変数 Y-ij, と yij が互いに独立で、
それぞれ Po(λ1), Po(λ2) に従う

2

P ( y ij | YIJ )  bin  YIJ ,
1   2





2
E ( y ij | YIJ )  YIJ
1   2
Mugglin et al. (1999) では Bayesian areal interpolation
でこの条件付き期待値を利用
11
Real Estate & Spatial Statistics Laboratory
Real Estate & Spatial Statistics Laboratory
対象単位間フローの予測
条件付き期待値の導出(ケース2)
• 発生量 Oi と集中量 Dj が与えられた下での
対象単位間フローの条件付き期待値
• 確率変数 yij, O-i, D-j が互いに独立で、
それぞれ Po(λ1), Po(λ2), Po(λ3) に従う

1
P ( y ij | Oi , D j )  bin  Oi ,
1   2

E ( y ij | Oi , D j ) 
 
1
bin  D j ,
 
1  3
 
Oi D j
(1   2 )( 1  3 )

 Po (1 ) 1


1
12
Real Estate & Spatial Statistics Laboratory
Real Estate & Spatial Statistics Laboratory
空間的相互作用モデルとの接点(ケース2)
• 二重制約重力モデル
y ij  Ai B j Oi D j f (cij )
y ij 
均衡因子
Ai : Oi   j y ij
Dj
Oi
 j B j D j f (cij )  i Ai Oi f (cij )
f (cij )
B j : D j   i y ij
• ケース2の条件付き期待値
E ( y ij | Oi , D j ) 

Oi
Oi
Dj
 j ij  i ij
ij
Dj
 j exp( 1 xi )  ij  i exp(  2 x j )  ij
 ij
 ij  exp(   3 ln d ij )
統計学的アプローチによる空間詳細化が可能な
二重制約型重力モデル
13
Real Estate & Spatial Statistics Laboratory
Real Estate & Spatial Statistics Laboratory
パラメータ推定法
• 一般化線形回帰モデル
E[ y ij ]  exp( X ij β )
 e.g. 反復重み付き最小二乗法
E[   yij ]    exp( X ij β )
• 本研究のモデル
iI jJ
iI jJ
 統計パッケージの標準的な関数は適用不可
MHアルゴリズム
パラメータの条件付き事後分布
 ( β | Y )   (Y | β ) ( β )
尤度関数
提案分布からサンプリング
β ( t 1)  β ( t )  z
z ~ N ( 0,  2 I )
事前分布
β ~ N ( 0,  2 I )
採択 or 棄却
 (
( t 1)
|
(t )
  (  ( t 1) ) 
)  min 
,1
(t )
  (  ) 
14
Real Estate & Spatial Statistics Laboratory
Real Estate & Spatial Statistics Laboratory
MCMCによる推定
• MCMCのメリット:複雑な関数形でもコーディングが容易
• MCMCのデメリット:テクニックが必要
パラメータの事前分布
β ~ N (0,  2 I )
提案分布
β ( t 1) ~ N ( β ( t ) ,  2 I )
分散が小:局所的な探索になる
分散が大:採択されにくくなる
収束に時間がかかる
15
Real Estate & Spatial Statistics Laboratory
Real Estate & Spatial Statistics Laboratory
実証分析にむけて
使用するデータ
• H22国勢調査 人口移動集計(2005 → 2010)
茨城県内市町村間人口移動(44市町村間)
• 説明変数
H17国勢調査 市町村別人口
市町村役所間のユークリッド距離(km)
• 内々データを抜いて推定が安定するかチェック
(ケース2)
16
Real Estate & Spatial Statistics Laboratory
Real Estate & Spatial Statistics Laboratory
参考文献
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Behrens, K., Ertur, C., and Koch, W.: ‘Dual’ gravity using spatial econometrics to control for multilateral resistance, Journal
of Applied Econometrics, Vol.27, pp.773–794, 2012.
Boyle, P. and Feng, Z.: A method for integrating the 1981 and 1991 British census interaction data, Computers, Environment
and Urban Systems, Vol.26, pp.241–256, 2002.
Chagneau, P., Mortier, F., Picard, N., and Bacro, J.: A hierarchical Bayesian model for spatial prediction of multivariate nongaussian random fields, Biometrics, Vol.67, pp.97–105, 2011.
Christensen, O.F. and Waagepetersen, R.: Bayesian prediction of spatial count data using generalized linear mixed models,
Biometrics, Vol.58, pp.280–286, 2002.
Christensen, O.F., Roberts G.O., and Skold M.: Robust Markov Chain Monte Carlo methods for spatial generalized linear
mixed models, Journal of Computational and Graphical Statistics, Vol.15, pp.1–17, 2006.
Flowerdew, R. and Aitkin, M.: A method of fitting the gravity model based on the Poisson distribution, Journal of Regional
Science, Vol.22, pp.191–202, 1982.
Gotway, C.A. and Stroup, W.W.: A generalized linear model approach to spatial data analysis and prediction, Journal of
Agricultural, Biological, and Environmental Statistics, Vol.2, pp.157–178, 1997.
Head, K. and Mayer, T.: Non-Europe: the magnitudeand causes of market fragmentation in the EU, Weltwirtschaftliches
Archiv, Vol.136, pp.284 – 314, 2000.
LeSage, J.P. and Pace, R.K.: Spatial econometric modeling of origin-destination flows, Journal of Regional Science, Vol.48,
pp.941–967, 2008.
McCulloch, C.E.: Maximum likelihood algorithm for generalized linear mixed models, Journal of the American Statistical
Association, Vol.92, pp.162–170, 1997.
Mugglin, A.S., Carlin, B.P., Zhu, L., Conlon, E.: Bayesian areal interpolation, estimation, and smoothing: an inferential
approach for geographic information systems, Environment and Planning A, Vol.31, pp.1337–1352, 1999.
Paciorek, C.J.: Computational techniques for spatial logistic regression with large data sets, Computational Statistics & Data
Analysis, Vol.51, pp.3631–3653, 2007.
Rosenthal, J.S.: Optimal proposal distributions and adaptive MCMC. In Brooks S., Gelman A., Jones G.L., Meng X. (eds.)
Handbook of Markov Chain Monte Carlo. Chapman & Hall/CRC, Florida, pp.93–112, 2011.
瀬谷創,堤盛人:空間統計学―自然科学から人文・社会科学まで―,朝倉書店,2014.
総務省統計局:平成22年国勢調査 移動人口の男女・年齢等集計結果 結果の概要,http://www.stat.go.jp/
data/kokusei/2010/idou1/pdf/gaiyou.pdf,2012.
17
村上大輔,堤盛人:Kriging を用いた実用的な面補間法,GIS-理論と応用,Vol.19, pp.59 – 69, 2011.
Real Estate & Spatial Statistics Laboratory