VII. 空間モデル

VII. 空間モデル
VII. 空間モデル
VII-1 空間モデルとは何か
空間操作,空間解析で得られる,空間パターンに
関する知識に基づいて作られる,空間現象を記述す
るための数理的モデル
VII. 空間モデル
空間モデルの分類法
1) 理論的モデル
理論的に妥当であると思われる行動や現象の仮説
を置き,それに依拠して演繹的に構築するモデル
2) 記述的モデル
現象から得られるデータを分析し,それを適切に記
述する方法を帰納的に構築するモデル
VII. 空間モデル
1) 決定論的モデル
現象が行動原理や理論によって完全に記述されて
いるモデル
2) 確率論的モデル
現象のうち,行動原理や理論によって記述され内
部分が残されており,それを確率的変動として記述
するモデル
VII. 空間モデル
ここでは,確率論的モデルのみを取り上げる.空間
モデルにはこれ以外の範疇に含まれるものもあるが,
我々が身近に接するモデルの多くは確率論的モデ
ルである.理論的モデルと記述的モデルについては,
ここではその両方を取り上げる.
VII. 空間モデル
モデル構築の一般論
1) 理論的に適切と思われる統計的モデルを考える.
2) 得られているデータから,モデルのパラメータを推
定する.
3) 推定されたパラメータの有意性を検討する.
4) 複数のモデルを考えている場合には,その中から
最も適切なものを選択する.
VII. 空間モデル
空間モデルの例
1) 空間回帰モデル
2) 空間選択モデル
3) 点パターン過程
4) 空間拡散過程
・
・
VII. 空間モデル
空間モデルは,分野ごとにはそれぞれ開発が行わ
れてきたが,その一般化はそれほど進んでいるとは
いえない.空間モデルの研究は現在も途上である.
そのため,空間モデルをきちんと体系的に説明す
ることは極めて困難である.
VII. 空間モデル
VII-2 空間回帰モデル
点,線,面の各オブジェクトに付随する属性を記述
するモデル.理論的モデルというよりも記述的モデル
である.
例:各空間集計単位における作物の単位面積当たり
収量を,各空間集計単位の気温や標高,雨量などで
説明する.
VII. 空間モデル
領域:S1, S2, …, Sn
領域iに与えられている被説明変数:yi
領域iに与えられている説明変数:xi1, xi2, …, xip
yiを,xi1, xi2, …, xipで説明したい!
VII. 空間モデル
VII-2.1 (通常の)重回帰モデル
 1 x11
 y1 

 
 1 x21
 y2 
Y  X


 
y 
1 x
n1
 n

とおき,
Y  Xβ  ε
とする.
x12
x22
xn 2
x1 p 

x2 p 



xnp 
定数項相当分
 0 
 
 1 
β   2 
 
  
 
 p
VII. 空間モデル
ここで,eは確率的に変動する誤差項であり,期待
値0かつ各iについて独立に同一の確率分布に従うも
のとする.即ち,
Eε  0
 
Vε   E εε T
  2In
と仮定する.
 2
0





2
0



VII. 空間モデル
この仮定の下では,XとYが与えられれば,通常最
小自乗法(ordinary least squares)によってを推定
し,YをXによって説明するモデルが得られる.即ち,


ˆβ  XT X 1 XT Y
である.さらに,eの分散の推定値は,
n
ˆ 2 
となる.
2
ˆ


y

y
 i i
i 1
n   p  1
VII. 空間モデル
モデル推定の有意性を統計的に議論するには,e
が正規分布に従うという仮定を追加する.すると,パ
ラメータの各成分についてt値が計算され,それら
が検定に用いられる.
VII. 空間モデル
VII-2.2 (一般)重回帰モデル
通常の重回帰モデルでは,誤差の確率分布に独立
性,同一性を仮定する.この仮定は非常に強く,特に,
空間に分布するデータに対しては成立することは稀で
ある.実際例えば,隣接する領域の値における誤差は
強く相関していることが多い.
VII. 空間モデル
(一般)重回帰モデル
Y  Xβ  ε
仮定
Eε  0
 
Vε   E εε T
2
 112  122
 1n 
 2
2
2 
 21  22
 2n 


C



 2
2
2 
 nn 
 n1  n 2
VII. 空間モデル
2番目の仮定は,回帰式の誤差項が互いに相関し
ていることを表しており,行列Cは分散共分散行列と
呼ばれる.相関が強ければ,共分散は大きくなる.
これらの仮定の下では,パラメータベクトルは一
般最小二乗法(generalized least squares)によって
推定される.即ち,


ˆβ  XTC1X 1 XTC1Y
である.
VII. 空間モデル
この推定は,一見簡単そうであるが,実はそうでは
ない.推定には分散共分散行列Cが必要であり,こ
の値は普通は分からない.そのため,パラメータベク
トルと分散共分散行列Cをどちらも推定しなければ
ならない.
推定にはいくつかの方法があるが,最も良く用いら
れるのはバリオグラムを利用する方法である.
VII. 空間モデル
推定の手順
1) 通常の回帰モデルを適用し,Yの推定値を算出す
る.そして,その残差のバリオグラムを作成する.
2) 得られたバリオグラムに対して,適当な理論モデ
ルを適用し,それに基づいて分散共分散行列C
を推定する.
VII. 空間モデル
2) のバリオグラムは,領域間の距離を説明変数,
Yの推定値の残差の共分散を被説明変数とするもの
である.
VII. 空間モデル
3) 推定された分散共分散行列Cを用いて,一般最小
二乗法によりパラメータベクトルを推定し,その
残差分布を求める.
4) 2)と3)の過程を,残差が十分小さくなるまで繰り返
し,最終的な結果を採用する(収束計算).
VII. 空間モデル
VII-2.3 空間誤差モデル(Spatial Error Model:
SEM)
(一般)重回帰モデルでは,分散共分散の構造が通
常の重回帰モデルと比べて大きな自由度を持つよう
になる.しかしそれでも,(一般)重回帰モデルでは以
下の仮定が置かれていることになる.
誤差分布の分散共分散は,空間的な距離の連続
関数として表すことができる(距離のみに依存する).
VII. 空間モデル
この仮定は必ずしも妥当であるとはいえない.そこ
で,この仮定を要求しないモデルが必要となり,それ
に応えるものの一つが空間誤差モデルである.
VII. 空間モデル
空間誤差モデル
Y  Xβ  U
U  WU  ε
Y:被説明変数
X:説明変数
U:構造的に決定される誤差を表す項
W:領域間の距離を表す距離行列
e:ランダム誤差を表す項
:定数項
VII. 空間モデル
距離行列
d1n 
 0 d12
d

0
d
2n 
W   21





0 
d n1 d n 2
VII. 空間モデル
ランダム誤差に関する仮定
Eε  0
 
Vε   E εε T
  2In
 2
0





2
0



VII. 空間モデル
空間誤差モデルの意味
Y  Xβ  U
この項だけ見れば,通常の重回帰モデルと同じ
である.つまり,被説明変数Yを説明変数Xを用
いて表し,そこに誤差Uが加わっている.但し,誤
差Uが独立・同一の確率分布に従うのではなく,
ある構造によって決定されるという点が異なる.
VII. 空間モデル
U  WU  ε
この式のうち,Uの一つを書き下してみよう.
ui   d i1u1  d i 2u2  
  d i ,i 1ui 1  d i ,i 1ui 1  
  d i ,n1un 1  d inun   e i
VII. 空間モデル
ここから分かるとおり,上の式は,誤差uiがそれ
以外の誤差u1,u2,…, ui-1, ui+1, …, un-1, unとラン
ダム誤差によって決定されることを表している.
つまり,各領域の構造誤差は互いに影響し合っ
ており,その影響の仕方は領域間の距離(距離行
列W)によって規定されている.
VII. 空間モデル
空間誤差モデルは,一種の同時自己回帰モデ
ル(SAM:Simulnateous Autoregressive Model)で
ある.これは,二つの式を合わせると理解しやす
い.
VII. 空間モデル
Y  Xβ  U
 Xβ  WU  ε
 Xβ  W Y  Xβ   ε
 I  W Xβ  WY  ε
被説明変数Yは,各領域の説明変数X((XW)X)と,各領域の周辺におけるY(WY)に
よって決定される.この後者,つまり,周辺におけ
るYの値が含まれていることが,「自己」回帰の性
質を表している.
VII. 空間モデル
U  WU  ε
この式より,Uの分散共分散行列は陽に表される.

VU   E UU T


I  W   
 I  W  Eεε I  W  
 I  W   I I  W  
  I  W  I  W 
 E I  W  εε
1
1
1
2
1 T
T
1 T
T
2
T
1 T
1
VII. 空間モデル
空間誤差モデルにおいて,未知のパラメータは,,
である(UはWと,が与えられれば前式によって
定まる).これらの推定には,通常,Uが分散共分散
行列V[U]を持つ正規分布に従うという仮定を置く.
この仮定は,空間誤差モデルの基本式
Y  Xβ  U
が(一般)重回帰モデルに従うと考えるのと同値である.
VII. 空間モデル
推定の手順
1) 通常の重回帰モデル(Y=X+e)を適用し,の推
定値を算出する.
2) 1)で得られたを用い,尤度を最大化するとを
計算する.
VII. 空間モデル
3) 空間誤差モデル(Y=X+U)を適用し(ここで,Uは
分散共分散行列V[U]を持つ正規分布に従うと考
える),それに基づいての新たな推定値を算出
する.
4) 2)と3)の過程を,,,の推定値が十分に安定
するまで繰り返し,最終的な結果を採用する(収
束計算).
VII. 空間モデル
空間誤差モデルと対比されるモデルとして,空間自
己回帰モデル(Spatial Autoregressive Model:
SAM)がある.これは,ある地点における被説明変
数の値Yが他の領域の値から受ける影響を明示的
に組み込んだモデルである.
VII. 空間モデル
そして,空間誤差モデルと空間自己回帰モデルを
統合するモデルが空間回帰モデル(Spatial
Regressive Model: SRM)である.このモデルでは,
被説明変数を説明する構造において,被説明変数と
誤差の両方に自己回帰的(この場合には空間的)構
造が組み込まれている.
VII. 空間モデル
VII-2.4 一般線形モデル(Generalized Linear
Model: GLIM)
これまで扱った三つのモデルでは,被説明変数は
連続的に無限の値域を取りうることが前提となってい
る.しかし,GISデータの中には人口や世帯数など,
整数値しか取らない個数データや,正値しか取らない
密度データなども多い.これらのデータにも対応する
モデルが一般線形モデルである.
VII. 空間モデル
被説明変数が個数を表す場合
・・・値域は正の整数値に限定されるため,被説明
変数Yを対数変換
Y'  log Y
する.これは,値域を拡大するだけでなく,誤差項
の等分散性を確保する意味でも極めて有効であ
る(通常,Yが大きいほど誤差の分散も大きい).
VII. 空間モデル
被説明変数が比率を表す場合
・・・値域は0~1に限定されるため,被説明変数Y
をロジスティック変換
 Y 
Y'  log 

1 Y 
した上で,Y‘を被説明変数とする回帰分析を行う.
VII. 空間モデル
これらの変数変換を統一的に理解し,理論的枠組
みを与えるモデルが一般線形モデルである.これは,
被説明変数Yが指数型分布族(正規分布,Poisson
分布,二項分布など)に従い,その期待値mの関数
g(m)が説明変数Xの線形関数Xと表されるモデルを
指す.即ち,
Y~指数型分布族
である.
EY  μ
g μ  Xβ
VII. 空間モデル
なおここで,期待値mの関数g(m)は対数変換やロジ
スティック変換などの変数変換に相当し,関数g(m)は
連結関数link functionと呼ばれる.
VII. 空間モデル
一般線形モデルの例
通常の重回帰モデル Y=X+e
これは,Yが期待値Xの正規分布に従っていると
考えるモデルであり,連結関数g(m)=mである.
VII. 空間モデル
Poisson回帰モデル Y~Poisson(exp(X))
個数データYを被説明変数とする場合,それを対数
変換した上で回帰分析を行う.また,被説明変数
はPoisson分布に従うと考えるのが通例である(正
規分布では整数以外の値を取りうる).この場合,
連結関数g(m)=log(m)であり,Yは期待値exp(X)
のPoisson分布に従っていると考える.
VII. 空間モデル
Logistic回帰モデル Y~Bi(exp(X)/(1+exp(X)))
比率データYを被説明変数とする場合,それをロジ
スティック変換した上で回帰分析を行う.また,被
説明変数は二項分布に従うと考える.この場合,
連結関数g(m)=log(m/(1-m))であり,Yは期待値
exp(X)/(1+exp(X))の二項分布に従っていると考
える.
VII. 空間モデル
一般線形モデルの推定には最尤法が用いられる.
具体的な計算は繰り返し計算による.即ち,通常の
重回帰モデル(Y=X+e)を適用しての推定値を算
出し,その値を用いて誤差項の分散共分散行列を計
算,さらにそれに基づいての推定値を再推定,とい
う手続きを,推定値が収束するまで行う.
VII. 空間モデル
VII-2.5 その他の回帰モデル
Geographically Weighted Regression Model (GER)
回帰式のパラメータが空間上の位置によって異な
ることを明示的に組み込んだモデル.
VII. 空間モデル
Bidimensional Regression Model
説明変数,被説明変数がいずれも2次元ベクトルで
表されており,それらの関係を線形式で記述するモデ
ル.地図の歪みを扱うためにしばしば用いられる.
 u   1   11
      
 v   2    21
12  x   e1 
    
 22  y   e 2 