Moranの I 統計量の裾野分布が空間自己相関の検定に

Moranの I 統計量の裾野分布が空間自己相関の検定に与える影響に
ついての考察
中央大学・山田 育穂([email protected]) 青山学院大学・岡部篤行

研究の背景

MoranのI統計量
n
Moranの I 統計量(Moran 1948)は、地区データの空間
自己相関の検定手法として広く用いられている。対象
地域内の地区数、n、が十分に大きく、解析対象変数 X
について、右のいずれかの条件が満たされる場合、I
統計量は漸近的に正規分布に従うとされる。
I=
研究の目的

0.3



0.2
-2
0
正規分布
Iの推定分布(シ
ミュレーションに
よる)
2

シミュレーションの設定

上記の2条件のうち、より汎用性の高い順列空間ランダ
ム仮定に着目 → ランダム発生させた X の空間分布を
ランダムに並べ替えるシミュレーションを行う。

変数 X の分布形: 正規分布、対数正規分布

対象地域: 正方形グリッド (地区数 n =5×5~50×50
まで7段階)

1セットの繰り返し回数 100,000回 × 1,000セット

この平均値をシミュレーションによる棄却限界値とす
Changes in S.D. of simulated C.V.s (sig = 0.05)
空間自己相関無し
正の空間自己相関
空間的にランダムな分布
似た値が近くに集まる分布
結果: シミュレーションにより得られた棄却限界値
Normal distribution (sig. level=0.05)
5x5
Max
0.2024
Mean
0.1927
Upper critical value
S.D.
0.0057
Theoretical
0.1668
Mean
-0.2227
Min
-0.2271
Lower critical value
S.D.
0.0026
Theoretical
-0.2501
Type
(out of 1,000sets)
50
 I errors
3
5x5
Max
0.2035
Mean
0.1856
Upper critical value
S.D.
0.0174
Theoretical
0.1584
Mean
-0.2134
Min
-0.2271
Lower critical value
S.D.
0.0133
Theoretical
-0.2417
Type I errors
(out of 1,000sets)
56
0.01
40x40
30x30
0.0339
0.0334
0.0002
0.0326
-0.0340
-0.0343
0.0001
-0.0348
52
50x50
0.0202
0.0199
0.0001
0.0196
-0.0201
-0.0204
0.0001
-0.0204
40
50x50
Normal distribution
Log-normal distribution (meanlog = 0; sdlog = 0.5)
Log-normal distribution (meanlog = 0; sdlog = 1.0)
参考文献
Cliff, A.D. and K. Ord (1971). Evaluating the Percentage Points of a Spatial Autocorrelation
Coefficient. Geographical Analysis 3(1), 51-62.
Moran, P.A.P. 1948. The Interpretation of Statistical Maps. Journal of the Royal Statistical
Society, Series B 10 (2):243-251.


10x10
0.1043
0.1017
0.0021
0.0927
-0.1039
-0.1082
0.0033
-0.1129
48
30x30
0.0343
0.0337
0.0002
0.0325
-0.0335
-0.0341
0.0002
-0.0347
46
50x50
0.0203
0.0200
0.0001
0.0196
-0.0199
-0.0202
0.0001
-0.0204
52

1セットのシミュレーションにより得られる棄却限界値には
ばらつきがあり、検定結果に影響を与える。しかしながら、
大規模シミュレーションを多数繰り返して平均をとることに
より、安定した限界値を算出できた。

地区数の増加に応じて、棄却限界値の理論値と平均シ
ミュレーション値の乖離が小さくなることが確認された。

シミュレーションにより得られる棄却限界値の標準偏差
は、地区数の増加に応じて減少した。地区数が少ない場
合には、繰り返し回数あるいはセット数を増やすことによ
り、安定性を向上させルことができると考えられる。
0.00
30x30
10x10
0.1039
0.1018
0.0006
0.0947
-0.1076
-0.1092
0.0004
-0.1149
46
まとめと考察
0.02
20x20
I≈ +1
I≈0
負の空間自己相関

10x10
I統計量の解釈 (Iの範囲は概ね -1≤ I ≤ 1)
異なる値が近くに集まる分布
0.03

順列空間ランダム仮定: 観測された X 値の全ての可能
な順列配置は、一様に起こりやすい
Log-normal distribution (meanlog = 0; sdlog = 0.5; sig. level=0.05)
る。
結果:シミュレーションによって得られた棄却限界
値のばらつきと地区数の関連性


I ≈ -1

0.04

正規変数空間ランダム仮定: 各地区で観測される変数
X は同一で独立の正規分布に従う
4
裾野部分の乖
離が大きいた
め、正規分布を
仮定した検定に
は限界がある。
変数 X および地区数 n を様々に変化させ、Monte
Carloシミュレーションによって、I の推定分布を求
め、有意水準1%および5%の棄却限界値を算出す
る。
7x7

0
-4

5x5
Xi : 地区 i で観測された X値(i=1, …, n)
X : Xi の平均値
0.1
研究の方法
(S.D.)
 n n
 n
2
  wij   ( X i − X )
 i =1 j =1  i =1
I統計量の正規性確保のための条件
0.4
上記を踏まえ、本研究では、
大規模シミュレーションにより
一般的な有意水準の棄却限
界値を推定し、その安定性と
利用可能性について検証を
行う。
( Xi − X ) ( X j − X )
i =1 j =1
n : 対象地域内の地区数
wij : 接続行列 Wの ij成分
しかしながら、検定において重要な分布の裾野では、I
統計量の正規分布からの乖離が指摘されている
(Tiefelsdorf and Boots 1995)。Cliff and Ord(1971)は
こうした乖離を考慮し、理論的棄却限界値の補正式を
提案しているが、その適用は進んでいない。

n
n  wij
Tiefelsdorf, M. and B. Boots (1995). The exact distribution of Moran’s I. Environment and
Planning A 27, 985-999.
山田育穂・岡部篤行 (2013). MoranのI統計量を用いた空間自己相関の検定に関する一
提案. 2013年日本地理学会春期学術大会予稿集.
日本地理学会 2014年春季学術大会 @国士舘大学 (2014年3月)