Moranの I 統計量の裾野分布が空間自己相関の検定に与える影響に ついての考察 中央大学・山田 育穂([email protected]) 青山学院大学・岡部篤行 研究の背景 MoranのI統計量 n Moranの I 統計量(Moran 1948)は、地区データの空間 自己相関の検定手法として広く用いられている。対象 地域内の地区数、n、が十分に大きく、解析対象変数 X について、右のいずれかの条件が満たされる場合、I 統計量は漸近的に正規分布に従うとされる。 I= 研究の目的 0.3 0.2 -2 0 正規分布 Iの推定分布(シ ミュレーションに よる) 2 シミュレーションの設定 上記の2条件のうち、より汎用性の高い順列空間ランダ ム仮定に着目 → ランダム発生させた X の空間分布を ランダムに並べ替えるシミュレーションを行う。 変数 X の分布形: 正規分布、対数正規分布 対象地域: 正方形グリッド (地区数 n =5×5~50×50 まで7段階) 1セットの繰り返し回数 100,000回 × 1,000セット この平均値をシミュレーションによる棄却限界値とす Changes in S.D. of simulated C.V.s (sig = 0.05) 空間自己相関無し 正の空間自己相関 空間的にランダムな分布 似た値が近くに集まる分布 結果: シミュレーションにより得られた棄却限界値 Normal distribution (sig. level=0.05) 5x5 Max 0.2024 Mean 0.1927 Upper critical value S.D. 0.0057 Theoretical 0.1668 Mean -0.2227 Min -0.2271 Lower critical value S.D. 0.0026 Theoretical -0.2501 Type (out of 1,000sets) 50 I errors 3 5x5 Max 0.2035 Mean 0.1856 Upper critical value S.D. 0.0174 Theoretical 0.1584 Mean -0.2134 Min -0.2271 Lower critical value S.D. 0.0133 Theoretical -0.2417 Type I errors (out of 1,000sets) 56 0.01 40x40 30x30 0.0339 0.0334 0.0002 0.0326 -0.0340 -0.0343 0.0001 -0.0348 52 50x50 0.0202 0.0199 0.0001 0.0196 -0.0201 -0.0204 0.0001 -0.0204 40 50x50 Normal distribution Log-normal distribution (meanlog = 0; sdlog = 0.5) Log-normal distribution (meanlog = 0; sdlog = 1.0) 参考文献 Cliff, A.D. and K. Ord (1971). Evaluating the Percentage Points of a Spatial Autocorrelation Coefficient. Geographical Analysis 3(1), 51-62. Moran, P.A.P. 1948. The Interpretation of Statistical Maps. Journal of the Royal Statistical Society, Series B 10 (2):243-251. 10x10 0.1043 0.1017 0.0021 0.0927 -0.1039 -0.1082 0.0033 -0.1129 48 30x30 0.0343 0.0337 0.0002 0.0325 -0.0335 -0.0341 0.0002 -0.0347 46 50x50 0.0203 0.0200 0.0001 0.0196 -0.0199 -0.0202 0.0001 -0.0204 52 1セットのシミュレーションにより得られる棄却限界値には ばらつきがあり、検定結果に影響を与える。しかしながら、 大規模シミュレーションを多数繰り返して平均をとることに より、安定した限界値を算出できた。 地区数の増加に応じて、棄却限界値の理論値と平均シ ミュレーション値の乖離が小さくなることが確認された。 シミュレーションにより得られる棄却限界値の標準偏差 は、地区数の増加に応じて減少した。地区数が少ない場 合には、繰り返し回数あるいはセット数を増やすことによ り、安定性を向上させルことができると考えられる。 0.00 30x30 10x10 0.1039 0.1018 0.0006 0.0947 -0.1076 -0.1092 0.0004 -0.1149 46 まとめと考察 0.02 20x20 I≈ +1 I≈0 負の空間自己相関 10x10 I統計量の解釈 (Iの範囲は概ね -1≤ I ≤ 1) 異なる値が近くに集まる分布 0.03 順列空間ランダム仮定: 観測された X 値の全ての可能 な順列配置は、一様に起こりやすい Log-normal distribution (meanlog = 0; sdlog = 0.5; sig. level=0.05) る。 結果:シミュレーションによって得られた棄却限界 値のばらつきと地区数の関連性 I ≈ -1 0.04 正規変数空間ランダム仮定: 各地区で観測される変数 X は同一で独立の正規分布に従う 4 裾野部分の乖 離が大きいた め、正規分布を 仮定した検定に は限界がある。 変数 X および地区数 n を様々に変化させ、Monte Carloシミュレーションによって、I の推定分布を求 め、有意水準1%および5%の棄却限界値を算出す る。 7x7 0 -4 5x5 Xi : 地区 i で観測された X値(i=1, …, n) X : Xi の平均値 0.1 研究の方法 (S.D.) n n n 2 wij ( X i − X ) i =1 j =1 i =1 I統計量の正規性確保のための条件 0.4 上記を踏まえ、本研究では、 大規模シミュレーションにより 一般的な有意水準の棄却限 界値を推定し、その安定性と 利用可能性について検証を 行う。 ( Xi − X ) ( X j − X ) i =1 j =1 n : 対象地域内の地区数 wij : 接続行列 Wの ij成分 しかしながら、検定において重要な分布の裾野では、I 統計量の正規分布からの乖離が指摘されている (Tiefelsdorf and Boots 1995)。Cliff and Ord(1971)は こうした乖離を考慮し、理論的棄却限界値の補正式を 提案しているが、その適用は進んでいない。 n n wij Tiefelsdorf, M. and B. Boots (1995). The exact distribution of Moran’s I. Environment and Planning A 27, 985-999. 山田育穂・岡部篤行 (2013). MoranのI統計量を用いた空間自己相関の検定に関する一 提案. 2013年日本地理学会春期学術大会予稿集. 日本地理学会 2014年春季学術大会 @国士舘大学 (2014年3月)
© Copyright 2024 ExpyDoc