3 - 地理空間的思考の教育研究プロジェクト

2013年5月31日
第3章 空間データの変換と管理
2.ジオコーディング
相良毅
[email protected]
地理情報科学教育用スライド ©相良 毅
ここで学ぶこと
実社会の空間データには、場所が経緯度ではなく住所で書
かれているものも多い。たとえば犯罪発生現場のGISで解析
しようと思えば、まず事件簿に記載されている住所を見て、
地図を調べて該当する地点の経緯度を入力するという作業
が必要になる。この住所から経緯度に変換する処理はジオ
コーディングと呼ばれている。
ここでは、ジオコーディングについて以下の事項を学ぶ。
ジオコーディングの基本と高度な処理
逆ジオコーディングの基本
ジオコーディングの用語
利用可能なジオコーダ、位置参照情報
高度なジオコーディング処理
ジオコーディング利用上の注意
地理情報科学教育用スライド ©相良 毅
ジオコーディング(geocoding)の
基本
住所表記
千葉県柏市柏の葉
五丁目1番5号
最長一致検索
住所と経緯度の対応表(位置参照情報)
千葉県柏市柏六丁目9番7号
千葉県柏市柏六丁目9番8号
千葉県柏市柏六丁目9番9号
千葉県柏市柏の葉
千葉県柏市柏の葉一丁目
千葉県柏市柏の葉一丁目10番
千葉県柏市柏の葉一丁目1番
千葉県柏市柏の葉一丁目2番
千葉県柏市柏の葉一丁目3番
千葉県柏市柏の葉一丁目4番
千葉県柏市柏の葉一丁目5番
千葉県柏市柏の葉一丁目6番
千葉県柏市柏の葉一丁目7番
千葉県柏市柏の葉一丁目8番
千葉県柏市柏の葉一丁目9番
千葉県柏市柏の葉五丁目
千葉県柏市柏の葉五丁目1番
千葉県柏市柏の葉五丁目1番地
千葉県柏市柏の葉五丁目2番
千葉県柏市柏の葉五丁目3番
千葉県柏市柏の葉五丁目4番
千葉県柏市柏の葉三丁目
139.97854,35.8661283
139.97858,35.8662631
139.97864,35.8663855
139.942879,35.891247
139.942879,35.891247
139.942039,35.891057
139.943993,35.891184
139.943491,35.891635
139.943193,35.892486
139.942071,35.892151
139.942374,35.891787
139.942694,35.891534
139.942872,35.891208
139.942787,35.890794
139.942989,35.890475
139.936938,35.902105
139.935456,35.901708
139.931938,35.900455
139.935382,35.905139
139.938779,35.904419
139.940344,35.903356
139.936080,35.891753
地理情報科学教育用スライド ©相良 毅
処理結果
経度:139.935456
緯度:35.901708
高度なジオコーディング
住所表記
柏の葉五丁目1番
県、市を省略
柏の葉5丁目…
文字種が違う
柏の葉5-1-5
省略表記
住所と経緯度の対応表(位置参照情報)
千葉県柏市柏六丁目9番7号
139.97854,35.8661283
千葉県柏市柏六丁目9番8号
139.97858,35.8662631
千葉県柏市柏六丁目9番9号
139.97864,35.8663855
千葉県柏市柏の葉
139.942879,35.891247
途中からでも検索できるインデックス
千葉県柏市柏の葉一丁目
139.942879,35.891247
千葉県柏市柏の葉一丁目10番
139.942039,35.891057
千葉県柏市柏の葉一丁目1番
139.943993,35.891184
千葉県柏市柏の葉一丁目2番
139.943491,35.891635
文字種や異体字に依存しない内部表現
千葉県柏市柏の葉一丁目3番
139.943193,35.892486
千葉県柏市柏の葉一丁目4番
139.942071,35.892151
千葉県柏市柏の葉一丁目5番
139.942374,35.891787
千葉県柏市柏の葉一丁目6番
139.942694,35.891534
千葉県柏市柏の葉一丁目7番 五丁目1番と五丁目1番地の識別
139.942872,35.891208
千葉県柏市柏の葉一丁目8番
139.942787,35.890794
千葉県柏市柏の葉一丁目9番
139.942989,35.890475
千葉県柏市柏の葉五丁目
139.936938,35.902105
千葉県柏市柏の葉五丁目1番
139.935456,35.901708
千葉県柏市柏の葉五丁目1番地
139.931938,35.900455
千葉県柏市柏の葉五丁目2番
139.935382,35.905139
千葉県柏市柏の葉五丁目3番
139.938779,35.904419
省略表記を解析しながら文字列比較
千葉県柏市柏の葉五丁目4番
139.940344,35.903356
千葉県柏市柏の葉三丁目
139.936080,35.891753
処理結果
経度:139.935456
緯度:35.901708
「龍ヶ崎市」と「竜ケ崎市」、「市ヶ谷」と「市谷」、「虻田町」と「虹田町」、どこまで同じと考える?
地理情報科学教育用スライド ©相良 毅
逆ジオコーディング
千葉県柏市柏の葉 住所と経緯度の分布
35.906
柏の葉五丁目2番
検索地点
柏の葉五丁目3番
35.904
柏の葉五丁目4番
経度:139.94023
緯度:35.903544
柏の葉五丁目
柏の葉五丁目1番
35.902
柏の葉五丁目1番地
35.9
35.898
処理結果
柏の葉四丁目4番地
柏の葉四丁目3番地
35.896
千葉県柏市柏の葉
五丁目4番
柏の葉四丁目
35.894
柏の葉一丁目3番
柏の葉三丁目1番
柏の葉三丁目2番
柏の葉一丁目4番
柏の葉三丁目3番 柏の葉二丁目11番
柏の葉一丁目5番
柏の葉三丁目
柏の葉一丁目2番
柏の葉三丁目4番
柏の葉一丁目6番
柏の葉三丁目11番
柏の葉一丁目
柏の葉 柏の葉一丁目1番
柏の葉三丁目5番 柏の葉二丁目10番
柏の葉一丁目7番
柏の葉一丁目10番
柏の葉三丁目6番
柏の葉一丁目8番
柏の葉三丁目7番
柏の葉一丁目9番
柏の葉三丁目8番
柏の葉二丁目
柏の葉三丁目9番
柏の葉三丁目10番
35.892
35.89
35.888
139.93
139.932
139.934
139.936
139.938
139.94
139.942
139.944
地理情報科学教育用スライド ©相良 毅
139.946
ジオコーディングの用語
• ジオコーディング(geocoding)
• 広義には、間接的に位置を表す情報(住所など)から直接的に位置を
表す情報(経緯度など)への変換処理全般を指す
• 一般に住所を経緯度に変換する処理を指すが、広義のジオコーディ
ングと区別したい場合はアドレスジオコーディングと言う
• 郵便番号から経緯度、住所から地図データ中のオブジェクト番号への
変換もジオコーディングの一種
• ジオコーダ(geocoder)
• ジオコーディングを行うシステム
• 逆ジオコーディング(reverse geocoding)
• ジオコーディングの逆処理、一般に経緯度から住所を検索する処理
• 位置参照情報(location reference information)
• ジオコーダが利用する住所と経緯度の対応表
• 名寄せ(aggregation)
• 表記の違いを吸収し、同じ意味の表記を同値とみなす処理
地理情報科学教育用スライド ©相良 毅
利用可能なジオコーダ
• 無償利用が可能なジオコーダ
• Google geocoding API
•
•
•
•
•
URL: https://developers.google.com/maps/documentation/geocoding/
逆ジオコーディングも可能
1日2,500回の制限あり
世界中の住所をジオコーディング可能
プログラム内から呼び出して利用する
• CSISジオコーダ
• URL: http://newspat.csis.u-tokyo.ac.jp/geocode/
• 利用制限なし
• プログラム内から呼び出して利用するか、CSV形式のデータを一括ジオ
コーディングする
• 国土地理院マップシート
• URL: http://renkei2.gsi.go.jp/renkei/130326mapsh_gijutu/index.htm
• Excelデータに含まれる住所を地図上で閲覧する
• KML形式での出力機能など
地理情報科学教育用スライド ©相良 毅
利用可能な位置参照情報
• 無償利用が可能な位置参照情報
• 街区レベル位置参照情報(国交省)
• URL: http://nlftp.mlit.go.jp/isj/
• 街区レベル(○丁目△番、または□番地)まで
• 全国の都市計画地域全域およびその周辺地域
• 電子国土基本図「住居表示住所」(国土地理院)
• URL: http://www.gsi.go.jp/kihonjohochousa/jukyo_jusho.html
• 住居表示レベル(○丁目△番×号)まで
• 都市計画地域の一部(整備範囲拡大中)
• 地図データ等から独自に作成することも重要
地理情報科学教育用スライド ©相良 毅
ジオコーディング利用上の注意
• ジオコーディングの性能は位置参照情報とジオ
コーダの性能で決まる
• 位置参照情報に載っていない住所は処理できない
• ジオコーダが対応できない表記揺れは処理できない
• 住所表記部分の切り出しは自動的には行えない
• 住所の前後に住所以外の文字列が含まれている場合
は、何らかの方法で事前に切り出しておく必要がある
地理情報科学教育用スライド ©相良 毅
参考文献
• Ratcliffe, Jerry H. (2001). "On the accuracy of
TIGER-type geocoded address data in relation to
cadastral and census areal units". International
Journal of Geographic Information Sciences 15 (5)
• 相良毅,有川正俊,坂内正夫,分散位置参照サービ
ス,情報処理学会論文誌 42(12), 2928-2940, 200112-15
地理情報科学教育用スライド ©相良 毅