2013年5月31日 第3章 空間データの変換と管理 2.ジオコーディング 相良毅 [email protected] 地理情報科学教育用スライド ©相良 毅 ここで学ぶこと 実社会の空間データには、場所が経緯度ではなく住所で書 かれているものも多い。たとえば犯罪発生現場のGISで解析 しようと思えば、まず事件簿に記載されている住所を見て、 地図を調べて該当する地点の経緯度を入力するという作業 が必要になる。この住所から経緯度に変換する処理はジオ コーディングと呼ばれている。 ここでは、ジオコーディングについて以下の事項を学ぶ。 ジオコーディングの基本と高度な処理 逆ジオコーディングの基本 ジオコーディングの用語 利用可能なジオコーダ、位置参照情報 高度なジオコーディング処理 ジオコーディング利用上の注意 地理情報科学教育用スライド ©相良 毅 ジオコーディング(geocoding)の 基本 住所表記 千葉県柏市柏の葉 五丁目1番5号 最長一致検索 住所と経緯度の対応表(位置参照情報) 千葉県柏市柏六丁目9番7号 千葉県柏市柏六丁目9番8号 千葉県柏市柏六丁目9番9号 千葉県柏市柏の葉 千葉県柏市柏の葉一丁目 千葉県柏市柏の葉一丁目10番 千葉県柏市柏の葉一丁目1番 千葉県柏市柏の葉一丁目2番 千葉県柏市柏の葉一丁目3番 千葉県柏市柏の葉一丁目4番 千葉県柏市柏の葉一丁目5番 千葉県柏市柏の葉一丁目6番 千葉県柏市柏の葉一丁目7番 千葉県柏市柏の葉一丁目8番 千葉県柏市柏の葉一丁目9番 千葉県柏市柏の葉五丁目 千葉県柏市柏の葉五丁目1番 千葉県柏市柏の葉五丁目1番地 千葉県柏市柏の葉五丁目2番 千葉県柏市柏の葉五丁目3番 千葉県柏市柏の葉五丁目4番 千葉県柏市柏の葉三丁目 139.97854,35.8661283 139.97858,35.8662631 139.97864,35.8663855 139.942879,35.891247 139.942879,35.891247 139.942039,35.891057 139.943993,35.891184 139.943491,35.891635 139.943193,35.892486 139.942071,35.892151 139.942374,35.891787 139.942694,35.891534 139.942872,35.891208 139.942787,35.890794 139.942989,35.890475 139.936938,35.902105 139.935456,35.901708 139.931938,35.900455 139.935382,35.905139 139.938779,35.904419 139.940344,35.903356 139.936080,35.891753 地理情報科学教育用スライド ©相良 毅 処理結果 経度:139.935456 緯度:35.901708 高度なジオコーディング 住所表記 柏の葉五丁目1番 県、市を省略 柏の葉5丁目… 文字種が違う 柏の葉5-1-5 省略表記 住所と経緯度の対応表(位置参照情報) 千葉県柏市柏六丁目9番7号 139.97854,35.8661283 千葉県柏市柏六丁目9番8号 139.97858,35.8662631 千葉県柏市柏六丁目9番9号 139.97864,35.8663855 千葉県柏市柏の葉 139.942879,35.891247 途中からでも検索できるインデックス 千葉県柏市柏の葉一丁目 139.942879,35.891247 千葉県柏市柏の葉一丁目10番 139.942039,35.891057 千葉県柏市柏の葉一丁目1番 139.943993,35.891184 千葉県柏市柏の葉一丁目2番 139.943491,35.891635 文字種や異体字に依存しない内部表現 千葉県柏市柏の葉一丁目3番 139.943193,35.892486 千葉県柏市柏の葉一丁目4番 139.942071,35.892151 千葉県柏市柏の葉一丁目5番 139.942374,35.891787 千葉県柏市柏の葉一丁目6番 139.942694,35.891534 千葉県柏市柏の葉一丁目7番 五丁目1番と五丁目1番地の識別 139.942872,35.891208 千葉県柏市柏の葉一丁目8番 139.942787,35.890794 千葉県柏市柏の葉一丁目9番 139.942989,35.890475 千葉県柏市柏の葉五丁目 139.936938,35.902105 千葉県柏市柏の葉五丁目1番 139.935456,35.901708 千葉県柏市柏の葉五丁目1番地 139.931938,35.900455 千葉県柏市柏の葉五丁目2番 139.935382,35.905139 千葉県柏市柏の葉五丁目3番 139.938779,35.904419 省略表記を解析しながら文字列比較 千葉県柏市柏の葉五丁目4番 139.940344,35.903356 千葉県柏市柏の葉三丁目 139.936080,35.891753 処理結果 経度:139.935456 緯度:35.901708 「龍ヶ崎市」と「竜ケ崎市」、「市ヶ谷」と「市谷」、「虻田町」と「虹田町」、どこまで同じと考える? 地理情報科学教育用スライド ©相良 毅 逆ジオコーディング 千葉県柏市柏の葉 住所と経緯度の分布 35.906 柏の葉五丁目2番 検索地点 柏の葉五丁目3番 35.904 柏の葉五丁目4番 経度:139.94023 緯度:35.903544 柏の葉五丁目 柏の葉五丁目1番 35.902 柏の葉五丁目1番地 35.9 35.898 処理結果 柏の葉四丁目4番地 柏の葉四丁目3番地 35.896 千葉県柏市柏の葉 五丁目4番 柏の葉四丁目 35.894 柏の葉一丁目3番 柏の葉三丁目1番 柏の葉三丁目2番 柏の葉一丁目4番 柏の葉三丁目3番 柏の葉二丁目11番 柏の葉一丁目5番 柏の葉三丁目 柏の葉一丁目2番 柏の葉三丁目4番 柏の葉一丁目6番 柏の葉三丁目11番 柏の葉一丁目 柏の葉 柏の葉一丁目1番 柏の葉三丁目5番 柏の葉二丁目10番 柏の葉一丁目7番 柏の葉一丁目10番 柏の葉三丁目6番 柏の葉一丁目8番 柏の葉三丁目7番 柏の葉一丁目9番 柏の葉三丁目8番 柏の葉二丁目 柏の葉三丁目9番 柏の葉三丁目10番 35.892 35.89 35.888 139.93 139.932 139.934 139.936 139.938 139.94 139.942 139.944 地理情報科学教育用スライド ©相良 毅 139.946 ジオコーディングの用語 • ジオコーディング(geocoding) • 広義には、間接的に位置を表す情報(住所など)から直接的に位置を 表す情報(経緯度など)への変換処理全般を指す • 一般に住所を経緯度に変換する処理を指すが、広義のジオコーディ ングと区別したい場合はアドレスジオコーディングと言う • 郵便番号から経緯度、住所から地図データ中のオブジェクト番号への 変換もジオコーディングの一種 • ジオコーダ(geocoder) • ジオコーディングを行うシステム • 逆ジオコーディング(reverse geocoding) • ジオコーディングの逆処理、一般に経緯度から住所を検索する処理 • 位置参照情報(location reference information) • ジオコーダが利用する住所と経緯度の対応表 • 名寄せ(aggregation) • 表記の違いを吸収し、同じ意味の表記を同値とみなす処理 地理情報科学教育用スライド ©相良 毅 利用可能なジオコーダ • 無償利用が可能なジオコーダ • Google geocoding API • • • • • URL: https://developers.google.com/maps/documentation/geocoding/ 逆ジオコーディングも可能 1日2,500回の制限あり 世界中の住所をジオコーディング可能 プログラム内から呼び出して利用する • CSISジオコーダ • URL: http://newspat.csis.u-tokyo.ac.jp/geocode/ • 利用制限なし • プログラム内から呼び出して利用するか、CSV形式のデータを一括ジオ コーディングする • 国土地理院マップシート • URL: http://renkei2.gsi.go.jp/renkei/130326mapsh_gijutu/index.htm • Excelデータに含まれる住所を地図上で閲覧する • KML形式での出力機能など 地理情報科学教育用スライド ©相良 毅 利用可能な位置参照情報 • 無償利用が可能な位置参照情報 • 街区レベル位置参照情報(国交省) • URL: http://nlftp.mlit.go.jp/isj/ • 街区レベル(○丁目△番、または□番地)まで • 全国の都市計画地域全域およびその周辺地域 • 電子国土基本図「住居表示住所」(国土地理院) • URL: http://www.gsi.go.jp/kihonjohochousa/jukyo_jusho.html • 住居表示レベル(○丁目△番×号)まで • 都市計画地域の一部(整備範囲拡大中) • 地図データ等から独自に作成することも重要 地理情報科学教育用スライド ©相良 毅 ジオコーディング利用上の注意 • ジオコーディングの性能は位置参照情報とジオ コーダの性能で決まる • 位置参照情報に載っていない住所は処理できない • ジオコーダが対応できない表記揺れは処理できない • 住所表記部分の切り出しは自動的には行えない • 住所の前後に住所以外の文字列が含まれている場合 は、何らかの方法で事前に切り出しておく必要がある 地理情報科学教育用スライド ©相良 毅 参考文献 • Ratcliffe, Jerry H. (2001). "On the accuracy of TIGER-type geocoded address data in relation to cadastral and census areal units". International Journal of Geographic Information Sciences 15 (5) • 相良毅,有川正俊,坂内正夫,分散位置参照サービ ス,情報処理学会論文誌 42(12), 2928-2940, 200112-15 地理情報科学教育用スライド ©相良 毅
© Copyright 2024 ExpyDoc