- 地理空間的思考の教育研究プロジェクト

2011-02-15
第1章 実世界のモデル化と形式化
8.モデルの信頼性
太田守重
[email protected]
地理情報科学教育用スライド ©太田守重
ここで学ぶこと
これまで示してきたように、実世界の諸現象は、概念として、もしくは個物とし
てモデル化される。従ってモデルの信頼性は,スキーマレベル及びインスタン
スレベルで評価される.スキーマレベルの信頼性は,形式的には一般地物モ
デルに準拠しているか否かで評価できるが,型や型同士の相互関係の表現に
ついては,そのスキーマに関係する人々の合意が信頼性を保証する.一方イ
ンスタンスレベルの信頼性は,その正確さで評価でき、大きく5つに分類できる.
それは完全性 (completeness),位置正確度 (positional accuracy) ,時間正確
度 (temporal accuracy) ,論理一貫性 (logical consistency),及び主題正確度
(thematic accuracy)である.
ここでは、スキーマレベル及びインスタンスレベスに分けて、信頼性評価の
基本的な知識を学ぶ。最後に、空間データの要求仕様を記述する空間データ
製品仕様書についても紹介する。
地理情報科学教育用スライド ©太田守重
応用スキーマの信頼性
形式的な評価:一般地物モデル(GFM)に照らした妥当性の確認
1. 地物型の定義、継承、及び関連が、UML及びGFMの規則に準拠している
か?
2. 属性(空間、時間、場所)が、それぞれのスキーマに準拠して定義されて
いるか?
3. 関連役割や継承の定義にもれはないか?
4. 操作の定義にもれはないか?
合意形成:関係者間の合意形成を通じた妥当性の確認
1.
2.
3.
4.
タスクフォース内部の合意
有識者の理解
公開による周知
改訂可能性の確保
地理情報科学教育用スライド ©太田守重
応用スキーマの信頼性ーUML及びGFMへの準拠
UMLへの準拠:
GFMはUMLクラス図の記法を制限して使用している。
そこで、GFMが示す範囲内でUML表記法に従っていることを確認する。
応用スキーマの作成に、UMLによるモデリングを支援するソフト(*)を使用すれ
ば、UMLへの形式的な準拠が保証される。
(*) 例えば、ArgoUML, astah* communityなど
GFMへの準拠:
応用スキーマが、第2章2節に示したGFMによる応用スキーマのための規則
に従っていることを、確認する。
地理情報科学教育用スライド ©太田守重
応用スキーマの信頼性ー属性が基本スキーマに準拠するか
属性の定義には、以下の要素が完備しなければいけない。
1. 属性名(メンバー名)
2. 定義:属性の意味
3. データ型:基本スキーマ(*)に含まれるデータ型
4. 基数:多重度の下限と上限
(*)基本スキーマ:
以下のスキーマは応用スキーマを作成するための基本スキーマである。
1. 空間スキーマ、時間スキーマ、場所スキーマ及び基本データ型のような、属性
の型として使われるデータ型を定義するスキーマ
2. 参照系のためのスキーマ
3. 被覆スキーマ
地理情報科学教育用スライド ©太田守重
応用スキーマの信頼性ー関連役割や継承の定義
関連役割の定義には以下の要素が完備しなければいけない。
1. 関連種類(関連(association)、集成(aggregation)、又は合成( composition))
2. 役割名:相手の地物型の役割を示す名前
3. 定義:地物型に与えられた役割の説明
4. 基数:多重度(下限、上限)
継承の定義には以下の要素が完備しなければいけない。
1. 最下位の地物型は具象型でなければいけない。
2. 多重継承は避ける。
3. 自分自身に対する継承はできない。
地理情報科学教育用スライド ©太田守重
応用スキーマの信頼性ー操作の定義
操作の定義には以下の要素が完備しなければいけない。
1. 操作名:(メンバー名)
2. 定義:操作の説明
3. 引数:操作に入力されるパラメータ(名前とデータ型の対)
4. 戻り値:捜査の結果返されるデータの型
地理情報科学教育用スライド ©太田守重
応用スキーマの信頼性ー合意形成
タスクフォース内部の合意:
利害関係者がタスクフォースを形成して、共用する応用スキーマを設計する
ことが行われるが、その中で合意形成が行われる。
有識者の理解:
内部の合意がとれた段階で、その分野に知見をもつ有識者の意見を求め、
改良した原案を作る。
公開による周知:
さらに、必要に応じて原案を公開し、パブリックコメントを求める場合もある。
以上の段階を経て、応用スキーマは一定の信頼性を確保したことになる。
改訂可能性の確保:
利用中に気が付く問題点や、新たな需要への対応などが求められるので、
応用スキーマは一定の期間をおいて、改訂を行うべきである。
地理情報科学教育用スライド ©太田守重
インスタンスの信頼性
インスタンスは品質の評価を経て信頼性を確保することができる。評価要素は大
きく5つに分かれる。
品質:明示的又は暗示的に示される要求を、インスタンス(データ)が満たす程度。
品質評価要素:
1. 完全性
2. 論理一貫性
3. 位置正確度
4. 時間正確度
5. 主題正確度
地理情報科学教育用スライド ©太田守重
インスタンスの信頼性ー完全性
完全性:アイテム(地物,地物属性及び地物関係)の存在及び欠落
1. 過剰:データ集合内の過剰なアイテムの存在の度合い
2. 漏れ:データ集合からのアイテムの欠落の度合い
例:
ある自治体の道路管理者が、管理している照明灯(地物)の本数を現場で数
えたら5625本だった。これに対して自治体が保有している照明灯台帳(データ
集合)上の本数は5635本であった。確認したところ、撤去した照明灯が一部、
台帳に残っていたことが判明した。
この場合の完全性は「過剰」で、その度合いは、(5635 – 5625) / 5625 = 0.0018、
つまり、0.18%になる。
地理情報科学教育用スライド ©太田守重
インスタンスの信頼性ー論理一貫性
論理一貫性:データ集合,地物,属性及び関係に関する論理的規則の遵守
の度合い。以下の種類がある。
1. 書式一貫性:アイテムがデータ集合の物理構造を規定する規則に従って
格納されている度合い。例)XML で記述されたデータ集合は,XML の文法
に従わなければならない。
2. 概念一貫性:概念スキーマ規則の遵守の度合い。例)データ集合は,対
応する応用 スキーマを遵守しなければならない。
3. 定義域一貫性:属性値が定義域に含まれる度合い。例)定義域が1 から
10 までの整数であるときは,属性値は,その範囲になければならない。
4. 位相一貫性:明示的に符号化した位相的特性の正しさの度合い。例)道
路のネットワーク中のノードは全て,エッジの端点となる。したがって,孤
立したノードがあればエラーとなる。
地理情報科学教育用スライド ©太田守重
インスタンスの信頼性ー位置正確度
位置正確度:地物の空間位置の正確度。以下の種類がある。
1. 絶対正確度(外部正確度):測定された座標値と真又は真とみなす座標
値との近さ。例)地図上で計測した照明灯の平面直角座標と、現場で測
量用GPSで計測した値のずれ。GPSによる値はこの場合真と見なされる
値と考えられる。
2. 相対正確度(内部正確度):地物の相対位置と真又は真とみなす個々の
相対位置との近さ。例)航空写真測量用の図化機で計測した道路縁か
ら施設までの距離と、現場で巻き尺ではかった値のずれ。
地理情報科学教育用スライド ©太田守重
インスタンスの信頼性ー時間正確度
時間正確度:地物の時間属性及び時間関係の正確度。以下の種類がある。
1. 時間測定正確度:測定された時間属性の示す時間と真又は真とみなす時
間との近さ。例)事故を目撃した人が、昼の12時頃といった場合、真の時
間との差は±30分程度と考えられる。
2. 時間一貫性:事象系列の順序関係の正しさの度合い。例)竣工日は撤去日
より遅くなることはない。
3. 時間妥当性:報告されたトランザクション時間と真又は真とみなす値との近
さ備考 トランザクション時間は,データベースに登録されたデータがもつ時
間で,一般的には,アイテムの登録日時(タイムスタンプ)など。例)実世界
に起きた現象を報告する電子メールのタイムスタンプと、実際に現象が起き
た時点の差。
地理情報科学教育用スライド ©太田守重
インスタンスの信頼性ー主題正確度
主題正確度:地物の主題属性の正しさ又は正確度。以下の種類がある。
1. 分類の正しさ:地物,地物属性又は地物関連に割り当てられた分類値と真
値と見なされる値(例えば,ground truth,基準になる参照データ集合)との
比較
2. 非定量的主題属性の正しさ:他と区別するための符号(非定量的属性)の
正しさの度合い。例)土地利用分類の正確さ
3. 定量的主題属性の正確度:大小又は順序を示す数(定量的属性)と真又は
真とみなす数との近さ。例)地図上で測った道路の幅員と、現場で巻き尺で
測った値の差
地理情報科学教育用スライド ©太田守重
空間データ製品仕様書
空間データ製品仕様書:空間データの使用目的,内容及び品質など作成され
るべき空間データに対する要求事項を明確にするための仕様書。これによっ
て、応用スキーマのUMLクラス図及び文書、品質要求などがひとまとめに示
されることになる。以下の項目を含む。
1. 概覧:対象とする製品の概要説明
2. 適用範囲:空間データの地理的、時間的な範囲
3. データ製品識別:製品の名称
4. データ内容及び構造:応用スキーマのUMLクラス図及び文書
5. 参照系:空間参照系及び時間参照系の指定
6. データ品質 :品質要求及び検証の方法
7. データ製品配布 :データ提供方法、メディアなど
8. メタデータ:空間データの説明情報のためのルールの指定
9. その他:その他必要に応じて(例:描画のための規則など)
地理情報科学教育用スライド ©太田守重
まとめ
実世界の現象の抽象概念を地物とよぶが、地物は型(クラス)またはインス
タンス(オブジェクト)として表現される。これは、実世界の現象のモデルであ
る。地物型及び地物型同士の関係は応用スキーマで表現できるが、これが
GFMに準拠していれば、関係者の理解が得やすくなる。また、GFMに準拠し
ていることが応用スキーマの形式的な信頼性確保の条件になる。しかしその
内容については、関係する人々の合意こそが、信頼性の証しとなる。
地物インスタンスについては、品質要求に対する適合性で、信頼性をはか
ることができる。品質要素は大きく5種類あり、データの作成目的に応じた評
価基準が定められ、空間データ製品仕様書に示される。評価結果はデータ
のためのデータであるメタデータに記載することによって、関係者は自分の
目的に合致したデータか否かを判断することができる。
地理情報科学教育用スライド ©太田守重
参考文献
1. 有川正俊、太田守重監修(2007)『GISのためのモデリング入門』ソフトバン
ククリエイティブ
2. 国土地理院、地図情報レベル2500データ作成の製品仕様書(案)、国土
地理院技術資料A・1-No.295-1、
http://psgsv.gsi.go.jp/koukyou/download/detasakusei/2500index.html
3. (財)日本規格協会、JIS X 7113:2004 地理情報ー品質原理
4. (財)日本規格協会、JIS X 7114:2009 地理情報ー品質評価手順
5. ISO, ISO 19131:2007 Geographic Information – Data product specifications
地理情報科学教育用スライド ©太田守重