Is-a 階層の粒度の差に着目したオントロジー内容洗練支援シ ステムの

SIG-SWO-A1402-07
Is-a 階層の粒度の差に着目したオントロジー内容洗練支援シ
ステムの試作と評価方法の考察
A Prototyping of an Ontology Contents Refinement System based on Grain size
Differences of Specialization among hierarchies
増田壮志 1
古崎晃司 2
Takeshi Masuda1, Kouji Kozaki2
大阪大学大学院工学研究科
Graduate School of Engineering Osaka University
2
大阪大学産業科学研究所
2
The Institute of Scientific and Industrial Research(ISIR),Osaka University
1
1
Abstract: We proposed an ontology refinement system which can make more consistent ontology by
fixing the differences of the gain size between is-a hierarchies. In this paper, we will discuss this
refinement system and an evaluation technique.
1. はじめに
近年,オントロジー工学は,医療情報,生物規範
工学やセマンティックウェブ等の様々な領域で応用
システムのモデルや知識基盤として利用されている.
その中でオントロジーの品質は,それを利用するシ
ステムに直接的に影響を及ぼす重要な要素である.
そのためより良いオントロジーの構築は重要な課題
であると考えられている.
しかしながら,オントロジーの構築にはオントロ
ジーそのものの知識はもとより,構築しようとして
いるドメインの専門知識も不可欠である.そのため,
一般にオントロジー構築は容易なものではなく,そ
の構築方法や支援方法の確立が望まれている.
オントロジー構築支援に関しては,まず,オント
ロジーの大枠の構築を支援する方法がある.オント
ロジー構築プロセス全般のガイドラインの提案[Noy
01]や,Wikipedia の半構造化情報[森田 10]などの既
存の情報を利用した半自動構築などである.一方,
オントロジーの品質を向上させるための洗練支援を
行うといった方法も考えられてきており,本研究で
は,ある程度構築されたオントロジーに対して,そ
の品質を向上するための洗練支援を目的としている.
2.オントロジー洗練支援
オントロジー洗練方法としては,オントロジーの
文法規則に関する形式的なエラーの検出,修正をす
る方法と,オントロジーの内容を洗練する方法の 2
種類がある.オントロジーの形式的なエラー修正に
関しては,推論機構の整合性機能を用いた手法が多
く提案されている[太田 11, Ohta 11].また owl 上で
よく見られる間違いを列挙し,その幾つかについて
修正をするといったものも存在している[Poveda 12].
本論文では,オントロジーの内容を洗練すること
を目的として,修正箇所の検出とそれらに関する洗
練方法の提示を計算機に行わせ,その結果をシステ
ムユーザが判断し洗練を行う半自動的な内容洗練シ
ステムの紹介をするとともに,そのシステムの評価
方法について述べる.
3. is-a 階層の粒度の差に着目したオ
ントロジー洗練手法
3.1. 一貫性の高いオントロジー
オントロジー内には,ある概念階層が定義される際
に他の概念階層の概念を参照するため,is-a 階層が
部分的に相似形となっている部分が見られる.この
性質は,一貫性のあるオントロジーを構築する際の
指針の一つである「ある概念の下位概念において,
その分類は同じ性質を参照して行われることが望ま
しい」[溝口 06]に従った結果であると考えられる.
例えば,図 1 の is-a 階層を考える.
“乗り物”はその
下位で“陸上乗り物”と“航空機”の 2 つの概念に
特殊化されているが,この時,それぞれの概念にお
いてクラス制約として参照している概念はそれぞれ
07-01
SIG-SWO-A1402-07
“自然空間”,“陸上”,“空”であり,どちらも移動
空間で分類され,スロットも特殊化されている.同
様に,
“自転車”もクラス制約として参照している概
念の is-a 階層に沿って,そのクラス制約が特殊化さ
れている.このように,ある概念を特殊化するとき
はそのスロットも特殊化される.ここで「クラス制
約の特殊化に伴うスロットの階層」を“スロット階
層”,「スロットのクラス制約となっている概念の階
層」を“被参照概念階層”と以下では呼ぶことにす
るが,それらは相似形となる.さらにスロットの階
層はそのスロットを持つ基本概念階層に沿って形成
されるため,オントロジー内では,
“基本概念階層”
,
“スロット階層”,
“被参照概念階層”の 3 つの階層
が部分的に相似形となっている箇所が多く見られる
と言える.
本研究では,これら 3 つの階層をそれぞれ比較す
ることによって非相似形となっている箇所を洗練支
援対象候補として検出し,洗練方法の提案を行う.
それらをオントロジー構築者に提示することによっ
てオントロジー洗練支援としている.
に特殊化されている.一方,“自動車”スロットのクラス制
約である“レース車両”, “F1 マシン”を含む被参照概念階
層は,それらの概念間に “フォーミュラーカー”という中
間概念が存在し 3 段階に特殊化されており,基本概念階層
及びスロット階層に比べより詳細に定義されている.そう
いった箇所が検出された場合には,それぞれの階層の特殊
化の粒度を揃えるような修正方法を提示する.図 2 の例の
場合であれば,基本概念階層の“レース競技”と “F1 競技”
の中間に“フォーミュラーカー競技”を加え,さらに“フォ
ーミュラーカー競技”に於いて,“自動車”スロットを加え
そのスロットのクラス制約を“フォーミュラーカー”とす
る,といった修正案の提示を行う.
図 1 特殊化の粒度が異なっている例
3.3. 検出された洗練候補箇所の分類
図 2
is-a 階層の相似性
3.2. is-a 階層の粒度の差に着目した洗練候
補箇所の検出
スロット階層を基に,対象のオントロジーから非相似形となっ
ている箇所を検出するために,本研究では,まず,スロット階
層に着目し,それらのスロットを持つ基本概念階層とそれらの
スロットのクラス制約となっている被参照概念階層を比較し,ス
ロット階層には存在しない概念が基本概念階層もしくは,被参
照概念階層に存在した場合,それぞれ 3 つの概念階層の特
殊化の粒度が異なっているので,3 つのうちで粒度が粗いもの
に対して概念もしくはスロットの追加を提案することでそれぞれ
の階層の特殊化の粒度を揃えるような提案をユーザに提示す
る.
例として図 2 の is-a 階層を考える.この例で着目しているス
ロット階層は,図 2 中の基本概念階層の“レース競技”で定義
されている“自動車”スロットとその下位スロットからなる
階層である.いまそれらのスロットを持つ概念からなる基
本概念階層は,着目しているスロット階層と同じく 2 段階
スロット階層と他の 2 階層を比較する際に,比較元
となるスロット階層の構造として,本論文では 3 種
類とした.
(a)is-a 階層を構成している 2 つのスロットからなる
スロット階層
(b)最上位のスロット
(c)最下位のスロット
この 3 種類である.
また,3.4 節で詳細を述べるが,検出された部分の基
本概念階層及び被参照概念階層のそれぞれの特殊化
の粒度の数により適用できる洗練方法が異なるため,
(a)についてはそれぞれの中間概念の数の関係,(b)に
ついてはそれぞれの上位概念の数,(c)についてはそ
れぞれの下位概念の数を考慮し,上記の(a),(b),(c)を
より詳細に分類した.
まず(a)についてであるが,中間概念の数は以下の 3
つの観点により分類可能である.
•
基本概念階層での中間概念の有無
•
被参照概念階層での中間概念の有無
•
基本概念階層と被参照概念階層での中間
概念数の差
07-02
SIG-SWO-A1402-07
その結果,
1.
基本概念階層と被参照概念階層のどちら
にも中間概念が無い
2.
基本概念階層と被参照概念階層の両方に
中間概念が存在し,その数が等しい
3.
基本概念階層と被参照概念階層の両方に
中間概念が存在するが,基本概念階層の方が多い
4.
基本概念階層と被参照概念階層の両方に
中間概念が存在するが,被参照概念階層の方が多い
5.
基本概念階層のみに中間概念が存在する
6.
被参照概念階層のみに中間概念が存在す
る
(a)は以上に示す 6 つに分類可能である.ただし,1 に
関しては 3 階層の粒度の差が無いため,洗練支援の
候補とはならない.
次に,(b)はそれぞれの上位概念の数で分類できるが
その観点は以下の 2 点である.
•
そのスロットを持つ基本概念の上位概念
の有無
•
そのスロットを参照している被参照概念
の上位概念の有無
その結果,
1.
基本概念階層,被参照概念階層の両方に上
位概念が無い
2.
基本概念階層のみに上位概念が有る
3.
被参照概念階層のみに上位概念が有る
4.
基本概念階層,被参照概念階層の両方に上
位概念が有る
以上の 4 つに分類可能である.(b)の1の場合も(a)の
1 と同様に元から 3 つの階層の粒度が揃っているた
め,洗練提案はされない.
最後に(c)についてであるが(b)と同様に,
•
そのスロットを持つ基本概念の下位概念
の有無
•
そのスロットを参照している被参照概念
の下位概念の有無
で分類すると,
1.
基本概念階層,被参照概念階層の両方に下
位概念が無い
2.
基本概念階層のみに下位概念が有る
3.
被参照概念階層のみに下位概念が有る
4.
基本概念階層,被参照概念階層の両方に下
位概念が有る
の 4 種類となった.この場合の 1 も粒度が揃ってい
るため洗練候補より除外される.
以上より, (a)2~6, (b)2~4, (c)2~4 の計 11 種類に対し
て,システムによって洗練方法が提示される.
3.4. 提案される洗練方法をその適用先
3.3 節で述べた各分類に適用できる洗練方法は,そ
れぞれの概念構造によって異なるので,洗練方法の
種類とその適用先について述べる.
(1)既存の概念を利用し,基本概念階層にスロットを
追加する
この洗練方法が適用可能なのは,被参照概念階層
の中間概念の数が基本参照概念階層の中間概念の数
より大きい場合,且つ基本概念階層に少なくとも一
つ概念が存在する場合,すなわち,(a)-2, 3, 4 (b)-4, (c)4 の場合に適用可能である.(図 3)
図 3
洗練方法(1)
(2)被参照概念階層の中間概念を参考に基本概念階
層に新規概念を追加しそこにスロットを追加する.
この洗練方法は,被参照概念階層に少なくとも 1
つ中間概念が存在する場合に適用可能である. (1)
との相違点は,基本概念階層に中間概念が存在しな
い場合にも適用可能である点である.すなわち,(a)2, 3, 4, 6 , (b)-3, 4 (c)-3, 4 の場合に適用可能である.
(図 4)
図 4
洗練方法(2)
(3)基本概念階層の中間概念を参考に被参照概念階
層に概念を追加しその概念をスロットのクラス制約
とする.
07-03
SIG-SWO-A1402-07
この洗練方法は,基本概念階層に少なくとも一つ
中間概念が存在すれば適用可能である.すなわち(a)2, 3, 4, 5 , (b)-2, 4 (c)-2, 4 の場合に適用可能である.
(図 5)
オントロジーを処理するためのライブラリとして
HozoCore お よ び 法 造 OAT ( Ontology Application
Toolkit)を利用している .
4. 本洗練支援システムに対する評価
4.1. 本システムに対する予備的評価
図 5
洗練方法(3)
3.3 節で示した検出箇所の分類と 3.4 節で示した洗
練方法の関連を表 1 にまとめた
表 1
検出箇所分類と洗練方法の関係
3 章までで提案してきたオントロジー洗練支援シ
ステムが提示する洗練候補箇所及び方法の妥当性を
評価するために,以下の 2 点についての予備的な評
価実験を行った.
[1]
各オントロジーに対する洗練候補検出数
について
複数のオントロジーに対して,それらの規模に対
してどの程度の数の提案がなされるかを調べた.
[2]
洗練提案の妥当性
初心者が構築オントロジーに対してシステムが推
定した,支援適用先候補箇所について,
「提案された
洗練方法を適用することが,オントロジーの内容洗
練として適切かどうか」を筆者が判断し,適当と考
えられる提案の割合を調べた.
妥当性の判断に関する[2]の予備的評価実験にお
いて,システムの提案の妥当性を判断したのは筆者
自身であり,さらに評価に用いたオントロジーも筆
者自身が構築したものではあるものの,全体として
44%の洗練提案に対して妥当である[増田 14]とい
う判断を下すことが出来た.そこで,より本格的な
評価実験を行う必要性を見出したため,以下 4.2 節
以降に述べる実験を計画した.
4.2. 実験目的
3.5. 洗練支援システムの試作
3.2~3.4 節で提案した洗練手法に基づきオントロ
ジーの内容洗練支援システムを試作した.本システ
ムは,対象オントロジーより,スロット階層とそれ
に伴う基本概念階層と被参照概念階層の特殊化の粒
度に差が生じている箇所を検出し,それぞれの箇所
に応じた洗練方法を提案するものである.システム
全体としては,3 つのモジュールから構成されてお
り,洗練支援候補箇所を検出する「支援適用先候補
推定モジュール」,推定された箇所に応じた洗練支援
案をユーザに提示し,適用する修正案を選択するた
めの「支援適用先候補表示・選択モジュール」
,ユー
ザが選択した修正案をオントロジーに反映し定義内
容を修正する「支援適用モジュール」の 3 つである.
なお,本システムの実装には Java を用いており,
本システムの提案する洗練支援候補に対する妥当
性の客観的評価を得ること及び提案が不適切である
とされたものについてそれらがどういった傾向を持
つのかを調査することである.
それにより本システムにおける洗練提案の妥当性
の向上に対する示唆が得られると考えている.
4.3. 評価対象
評価の対象として考えているオントロジーとして,
(a)オントロジー構築専門家が構築したオントロジ
ー
1. サ ス テ ナ ビ リ テ ィ サ イ エ ン ス オ ン ト ロ ジ ー
[Kumazawa 09]
2.乗り物オントロジー
07-04
SIG-SWO-A1402-07
(b)オントロジー構築初心者が作ったオントロジー
1.
ボート競技オントロジー
2.
打楽器オントロジー
3.
列車オントロジー
4.
交通オントロジー
の 6 つを想定している.各オントロジーにおける,
システムによる提示されるオントロジー洗練支援候
補箇所数を表 2 に示す.
表 2 中の(a)2~6, (b)2~4, (c)2~4
は,3.3.節で述べた分類分けのとおりである.
次に,実験参加者にどのように洗練候補箇所及び洗
練提案を提示するかについて説明する.実験参加者
に評価させる対象としては,システムが検出した洗
練支援候補箇所をランダムで抽出したものに対して
実験参加者に評価させる.実験者に評価させる洗練
支援適用箇所数は,50 箇所を想定しており,実験時
間としては,2~3 時間程度かかると想定している.
また,分類毎の数は,分類(a)から 30 箇所,分類(b),(c)
から 20 箇所と考えている.また,表 2 に示す通りオ
ントロジーによって検出数が少ないものが存在する
ため,一つのオントロジーからそれらの箇所を検出
することは困難であるため,実験者に提示する洗練
提案箇所は,一つのオントロジーから得られた候補
だけではなく,4.3 節の冒頭で提示した 6 つのオント
ロジーから横断的に抽出したものを想定している.
実験参加者にシステムが推定した洗練支援候補箇
所とそれに伴って提案される洗練方法を見せる.洗
練支援候補箇所は,粒度の差を比較する 3 つの階層
「基本概念階層」,「被参照概念階層」および「スロ
ット階層」をグラフで見せる.
提案される洗練方法は,テキストで表示する.そ
の際それぞれの方法が(1)で示した例のどれに当た
るのかを明示しておく.
(3)評価
各洗練候補箇所に対して提案される洗練方法の妥
当性について,以下の 3 段階の評価基準を設け,実
験参加者に評価していただく.
○:提案が妥当である.
△:不適切ではない.
×:提案が不適切である.
各洗練候補箇所に対して洗練方法は,図 6 に示さ
れるように複数個提案されるので,それぞれの洗練
方法毎に評価をしていただく.
(2)及び(3)を 50 箇所の洗練支援提案に対して行っ
た後,最後に全体として,△及び✕として評価された
洗練提案についての自由記述をさせる.
図 6
実験参加者に提示する洗練候補例
5. まとめと今後の展望
表 2
オントロジー毎の洗練支援適用箇所数
4.4. 評価実験の流れ
次に,実際に行う実験の流れについて説明する.
(1)インストラクション
実験参加者に 3.4 節で示した各洗練方法について
実例を示しながら実験中に実際に考える操作につい
ての説明を行う.この時示される例は,実験で用い
るオントロジーとは別のオントロジーを利用する.
(2)洗練候補の提示
本研究では,is-a 階層間の特殊化の粒度の差に着
目したオントロジーの内容洗練支援システムの提案
及び本システムに対する客観的な評価方法に関する
考察を行った.
今後,筆者の所属する研究室の学生等に協力を得
て,今回紹介した評価手法を用いた予備実験を通し
て改良を加えた後,研究室内外のオントロジー専門
家等の協力を仰ぎ,より本格的なシステムの評価実
験を行ないたい.それらの評価実験から得られた考
察を反映することにより本システムが行う洗練提案
の精度を向上させたいと考えている.
07-05
SIG-SWO-A1402-07
謝辞
本研究の一部は科学研究費補助金基盤研究(B)25280081
「オントロジーの多次元的視点管理に基づく領域横断型セマ
ンティックデータの知的探索」の助成による.
参考文献
[Noy 01] Natalya F. Noy, Deborah L. McGuiness : A Guide to
Creating Your First Ontology , Stanford Knowledge
Systems Laboratory Technical Report KSL-01-05 and
Stanford Medical Informatics Technical Report SMI,2001.
[森田 10] 森田武史, 山口高平, : オントロジーの学習の現
状と動向,人工知能学会誌 Vol.25(3), 2005
[Ohta 11] Mamoru Ohta, et al.: A Quality Assurance Framework
for Ontology Construction and Refinement,In Proc. of 7th
Atlantic Web Intelligence Conference (AWIC2011), pp.207216, Fribourg, Switzerland, January 26-28, 2011.
[太田 11] 太田 衛, 古崎 晃司, 溝口 理一郎:実践的なオ
ントロジー開発に向けたオントロジー構築・利用環境
「法造」の拡張 ― 実践編 ―,人工知能学会論文誌,
Vol.26 No.2, pp.403-418, 2011
[Poveda 12] Maria Poveda, Mari Carmen Suarez-Figueroa,
Asuncion Gomez-Perez : Validating ontologies with OOPS!,
Knowledge Engineering and Knowledge Management, 18th
International Conference, (EKAW 2012), pp 267281,Galway City, Ireland, October 8-12, 2012
[溝口 06] 溝口理一郎,古崎晃司,來村徳信,笹島宗彦:
オントロジー構築入門 pp50-52,オーム社,2006[増田
14] 増田壮志,古崎晃司:オントロジー内の is-a 階層の相
似性に基づいた内容洗練システムの開発,第 28 回人工
知能学会全国大会, May 12-15, 2014
[Kumazawa-09] Terukazu Kumazawa, Osamu Saito, Kouji
Kozaki, Takanori Matsui, RIichiro Muzoguchi : Integrated
Research System for Sustainability Science and Springer
2009
07-06