SIG-SWO-A1402-07 Is-a 階層の粒度の差に着目したオントロジー内容洗練支援シ ステムの試作と評価方法の考察 A Prototyping of an Ontology Contents Refinement System based on Grain size Differences of Specialization among hierarchies 増田壮志 1 古崎晃司 2 Takeshi Masuda1, Kouji Kozaki2 大阪大学大学院工学研究科 Graduate School of Engineering Osaka University 2 大阪大学産業科学研究所 2 The Institute of Scientific and Industrial Research(ISIR),Osaka University 1 1 Abstract: We proposed an ontology refinement system which can make more consistent ontology by fixing the differences of the gain size between is-a hierarchies. In this paper, we will discuss this refinement system and an evaluation technique. 1. はじめに 近年,オントロジー工学は,医療情報,生物規範 工学やセマンティックウェブ等の様々な領域で応用 システムのモデルや知識基盤として利用されている. その中でオントロジーの品質は,それを利用するシ ステムに直接的に影響を及ぼす重要な要素である. そのためより良いオントロジーの構築は重要な課題 であると考えられている. しかしながら,オントロジーの構築にはオントロ ジーそのものの知識はもとより,構築しようとして いるドメインの専門知識も不可欠である.そのため, 一般にオントロジー構築は容易なものではなく,そ の構築方法や支援方法の確立が望まれている. オントロジー構築支援に関しては,まず,オント ロジーの大枠の構築を支援する方法がある.オント ロジー構築プロセス全般のガイドラインの提案[Noy 01]や,Wikipedia の半構造化情報[森田 10]などの既 存の情報を利用した半自動構築などである.一方, オントロジーの品質を向上させるための洗練支援を 行うといった方法も考えられてきており,本研究で は,ある程度構築されたオントロジーに対して,そ の品質を向上するための洗練支援を目的としている. 2.オントロジー洗練支援 オントロジー洗練方法としては,オントロジーの 文法規則に関する形式的なエラーの検出,修正をす る方法と,オントロジーの内容を洗練する方法の 2 種類がある.オントロジーの形式的なエラー修正に 関しては,推論機構の整合性機能を用いた手法が多 く提案されている[太田 11, Ohta 11].また owl 上で よく見られる間違いを列挙し,その幾つかについて 修正をするといったものも存在している[Poveda 12]. 本論文では,オントロジーの内容を洗練すること を目的として,修正箇所の検出とそれらに関する洗 練方法の提示を計算機に行わせ,その結果をシステ ムユーザが判断し洗練を行う半自動的な内容洗練シ ステムの紹介をするとともに,そのシステムの評価 方法について述べる. 3. is-a 階層の粒度の差に着目したオ ントロジー洗練手法 3.1. 一貫性の高いオントロジー オントロジー内には,ある概念階層が定義される際 に他の概念階層の概念を参照するため,is-a 階層が 部分的に相似形となっている部分が見られる.この 性質は,一貫性のあるオントロジーを構築する際の 指針の一つである「ある概念の下位概念において, その分類は同じ性質を参照して行われることが望ま しい」[溝口 06]に従った結果であると考えられる. 例えば,図 1 の is-a 階層を考える. “乗り物”はその 下位で“陸上乗り物”と“航空機”の 2 つの概念に 特殊化されているが,この時,それぞれの概念にお いてクラス制約として参照している概念はそれぞれ 07-01 SIG-SWO-A1402-07 “自然空間”,“陸上”,“空”であり,どちらも移動 空間で分類され,スロットも特殊化されている.同 様に, “自転車”もクラス制約として参照している概 念の is-a 階層に沿って,そのクラス制約が特殊化さ れている.このように,ある概念を特殊化するとき はそのスロットも特殊化される.ここで「クラス制 約の特殊化に伴うスロットの階層」を“スロット階 層”,「スロットのクラス制約となっている概念の階 層」を“被参照概念階層”と以下では呼ぶことにす るが,それらは相似形となる.さらにスロットの階 層はそのスロットを持つ基本概念階層に沿って形成 されるため,オントロジー内では, “基本概念階層” , “スロット階層”, “被参照概念階層”の 3 つの階層 が部分的に相似形となっている箇所が多く見られる と言える. 本研究では,これら 3 つの階層をそれぞれ比較す ることによって非相似形となっている箇所を洗練支 援対象候補として検出し,洗練方法の提案を行う. それらをオントロジー構築者に提示することによっ てオントロジー洗練支援としている. に特殊化されている.一方,“自動車”スロットのクラス制 約である“レース車両”, “F1 マシン”を含む被参照概念階 層は,それらの概念間に “フォーミュラーカー”という中 間概念が存在し 3 段階に特殊化されており,基本概念階層 及びスロット階層に比べより詳細に定義されている.そう いった箇所が検出された場合には,それぞれの階層の特殊 化の粒度を揃えるような修正方法を提示する.図 2 の例の 場合であれば,基本概念階層の“レース競技”と “F1 競技” の中間に“フォーミュラーカー競技”を加え,さらに“フォ ーミュラーカー競技”に於いて,“自動車”スロットを加え そのスロットのクラス制約を“フォーミュラーカー”とす る,といった修正案の提示を行う. 図 1 特殊化の粒度が異なっている例 3.3. 検出された洗練候補箇所の分類 図 2 is-a 階層の相似性 3.2. is-a 階層の粒度の差に着目した洗練候 補箇所の検出 スロット階層を基に,対象のオントロジーから非相似形となっ ている箇所を検出するために,本研究では,まず,スロット階 層に着目し,それらのスロットを持つ基本概念階層とそれらの スロットのクラス制約となっている被参照概念階層を比較し,ス ロット階層には存在しない概念が基本概念階層もしくは,被参 照概念階層に存在した場合,それぞれ 3 つの概念階層の特 殊化の粒度が異なっているので,3 つのうちで粒度が粗いもの に対して概念もしくはスロットの追加を提案することでそれぞれ の階層の特殊化の粒度を揃えるような提案をユーザに提示す る. 例として図 2 の is-a 階層を考える.この例で着目しているス ロット階層は,図 2 中の基本概念階層の“レース競技”で定義 されている“自動車”スロットとその下位スロットからなる 階層である.いまそれらのスロットを持つ概念からなる基 本概念階層は,着目しているスロット階層と同じく 2 段階 スロット階層と他の 2 階層を比較する際に,比較元 となるスロット階層の構造として,本論文では 3 種 類とした. (a)is-a 階層を構成している 2 つのスロットからなる スロット階層 (b)最上位のスロット (c)最下位のスロット この 3 種類である. また,3.4 節で詳細を述べるが,検出された部分の基 本概念階層及び被参照概念階層のそれぞれの特殊化 の粒度の数により適用できる洗練方法が異なるため, (a)についてはそれぞれの中間概念の数の関係,(b)に ついてはそれぞれの上位概念の数,(c)についてはそ れぞれの下位概念の数を考慮し,上記の(a),(b),(c)を より詳細に分類した. まず(a)についてであるが,中間概念の数は以下の 3 つの観点により分類可能である. • 基本概念階層での中間概念の有無 • 被参照概念階層での中間概念の有無 • 基本概念階層と被参照概念階層での中間 概念数の差 07-02 SIG-SWO-A1402-07 その結果, 1. 基本概念階層と被参照概念階層のどちら にも中間概念が無い 2. 基本概念階層と被参照概念階層の両方に 中間概念が存在し,その数が等しい 3. 基本概念階層と被参照概念階層の両方に 中間概念が存在するが,基本概念階層の方が多い 4. 基本概念階層と被参照概念階層の両方に 中間概念が存在するが,被参照概念階層の方が多い 5. 基本概念階層のみに中間概念が存在する 6. 被参照概念階層のみに中間概念が存在す る (a)は以上に示す 6 つに分類可能である.ただし,1 に 関しては 3 階層の粒度の差が無いため,洗練支援の 候補とはならない. 次に,(b)はそれぞれの上位概念の数で分類できるが その観点は以下の 2 点である. • そのスロットを持つ基本概念の上位概念 の有無 • そのスロットを参照している被参照概念 の上位概念の有無 その結果, 1. 基本概念階層,被参照概念階層の両方に上 位概念が無い 2. 基本概念階層のみに上位概念が有る 3. 被参照概念階層のみに上位概念が有る 4. 基本概念階層,被参照概念階層の両方に上 位概念が有る 以上の 4 つに分類可能である.(b)の1の場合も(a)の 1 と同様に元から 3 つの階層の粒度が揃っているた め,洗練提案はされない. 最後に(c)についてであるが(b)と同様に, • そのスロットを持つ基本概念の下位概念 の有無 • そのスロットを参照している被参照概念 の下位概念の有無 で分類すると, 1. 基本概念階層,被参照概念階層の両方に下 位概念が無い 2. 基本概念階層のみに下位概念が有る 3. 被参照概念階層のみに下位概念が有る 4. 基本概念階層,被参照概念階層の両方に下 位概念が有る の 4 種類となった.この場合の 1 も粒度が揃ってい るため洗練候補より除外される. 以上より, (a)2~6, (b)2~4, (c)2~4 の計 11 種類に対し て,システムによって洗練方法が提示される. 3.4. 提案される洗練方法をその適用先 3.3 節で述べた各分類に適用できる洗練方法は,そ れぞれの概念構造によって異なるので,洗練方法の 種類とその適用先について述べる. (1)既存の概念を利用し,基本概念階層にスロットを 追加する この洗練方法が適用可能なのは,被参照概念階層 の中間概念の数が基本参照概念階層の中間概念の数 より大きい場合,且つ基本概念階層に少なくとも一 つ概念が存在する場合,すなわち,(a)-2, 3, 4 (b)-4, (c)4 の場合に適用可能である.(図 3) 図 3 洗練方法(1) (2)被参照概念階層の中間概念を参考に基本概念階 層に新規概念を追加しそこにスロットを追加する. この洗練方法は,被参照概念階層に少なくとも 1 つ中間概念が存在する場合に適用可能である. (1) との相違点は,基本概念階層に中間概念が存在しな い場合にも適用可能である点である.すなわち,(a)2, 3, 4, 6 , (b)-3, 4 (c)-3, 4 の場合に適用可能である. (図 4) 図 4 洗練方法(2) (3)基本概念階層の中間概念を参考に被参照概念階 層に概念を追加しその概念をスロットのクラス制約 とする. 07-03 SIG-SWO-A1402-07 この洗練方法は,基本概念階層に少なくとも一つ 中間概念が存在すれば適用可能である.すなわち(a)2, 3, 4, 5 , (b)-2, 4 (c)-2, 4 の場合に適用可能である. (図 5) オントロジーを処理するためのライブラリとして HozoCore お よ び 法 造 OAT ( Ontology Application Toolkit)を利用している . 4. 本洗練支援システムに対する評価 4.1. 本システムに対する予備的評価 図 5 洗練方法(3) 3.3 節で示した検出箇所の分類と 3.4 節で示した洗 練方法の関連を表 1 にまとめた 表 1 検出箇所分類と洗練方法の関係 3 章までで提案してきたオントロジー洗練支援シ ステムが提示する洗練候補箇所及び方法の妥当性を 評価するために,以下の 2 点についての予備的な評 価実験を行った. [1] 各オントロジーに対する洗練候補検出数 について 複数のオントロジーに対して,それらの規模に対 してどの程度の数の提案がなされるかを調べた. [2] 洗練提案の妥当性 初心者が構築オントロジーに対してシステムが推 定した,支援適用先候補箇所について, 「提案された 洗練方法を適用することが,オントロジーの内容洗 練として適切かどうか」を筆者が判断し,適当と考 えられる提案の割合を調べた. 妥当性の判断に関する[2]の予備的評価実験にお いて,システムの提案の妥当性を判断したのは筆者 自身であり,さらに評価に用いたオントロジーも筆 者自身が構築したものではあるものの,全体として 44%の洗練提案に対して妥当である[増田 14]とい う判断を下すことが出来た.そこで,より本格的な 評価実験を行う必要性を見出したため,以下 4.2 節 以降に述べる実験を計画した. 4.2. 実験目的 3.5. 洗練支援システムの試作 3.2~3.4 節で提案した洗練手法に基づきオントロ ジーの内容洗練支援システムを試作した.本システ ムは,対象オントロジーより,スロット階層とそれ に伴う基本概念階層と被参照概念階層の特殊化の粒 度に差が生じている箇所を検出し,それぞれの箇所 に応じた洗練方法を提案するものである.システム 全体としては,3 つのモジュールから構成されてお り,洗練支援候補箇所を検出する「支援適用先候補 推定モジュール」,推定された箇所に応じた洗練支援 案をユーザに提示し,適用する修正案を選択するた めの「支援適用先候補表示・選択モジュール」 ,ユー ザが選択した修正案をオントロジーに反映し定義内 容を修正する「支援適用モジュール」の 3 つである. なお,本システムの実装には Java を用いており, 本システムの提案する洗練支援候補に対する妥当 性の客観的評価を得ること及び提案が不適切である とされたものについてそれらがどういった傾向を持 つのかを調査することである. それにより本システムにおける洗練提案の妥当性 の向上に対する示唆が得られると考えている. 4.3. 評価対象 評価の対象として考えているオントロジーとして, (a)オントロジー構築専門家が構築したオントロジ ー 1. サ ス テ ナ ビ リ テ ィ サ イ エ ン ス オ ン ト ロ ジ ー [Kumazawa 09] 2.乗り物オントロジー 07-04 SIG-SWO-A1402-07 (b)オントロジー構築初心者が作ったオントロジー 1. ボート競技オントロジー 2. 打楽器オントロジー 3. 列車オントロジー 4. 交通オントロジー の 6 つを想定している.各オントロジーにおける, システムによる提示されるオントロジー洗練支援候 補箇所数を表 2 に示す. 表 2 中の(a)2~6, (b)2~4, (c)2~4 は,3.3.節で述べた分類分けのとおりである. 次に,実験参加者にどのように洗練候補箇所及び洗 練提案を提示するかについて説明する.実験参加者 に評価させる対象としては,システムが検出した洗 練支援候補箇所をランダムで抽出したものに対して 実験参加者に評価させる.実験者に評価させる洗練 支援適用箇所数は,50 箇所を想定しており,実験時 間としては,2~3 時間程度かかると想定している. また,分類毎の数は,分類(a)から 30 箇所,分類(b),(c) から 20 箇所と考えている.また,表 2 に示す通りオ ントロジーによって検出数が少ないものが存在する ため,一つのオントロジーからそれらの箇所を検出 することは困難であるため,実験者に提示する洗練 提案箇所は,一つのオントロジーから得られた候補 だけではなく,4.3 節の冒頭で提示した 6 つのオント ロジーから横断的に抽出したものを想定している. 実験参加者にシステムが推定した洗練支援候補箇 所とそれに伴って提案される洗練方法を見せる.洗 練支援候補箇所は,粒度の差を比較する 3 つの階層 「基本概念階層」,「被参照概念階層」および「スロ ット階層」をグラフで見せる. 提案される洗練方法は,テキストで表示する.そ の際それぞれの方法が(1)で示した例のどれに当た るのかを明示しておく. (3)評価 各洗練候補箇所に対して提案される洗練方法の妥 当性について,以下の 3 段階の評価基準を設け,実 験参加者に評価していただく. ○:提案が妥当である. △:不適切ではない. ×:提案が不適切である. 各洗練候補箇所に対して洗練方法は,図 6 に示さ れるように複数個提案されるので,それぞれの洗練 方法毎に評価をしていただく. (2)及び(3)を 50 箇所の洗練支援提案に対して行っ た後,最後に全体として,△及び✕として評価された 洗練提案についての自由記述をさせる. 図 6 実験参加者に提示する洗練候補例 5. まとめと今後の展望 表 2 オントロジー毎の洗練支援適用箇所数 4.4. 評価実験の流れ 次に,実際に行う実験の流れについて説明する. (1)インストラクション 実験参加者に 3.4 節で示した各洗練方法について 実例を示しながら実験中に実際に考える操作につい ての説明を行う.この時示される例は,実験で用い るオントロジーとは別のオントロジーを利用する. (2)洗練候補の提示 本研究では,is-a 階層間の特殊化の粒度の差に着 目したオントロジーの内容洗練支援システムの提案 及び本システムに対する客観的な評価方法に関する 考察を行った. 今後,筆者の所属する研究室の学生等に協力を得 て,今回紹介した評価手法を用いた予備実験を通し て改良を加えた後,研究室内外のオントロジー専門 家等の協力を仰ぎ,より本格的なシステムの評価実 験を行ないたい.それらの評価実験から得られた考 察を反映することにより本システムが行う洗練提案 の精度を向上させたいと考えている. 07-05 SIG-SWO-A1402-07 謝辞 本研究の一部は科学研究費補助金基盤研究(B)25280081 「オントロジーの多次元的視点管理に基づく領域横断型セマ ンティックデータの知的探索」の助成による. 参考文献 [Noy 01] Natalya F. Noy, Deborah L. McGuiness : A Guide to Creating Your First Ontology , Stanford Knowledge Systems Laboratory Technical Report KSL-01-05 and Stanford Medical Informatics Technical Report SMI,2001. [森田 10] 森田武史, 山口高平, : オントロジーの学習の現 状と動向,人工知能学会誌 Vol.25(3), 2005 [Ohta 11] Mamoru Ohta, et al.: A Quality Assurance Framework for Ontology Construction and Refinement,In Proc. of 7th Atlantic Web Intelligence Conference (AWIC2011), pp.207216, Fribourg, Switzerland, January 26-28, 2011. [太田 11] 太田 衛, 古崎 晃司, 溝口 理一郎:実践的なオ ントロジー開発に向けたオントロジー構築・利用環境 「法造」の拡張 ― 実践編 ―,人工知能学会論文誌, Vol.26 No.2, pp.403-418, 2011 [Poveda 12] Maria Poveda, Mari Carmen Suarez-Figueroa, Asuncion Gomez-Perez : Validating ontologies with OOPS!, Knowledge Engineering and Knowledge Management, 18th International Conference, (EKAW 2012), pp 267281,Galway City, Ireland, October 8-12, 2012 [溝口 06] 溝口理一郎,古崎晃司,來村徳信,笹島宗彦: オントロジー構築入門 pp50-52,オーム社,2006[増田 14] 増田壮志,古崎晃司:オントロジー内の is-a 階層の相 似性に基づいた内容洗練システムの開発,第 28 回人工 知能学会全国大会, May 12-15, 2014 [Kumazawa-09] Terukazu Kumazawa, Osamu Saito, Kouji Kozaki, Takanori Matsui, RIichiro Muzoguchi : Integrated Research System for Sustainability Science and Springer 2009 07-06
© Copyright 2024 ExpyDoc