Ontological Engineering for AIEd Riichiro

セマンティックウェブのお話
溝口理一郎@阪大産研
1
セマンティックウエブとは

コンピュータが理解できるWeb
– 今のWebはコンピュータには単なるbit列
– SWでは,Webの内容がコンピュータにある程度分かる

メタデータ(知識表現)と推論とオントロジー

SWは新しい人工知能研究のそのもの!?
2
HTML->XML->RDF->RDF-Schema->OWL


HTML: 表示のためのタグ付け;タグは固定
XML(eXtensible Markup Language):
表示も意味も含めたタグ付け;タグは自由
– XML-DTD: タグ付けの構文構造と属性値を規定
– ドキュメントへのアノテーション
– XML-Schema: DTDの拡張,名前空間の導入,構文はXML

RDF(Resource Description Framework):
表現のモデルを規定:意味ネットワーク的;構文はXML
– メタデータの記述



RDF-Schema: RDFで使うタグの定義,クラス階層
DAML+OIL: スロット値の制約を強化,公理記述
OWL: DAML+OILの改良版
3
セマンティックウエブの技術的本質






URIによる地球規模で一意なidentityを持つ資源
タグ付けによる資源へのメタデータの付与
メタデータに関する主張
メタデータ表現用の共通言語
共通の理解と語彙を表すオントロジー
新しいメタデータや知識を推論するルール
4
セマンティックウエブの課題の一部

セマンティックウェブはこれまで培われてきた人工知能の研究成果を活かす新しい
世界を提供する.

e-Business,e-Learningやナレッジマネジメントのintelligent化
ウェブサービスのintelligent化

– 簡単な問い合わせの知的処理
– 大規模な分散問題解決

マルチエージェント
– 協調的情報エージェント
– ディジタルシティー

オントロジー
– セマンティックウェブの知的機能を本質的に支える
– 異種の知識源の相互運用性を保証

Semantic Tag Computing
– オントロジーに基づいて定義された意味タグの新しい知識処理のパラダイムを創出する.

言語体系の問題
– 全ての計算メカニズムを支える
– XMLを基礎にする階層モデル
– 言語の意味論から効率的なインプリメントまで

アノテーション技術
– 言語やビジョン等の知覚データと形式的意味記述を体系的に結び付けることによって人間
と人工物との間で意味を共有し,不完全なオントロジーを補完するとともにオントロジー構
築の基盤を確立することができる
5
いくつかの問題点(その1)

知識ベース vs. IT,Web technology
– AI vs. 使える高度IT技術

オントロジー
– 概念 vs. 語彙
– Heavy-weight Ontology 対 Light-weight Ontology
公理あり or 哲学的考察



公理なし or 語彙の集合
ヨーロッパ vs. アメリカ
Local 対 Global
応用指向 vs. 言語指向 vs. 基礎指向
6
いくつかの問題点(その2)

要するにメタデータ付き情報の知的処理の問題

分散 VS 集中
– 集中制御では育たない
– 自由放任で多様なオントロジー間の意味的相互運用可能性は保て
るのか?


誰がメタデータを作るのか? 人手 or 自動?
どうやってSWは立ち上がるのか?
– Webと同様個々人の力?
• Webがe-businessを可能にした(逆ではない)
– SWもWebと同様に成長するのか?

Web情報検索の高度化だけがゴールで良いのか?
7
メタデータを対象にしたAI
これまでのAIとはどこが異なるのか?

知識表現
– 従来:閉世界,無矛盾,集中制御,知識ベース,一様,小規模
– SW: 開世界,矛盾あり,分散制御,メタデータ,多様,大規模

問題解決
– 従来:診断,設計,計画,etc.
– SW: 情報検索,ナレッジマネジメント,etc.

(自動)プログラミング
– 従来:小さな多くのモジュールの結合,共通のプラットフォーム
– WS: 大きな少数モジュールの探索と結合,プラットフォーム独立

オントロジー
– 従来(ヨーロッパ):哲学的考察に基づいた概念体系
– SW(アメリカ):コンピュータ理解可能な語彙セット
• 複数オントロジーのアラインメントや統合
8
AIからIAへ

Artificial Intelligence

Intelligence Amplifier
Intelligent Assistant
Intelligent Access
Informaton Access



9
Research Challenge and
Perspectives of the Semantic Web
EU-NSF Strategic Workshop
France, Oct. 3rd-5th, 2001
http://www.ercim.org/EU-NSF
10
主要な項目
1. アプリケーションシナリオ
2. 言語と推論
3. 基底構造(Infrastructure)
4. オントロジー
5. Human factor
6. サマリー
http://www.ercim.org/EU-NSF
11
アプリケーションシナリオ

E-Commerce
–
–
–

e-Science Knowledge Grids
–
–
–

バイオサイエンスで起こりつつあるWebベース協調研究環境の総体
地球規模でデータ,処理などを共有するデータリッチ,計算リッチなアプリのた
めのプラットフォーム
大規模分散情報管理,実験プロセスやワークフローの明示的な管理,統制さ
れた分散資源管理,協調による科学,統制された科学
個人のためのセマンティックウェブ
–

P2P:商売相手の探索
多様なデータの互換性の確保
多様なビジネスロジックの相互運用性 Web service
その日に出会った人(Peter)のvCardをもとにアシスタントエージェントがその
人にあわせるべきパートナーとしてBillを紹介する.BillとPeterはアシスタント
のネゴでmeetingを設定....信用の問題が非常に重要になる.
知識管理
–
–
–
知識創造のワークコンテキストへのSeamlessな統合
知識のコンテキスト依存性=>オントロジー学習
e-LearningとKMの融合
12
言語と推論


言語の氾濫
異なったモデリングスタイル
– 論理,意味制約,オブジェクト指向,DB検索




異なった推論サービス
–
–
–
–
–
–
ドメイン記述からの帰結を推論
一貫性チェック
二つの記述の同一性判定
二つの記述の類似度の計算
関係の循環などの問題の検出
あるクラス階層内でのインスタンスの分類
–
–
–
–
正確かつ完全な推論
近似的な推論
任意時点停止可能アルゴリズム
有限資源下推論
同一性:URIだけでは不十分,その解釈:「第20代日本国首相」
モジュラー性
世界全体の協調が必須
13
基底構造

今後の課題
– スケーラビリティーのある基底構造の開発
– 特定のモデルに依存しない一般性のあるもの
– 使えるもの

モデルに関して
– 信用,信頼
– 同一性
– モデル変換のProperties(何を捨てて,何を保存したか;粒度は)

ツールに関して
– 場所同定と資源のマッチング
– 証明と方針のチェック
– 信用と証明と報酬の伝搬

実験
–
–
–
–
証明が持っていける変換(proof-carrying …)
信用の伝播
権利管理
頑健性
14
オントロジー

オントロジー開発が戦略的に見て必要な領域
– 情報,および情報処理(情報(表現)と実世界のもの)
– 社会的「モノ」のオントロジー:組織,会社,人々,国,法律など
– 社会的交流のオントロジー

ツールへの要求
–
–
–
–

複雑なオントロジーの可視化
協調作業によるオントロジー構築支援(合意形成支援)
上で行われた議論の管理やオントロジーの設計意図の利用
モジュラー性とオントロジー変換の支援
将来の課題
–
–
–
–
–
–
多種の知識源からのオントロジー獲得(学習)
オントロジー比較,マージ,版管理,洗練,評価
フォーマルオントロジーの原理(統合的概念分析方法論の基礎)
Identityに関する理論的考察
基盤オントロジーのライブラリー
重要なオントロジーの開発
15
Human factors


本物の業務の環境で持続的な利用
セマンティックウェブの成長モデル
–
–
–
–

Webのまねをする
Webのまねをするな
両方を掛け合わせたもの(communityの中ではWebのまねをしてもよい)
多様な利用者をサポートするツールや環境
次世代環境
– HTMLエディタの進化が示唆するものは?
– 言語への影響は?XMLユーザーはRDFを勉強する気にならない.今のWeb
peopleを抵抗なくSWへ引き込むには?過去の言語の標準化の成功・失敗から
学ぶべきものは?
– 知らぬ間に” capture”(メタデータ作成や知識ベースの構築)をやってしまってい
るようにするために必要な戦略は?

メタデータの乱立
– 避ける
– 許容する
– きれいにする

合意形成の支援
– ドメインは生きている,境界も流動的
16
Human factors(続き)

メタデータ利用法のより深い理解
– メタデータのlayering(多様性への対応)
– お化粧・素顔(メタデータは一種のファッション;流行あり)
– メタデータの資源へのバインド(メタデータ遊離させない)

過去の経緯の保存と分析
–
–
–
–

後戻り,
説明生成
デバッギング
設計意図
情報洪水の軽減に如何に貢献できるか
– 個人適応エージェント,email管理,協調フィルタリング


気軽な「意味まで踏み込んだ協調」
程々の「意味の相互運用可能性」
17
私見(その1)

真理は中庸にあり
–
–
–
–
–

無秩序な放任も,ガチガチの集中制御もダメ
SWはWebと全く同じ成長過程は辿らないのでは?
e-Businessやe-Learningなどの組織的な応用の先導が必要
Semantic Interoperabilityの実証実験
そのような応用分野で早くオントロジーを構築すべき
e-Learning
– 標準化がかなり進んでいる
• IEEE LTSC, IMS, ADL, Ariadne, etc.
• ALIC(先進学習基盤協議会): CSCL
• LOM(Learning Object Metadata)
SCORM(Sharable Content Object Reference Model)
LIP(Learner Information Package)
• e-Learningの機能要素のWebサービス化

e-Business
– EAI, e-MarketplaceなどへのセマンティックWebサービスの応用
18
私見(その2)

新しいAI研究
– メタデータの上でのAI
• Open,分散制御,巨大空間
• 知識表現,推論,問題解決,自動プログラミング,オントロジー
– Semantic Interoperabilityの確保
– SW上での「知の体系化」
• ボトムはWebページ(or URI)+メタデータ
• Local communityで独自のタグとメタデータの開発と利用
• 更に上位のコミュニティーでオントロジー開発, alignment,統合

SWを大規模知識ベースと見なす
– 生データ(URI) <=人間にとっての知識
– メタデータ <= 機械にとっての知識
– 高次データ <= オントロジー
19
私見(その3)

要するにメタデータ付き情報の知的処理の問題

メタデータを付けるには「タグセット」が必要
「タグセット」を意味づけるのがオントロジー
支援付き放任と統制のとれた先導研究
SWにおける意味の相互運用可能性を支えるため
のオントロジー
SWを利用して知を体系化するためのオントロジー




20