平成17年度大学院 知識システム特論

平成19年度大学院 知識システム特論
(先端ITスペシャリスト・プログラム科目)
山口 高平
居室:慶應義塾大学 理工学部 矢上キャンパス 24-619A
内線:42673
電話:045-566-1614
FAX; 045-566-1617
メール:[email protected]
Web: www.yamaguti.comp.ae.keio.ac.jp
授業計画,資料,成績評価
計画
PART1:知識システム,知識獲得支援システム,
知識モデリング,オントロジー
PART2:セマンティックWeb,RDF(S), OWL, SWS,
ツール,応用
資料:pptスライドやpdf資料をWebに掲載
成績:レポート×2回程度で評価
AI(KT)の歴史
1956年 ダートマス会議
(2006年→AI誕生50周年,人工知能学会20周年)
•
•
•
•
•
•
•
John McCarthey
Marvin L.Minsky
Claude Elwood Shannon
オートマトン≠人工知能(AI)
AI:人間のような知的な動作を機械にさせるには?
GPS (General Problem Solver)
探索の研究 A*アルゴリズム
1965年 AIの3(4)大事件
・導出原理:拡張三段論法J.A.Robinson
1972:Prolog処理系、
1982:第5世代コンピュータ~1994
・DENDRAL:スペクトラム分析→分子構造
ファイゲンバウム(スタンフォード大学)
一つのアプリケーションにしかすぎない,汎用性
・ピアス勧告:MTは不可能
・ファジィ理論:ザデー教授
・推論の時代→ Toy Problems、AI冬の時代へ
1977年 知識は力なり
• HPP:Heuristics Programming Project
完全ではないがたいていの場合うまくいく知識や方法
• MYCINプロジェクト(1973~1976)
•
•
•
•
•
MYCIN,TEIRESIAS,GUIDN,EMYCIN
知識表現、知識利用、知識獲得→知識工学
There is power in the knowledge ! by Feigenbaum
知識の時代へ
エキスパートシステム,自然言語・画像・音声理解システ
ム,知的教育支援システム,...
国家プロジェクト,AIハード・ソフトベンダー
知識獲得ボトルネック→学習へ期待
1995ー現在
• チェスの世界チャンピオンに勝利
カスパロフ(ロシア人)1勝2敗 DeepBlue(iBM) 1997年
「毎回、対戦相手が違っていた気がする」
学習パラメータを変更⇒DeepBlueの振るまいが変わる
• ホンダヒュ-マノイド、AIBO,ロボカップ
• 生物とAI(ゲノム情報...)
GACTTTCAGTAA…… 機能分析,バイオ特許
• セマンティックWeb
• データマイニング
• 知識マネジメント
WWWとブラウザの
過去,現在,未来
図書館のカード目録
MEMEX(メメックス)
MEMory EXtension
ヴァネバー・ブッシュのハイパーメディア
「メメックスとは、人間がそのすべての蔵書、記録、
通信を収納しておく装置で、素早く柔軟に参照でき
るように機械化されている。 これは、いわば所有者
の個人的な記憶の詳細かつ大がかりな補遺のよう
なものといえる。 メメックスは一種の机であり、離れ
たところからも操作できるが、基本的にはユーザー
がそこで作業する家具といえる。 机の上には傾け
た透明のスクリーンがあり、いつでも読めるようにこ
こにデータが投影される。 キーボードと一群のボタ
ンやレバーもある。以上の点を除けば外見上は普
通の机に見えるだろう。」
(1945.7)コンピュータの無い時代に発表
ハイパーテキスト
→複数の文書(テキスト)を相互に関連付けてリンクする仕組み
(ダグラス・エンゲルバートが考案).「テキストを超える」という
意味からhyper- (~を超えた) text (文書) と命名.
テキスト間を結びつける参照のことをハイパーリンクと言う.
ディスプレー上で複数の文献を検索し,それらを一つながりのも
のとして連結するハイパーテキストのような処理が可能な機械
を開発し,1968年のデモンストレーションとなった。
ダグラス・エンゲルバートは,マウス,ワードプロセッサ,
マルチウインドウ・システムなどの発明者.
世界最初のWWWブラウザー
(1990年クリスマス)
Tim Berners Lee: Information Management: A Proposal (1989)
I wrote in 1990 the first GUI browser, and called it "WorldWideWeb".
It ran on the NeXT computer.
http://www.w3.org/People/Berners-Lee/FAQ.html#browser
ハイパーテキストの概念を
ネットワーク上で展開.
CERN(欧州原子力研究所)
における文書の流通
他のコンピューターにアクセスして
他人の文書を見ることができる.
さらに,ハイパーリンクを使って,
また別の文書にも移動できる
WWWを使ってWWWを見る!
http://www.w3.org/History/1994/WWW/Journals/CACM/screensnap2_24c.gif
1993年4月
•
TBLの決断:WebとCERNで開発されたソースコードを公開.CERN
のWeb技術ライセンスの主張放棄.Webが世界中に普及する原点.
2004年6月16日にエリザベス女王よりナイトの称号の授与だれる.
•
NCSA(イリノイ大学,スーパーコンピュータ応用研究所)がブラウザ
Mosaic1.0をリリース.マーク・アンドリューセンが開発担当.
従来,画像は別ウィンドウで表示.
MosaicではWebページ内に表示.
メニューもボタンもアドレスバーあり,
現在のブラウザーの原型となる.
ただ,画像ダウンロードでは残り時間
が表示されず使いにくかった.
ブラウザ戦争
• 1994:Netscape Navigator 1.0
• 1995:インターネット元年
IE 1.0 (=Mosaic) in Windows95<<NN2.0
• 1996:IE2.0, IE3.0 << NN3.0
• 1997~:ブラウザ戦争 IE4.0 = NC4.0
• MSが,OSとIEの抱き合わせによる販売を展開.
IEのシェアが急速に拡大
• 1998年:AOLがNetscapeを買収
IEの停滞 Blue-e
• Netscapeが敗北した後,1998年以降IE技術
革新が停滞.OSとIEが一心同体.2001年か
ら2006年までversion upなし.
• ブラウザーのオープンソース
Firefox(タブブラウジング,RSS,...)
http://www.mozillajapan.org/products/firefox/central.html
IEのセキュリティ問題
• 2004年6月24日~
ウィルス(トロイの木馬)が蔓延
→キーロガー(個人情報を外部にもらす)発生
→IEのセキュリティホールを利用
他のブラウザなら問題なし
→US-CERT(米国コンピュータ非常事態対策チーム)が
「IEを使うな.他のブラウザを使え」と警告
TBLの当初のWeb構想
•
Information Management: A Proposal (1989) by Tim Berners-Lee
http://www.w3.org/History/1989/proposal-msw.html
•
•
•
•
数千人が働く
人々が入れ替わる
組織は常に変化している
情報欠落が起こっている
–
–
–
–
–
–
•
•
•
•
Where is this module used?
Who wrote this code? Where does he work?
What documents exist about that concept?
Which laboratories are included in that project?
Which systems depend on this device?
What documents refer to this one?
Hypertextによる情報の管理を提案
一つの文書で巨大な組織のすべてのことを書くことは不可能
組織は階層的で木構造だが、情報は階層的には管理しにくい
キーワードでの検索では探しにくい
TBL 1st Proposal
Information Management: A Proposal (1989)
• リンクにタイプがあった
–
–
–
–
–
–
depends on
is part of
made
refers to
uses
is an example of
• データ解析を行いたかった
–
–
–
–
自動的な解析
人の居ないdivisionやドキュメントのないソフトウェアの検索
メーリングリストの自動生成
実際の組織の構造を導き出す
セマンティックWeb入門
TBL 2nd Proposal (2001)
Tim Berners Lee, James Hendler, Ora Lassila: The Semantic Web,
http://www.sciam.com/article.cfm?articleID=00048144-10D2-1C70-84A9809EC588EF21&sc=I10032
• Semantic Web
– Webを正しいHypertextシステムにする
– リンクにタイプがある
– データ間の関係を書く
– 文書だけでなくデータを取り扱う
– データにも型がある?
• 自動的な解析を行うことができる
– 推論可能にする
“The Semantic Web
will globalize KR,
just as the WWW
globalized hypertext
WWWが登場する以前、ハイパーテキストは一部の「理想家」だけが
熱心に取り組んでいる特殊な道具でした。
知識表現や機械に理解可能な知識というコンセプトの現在も、
とてもよく似た状況と言えそうです。
「絶対の真実、全ての物事を網羅する知識、あらゆる可能性といった
中央集約型のコンセプト」から離れて、限られた知識で何ができるか
というところからスタートすることで、知識表現におけるWWW、
すなわちセマンティック・ウェブへの未知が開けてくるというのです。
By TBL
Big Picture for Semantic Web (2001)
http://www.semanticweb.org/about.html#bigpicture
セマンティックWebが実現した世界(1)
電話が鳴ったとき、エンターテインメントシステムはビー
トルズの 「We Can Work It Out 」を大音量で再生してい
た。Peteが電話に出ると,ボリューム設定ができる他の
ローカル機器すべてにその電話機がメッセージを送信し,
自動的に音量を下げた.電話の相手は妹のLucyで,病院か
らの連絡だった。「ママは専門医のところへ行って,物理
療法のための診察を受けなくてはならないの。週に2回程
度ね.私はエージェントにアポイントを取ってもらうつも
りよ」と彼女は話した.Peteは即座に,車での送迎は自分
が請け負うと申し出た.
セマンティックWebが実現した世界(2)
この後,セマンティツクウェブのエージェント群が,PeteやLucyや他
のエージェント群と協力しながら物理療法士を選定し,母親のための
一連のアポイントを設定していく.
私たちのエージェントは,ママに処方された治療法についての情報を
医師エージェントから即座に入手し,その提供者の複数のリストを調
べ,ママの自宅から半径20マイル以内で,信頼できる評価サービスに
おいて「きわめて良い」または「とても良い」という評価を得ている,
加入済みの保険のプランでカバーできるところをチェックした.次に
は、アポイント設定が可能な日時(各提供者のウェブサイトを通じて
エージェントが配信している)と,PeteやLucyの多忙なスケジュール
とを突き合わせて,実際に設定可能なアポイント日時を探し始めた。
ZDNetエンタープライズ (2002.12.17)
http://www.zdnet.co.jp/enterprise/
Opinion:現実のものとなるセマンティックWeb
• 人がHTMLページを要求するのではなく、離れたコンピュー
タ同士が意味のある方法で会話できるWebを、XMLよりさら
に高いレベルでつくりあげようという「セマンティックWeb」が
現実味を帯びてきた。W3Cが取り組んでいるほか、国防総
省のDARPAも後押ししている。
• セマンティックWebは単なる騒動かもしれないし、インター
ネットの将来かもしれない。人により意見が異なる。
デビッドワインバーグの批判(2002)
私が危惧するのは,セマンティツクウェブがSGMLと同じ末
路をたどるのではないか-それも基本的に同じ理由で,と
いうことである.
メタデータの正規化が真に機能するのは,
高い報酬が得られ,管理権限が一カ所に集約されており,
ユーザに規範を遵守させやすいような,限定的なアプリ
ケーションにおいてである.
言い換えれば,Webにおいてはうまく機能しない,という
ことだ。
David Weinberge: The Semantic Argument Web,
64.28.79.69/read/swiftkick/colum.html?ArticleID=421
知識工学とセマンティックWebにおけるオン
トロジーの研究開発
知識工学
•
90-: 概念化の明示的仕様
(Tom Gruber オントロジーの定義)
オントロジー記述言語
(Ontolingua)
知識交換言語(KIF)
Generic Ontology
CYC, WordNet, EDR…
PSM
Task Ontology
オントロジー構築方法論
...
セマンティックWeb
• 95-97: XML as arbitrary
structures
• 97-98: RDF
• 98-99: RDFS
• 00-01: DAML+OIL
• 2004.2.10: OWL
• Rule 仕様検討中
Semantic Web Stack
2001
->
2005
セマンティックWeb 参考書
• セマンティックWeb入門、
斉藤・萩野監修、オーム社、2800円
• セマンティック・ウェブのためのRDF/OWL入門、
神崎正英、2800円、森北出版
• ~進化するWeb~セマンティックWeb、
斉藤・萩野監訳、4800円、ジャストシステム
• CD-ROMで始めるセマンティックWeb,
ジャストシステム翻訳,3150円,ジャストシステム
• 知の科学シリーズ:オントロジー工学、
溝口理一郎、3800円、オーム社
セマンティックWeb リンク集
• www.semanticweb.org SW最大ポータルサイト
• www.w3.org/2001/sw/ W3CにおけるSW最新情報
• www.deri.com/ 欧州最大SWプロジェクト
(日本語のサイト)
• www.kanzaki.com/docs/sw/ SW入門最適
• www.jaist.ac.jp/ks/labs/kbs-lab/sig-swo
人工知能学会 セマンティックウェブとオントロジー研究会
• www.net.intap.or.jp INTAP セマンティックウェブ委員会
• http://mmm.semanticweb.org/
www.semanticweb.org
当研究室のSWサイト
人工知能学会
セマンティックWebとオントロジー研究会
特別講演会 2005年5月9日 慶應日吉
Opportunities for Semantics Web Services
in Service Oriented Architectures
• Dr. Michael L. Brodie
• Dr. Michael L. Brodie is Chief Scientist of
Verizon IT. He works on large-scale
strategic Information Technology (IT)
challenges for Verizon Communications
Corporation’s senior executives.
His primary interest is in the optimal use of IT, with an emphasis on
emerging and advanced technologies and practices, to enable
organizational and business objectives, including organizational
change. In addition to Computer Science he investigates the
relationships between economics, business, and technology, and
computing-communications convergence.
第12回研究会
2006年1月28日(土) 慶應・矢上
特集「セマンティックWebサービス」
【招待講演】
Semantically Enabled Service-Oriented
Architectures: A Framework
Dr. Dieter Fensel, Dr. Michal Zaremba (DERI
International)
第13回研究会
2006年7月3日(月) 慶應・日吉
特集:セマンティックWeb応用
【招待講演】
Semantic Web Technologies for Real-World
Applications
Prof. Ulrich Reimer
(University of Applied Sciences St. Gallen,
Switzerland)
Semantic Web Technologies: Opportunities
• Alleviation of information overload
• Querying facts instead of searching texts
• Integration of heterogeneous information sources
• Process integration
• Dynamic formation of business transactions
• Model-driven development of information systems
• Specialization and aggregation of reference models
Semantic Web Technologies: Barriers
• Where do the ontologies come from?
But: Many ontologies already exist
• Where do the semantic content descriptions come from?
Ontology development is expensive.
• Not many people have the expertise to build ontologies.
• How to achieve good cost/benefit ratio?