インテリジェントコンテンツ による 情報の加工と利用

情報インフラに基づく
シンボルグラウンディング
電子情報通信学会秋季ソサイエティ大会
NLC主催シンポジウム
「ITとしての自然言語処理技術の応用」
2001年9月20日
橋田 浩一
産業技術総合研究所
サイバーアシスト研究センター、
科学技術振興事業団CREST
1
グラウンディング
2
情報技術の2つの側面

人間を超える




人間に合わせる … グラウンディング




3
高速計算
高速通信
大容量記憶
人工知能
パタン認識
自然言語処理
ヒューマンインタフェース
(シンボル) グラウンディング

デジタル情報を実世界に結びつけ、意味
や価値を与えること (Harnad, 1990)
デジタル世界
グラウンディング
実世界
4
グラウンディング →





5
デジタル情報の意味と価値
人間の生活世界のITによる拡張
すべての人々の生活のあらゆる場面にお
いて、今、ここで、私が使える生きた情報を
提供
実世界に根ざした健全なビジネスモデル
実世界での絆を支援
… コミュニティ形成・運営
グラウンディングへの
伝統的なアプローチ

物理的身体化


ロボット
パタン認識・理解



画像
音
自然言語
当分の間は達成不可能
6
社会情報インフラに基づく
グラウンディング
生活世界
デジタル世界
出逢い
意味タグ
人
情報
位置センサ
モノ
7
関連研究



CARC http://www.carc.aist.go.jp/
2
CAL(IT) http://www.calit2.net/
IBM http://www-6.ibm.com/jp/ebusiness/wireless/


8
MIT Oxygen
http://www.oxygen.lcs.mit.edu/
Hewlett Packard http://cooltown.hp.com/
サイバーアシストプロジェクト
基盤技術
位置に基づく通信
コンテンツ
グラウンディング
位置情報
意味構造
プライバシ保護
非ID通信
割符
目標
9
グラウンディングに基づく
情報サービス
10
サイバーナビゲーション
▲▲・■■方面
2番線
※※方面
3番線
11
○○・××方面
1番線
☆☆・◎◎方面
3番線
サイバーマート
~ レジのないスーパーマーケット ~
マーケティング
データの自動
収集
位置に基づく
商品同定
OUT
IN
梨
150円
膏薬
580円
にんじん 120円
12
空間リマインダ
物理的位置が情報サービスを起動
Cf.
目覚まし時計 =
時刻リマインダ
13
文脈リマインダ



文脈 = 位置 + コンテンツ
文脈がサービスを起動
出逢い支援



14
近くの人やモノとの意味的な照合
プライバシ開示の制御
共有信念の操作
コンテンツと意味構造
15
インテリジェントコンテンツ


意味構造を明示された情報コンテンツ
自然言語の文書、マルチメディアデータ
<su syn=“f”>
<np syn=“c”>
↓ブラウザでの見え
<np>
Jane (Pamela Franklin) and
<persname>Jane</persname>
Cathy (Michele Dotrice)、 two
<persnamep>
British nurses on a bicycle
(Pamela Franklin)
holiday through rural France、
</persnamep>
travel down the wrong road
</np>
and before long Cathy is
<np>
missing. Jane doesn't
…
understand French and …
↑ソースファイル
16
GDA (大域文書修飾)

自然言語の文書のXMLによる意味構造化


意味構造に基づく情報サービス


17
係り受け、照応、etc.
検索、要約、翻訳、提示、etc.
半自動的意味構造化の普及
GDAタグ集合
→ Linguistic DS (MPEG-7第2版)

意味構造


多言語の統一的記述



意味ネットワークへの写像
形態論・統語論の記述を最小化
多用途


18
主題役割、修辞関係、共参照、作用域 (量化、
様相、 etc.)、…
宣言的な意味記述
アノテーションの部分性
意味構造の検索
19
意味構造の類似性による検索
ランク付け 再現率
の方法
キーワード
0.826
+ シソーラス
キーワード
0.783
+ シソーラス
+ 意味構造
20
正解率
F値
0.003
0.006
0.367
0.5
意味構造に基づく
インタラクティブな検索


検索の困難: 検索質問と検索対象の間の表現上
の差異を埋める推論
意味構造を手掛かりとするインタラクティブな推
論


21
例題:フランスで外国人看護婦が行方不明になる
意味構造の精度
→ 検索の性能
→ 半自動的意味構造化の普及
キーワードとして nurse を入力
22
nurse は 71345 回現れる
23
nurse と直接関係する語から missing を選択
24
nurse と missing の関係は 32 回出現
25
nurse と関係する他の語から
British を選択
26
nurse と missing の関係と nurse と British
の関係との組み合わせは 1 回だけ現れる
27
要約と提示

利用者の情報要求や背景知識の多様性


インタラクティブな要約 → 利用者適応



意味構造の利用
検索との組み合わせ
インタラクティブな情報提示

28
万人向けの要約は不可能
スライドを作りながらプレゼンテーション
半自動的意味構造化

人間だけでも機械だけでもできない、本質的
に新しい高度なサービス




雇用の創出


クリエイティビティは不要、リテラシで十分
普及



29
人間 … 個別的文脈における微妙な判断
機械 … 大量、高速、画一的処理
インタラクティブな利用
公開コンテンツ … 検索
収益性の高いコンテンツ … 応用?
再利用性の高いコンテンツ
コンテンツと知能情報技術
30
知能情報技術の流れ

1980年代=知識と推論の時代




意味と文脈
第五世代コンピュータプロジェクト
孤立した思惟 → 状況論
1990年代=データの時代
… フォーディズムの最後の輝き
 規格化された製品・サービスの大量生産・消費
 マスコミュニケーション
 大量データの統計処理による一般性の扱い

2000年代=コンテンツの時代



31
製品・サービスの多品種少量生産・消費
個々の顧客の特定のニーズ
個別的な意味構造の社会的共有
… MPEG-7 MDS、GDA、RDF、etc.
コンテンツ技術と知能技術


構造化のための解析・理解技術
研究用データとしてのコンテンツ



32
画像のground truth
音声対話の意味・語用論的構造
入出力データの標準化 → 情報統合
情報統合
33
まとめ


情報インフラに基づくグラウンディング
コンテンツとしての生活世界


半自動的意味構造化の意義

34
従来の意味でのコンテンツに限らない利用
高度なサービス、雇用の創出