スライド 1

第62回言語・音声理解と対話処理研究会
統語論に基づく新しい意味理論の提案
上山あゆみ(九州大学)
[email protected]
生成文法のモデル
Numeration (いくつかの
単語の集合)
Computational
System
PF(Phonological Form:
単語を構造化した、音関
連の表示)
LF (Logical Form: 単語を構造化
した、意味関連の表示)
2
世界知識
 Information Database
 具体的なモノ/コト(オブジェクト)が、指標番号で区別さ
れ、次のような形式で、その性質とともに記憶されている
On:attribute1=value1, attribute2=value2, attribute3=value3,...
X19:名称=ジョン, 類=大学生, 年齢=20, ...
X225:名称=渡辺くん, ...
E65:名称=北京オリンピック, 開催年=2008年, 開催国=中国, ...
E923:名称=○○海岸OL殺人事件, 犯人= X45, 被害者= X225, ...
E82:類=落とす, 落下物=X53, 行為者=X19,...
3
言語と世界知識の接点
Numeration
Lexicon
Computational System
PF
LF
(Semantic Representation)
SR
Working Space
Information
Database
Inference rules
4
言語と世界知識
 John kissed Mary.
どのようにして、これらが結びつくのか?
X 19: 名称=John, 類=大学生, 年齢=20, ...
X 22: 名称=Mary, 類=OL, 年齢=24, ...
E 614: 類=kissed, Patient= X22, Agent= X19, ...
5
SR (Semantic Representation)
 John1 kissed2 Mary3
変換
o1: ... John ...
o2: ... Mary ...
o3: ... kissed ...
知識内の検索と同定
X 19: 名称=John, 類=大学生, 年齢=20, ...
X 22: 名称=Mary, 類=OL, 年齢=24, ...
E 614: 類=kissed, Patient= X22, Agent= X19, ...
6
SR (Semantic Representation)
 John1 kissed2 Mary3
変換
xo1: 名称
... John
=John
...
linguistic
x
o
:
名称
...
Mary
=Mary
...
2
SR
e
o3: 類
... =kissed,
kissed ...Patient=x2, Agent=x1
知識内の検索と同定
X 19: 名称=John, 類=大学生, 年齢=20, ...
X 22: 名称=Mary, 類=OL, 年齢=24, ...
E 614: 類=kissed, Patient= X22, Agent= X19, ...
7
語彙の「意味」と構造の「意味」
 「John1 Mary2 Alaska3 go4」
変換
x1: 名称=John
x2: 名称=Mary
x3: 名称=Alaska
e4: 類=go, Goal=_, Agent=_
知識内の検索と同定
X11: ... 名称=John, ...
X204: ... 名称=Mary, ...
X4743: ... 名称=Alaska, ...
E61: ... 類=go, ...
8
xn型のSR式を導入しうる表現
John1
SR式
x1: 名称=John
知識内の検索
x1 = X19
あのOL3
SR式
x3: 類=OL
知識内の検索
x3 = X22
その4人11
SR式
x11: 人数=4人
知識内の検索
x11 = X105
X19: 名称=John, 類=大学生, 年齢=20, ...
X22: 名称=Mary, 類=OL, 年齢=24, ...
X105: 名称=ビートルズ, 人数=4人, ...
9
同定(Identification)
 同定そのものは、言語のシステムの外の操作
 であるが、表現によっては、即時の同定を要求する
ものがある。
(7) A: ジョンがメアリを推薦したんだって。
B1: (その事実を知らない)へえ、そう。
B2: (そのジョンを知らない)え、ジョンって?
 情報量の問題ではない。
(8) A:ジョンっていうやつがメアリを推薦したんだって。
B:へえ、そう。
(9) A: 誰かがメアリを推薦したんだって。
B: へえ、そう。
10
en型のSR式を導入しうる表現
北京五輪2
落ちた1(Theme) 落とした38(Theme, Agent)
SR式
SR式
SR式
e2:名称=北京五輪
e1:類=落ちた,
e38Theme=_
:類=落とした, Theme=_, Agent=_
知識内の検索
e2 = E65
知識内の検索
e1 = E22
知識内の検索
e38 = ??
E65: 名称=北京五輪, 開催年=2008年, ...
E22: 類=落ちた, Theme=X24, ...
E8825:類=落とした, Theme=_, Agent=_...
11
attributeを示してvalueを指す表現
 「彼女の年齢をこの欄に書いてください。」
=欄に「25」と書く
 「彼女の名前をこの欄に書いてください。」
=欄に「陽子」と書く
 「犯人を連れてきてください。」
=その事件の犯人である人物を連れてくる
12
vn型のSR式
X19:名称=John, 類=大学生, 年齢=20, ...
X22:名称=Mary, 類=OL, 年齢=24, ...
E614:類=kissed, Patient = X22, Agent= X19, ...
E614 Patient
X22
X22 : Patient(E614)
John :名称(X19)
大学生 : 類(X19)
20 : 年齢(X19)
vn型のSR式
value :attribute (object)
13
vn型のSR式を導入しうる表現
年齢2
SR式
v2: 年齢( )
オブジェクトの同定
v2 : 年齢(X19)
知識内の検索
v2 =20
犯人4
SR式
v4: 犯人( )
オブジェクトの同定
v4 : 犯人(E246)
知識内の検索
v4 = X22
目標1
SR式
v1: 目標( )
オブジェクトの同定
v1 : 目標(X19)
知識内の検索
v1 = E205
X19: 名称=John, 類=大学生, 年齢=20, ...
E246: 名称=○○殺人事件, 犯人=X22, ...
14
attributeを表すが、
valueだけを指しているわけではない表現
 「彼女の年齢にはびっくりした。」
≠「25才にびっくりした」
=「彼女が25才であるということにびっくりした。」
 「名前は関係ない。」
≠「陽子は関係ない」
=「名前が何であるかは関係ない。」
 「犯人は知りません。」
≠「X22は知りません」
=「犯人が誰なのか、知りません」
15
an型のSR式
X19:名称=John, 類=大学生, 年齢=20, ...
X22:名称=Mary, 類=OL, 年齢=24, ...
E614:類=kissed, Patient = X22, Agent= X19, ...
E614 Patient
X22
a1: Patient(E614)= X22
a2:名称(X19)=John
an型のSR式
a3:類(X19)=大学生
an :attribute(object)=value
a4:年齢(X19)=20
16
an型のSR式を導入しうる表現
年齢2
SR式
a2:年齢( )=_
オブジェクトの同定
a2:年齢(X19)=_
知識内の検索
a2:年齢(X19)=20
犯人4
SR式
a4:犯人( )=_
オブジェクトの同定
a4:犯人(E246)=_
知識内の検索
a4:犯人(E246)=X22
黄色い1
SR式
a1:_( )=黄色い
オブジェクトの同定
a1:色(X79)=黄色い
知識内の検索
a1:色(X79)=黄色い
X19: 名称=John, 類=大学生, 年齢=20, ...
E246: 名称=○○殺人事件, 犯人=X22, ...
X79:色=黄色い,...
17
SR式を導くために知らねばならない語彙の知識
 導入しうるSR式の型
 en: attribute = value (その表現はvalueに対応する)
 このattributeは?
 他に指定されたattribute(=いわゆる「項構造」)は?
 xn: attribute = value (その表現はvalueに対応する)
 このattributeは?
 他に指定されたattribute(=いわゆる「項構造」)は?
 vn: attribute(object) (その表現はattributeに対応する)
 an: attribute(object)=value
 その表現がvalueに対応する場合、そのattributeは?
 その表現がattributeに対応する場合もありうる。
18
構造の違いによる意味の違い
x2:類=ギター, 色=白い
x3:類=箱
(a)
箱3
白い1
a1:色( )=白い
x2:類=ギター
x3:類=箱
ギター2の
(b)
x2:類=ギター
x3:類=箱, 色=白い
白い1
ギター2の
箱3
19
修飾のSRとアブダクション
○1: ... α ...
○2: ... β ...
α1
β2
|○1
○1は○2に「関連している」
 「関連している」とは?
 [推論1] ak:Attribute(oi)=Valuej ⇒ oi:.... | ak
 [推論2] oi:.... Attribute=vj ... ⇒ oi:.... | vj
 [推論3] oi:....Attribute=oj, ...,Attribute=ok ...⇒oj:.... | ok
 [推論4 <symmetry>] α:... |β
⇒ β:... |α
 [推論5 <transitivity>] α:... |β かつ、β:... |γ
⇒ α:... |γ
20
修飾関係 1
linguistic SR
フロリダ産1の
オレンジ2
a1:産地( )=フロリダ
x2:類=オレンジ |a1
「|」を解くためのアブダクション
a1:産地(x2)=フロリダ
と仮定すると、
[推論1] より、
x2:.... | a1
が導出されるので、
この仮定は適切。
∴ x2:類=オレンジ,産地=フロリダ
[推論1] ak:Attribute(oi)=Valuej ⇒ oi:.... | ak
21
修飾関係 2
linguistic SR
高校生1の
子供2
v2:子供(x1)
x1:類=高校生, 子供=v2
v2: ... |x1
x1:類=高校生
v2:子供( ) |x1
と仮定すると、
となり、
[推論2]とsymmetry により、
が導出されるので、
この仮定は適切。
[推論2] oi:.... Attribute=vj ... ⇒ oi:.... | vj
[推論4 <symmetry>] α:... |β
⇒ β:... |α
22
修飾関係 3
linguistic SR
落ちた1
おもり2
e1:類=落ちた, Theme=_
x2:類=おもり|e1
e1:類=落ちた, Theme=x2 と仮定すると、
[推論2]とsymmetry により、
x2: ... |e1
が導出されるので、
この仮定は適切。
[推論2] oi:.... Attribute=vj ... ⇒ oi:.... | vj
[推論4 <symmetry>] α:... |β
⇒ β:... |α
23
修飾関係 4
linguistic SR
落ちた1
おもり2
e1:類=落ちた, Theme=_
x2:類=おもり|e1
e3:... _=e1, _=x2, ...
と仮定すると、
(たとえば、その「おもり」が何かの「落下」を引き起こした
ような場合を仮定すると)
[推論3]により、
x2: ... |e1
が導出されるので、
この仮定は適切。
[推論3] oi:....Attribute=oj, ...,Attribute=ok ...⇒oj:.... | ok
24
修飾関係 5
linguistic SR
つかまえた1
人数2
e1:類=つかまえた, Theme=_,
Agent=_
v2:人数( )|e1
e1:類=つかまえた, Theme=Xi, Agent=__ と仮定すると、[推論2]により、
Xi:... |e1
が導出される。さらに、
v2:人数(Xi)
と仮定すると、 [推論2] により、
v2:... |Xi
が導出される。この2つに対して、
transitivity を適用すると、
v2: ... |e1
が導出されるので、これらの仮定は適切。
[推論2] oi:.... Attribute=vj ... ⇒ oi:.... | vj
[推論5 <transitivity>] α:... |β かつ、β:... |γ
⇒ α:... |γ
25
英語の関係節の場合
linguistic SR
x1:類=boy|a3
x2:類=person
NP
a boy1
a3: x1=x2
CP
e4:類=saw,Theme=x5,Agent=x2
x5:名称=Mary
who2
IP
φ3
t2
saw4
Mary5
26
(perceived) phonetic strings
frequent patterns
Numeration
Extractor
Lexicon
(formal) features
Numeration
Computational System
PF
Phonology
(generated)
phonetic
strings
LF
Information Extractor
SR
Concepts
Working Space
Information Database
Inference rules
input/output
process system
influence
reference
(dynamic) database
27