スライド 1

統語意味論:構造と意味の対応とズレ
上山あゆみ(九州大学)
[email protected]
統語論と意味
統
語
意
味
論
 文の意味とは、どのような仕組みで構築されるのか?
 「文の意味」≠「それぞれの語の意味の総和」
3
つ
の
S
R
式
→ 私たちが理解する「意味」=
1) 各語彙の意味
×
p
型
+ 2) 構造構築による変容
o
型
+ 3) 世界知識等に基づいて推論で補われるもの
×
o
型
v
型
 構造というものは、「音(語順)」だけでなく、「意味」につい
ても、重要な基盤となっている。
助
詞
の
機
能
2
課
題
文
文理解のモデル
統
語
意
味
論
知覚した音連鎖
Lexicon
Numeration
p
型
Computational
System
o
型
o
型
LF
×
Information
Database
PF
Phonology
内的に生
成された
音韻表示
×
Numeration
Formation
3
つ
の
S
R
式
linguistic SR
v
型
Working Space
Inference rules
助
詞
の
機
能
課
題
文
統語意味論の目標
 linguistic SR (=LF構造表示が表す意味情報を表示したもの)
 1語文でも何らかの情報を受け取ることはできる。
 各語彙の「意味」も、それ自体、「断片的な情報」は表している。
 文になっても、「不完全な情報」しか表していないという点は変わりない。
統
語
意
味
論
3
つ
の
S
R
式
p
型
×
 SR式=不完全/断片的であっても、何らかの情報を表す式
 各語彙の意味は、SR式で表される。
 語彙を単に並べただけでも、ある程度の情報伝達はできる。
 linguistic SR も、SR式の集積である。
o
型
×
o
型
 ただし、構造構築の過程で、各語彙のSR式に対して変容が起
こる場合がある。その変容こそが、統語論が意味解釈にもたら
す働きであり、その仕組みを明らかにしたい。
 以下、SR式の形式について、もう少し具体的に考えていく。
4
v
型
助
詞
の
機
能
課
題
文
情報データベース(Information Database)
 1つ1つのオブジェクトが、指標番号で区別され、その特性の
記述とともに記憶されているとする。
統
語
意
味
論
3
つ
の
S
R
式
 オブジェクトの下位タイプ:
モノ(Xn)、コト(En)、場所?、時?、コトバ?、数?
のペアとして記述されている。
×
 各オブジェクトの特性は、項目名(attribute)とその値(value)
p
型
o
型
o
型
×
 「知識の更新」とはー
 データベースの中に新しい「オブジェクト」が追加される
 既知のオブジェクトに新しく、項目名(attribute)と値(value)のペアが追
加される
 既存の値(value)が書き換えられる
5
v
型
助
詞
の
機
能
課
題
文
情報データベースでのそれぞれの情報記載
統
語
意
味
論
 オブジェクト番号 [項目名1: 値1 ; 項目名2: 値2 ; 項目名3: 値3; ...]
Xn [attribute1:value1 ; attribute2:value2 ; attribute3:value3; ...]
3
つ
の
S
R
式
En [attribute1:value1 ; attribute2:value2 ; attribute3:value3; ...]
X19 [名称 :ジョン ; 類 :大学生 ; 年齢 :20 ; ... ]
p
型
×
E82 [類 :批判した ; 対象 :X53 ; 行為者 :X19 ; ... ]
o
型
E812[類 :落下 ; 対象 :X3 ; 行為者 :X159 ; ... ]
o
型
×
X225[縦 :40cm ; 横 :50cm ; 高さ :15cm ; 重さ :650g ; ... ]
v
型
E65[名称 :北京オリンピック ; 開催年: 2008年 ; ... ]
E923[名称 :○○海岸OL殺人事件; 犯人:X45 ; 被害者 :X225 ; ..]
 (項目名に対応する)Attribute表現
 (値に対応する) Value表現
6
助
詞
の
機
能
課
題
文
知識状態の変化
統
語
意
味
論
 データベース更新のために必要な機能:
 Select機能=いわゆる「指示」。データベースの特定の項
目を検索して呼び出す機能。
 Update機能=いわゆる「記述」。呼び出されている項目に
p
型
×
対して、特性を追加する機能。
3
つ
の
S
R
式
o
型
Value 表現
(指示)
Value表現で、オブジェ
クトを「指示」する
o
型
×
Select 機能
Attribute 表現
Attribute表現で、値
を「指示」する
v
型
助
詞
の
機
能
Update 機能 Value表現で、値を「記
述」する
(記述)
7
課
題
文
統
語
意
味
論
SR式の3つのタイプ
 各語彙は、それぞれどの型のSR式に対応するか、
Lexiconで定められている。
objectn [attribute :value]
 v型のSR式 :
valuen = attribute (objectm)
p
型
 p型のSR式 :
[attribute (objectm) = value]n
Value 表現
(指示)
o
型
Attribute 表現
o
型
×
Select 機能
×
 o型のSR式 :
3
つ
の
S
R
式
Value表現で、オブジェ Attribute表現で、値
クトを「指示」する
を「指示」する
o型
v型
v
型
助
詞
の
機
能
Update 機能 Value表現で、値を「記
述」する
(記述)
p型
8
課
題
文
オブジェクトを「指示」するo型
John1
SR式
x1 [名称 :John]
x1 = X19
SR式
x3 [類 :OL]
知識内の検索
x3 = X22
(その)4人11
3
つ
の
S
R
式
SR式
x11 [人数 :4]
p
型
×
知識内の検索
(あの)OL3
統
語
意
味
論
知識内の検索
o
型
x11 = X105
×
o
型
v
型
X19 [ 名称 :John ; 類 :大学生 ; 年齢 :20 ; ... ]
X22 [ 名称 :Mary ; 類 :OL ; 年齢 :24 ; ... ]
X105 [ 名称 :ビートルズ ; 人数 :4 ; ... ]
助
詞
の
機
能
9
課
題
文
オブジェクトを「指示」するo型
統
語
意
味
論
 o型のSR式に変換される Value表現




田中一郎、山田くん、陽子ちゃん、...
学生、教師、弁護士、落下、隠蔽、出版、...
落ちた、落とした、勉強している、...
4人、52kg、5cm、10歳、...
3
つ
の
S
R
式
×
p
型
 o型のSR式
 表現
αn
 SR式 on [attribute :α]
o
型
×
o
型
v
型
 oが x か e かは、語彙的に決められている。
 attribute も通常、語彙的に決められている。
(固有名詞ならば「名称」、いわゆる普通名詞ならば「類」、等)
助
詞
の
機
能
10
課
題
文
値を「記述」するp型
統
語
意
味
論
 p型のSR式となる Value表現
 穏やか、短い、大きい、すごい、 ...
 木製、特大、突然、上々、...
3
つ
の
S
R
式
p
型
×
 p型のSR式
 表現
αUn
 SR式 [attribute(om) =α]Un
o
型
 p型のSR式になる語彙はNumerationにおける指標に「U」が付い
ているとする。
 p型のSR式における omを「見出しオブジェクト」と呼ぶことにする。
11
×
o
型
v
型
助
詞
の
機
能
課
題
文
値を「指示」するv型
統
語
意
味
論
 「この欄に年齢を書いてください。」
=欄に「25」と書く
3
つ
の
S
R
式
≠欄に「年齢」と書く
 v型のSR式となる Attribute表現
 年齢、長さ、サイズ、人数、値段、...
 作者、監督、実行犯、被害者、...
 名称、色、職業、規模、出身地、場所、...
×
p
型
o
型
×
o
型
 v型のSR式
 表現
αn(X/E)
 SR式 vn = α (X/E)
v
型
 v型のSR式におけるXもしくはEを「見出しオブジェクト」と呼ぶこと
にする。
12
助
詞
の
機
能
課
題
文
o型にならない名詞
 名詞は多くの場合、Select機能を持っているが、名
詞の中には、Update機能しか持たないものもある。
特大の皿
突然の大雨
上々の出来
木製の椅子
フロリダ産のオレンジ
3
つ
の
S
R
式
p
型
×





統
語
意
味
論
o
型
o
型
×
 次の語順にはなれない。
 *皿の特大
 *大雨の突然
 *出来の上々
 *椅子の木製
 *オレンジのフロリダ産
v
型
助
詞
の
機
能
13
課
題
文
修飾(modification) 関係の非対称性
 修飾という関係を、従来のように「集合の交わり」とい
う対称的な概念でとらえてしまうと、このような非対称
性が説明できない。
←→ *椅子の木製
okフロリダ産のオレンジ ←→ *オレンジのフロリダ産
ok木製の椅子
3
つ
の
S
R
式
p
型
×


統
語
意
味
論
o
型
14
×
→ p型に対する統語的な制限であるとみなすべきであ
る。
o
型
v
型
助
詞
の
機
能
課
題
文
Merge
 Merge : 2つの要素を1つにする操作。主要部につ
ながる branch を太線で表すことにする。
統
語
意
味
論
3
つ
の
S
R
式
×
p
型
o
型
α1
β2
×
o
型
v
型
助
詞
の
機
能
15
課
題
文
modification の構造
黄色いU1
統
語
意
味
論
3
つ
の
S
R
式
鳥2
 Lexicon での指定のままならば、SR式は。。。
[色( )=黄色い]U1
x2 [類 : 鳥]
×
p
型
o
型
o
型
×
 Mergeの結果、SR式は。。。
[色(x2)=黄色い]U1
⇒ x2 [類 :鳥 ; 色 :黄色い]
x2 [類 :鳥]
v
型
 p型のSR式の見出しオブジェクトは構造的に決まる。
16
助
詞
の
機
能
課
題
文
p型とo型のMerge
 下図のように、p型のsisterがo型であり、o型が主要
部の場合、p型のSR式の見出しオブジェクトはomと
なる。
3
つ
の
S
R
式
p
型
o型m
×
p型Un
統
語
意
味
論
o
型
 見出しオブジェクトが決定しないp型のSR式は、不
o
型
×
適格(ill-formed)である。
v
型
助
詞
の
機
能
17
課
題
文
助詞「の」
 「の」は、Select機能を持つ表現(o型)に付いて、そ
れをUpdate機能に変える働きを持ちうる。
このような「の」を「のU」
と呼ぶことにする。
統
語
意
味
論
3
つ
の
S
R
式
×
p
型
o
型
[類(x2)=バイト]U1
x2 [類 : 大学生]
 「医者の奥さん」などは、その「の」が、「のU」なのか
そうでないのかで、異なった解釈となる。
o
型
×
[類( )=バイト]U1 →
x2 [類 : 大学生]
v
型
助
詞
の
機
能
課
題
文
o型同士の修飾関係とアブダクション
 これに対して、o型同士が Merge した場合には、2つのオブ
ジェクトの関係については、言語的にはわからない。
ジョン1の
統
語
意
味
論
3
つ
の
S
R
式
パソコン2
p
型
×
 単に、「ジョン1が何らかの意味でパソコン2と関係がある」と
 この状態を「α ... |β」という記法で表すことにする。
o
型
×
いうことしか表されていない。(極端な場合には、「ジョン1が
独り立ちしたときに、メアリが購入したパソコン2」というような
可能性もありうる。)
o
型
v
型
助
詞
の
機
能
linguistic SR x1 [名称 :ジョン]
x2 [類 :パソコン] |x1
19
課
題
文
p型と o型の違い
 「言語が表す意味」は、linguistic SRのみであり、そ
こに含まれる「|」がどのような推論の結果、成り立
ったものであるかは、言語使用者がアブダクションで
「解決」しなければならない。
3
つ
の
S
R
式
p
型
×
(しばしば、このアブダクションが成功することを「理解」と呼ぶ。)
統
語
意
味
論
o
型
 修飾部が(Select機能を持つ)o型の場合には、この
 黄色いマット ≠ 「黄色い花瓶がのっているマット」
20
×
ように、主要部との関係がきわめて自由であるが、
修飾部がp型の場合には、解釈の自由度がない。
o
型
v
型
助
詞
の
機
能
課
題
文
v型に対する修飾関係とアブダクション
 v型は通常、見出しオブジェクト(X)がわからないと理解がで
きない。
3
つ
の
S
R
式
メアリ1の 弟2(X)
 そのため、linguistic SR は以下のように「|」を含むもので
あっても、ほとんどの場合、修飾しているo型を見出しオブ
ジェクトとみなす解釈になる。
linguistic SR x1 [名称 :メアリ]
v2=弟 (X) |x1
p
型
×
o
型
o
型
×
→ 理解
統
語
意
味
論
v
型
x1 [名称 :メアリ ; 弟 : v2]
v2=弟 (x1)
助
詞
の
機
能
 しかし、この解釈でなければならないということはない。
=p型の場合とは異なり、v型の見出しオブジェクトは構造的
に決定されるわけではない。
21
課
題
文
のUはv型をとることができない
統
語
意
味
論
 のU は、v型をとることができない。
(1) *サイズの靴/*色の車/ *年齢の女性
 ところが、それぞれ、そのattributeに対する記述を補えば容
認可能になる。
3
つ
の
S
R
式
p
型
×
(2) サイズが24の靴/色が白の車/年齢が30歳以上の女性
(3) 24のサイズの靴/白い色の車/ 30歳以上の年齢の女性
o
型
 (1)が容認不可能なのは、valueが述べられていないために
(4) a. この靴のサイズは私には大きすぎる。
b. あの車の色が気に入らない。
c. その女性の年齢を言い当てた。
22
×
情報が足りないためではない。(4)のように、valueが言語表
現として含まれていなくとも、情報内容にそのvalueが含まれ
ることは可能だからである。
o
型
v
型
助
詞
の
機
能
課
題
文
Attribute表現はUpdate機能を持てない
民部(2012:九大卒論) 23
3
つ
の
S
R
式
p
型
o
型
o
型
×
お手頃な値段の商品
世界最大の規模の大会
ちょうどいい大きさの靴
穏やかな性格の太郎
複雑な作り方のプラモデル
人懐っこさが長所のジョン
ずば抜けた成績のメアリ
珍しい名前の男の子
独特な味の料理
理不尽な動機の通り魔事件
過去最高の順位の決勝レース
残忍な犯人の連続殺人事件
例年通りの日程の文化祭
最高の点数の合格者
×
→
*値段の商品
→
*規模の大会
→
*大きさの靴
→
*性格の太郎
*作り方のプラモデル →
→
*長所のジョン
→
*成績のメアリ
→
*名前の男の子
→
*味の料理
*動機の通り魔事件 →
→
*順位の決勝レース
*犯人の連続殺人事件 →
→
*日程の文化祭
→
*点数の合格者
統
語
意
味
論
v
型
助
詞
の
機
能
課
題
文
Attribute 表現による修飾
 もちろん、Select機能を持つ要素同士の 修飾関係
の解釈は、何の問題もない。
 値段1の乱高下2
v1=値段( )
e2[類: 乱高下; Theme: _] |v1
統
語
意
味
論
3
つ
の
S
R
式
×
p
型
v1=値段( )
e2[類: 乱高下; Theme: v1]
規模の調査
大きさの好み
性格の不一致
作り方の説明
o
型
×




o
型
v
型
助
詞
の
機
能
民部(2012:九大卒論) 24
課
題
文
付加詞を作る格助詞(p型の機能範疇)
統
語
意
味
論
a. 東京への帰還
e1 [類 :帰還 ; Goal :x2 ]
x2 [名称 :東京]
3
つ
の
S
R
式
p
型
×
b. 東京からの帰還
e1 [類 :帰還 ; Source :x2]
x2 [名称 :東京]
o
型
×
o
型
v
型
助
詞
の
機
能
25
課
題
文
付加詞を作る格助詞(p型の機能範疇)
統
語
意
味
論
3
つ
の
S
R
式
帰還2(Theme)
東京1
へU8(Goal 1 )
×
p
型
o
型
 linguistic SR
x1 [名称 :東京]
[Goal(e3)=x1]U8
e3 [類 :帰還]
×
o
型
v
型
助
詞
の
機
能
→つまり、
e3 [類 :帰還 ; Goal :x1]
26
課
題
文
付加詞を作る格助詞(p型の機能範疇)
統
語
意
味
論
 「へ」 ... 項構造を持っている機能範疇
 「から」
27
p
型
o
型
o
型
×
Lexicon から (Source)
syntax からun(Sourcem) ...m=Mergeの相手のindex
SR式
[Source( )=om]un
3
つ
の
S
R
式
×
argument をとる Merge をするが、SR式は p型
Lexicon へ (Goal)
syntax へun(Goalm) ... m=Mergeの相手のindex
SR式
[Goal( )=om]un
v
型
助
詞
の
機
能
課
題
文
課題文
統
語
意
味
論
 武道館でコンサートが計画されている
 解釈1: 実際に「計画」が行われている場所が「武道館」
であるという解釈
3
つ
の
S
R
式
 解釈2: 今、計画されている「コンサート」の場所が「武道
館」であるという解釈
×
p
型
o
型
×
o
型
v
型
助
詞
の
機
能
28
課
題
文
解釈1の説明
 武道館でコンサートが計画されている
 解釈1: 実際に「計画」が行われている場所が「武道館」
であるという解釈
 「で」がp型の機能範疇であるとする。
統
語
意
味
論
3
つ
の
S
R
式
×
p
型
武道館1
o
型
でU2(Location1)
o
型
×
この部分の linguistic SR は次のようになる。
x1 [名称 :武道館]
[Location( )=x1]U2
さらに Merge が進むと、
v
型
助
詞
の
機
能
29
課
題
文
解釈1の説明
統
語
意
味
論
3
つ
の
S
R
式
計画されている3
でU2(Location1)
武道館1
linguistic SR
x1 [名称 :武道館]
[Location(e3)=x1]U2
e3 [類 :計画されている ; 対象 : ...]
×
p
型
o
型
×
o
型
v
型
p型の見出しオブジェクトは構造的に決定されるため、必ず、 助
詞
主要部であるe3となる。その結果、この場合の解釈は、
の
「武道館」が「計画」という出来事の場所だということになる。 機
能
30
課
題
文
解釈2の説明
 武道館でコンサートが計画されている
 解釈2: 今、計画されている「コンサート」の場所が「武道
館」であるという解釈
 「で」は名詞に対する接辞であり、単独でSR式に変
3
つ
の
S
R
式
p
型
×
換されないとする。
統
語
意
味
論
o
型
計画されている3
×
武道館で1
o
型
linguistic SR
x1 [名称 :武道館]
e3 [類 :計画されている ; 対象 : ...] |x1
この場合、x1とe3の関係は、定まっていないため、世界知識
の許す範囲で、自由に「関係づけ」が起こることになる。
31
v
型
助
詞
の
機
能
課
題
文