言語体系とコンピュータ

言語体系とコンピュータ
2006年度2学期
第8回
本日の内容
• 単語の意味を決める
– (文の中の)単語の意味,解説編
• 選択制約,意味的整合性
• 格文法,格フレーム,意味素
• シソーラスを用いた方法
• 連想関係を使った方法
• 意味にまつわるその他の問題
2
単語の意味(1)
• 単語
– なんらかの意味を持つ(通常は複数ある)
• 単語の意味を決めるとは
– 文中の単語の意味が,複数の意味の内のどの
意味であるかを決定すること
3
単語の意味(2)
• 単語
– 通常: 意味1,意味2,意味3,...
例: 単語 「やま」
意味1:周りの土地より著しく高くなった所
意味2:量の多い様子
意味3:重要なポイント,クライマックス
意味4:象徴的な巨大な組織
...
その単語だけを見ていてもどれかはわからない.
4
単語の意味(3)
• その単語だけを見ていてもわからない.
• どうやったら意味がわかるか?
– 人はどうやっているか?
→複数の語でみているのでは?
5
単語の意味(4)
• その単語だけを見ていてもわからない.
• どうやったら意味がわかるか?
– 人はどうやっているか?
→複数の語でみているのでは?
山 動く
山 芝刈り 行く
←これでどうか?
話 山 向かえる
6
単語の意味(5)
• その単語だけを見ていてもわからない.
• どうやったら意味がわかるか?
– 人はどうやっているか?
→複数の語でみているのでは?
山 動く
→ 巨大な組織
山 芝刈り 行く
→ 周りより高くなった陸地
話 山 向かえる → クライマックス
7
単語の意味(6)
• その単語だけを見ていてもわからない.
• どうやったら意味がわかるか?
– 人はどうやっているか?
→複数の語でみているのでは?
太郎 山 眺める
書類 山 抱える
←これはどうか?
事件 山 越す
8
単語の意味(7)
• その単語だけを見ていてもわからない.
• どうやったら意味がわかるか?
– 人はどうやっているか?
→複数の語でみているのでは?
太郎 山 眺める → 周りより高くなった陸地
書類 山 抱える → 量の多い様子
事件 山 越す
→ クライマックス
9
単語の意味(8)
• どうやったら意味がわかるか?
→複数の語だけか?
山 動く
→ 巨大な組織
山 芝刈り 行く
→ 周りより高くなった陸地
話 山 向かえる → クライマックス
太郎 山 眺める
→ 周りより高くなった陸地
書類 山 抱える → 量の多い様子
事件 山 越す
→ クライマックス
10
単語の意味(9)
• どうやったら意味がわかるか?
少なくとも「語」だけでなく文
→複数の語だけか? を作成しているはず
山 動く
→ 巨大な組織
山 芝刈り 行く
→ 周りより高くなった陸地
話 山 向かえる → クライマックス
太郎 山 眺める → 周りより高くなった陸地
書類 山 抱える → 量の多い様子
事件 山 越す
→ クライマックス
11
単語の意味(10)
少なくとも「語」だけでなく文
を作成しているはず
• どうやったら意味がわかるか?
→複数の語+統語構造も利用しているはず
山が動く
→ 巨大な組織
山へ芝刈りに行く
→ 周りより高くなった陸地
話の山を向かえる → クライマックス
太郎が山を眺める → 周りより高くなった陸地
書類の山を抱える → 量の多い様子
事件が山を越す
→ クライマックス
12
単語の意味(11)
「語」と統語構造で意味は解決するか?
• どうやったら意味がわかるか?
→複数の語+統語構造も利用しているはず
山が動く
→ 巨大な組織
山へ芝刈りに行く
→ 周りより高くなった陸地
話の山を向かえる → クライマックス
太郎が山を眺める
→ 周りより高くなった陸地
書類の山を抱える → 量の多い様子
事件が山を越す
→ クライマックス
13
単語の意味(12)
表層的な統語構造が一致するのに
• どうやったら意味がわかるか?
→複数の語+統語構造も利用しているはず
意味が異なることもある:曖昧
山が[どうする]
→ 巨大な組織
山へ[ ]に[どうする] → 周りより高くなった陸地
[ ]の山を[どうなる] → クライマックス
[ ]が山を[どうする] → 周りより高くなった陸地
[ ]の山を[どうする] → 量の多い様子
[ ]が山を[どうする] → クライマックス
14
単語の意味(13)
• どうやったら意味がわかるか?
文の中の複数の語と統語情報を利用している
しかし,完全ではない
→同じ表層的構造でも意味が違うことがある
太郎が山を眺める/事件が山を越える
日本の山に登る/話の山に差し掛かる
15
単語の意味(14)
• 例:「A の B」はいろんな意味関係で使用
– 言語の理解 :
– 太郎の親戚 :
– 日産の自動車 :
木の家
– 東外大の望月 :
花子の鉛筆
– 美人の妻
:
日課の体操
Bが事象を表す
Bが関係を表す
AがBの属性
所属・所有
AであるB
などなど
16
単語の意味(15)
• 例:「A の B」はいろんな意味関係で使用
– 言語の理解
: Bが事象を表す
表層上は同じ「AのB」という形の
– 太郎の親戚 : Bが関係を表す
表現だが意味関係はたくさんの
– 日産の自動車 : AがBの属性
曖昧性がありうる
木の家
– 東外大の望月 : 所属・所有
表層の形だけでは,
花子の鉛筆
– 美人の妻
: AであるB
一意には決まらないことが多い
日課の体操
などなど
17
単語の意味(16)
• ある単語の意味を一意に決めるには
– 文脈の情報がなければわからないもの
– 文脈があってもよくわからないも
こういうものもある.計算は非常に難しい.
→ここではとりあげない.
1文を読んで人間が一意に意味を決められるもの
→何か,なぞを解く鍵が1文の中で見つけられる
鍵:意味的整合性
18
単語の意味を決める(1)
• 鍵:意味的整合性
– 1文を持ってくると,その中の単語間の意味的な
整合性をどうにかして計算
– 意味的に矛盾のない(整合性のある)組み合わ
せを,各単語の意味として導き出す
• 核となる考え方,材料,道具
選択制限,格フレーム,意味素,用例,連想関係
19
単語の意味を決める(2)
• かいつまんで言うと...
例: 職場の花を食事に誘う.
花 (1)植物の花 (2)美しい人
– (1)では,植物を食事に誘うことになる
→意味的におかしい
– (2)では,意味的に整合性がとれる
→この意味に決定する
20
単語の意味を決める(3)
• 大事な役割をするのは動詞
– 例: 職場の花を食事に誘う.
植物ではおかしいのは「誘う」に合わないから
動詞を中心に文中の各語の意味を考える
→格文法(フィルモアの格文法)
21
格文法と格フレーム(1)
• (フィルモアの)格文法 case grammar
– 語と語の間の意味的関係を動詞を中心に捉える
表層格:主格(he),目的格(him),所有格(his)
ガ格(彼が),ヲ格(彼を),ニ格(彼に)
深層格:文中の動詞に対し,どの単語がどのような
役割を持つか
動作主格(A),経験者格(E),道具格(I),対象格(O),
源泉格(S),目標格(G),場所格(L),時間格(T)
22
格文法と格フレーム(2)
• 深層格に基づく文の意味表現(格構造表現)
break
break
O
the window
the window broke.
A
John
(I)
O
(with a hammer)
the window
John broke the window (with a hammer).
break
I
O
a hammer the window
a hammer broke the window
23
格文法と格フレーム(3)
• 各構造表現は複雑→格フレームで表現
break1 - subject:O
(the window broke.)
break2 - subject:A object:O (with:I)
(John broke the window with a hammer. )
break3 - subject: I object:O
(A hammer broke the window.)
24
格文法と格フレーム(4)
• 格フレームは以下のようにもあらわされる
break1
break2
break3
subject
subject
subject
O: ...
A: ...
I: ...
object
object
O: ...
O: ...
(with
I : ...
)
25
格文法と格フレーム(5)
• 格フレームは以下のようにもあらわされる
break1
break2
break3
subject
subject
subject
O: ...
A: ...
I: ...
object
object
格スロット
O: ...
O: ...
入りうる単語に共通
の属性を定義
I : ...
(with
)
格スロット
26
格文法と格フレーム(6)
• 格スロット:
– 入りうる単語に共通の属性を定義
– 属性が合わない単語(の意味)は入らない
– 入れると意味的整合性があわないので
→意味的に矛盾しない解釈だけが選択される
27
格文法と格フレーム(7)
• 格スロット:共通の属性を定義
• 属性として利用する情報 (いろいろ)
– 意味素:名詞を意味によって分類
– シソーラス:類似語,類義語の分類
– 用例:同じ用法で使用される語のまとまり
• 単語の意味を決める
→格フレームと選択制限によって決める
• 入力文 ~ 適切な格フレームを選択
28
格文法と格フレーム(8)
• 格スロットの要素(意味素,シソーラス,用例)
• 意味素の例:IPAL (Web上で)
concrete, animal, organization,...
– 意味素(意味素性)を階層構造化
– 通常,重複ありの分類
29
意味素を用いた方法(1)
• 意味素と格フレームの組み合わせ
「かける」
1. <HUM/ORG>ガ <HUM>ニ<MEN>ヲ
2. <HUM>ガ<LOC/PRO>ニ<CON>ヲ
3. <HUM/ANI>ガ<CON>ニ<CON>ヲ
30
意味素を用いた方法(2)
• 意味素と格フレームの組み合わせ
「かける」
1. <HUM/ORG>ガ <HUM>ニ<MEN>ヲ
2. <HUM>ガ<LOC/PRO>ニ<CON>ヲ
3. <HUM/ANI>ガ<CON>ニ<CON>ヲ
彼が姉に希望をかける
会社が彼に期待をかける
姉がハンガーにタオルをかける
犬が電柱におしっこをかける
31
シソーラスを用いた方法(1)
• 格スロット:共通の属性を定義
• 属性として利用する情報 (いろいろ)
– 意味素:名詞を意味によって分類
– シソーラス:類似語,類義語の分類
– 用例:同じ用法で使用される語のまとまり
• 単語の意味を決める
→格フレームと選択制限によって決める
• 入力文 ~ 適切な格フレームを選択
32
シソーラスを用いた方法(2)
• 格スロットの要素(意味素,シソーラス,用例)
• シソーラス(類語辞典など)Webで
– 概念的なまとまりで単語を分類
– 各分類(概念)を階層構造化
– 通常,重複ありの分類
33
シソーラスを用いた方法(3)
• シソーラス(番号)と格フレームの組み合わせ
「かける」
1. <?>ガ <?>ニ<?>ヲ
2. <?>ガ<?>ニ<?>ヲ
3. <?>ガ<?>ニ<?>ヲ
彼が姉に希望をかける → 1
会社が彼に期待をかける → 1
姉がハンガーにタオルをかける → 2
犬が電柱におしっこをかける → 3
34
シソーラスを用いた方法(4)
• シソーラス(番号)と格フレームの組み合わせ
「かける」
角川類語新辞典の例
1. <?>ガ <?>ニ<?>ヲ
を用いて格フレームの
2. <?>ガ<?>ニ<?>ヲ
スロット属性を考える
3. <?>ガ<?>ニ<?>ヲ
彼が姉に希望をかける → 1
会社が彼に期待をかける → 1
姉がハンガーにタオルをかける → 2
犬が電柱におしっこをかける → 3
35
連想関係によって意味を決める(1)
Cranes were used to lift building materials.
1. a large waterbird with long legs and necks.
2. a large machine used to lift heavy loads.
どっちか?
連想関係で決める
36
連想関係によって意味を決める(2)
Cranes were used to lift building materials.
1. a large waterbird with long legs and necks.
2. a large machine used to lift heavy loads.
見出し語[語義1] ... 語11,語12, 語13, ... , 語1n
見出し語[語義2] ... 語21,語22, 語23, ... , 語2n
37
連想関係によって意味を決める(3)
入力文
wa wb wc wd we wf
Wc1: Wg Wk Wb Wi Wj
一致度1
Wc2: Wg Wk We Wf Wl Wm 一致度2
38
連想関係によって意味を決める(4)
入力文
wa wb wc wd we wf
Wc1: Wg Wk Wb Wi Wj
一致度1
Wc2: Wg Wk We Wf Wl Wm 一致度2
こっち(Wc2:語義2)の方が
可能性が高そう(尤もらしい)
39
連想関係によって意味を決める(5)
Cranes were used to lift building materials.
(used to) lift building material
1. a large waterbird with long legs and necks.
Wc1: large waterbird long leg neck
2. a large machine used to lift heavy loads.
Wc2: large machine (used to) lift heavy load
40
連想関係によって意味を決める(6)
Cranes were used to lift building materials.
(used to) lift building material
それぞれの語釈文に現れる単語
入力文中の単語の一致度
Wc1: large waterbird long leg neck
Wc2: large machine (used to) lift heavy load
41
連想関係によって意味を決める(7)
Cranes were used to lift building materials.
(used to) lift building material
「一致度」だけではなかなか一致
しないことが多いので拡張!
Wc1: large waterbird long leg neck
Wc2: large machine (used to) lift heavy load
42
連想関係によって意味を決める(8)
入力文 wa wb wc wd we wf
Wc1: Wg Wh Wb Wi Wh
Wa Wx Wz
Wq Wr
Wc2: Wg Wk We Wf Wl Wm
Wa
Wn Wo Wj Wy
Wq
Wp
Wd
類義語で拡張
類義語で拡張
43
連想関係によって意味を決める(9)
入力文 wa wb wc wd we wf
Wc1: Wg Wh Wb Wi Wh
Wa Wx Wz
Wq Wr
一致度2
Wc2: Wg Wk We Wf Wl Wm
Wa
Wn Wo Wj Wy
Wq
Wp
Wd
類義語で拡張
一致度4
類義語で拡張
44
連想関係によって意味を決める(10)
レシーバー
①受話器。受信器。特に、耳につけてきくもの。
②テニスなどで、相手のサーブを受けとめる側の人。
文1.片手でレシーバーを耳に当てる。
文2.レシーバーはサーブされたボールを2回バウンドする前に相手コー
トに打ち返し、お互いに ラリーを続ける。
文3.レシーバーは、スパイクによって放たれるボールに対して、すばやく
反応しなければなりません。
文4.スピーカーの元祖を尋ねると、電話機の受話器(レシーバー)に行
き着きます。
45
連想関係によって意味を決める(11)
レシーバー
①受話器。受信器。特に、耳につけてきくもの。
②テニスなどで、相手のサーブを受けとめる側の人。
文1.片手でレシーバーを耳に当てる。
連想関係を利用し,どうにかして
文2.レシーバーはサーブされたボールを2回バウンドする前に相手コー
計算してみよ
トに打ち返し、お互いに ラリーを続ける。
文3.レシーバーは、スパイクによって放たれるボールに対して、すばやく
反応しなければなりません。
文4.スピーカーの元祖を尋ねると、電話機の受話器(レシーバー)に行
き着きます。
46
単語の意味を決める-その他(1)
• 意味素かシソーラスか?
– 言語データを収集
→分析し,分類し,体系化すると,シソーラス
→それをさらに抽象化すると,意味素
– シソーラスは修正が容易
• 不足分を補えばよし
– 意味素は修正がたいへん
• 全体の体系がくずれては困る
47
単語の意味を決める-その他(2)
• 意味素かシソーラスか?
– シソーラスは処理効率が悪い
• 対応する事例を見つけないとならないので比較が多い
– 意味素は処理効率がよい
• 抽象化されているので,比較数が少ない
– シソーラスは意味の弁別力が高い
• 分類が細かい分,区別もつきやすい
– 意味素は抽象度の度合いにより変化
48
単語の意味を決める-その他(3)
• 格フレームの問題
– 格フレームの記述は高コスト(作るのが大変)
– 例えば,機械翻訳では
NTTのALT-J/E(日英翻訳)
約3000の意味素を使って,約6000の格フレーム
– これだけ作っても,逆変換には使えない
• J→Eとして作った格フレームの対応はJ→E方向のみ
• E→Jが欲しければ,別に格フレームの対応が必要
49
単語の意味を決める-その他(4)
• 動詞が存在しない文(言語表現は?)
– 日本語では大いにありうる
• 例:名詞句「A の B」は,
新聞記事 320000行中に248417例 出現
– 英語ではbe動詞の文
• 格文法,格フレームは使えない
50
単語の意味を決める-その他(5)
• 名詞句「AのB」をあらためて考える
– 人間はうまいこと意味を決めている
1.Bが述語相当語で事象を表し,AがBの格要素である
例:太郎の結婚,電車の通学
2.Bが相対名詞,同格名詞などで場所,時,理由,方法状況などをAを
基準に特定化する
例:ビルの前,彼のため
3.BがAの数量,性質,属性などを表す
例:バラの色,橋の長さ
4.Aが述語相当語で事象を表し,BがAの格要素である
例:通学の手段
5.AがBの所有者,場所,個数,種類,生産者,性質などを表す
例:先生の絵,東北の学校,大量のバラ
51
単語の意味を決める-その他(6)
• 名詞句「AのB」をあらためて考える
主素性:主要な意味特徴を示す
– 人間はうまいこと意味を決めている
1.Bが述語相当語で事象を表し,AがBの格要素である
椅子(thing),犬(animate),遊び(action)
例:太郎の結婚,電車の通学
2.Bが相対名詞,同格名詞などで場所,時,理由,方法状況などをAを
依存素性:他の素性との意味的依存性を示す
基準に特定化する
例:ビルの前,彼のため
「日本人」は「国nation」に「属すbelong-to-nation」
3.BがAの数量,性質,属性などを表す
例:バラの色,橋の長さ
機能素性:他の語との結合の仕方,役割を示す
4.Aが述語相当語で事象を表し,BがAの格要素である
例:通学の手段
「人間」は,動作主agent役割を持つので,
5.AがBの所有者,場所,個数,種類,生産者,性質などを表す
例:先生の絵,東北の学校,大量のバラ
機能素性role-agentをあてる
52
単語の意味を決める-その他(7)
• もっと広い「AのB」もある(交代現象)
– 人間はうまいこと意味を決めている 「こと」:彼が
行ったのは確かです.
「もの」:あそこで光っているのは灯台です.
「ひと」:勝負に勝ったのは元チャンピオンだ.
「とき」:この前会ったのは5年前だ.
「わけ」:野菜が高いのは品不足だからだ.
「その他」:彼女が車に乗り込むのを見た.(ところ)
「不可能」:勉強したのに,試験に落ちた.
53