ことばとコンピュータ

ことばとコンピュータ
第7回
本日の内容
• 前回のおさらい
– 選択制約,意味的整合性
– 格文法,格フレーム,意味素
• シソーラスを用いた方法
• 連想関係を使った方法
• 意味にまつわるその他の問題
2
おさらい 単語の意味(1)
• 単語
– なんらかの意味を持つ(通常は複数ある)
• 単語の意味を決めるとは
– 文中の単語の意味が,複数の意味の内のどの
意味であるかを決定すること
3
おさらい 単語の意味(11)
「語」と統語構造
• どうやったら意味がわかるか?
→複数の語+統語構造を利用しているはず
山が動く
→ 巨大な組織
山へ芝刈りに行く
→ 周りより高くなった陸地
話の山を向かえる → クライマックス
太郎が山を眺める
→ 周りより高くなった陸地
書類の山を抱える → 量の多い様子
事件が山を越す
→ クライマックス
4
おさらい 単語の意味(13)
• どうやったら意味がわかるか?
文の中の複数の語と統語情報を利用している
しかし,完全ではない
→同じ表層的構造でも意味が違うことがある
太郎が山を眺める/事件が山を越える
日本の山に登る/話の山に差し掛かる
5
おさらい 単語の意味を決める(1)
• 鍵:意味的整合性
– 1文を持ってくると,その中の単語間の意味的な
整合性をどうにかして計算
– 意味的に矛盾のない(整合性のある)組み合わ
せを,各単語の意味として導き出す
• 核となる考え方,材料,道具
選択制限,格フレーム,意味素,用例,連想関係
6
おさらい 単語の意味を決める(2)
• かいつまんで言うと...
例: 職場の花を食事に誘う.
花 (1)植物の花 (2)美しい人
– (1)では,植物を食事に誘うことになる
→意味的におかしい
– (2)では,意味的に整合性がとれる
→この意味に決定する
7
おさらい 単語の意味を決める(3)
• 大事な役割をするのは動詞
– 例: 職場の花を食事に誘う.
植物ではおかしいのは「誘う」に合わないから
動詞を中心に文中の各語の意味を考える
→格文法(フィルモアの格文法)
8
おさらい 単語の意味を決める(4)
• (フィルモアの)格文法 case grammar
– 語と語の間の意味的関係を動詞を中心に捉える
表層格:主格(he),目的格(him),所有格(his)
ガ格(彼が),ヲ格(彼を),ニ格(彼に)
深層格:文中の動詞に対し,どの単語がどのような
役割を持つか
動作主格(A),経験者格(E),道具格(I),対象格(O),
源泉格(S),目標格(G),場所格(L),時間格(T)
9
おさらい 単語の意味を決める(8)
• 格フレームは以下のようにもあらわされる
break1
break2
break3
subject
subject
subject
O: ...
A: ...
I: ...
object
object
格スロット
O: ...
O: ...
入りうる単語に共通
の属性を定義
I : ...
(with
)
格スロット
10
おさらい 単語の意味を決める(10)
• 格スロット:共通の属性を定義
• 属性として利用する情報 (いろいろ)
– 意味素:名詞を意味によって分類
– シソーラス:類似語,類義語の分類
– 用例:同じ用法で使用される語のまとまり
• 単語の意味を決める
→格フレームと選択制限によって決める
• 入力文 ~ 適切な格フレームを選択
11
おさらい 単語の意味を決める(11)
• 格スロットの要素(意味素,シソーラス,用例)
• 意味素の例:IPAL (Web上で)
concrete, animal, organization,...
– 意味素(意味素性)を階層構造化
– 通常,重複ありの分類
12
おさらい 単語の意味を決める(12)
• 意味素と格フレームの組み合わせ
「かける」
1. <HUM/ORG>ガ <HUM>ニ<MEN>ヲ
2. <HUM>ガ<LOC/PRO>ニ<CON>ヲ
3. <HUM/ANI>ガ<CON>ニ<CON>ヲ
彼が姉に希望をかける
会社が彼に期待をかける
姉がハンガーにタオルをかける
犬が電柱におしっこをかける
13
シソーラスを用いた方法(単語の意味を決める)
• 格スロット:共通の属性を定義
• 属性として利用する情報 (いろいろ)
– 意味素:名詞を意味によって分類
– シソーラス:類似語,類義語の分類
– 用例:同じ用法で使用される語のまとまり
• 単語の意味を決める
→格フレームと選択制限によって決める
• 入力文 ~ 適切な格フレームを選択
14
シソーラスを用いた方法(2)
• 格スロットの要素(意味素,シソーラス,用例)
• シソーラス(類語辞典など)Webで
– 概念的なまとまりで単語を分類
– 各分類(概念)を階層構造化
– 通常,重複ありの分類
15
シソーラスを用いた方法(3)
• シソーラス(番号)と格フレームの組み合わせ
「かける」
1. <?>ガ <?>ニ<?>ヲ
2. <?>ガ<?>ニ<?>ヲ
3. <?>ガ<?>ニ<?>ヲ
彼が姉に希望をかける → 1
会社が彼に期待をかける → 1
姉がハンガーにタオルをかける → 2
犬が電柱におしっこをかける → 3
16
シソーラスを用いた方法(4)
• シソーラス(番号)と格フレームの組み合わせ
「かける」
角川類語新辞典の例
1. <?>ガ <?>ニ<?>ヲ
を用いて格フレームの
2. <?>ガ<?>ニ<?>ヲ
スロット属性を考える
3. <?>ガ<?>ニ<?>ヲ
彼が姉に希望をかける → 1
会社が彼に期待をかける → 1
姉がハンガーにタオルをかける → 2
犬が電柱におしっこをかける → 3
17
連想関係によって意味を決める(1)
Cranes were used to lift building materials.
1. a large waterbird with long legs and necks.
2. a large machine used to lift heavy loads.
どっちか?
連想関係で決める
18
連想関係によって意味を決める(2)
Cranes were used to lift building materials.
1. a large waterbird with long legs and necks.
2. a large machine used to lift heavy loads.
見出し語[語義1] ... 語11,語12, 語13, ... , 語1n
見出し語[語義2] ... 語21,語22, 語23, ... , 語2n
19
連想関係によって意味を決める(3)
入力文
wa wb wc wd we wf
Wc1: Wg Wk Wb Wi Wj
一致度1
Wc2: Wg Wk We Wf Wl Wm 一致度2
20
連想関係によって意味を決める(4)
入力文
wa wb wc wd we wf
Wc1: Wg Wk Wb Wi Wj
一致度1
Wc2: Wg Wk We Wf Wl Wm 一致度2
こっち(Wc2:語義2)の方が
可能性が高そう(尤もらしい)
21
連想関係によって意味を決める(5)
Cranes were used to lift building materials.
(used to) lift building material
1. a large waterbird with long legs and necks.
Wc1: large waterbird long leg neck
2. a large machine used to lift heavy loads.
Wc2: large machine (used to) lift heavy load
22
連想関係によって意味を決める(6)
Cranes were used to lift building materials.
(used to) lift building material
それぞれの語釈文に現れる単語
入力文中の単語の一致度
Wc1: large waterbird long leg neck
Wc2: large machine (used to) lift heavy load
23
連想関係によって意味を決める(7)
Cranes were used to lift building materials.
(used to) lift building material
「一致度」だけではなかなか一致
しないことが多いので拡張!
Wc1: large waterbird long leg neck
Wc2: large machine (used to) lift heavy load
24
連想関係によって意味を決める(8)
入力文 wa wb wc wd we wf
Wc1: Wg Wh Wb Wi Wh
Wa Wx Wz
Wq Wr
Wc2: Wg Wk We Wf Wl Wm
Wa
Wn Wo Wj Wy
Wq
Wp
Wd
類義語で拡張
類義語で拡張
25
連想関係によって意味を決める(9)
入力文 wa wb wc wd we wf
Wc1: Wg Wh Wb Wi Wh
Wa Wx Wz
Wq Wr
一致度2
Wc2: Wg Wk We Wf Wl Wm
Wa
Wn Wo Wj Wy
Wq
Wp
Wd
類義語で拡張
一致度4
類義語で拡張
26
連想関係によって意味を決める(10)
レシーバー
①受話器。受信器。特に、耳につけてきくもの。
②テニスなどで、相手のサーブを受けとめる側の人。
文1.片手でレシーバーを耳に当てる。
文2.レシーバーはサーブされたボールを2回バウンドする前に相手コー
トに打ち返し、お互いに ラリーを続ける。
文3.レシーバーは、スパイクによって放たれるボールに対して、すばやく
反応しなければなりません。
文4.スピーカーの元祖を尋ねると、電話機の受話器(レシーバー)に行
き着きます。
27
連想関係によって意味を決める(11)
レシーバー
①受話器。受信器。特に、耳につけてきくもの。
②テニスなどで、相手のサーブを受けとめる側の人。
文1.片手でレシーバーを耳に当てる。
連想関係を利用し,どうにかして
文2.レシーバーはサーブされたボールを2回バウンドする前に相手コー
計算してみよ
トに打ち返し、お互いに ラリーを続ける。
文3.レシーバーは、スパイクによって放たれるボールに対して、すばやく
反応しなければなりません。
文4.スピーカーの元祖を尋ねると、電話機の受話器(レシーバー)に行
き着きます。
28
単語の意味を決める-その他(1)
• 意味素かシソーラスか?
– 言語データを収集
→分析し,分類し,体系化すると,シソーラス
→それをさらに抽象化すると,意味素
– シソーラスは修正が容易
• 不足分を補えばよし
– 意味素は修正がたいへん
• 全体の体系がくずれては困る
29
単語の意味を決める-その他(2)
• 意味素かシソーラスか?
– シソーラスは処理効率が悪い
• 対応する事例を見つけないとならないので比較が多い
– 意味素は処理効率がよい
• 抽象化されているので,比較数が少ない
– シソーラスは意味の弁別力が高い
• 分類が細かい分,区別もつきやすい
– 意味素は抽象度の度合いにより変化
30
単語の意味を決める-その他(3)
• 格フレームの問題
– 格フレームの記述は高コスト(作るのが大変)
– 例えば,機械翻訳では
NTTのALT-J/E(日英翻訳)
約3000の意味素を使って,約6000の格フレーム
– これだけ作っても,逆変換には使えない
• J→Eとして作った格フレームの対応はJ→E方向のみ
• E→Jが欲しければ,別に格フレームの対応が必要
31
単語の意味を決める-その他(4)
• 動詞が存在しない文(言語表現は?)
– 日本語では大いにありうる
• 例:名詞句「A の B」は,
新聞記事 320000行中に248417例 出現
– 英語ではbe動詞の文
• 格文法,格フレームは使えない
32
単語の意味を決める-その他(5)
• 名詞句「AのB」をあらためて考える
– 人間はうまいこと意味を決めている
1.Bが述語相当語で事象を表し,AがBの格要素である
例:太郎の結婚,電車の通学
2.Bが相対名詞,同格名詞などで場所,時,理由,方法状況などをAを
基準に特定化する
例:ビルの前,彼のため
3.BがAの数量,性質,属性などを表す
例:バラの色,橋の長さ
4.Aが述語相当語で事象を表し,BがAの格要素である
例:通学の手段
5.AがBの所有者,場所,個数,種類,生産者,性質などを表す
例:先生の絵,東北の学校,大量のバラ
33
単語の意味を決める-その他(6)
• 名詞句「AのB」をあらためて考える
主素性:主要な意味特徴を示す
– 人間はうまいこと意味を決めている
1.Bが述語相当語で事象を表し,AがBの格要素である
椅子(thing),犬(animate),遊び(action)
例:太郎の結婚,電車の通学
2.Bが相対名詞,同格名詞などで場所,時,理由,方法状況などをAを
依存素性:他の素性との意味的依存性を示す
基準に特定化する
例:ビルの前,彼のため
「日本人」は「国nation」に「属すbelong-to-nation」
3.BがAの数量,性質,属性などを表す
例:バラの色,橋の長さ
機能素性:他の語との結合の仕方,役割を示す
4.Aが述語相当語で事象を表し,BがAの格要素である
例:通学の手段
「人間」は,動作主agent役割を持つので,
5.AがBの所有者,場所,個数,種類,生産者,性質などを表す
例:先生の絵,東北の学校,大量のバラ
機能素性role-agentをあてる
34
単語の意味を決める-その他(7)
• もっと広い「AのB」もある(交代現象)
– 人間はうまいこと意味を決めている 「こと」:彼が
行ったのは確かです.
「もの」:あそこで光っているのは灯台です.
「ひと」:勝負に勝ったのは元チャンピオンだ.
「とき」:この前会ったのは5年前だ.
「わけ」:野菜が高いのは品不足だからだ.
「その他」:彼女が車に乗り込むのを見た.(ところ)
「不可能」:勉強したのに,試験に落ちた.
35