言語体系とコンピュータ 2006年度2学期 第8回 本日の内容 • 単語の意味を決める – (文の中の)単語の意味,解説編 • 選択制約,意味的整合性 • 格文法,格フレーム,意味素 • シソーラスを用いた方法 • 連想関係を使った方法 • 意味にまつわるその他の問題 2 単語の意味(1) • 単語 – なんらかの意味を持つ(通常は複数ある) • 単語の意味を決めるとは – 文中の単語の意味が,複数の意味の内のどの 意味であるかを決定すること 3 単語の意味(2) • 単語 – 通常: 意味1,意味2,意味3,... 例: 単語 「やま」 意味1:周りの土地より著しく高くなった所 意味2:量の多い様子 意味3:重要なポイント,クライマックス 意味4:象徴的な巨大な組織 ... その単語だけを見ていてもどれかはわからない. 4 単語の意味(3) • その単語だけを見ていてもわからない. • どうやったら意味がわかるか? – 人はどうやっているか? →複数の語でみているのでは? 5 単語の意味(4) • その単語だけを見ていてもわからない. • どうやったら意味がわかるか? – 人はどうやっているか? →複数の語でみているのでは? 山 動く 山 芝刈り 行く ←これでどうか? 話 山 向かえる 6 単語の意味(5) • その単語だけを見ていてもわからない. • どうやったら意味がわかるか? – 人はどうやっているか? →複数の語でみているのでは? 山 動く → 巨大な組織 山 芝刈り 行く → 周りより高くなった陸地 話 山 向かえる → クライマックス 7 単語の意味(6) • その単語だけを見ていてもわからない. • どうやったら意味がわかるか? – 人はどうやっているか? →複数の語でみているのでは? 太郎 山 眺める 書類 山 抱える ←これはどうか? 事件 山 越す 8 単語の意味(7) • その単語だけを見ていてもわからない. • どうやったら意味がわかるか? – 人はどうやっているか? →複数の語でみているのでは? 太郎 山 眺める → 周りより高くなった陸地 書類 山 抱える → 量の多い様子 事件 山 越す → クライマックス 9 単語の意味(8) • どうやったら意味がわかるか? →複数の語だけか? 山 動く → 巨大な組織 山 芝刈り 行く → 周りより高くなった陸地 話 山 向かえる → クライマックス 太郎 山 眺める → 周りより高くなった陸地 書類 山 抱える → 量の多い様子 事件 山 越す → クライマックス 10 単語の意味(9) • どうやったら意味がわかるか? 少なくとも「語」だけでなく文 →複数の語だけか? を作成しているはず 山 動く → 巨大な組織 山 芝刈り 行く → 周りより高くなった陸地 話 山 向かえる → クライマックス 太郎 山 眺める → 周りより高くなった陸地 書類 山 抱える → 量の多い様子 事件 山 越す → クライマックス 11 単語の意味(10) 少なくとも「語」だけでなく文 を作成しているはず • どうやったら意味がわかるか? →複数の語+統語構造も利用しているはず 山が動く → 巨大な組織 山へ芝刈りに行く → 周りより高くなった陸地 話の山を向かえる → クライマックス 太郎が山を眺める → 周りより高くなった陸地 書類の山を抱える → 量の多い様子 事件が山を越す → クライマックス 12 単語の意味(11) 「語」と統語構造で意味は解決するか? • どうやったら意味がわかるか? →複数の語+統語構造も利用しているはず 山が動く → 巨大な組織 山へ芝刈りに行く → 周りより高くなった陸地 話の山を向かえる → クライマックス 太郎が山を眺める → 周りより高くなった陸地 書類の山を抱える → 量の多い様子 事件が山を越す → クライマックス 13 単語の意味(12) 表層的な統語構造が一致するのに • どうやったら意味がわかるか? →複数の語+統語構造も利用しているはず 意味が異なることもある:曖昧 山が[どうする] → 巨大な組織 山へ[ ]に[どうする] → 周りより高くなった陸地 [ ]の山を[どうなる] → クライマックス [ ]が山を[どうする] → 周りより高くなった陸地 [ ]の山を[どうする] → 量の多い様子 [ ]が山を[どうする] → クライマックス 14 単語の意味(13) • どうやったら意味がわかるか? 文の中の複数の語と統語情報を利用している しかし,完全ではない →同じ表層的構造でも意味が違うことがある 太郎が山を眺める/事件が山を越える 日本の山に登る/話の山に差し掛かる 15 単語の意味(14) • 例:「A の B」はいろんな意味関係で使用 – 言語の理解 : – 太郎の親戚 : – 日産の自動車 : 木の家 – 東外大の望月 : 花子の鉛筆 – 美人の妻 : 日課の体操 Bが事象を表す Bが関係を表す AがBの属性 所属・所有 AであるB などなど 16 単語の意味(15) • 例:「A の B」はいろんな意味関係で使用 – 言語の理解 : Bが事象を表す 表層上は同じ「AのB」という形の – 太郎の親戚 : Bが関係を表す 表現だが意味関係はたくさんの – 日産の自動車 : AがBの属性 曖昧性がありうる 木の家 – 東外大の望月 : 所属・所有 表層の形だけでは, 花子の鉛筆 – 美人の妻 : AであるB 一意には決まらないことが多い 日課の体操 などなど 17 単語の意味(16) • ある単語の意味を一意に決めるには – 文脈の情報がなければわからないもの – 文脈があってもよくわからないも こういうものもある.計算は非常に難しい. →ここではとりあげない. 1文を読んで人間が一意に意味を決められるもの →何か,なぞを解く鍵が1文の中で見つけられる 鍵:意味的整合性 18 単語の意味を決める(1) • 鍵:意味的整合性 – 1文を持ってくると,その中の単語間の意味的な 整合性をどうにかして計算 – 意味的に矛盾のない(整合性のある)組み合わ せを,各単語の意味として導き出す • 核となる考え方,材料,道具 選択制限,格フレーム,意味素,用例,連想関係 19 単語の意味を決める(2) • かいつまんで言うと... 例: 職場の花を食事に誘う. 花 (1)植物の花 (2)美しい人 – (1)では,植物を食事に誘うことになる →意味的におかしい – (2)では,意味的に整合性がとれる →この意味に決定する 20 単語の意味を決める(3) • 大事な役割をするのは動詞 – 例: 職場の花を食事に誘う. 植物ではおかしいのは「誘う」に合わないから 動詞を中心に文中の各語の意味を考える →格文法(フィルモアの格文法) 21 格文法と格フレーム(1) • (フィルモアの)格文法 case grammar – 語と語の間の意味的関係を動詞を中心に捉える 表層格:主格(he),目的格(him),所有格(his) ガ格(彼が),ヲ格(彼を),ニ格(彼に) 深層格:文中の動詞に対し,どの単語がどのような 役割を持つか 動作主格(A),経験者格(E),道具格(I),対象格(O), 源泉格(S),目標格(G),場所格(L),時間格(T) 22 格文法と格フレーム(2) • 深層格に基づく文の意味表現(格構造表現) break break O the window the window broke. A John (I) O (with a hammer) the window John broke the window (with a hammer). break I O a hammer the window a hammer broke the window 23 格文法と格フレーム(3) • 各構造表現は複雑→格フレームで表現 break1 - subject:O (the window broke.) break2 - subject:A object:O (with:I) (John broke the window with a hammer. ) break3 - subject: I object:O (A hammer broke the window.) 24 格文法と格フレーム(4) • 格フレームは以下のようにもあらわされる break1 break2 break3 subject subject subject O: ... A: ... I: ... object object O: ... O: ... (with I : ... ) 25 格文法と格フレーム(5) • 格フレームは以下のようにもあらわされる break1 break2 break3 subject subject subject O: ... A: ... I: ... object object 格スロット O: ... O: ... 入りうる単語に共通 の属性を定義 I : ... (with ) 格スロット 26 格文法と格フレーム(6) • 格スロット: – 入りうる単語に共通の属性を定義 – 属性が合わない単語(の意味)は入らない – 入れると意味的整合性があわないので →意味的に矛盾しない解釈だけが選択される 27 格文法と格フレーム(7) • 格スロット:共通の属性を定義 • 属性として利用する情報 (いろいろ) – 意味素:名詞を意味によって分類 – シソーラス:類似語,類義語の分類 – 用例:同じ用法で使用される語のまとまり • 単語の意味を決める →格フレームと選択制限によって決める • 入力文 ~ 適切な格フレームを選択 28 格文法と格フレーム(8) • 格スロットの要素(意味素,シソーラス,用例) • 意味素の例:IPAL (Web上で) concrete, animal, organization,... – 意味素(意味素性)を階層構造化 – 通常,重複ありの分類 29 意味素を用いた方法(1) • 意味素と格フレームの組み合わせ 「かける」 1. <HUM/ORG>ガ <HUM>ニ<MEN>ヲ 2. <HUM>ガ<LOC/PRO>ニ<CON>ヲ 3. <HUM/ANI>ガ<CON>ニ<CON>ヲ 30 意味素を用いた方法(2) • 意味素と格フレームの組み合わせ 「かける」 1. <HUM/ORG>ガ <HUM>ニ<MEN>ヲ 2. <HUM>ガ<LOC/PRO>ニ<CON>ヲ 3. <HUM/ANI>ガ<CON>ニ<CON>ヲ 彼が姉に希望をかける 会社が彼に期待をかける 姉がハンガーにタオルをかける 犬が電柱におしっこをかける 31 シソーラスを用いた方法(1) • 格スロット:共通の属性を定義 • 属性として利用する情報 (いろいろ) – 意味素:名詞を意味によって分類 – シソーラス:類似語,類義語の分類 – 用例:同じ用法で使用される語のまとまり • 単語の意味を決める →格フレームと選択制限によって決める • 入力文 ~ 適切な格フレームを選択 32 シソーラスを用いた方法(2) • 格スロットの要素(意味素,シソーラス,用例) • シソーラス(類語辞典など)Webで – 概念的なまとまりで単語を分類 – 各分類(概念)を階層構造化 – 通常,重複ありの分類 33 シソーラスを用いた方法(3) • シソーラス(番号)と格フレームの組み合わせ 「かける」 1. <?>ガ <?>ニ<?>ヲ 2. <?>ガ<?>ニ<?>ヲ 3. <?>ガ<?>ニ<?>ヲ 彼が姉に希望をかける → 1 会社が彼に期待をかける → 1 姉がハンガーにタオルをかける → 2 犬が電柱におしっこをかける → 3 34 シソーラスを用いた方法(4) • シソーラス(番号)と格フレームの組み合わせ 「かける」 角川類語新辞典の例 1. <?>ガ <?>ニ<?>ヲ を用いて格フレームの 2. <?>ガ<?>ニ<?>ヲ スロット属性を考える 3. <?>ガ<?>ニ<?>ヲ 彼が姉に希望をかける → 1 会社が彼に期待をかける → 1 姉がハンガーにタオルをかける → 2 犬が電柱におしっこをかける → 3 35 連想関係によって意味を決める(1) Cranes were used to lift building materials. 1. a large waterbird with long legs and necks. 2. a large machine used to lift heavy loads. どっちか? 連想関係で決める 36 連想関係によって意味を決める(2) Cranes were used to lift building materials. 1. a large waterbird with long legs and necks. 2. a large machine used to lift heavy loads. 見出し語[語義1] ... 語11,語12, 語13, ... , 語1n 見出し語[語義2] ... 語21,語22, 語23, ... , 語2n 37 連想関係によって意味を決める(3) 入力文 wa wb wc wd we wf Wc1: Wg Wk Wb Wi Wj 一致度1 Wc2: Wg Wk We Wf Wl Wm 一致度2 38 連想関係によって意味を決める(4) 入力文 wa wb wc wd we wf Wc1: Wg Wk Wb Wi Wj 一致度1 Wc2: Wg Wk We Wf Wl Wm 一致度2 こっち(Wc2:語義2)の方が 可能性が高そう(尤もらしい) 39 連想関係によって意味を決める(5) Cranes were used to lift building materials. (used to) lift building material 1. a large waterbird with long legs and necks. Wc1: large waterbird long leg neck 2. a large machine used to lift heavy loads. Wc2: large machine (used to) lift heavy load 40 連想関係によって意味を決める(6) Cranes were used to lift building materials. (used to) lift building material それぞれの語釈文に現れる単語 入力文中の単語の一致度 Wc1: large waterbird long leg neck Wc2: large machine (used to) lift heavy load 41 連想関係によって意味を決める(7) Cranes were used to lift building materials. (used to) lift building material 「一致度」だけではなかなか一致 しないことが多いので拡張! Wc1: large waterbird long leg neck Wc2: large machine (used to) lift heavy load 42 連想関係によって意味を決める(8) 入力文 wa wb wc wd we wf Wc1: Wg Wh Wb Wi Wh Wa Wx Wz Wq Wr Wc2: Wg Wk We Wf Wl Wm Wa Wn Wo Wj Wy Wq Wp Wd 類義語で拡張 類義語で拡張 43 連想関係によって意味を決める(9) 入力文 wa wb wc wd we wf Wc1: Wg Wh Wb Wi Wh Wa Wx Wz Wq Wr 一致度2 Wc2: Wg Wk We Wf Wl Wm Wa Wn Wo Wj Wy Wq Wp Wd 類義語で拡張 一致度4 類義語で拡張 44 連想関係によって意味を決める(10) レシーバー ①受話器。受信器。特に、耳につけてきくもの。 ②テニスなどで、相手のサーブを受けとめる側の人。 文1.片手でレシーバーを耳に当てる。 文2.レシーバーはサーブされたボールを2回バウンドする前に相手コー トに打ち返し、お互いに ラリーを続ける。 文3.レシーバーは、スパイクによって放たれるボールに対して、すばやく 反応しなければなりません。 文4.スピーカーの元祖を尋ねると、電話機の受話器(レシーバー)に行 き着きます。 45 連想関係によって意味を決める(11) レシーバー ①受話器。受信器。特に、耳につけてきくもの。 ②テニスなどで、相手のサーブを受けとめる側の人。 文1.片手でレシーバーを耳に当てる。 連想関係を利用し,どうにかして 文2.レシーバーはサーブされたボールを2回バウンドする前に相手コー 計算してみよ トに打ち返し、お互いに ラリーを続ける。 文3.レシーバーは、スパイクによって放たれるボールに対して、すばやく 反応しなければなりません。 文4.スピーカーの元祖を尋ねると、電話機の受話器(レシーバー)に行 き着きます。 46 単語の意味を決める-その他(1) • 意味素かシソーラスか? – 言語データを収集 →分析し,分類し,体系化すると,シソーラス →それをさらに抽象化すると,意味素 – シソーラスは修正が容易 • 不足分を補えばよし – 意味素は修正がたいへん • 全体の体系がくずれては困る 47 単語の意味を決める-その他(2) • 意味素かシソーラスか? – シソーラスは処理効率が悪い • 対応する事例を見つけないとならないので比較が多い – 意味素は処理効率がよい • 抽象化されているので,比較数が少ない – シソーラスは意味の弁別力が高い • 分類が細かい分,区別もつきやすい – 意味素は抽象度の度合いにより変化 48 単語の意味を決める-その他(3) • 格フレームの問題 – 格フレームの記述は高コスト(作るのが大変) – 例えば,機械翻訳では NTTのALT-J/E(日英翻訳) 約3000の意味素を使って,約6000の格フレーム – これだけ作っても,逆変換には使えない • J→Eとして作った格フレームの対応はJ→E方向のみ • E→Jが欲しければ,別に格フレームの対応が必要 49 単語の意味を決める-その他(4) • 動詞が存在しない文(言語表現は?) – 日本語では大いにありうる • 例:名詞句「A の B」は, 新聞記事 320000行中に248417例 出現 – 英語ではbe動詞の文 • 格文法,格フレームは使えない 50 単語の意味を決める-その他(5) • 名詞句「AのB」をあらためて考える – 人間はうまいこと意味を決めている 1.Bが述語相当語で事象を表し,AがBの格要素である 例:太郎の結婚,電車の通学 2.Bが相対名詞,同格名詞などで場所,時,理由,方法状況などをAを 基準に特定化する 例:ビルの前,彼のため 3.BがAの数量,性質,属性などを表す 例:バラの色,橋の長さ 4.Aが述語相当語で事象を表し,BがAの格要素である 例:通学の手段 5.AがBの所有者,場所,個数,種類,生産者,性質などを表す 例:先生の絵,東北の学校,大量のバラ 51 単語の意味を決める-その他(6) • 名詞句「AのB」をあらためて考える 主素性:主要な意味特徴を示す – 人間はうまいこと意味を決めている 1.Bが述語相当語で事象を表し,AがBの格要素である 椅子(thing),犬(animate),遊び(action) 例:太郎の結婚,電車の通学 2.Bが相対名詞,同格名詞などで場所,時,理由,方法状況などをAを 依存素性:他の素性との意味的依存性を示す 基準に特定化する 例:ビルの前,彼のため 「日本人」は「国nation」に「属すbelong-to-nation」 3.BがAの数量,性質,属性などを表す 例:バラの色,橋の長さ 機能素性:他の語との結合の仕方,役割を示す 4.Aが述語相当語で事象を表し,BがAの格要素である 例:通学の手段 「人間」は,動作主agent役割を持つので, 5.AがBの所有者,場所,個数,種類,生産者,性質などを表す 例:先生の絵,東北の学校,大量のバラ 機能素性role-agentをあてる 52 単語の意味を決める-その他(7) • もっと広い「AのB」もある(交代現象) – 人間はうまいこと意味を決めている 「こと」:彼が 行ったのは確かです. 「もの」:あそこで光っているのは灯台です. 「ひと」:勝負に勝ったのは元チャンピオンだ. 「とき」:この前会ったのは5年前だ. 「わけ」:野菜が高いのは品不足だからだ. 「その他」:彼女が車に乗り込むのを見た.(ところ) 「不可能」:勉強したのに,試験に落ちた. 53
© Copyright 2024 ExpyDoc