ことばとコンピュータ 第7回 本日の内容 • 前回のおさらい – 選択制約,意味的整合性 – 格文法,格フレーム,意味素 • シソーラスを用いた方法 • 連想関係を使った方法 • 意味にまつわるその他の問題 2 おさらい 単語の意味(1) • 単語 – なんらかの意味を持つ(通常は複数ある) • 単語の意味を決めるとは – 文中の単語の意味が,複数の意味の内のどの 意味であるかを決定すること 3 おさらい 単語の意味(11) 「語」と統語構造 • どうやったら意味がわかるか? →複数の語+統語構造を利用しているはず 山が動く → 巨大な組織 山へ芝刈りに行く → 周りより高くなった陸地 話の山を向かえる → クライマックス 太郎が山を眺める → 周りより高くなった陸地 書類の山を抱える → 量の多い様子 事件が山を越す → クライマックス 4 おさらい 単語の意味(13) • どうやったら意味がわかるか? 文の中の複数の語と統語情報を利用している しかし,完全ではない →同じ表層的構造でも意味が違うことがある 太郎が山を眺める/事件が山を越える 日本の山に登る/話の山に差し掛かる 5 おさらい 単語の意味を決める(1) • 鍵:意味的整合性 – 1文を持ってくると,その中の単語間の意味的な 整合性をどうにかして計算 – 意味的に矛盾のない(整合性のある)組み合わ せを,各単語の意味として導き出す • 核となる考え方,材料,道具 選択制限,格フレーム,意味素,用例,連想関係 6 おさらい 単語の意味を決める(2) • かいつまんで言うと... 例: 職場の花を食事に誘う. 花 (1)植物の花 (2)美しい人 – (1)では,植物を食事に誘うことになる →意味的におかしい – (2)では,意味的に整合性がとれる →この意味に決定する 7 おさらい 単語の意味を決める(3) • 大事な役割をするのは動詞 – 例: 職場の花を食事に誘う. 植物ではおかしいのは「誘う」に合わないから 動詞を中心に文中の各語の意味を考える →格文法(フィルモアの格文法) 8 おさらい 単語の意味を決める(4) • (フィルモアの)格文法 case grammar – 語と語の間の意味的関係を動詞を中心に捉える 表層格:主格(he),目的格(him),所有格(his) ガ格(彼が),ヲ格(彼を),ニ格(彼に) 深層格:文中の動詞に対し,どの単語がどのような 役割を持つか 動作主格(A),経験者格(E),道具格(I),対象格(O), 源泉格(S),目標格(G),場所格(L),時間格(T) 9 おさらい 単語の意味を決める(8) • 格フレームは以下のようにもあらわされる break1 break2 break3 subject subject subject O: ... A: ... I: ... object object 格スロット O: ... O: ... 入りうる単語に共通 の属性を定義 I : ... (with ) 格スロット 10 おさらい 単語の意味を決める(10) • 格スロット:共通の属性を定義 • 属性として利用する情報 (いろいろ) – 意味素:名詞を意味によって分類 – シソーラス:類似語,類義語の分類 – 用例:同じ用法で使用される語のまとまり • 単語の意味を決める →格フレームと選択制限によって決める • 入力文 ~ 適切な格フレームを選択 11 おさらい 単語の意味を決める(11) • 格スロットの要素(意味素,シソーラス,用例) • 意味素の例:IPAL (Web上で) concrete, animal, organization,... – 意味素(意味素性)を階層構造化 – 通常,重複ありの分類 12 おさらい 単語の意味を決める(12) • 意味素と格フレームの組み合わせ 「かける」 1. <HUM/ORG>ガ <HUM>ニ<MEN>ヲ 2. <HUM>ガ<LOC/PRO>ニ<CON>ヲ 3. <HUM/ANI>ガ<CON>ニ<CON>ヲ 彼が姉に希望をかける 会社が彼に期待をかける 姉がハンガーにタオルをかける 犬が電柱におしっこをかける 13 シソーラスを用いた方法(単語の意味を決める) • 格スロット:共通の属性を定義 • 属性として利用する情報 (いろいろ) – 意味素:名詞を意味によって分類 – シソーラス:類似語,類義語の分類 – 用例:同じ用法で使用される語のまとまり • 単語の意味を決める →格フレームと選択制限によって決める • 入力文 ~ 適切な格フレームを選択 14 シソーラスを用いた方法(2) • 格スロットの要素(意味素,シソーラス,用例) • シソーラス(類語辞典など)Webで – 概念的なまとまりで単語を分類 – 各分類(概念)を階層構造化 – 通常,重複ありの分類 15 シソーラスを用いた方法(3) • シソーラス(番号)と格フレームの組み合わせ 「かける」 1. <?>ガ <?>ニ<?>ヲ 2. <?>ガ<?>ニ<?>ヲ 3. <?>ガ<?>ニ<?>ヲ 彼が姉に希望をかける → 1 会社が彼に期待をかける → 1 姉がハンガーにタオルをかける → 2 犬が電柱におしっこをかける → 3 16 シソーラスを用いた方法(4) • シソーラス(番号)と格フレームの組み合わせ 「かける」 角川類語新辞典の例 1. <?>ガ <?>ニ<?>ヲ を用いて格フレームの 2. <?>ガ<?>ニ<?>ヲ スロット属性を考える 3. <?>ガ<?>ニ<?>ヲ 彼が姉に希望をかける → 1 会社が彼に期待をかける → 1 姉がハンガーにタオルをかける → 2 犬が電柱におしっこをかける → 3 17 連想関係によって意味を決める(1) Cranes were used to lift building materials. 1. a large waterbird with long legs and necks. 2. a large machine used to lift heavy loads. どっちか? 連想関係で決める 18 連想関係によって意味を決める(2) Cranes were used to lift building materials. 1. a large waterbird with long legs and necks. 2. a large machine used to lift heavy loads. 見出し語[語義1] ... 語11,語12, 語13, ... , 語1n 見出し語[語義2] ... 語21,語22, 語23, ... , 語2n 19 連想関係によって意味を決める(3) 入力文 wa wb wc wd we wf Wc1: Wg Wk Wb Wi Wj 一致度1 Wc2: Wg Wk We Wf Wl Wm 一致度2 20 連想関係によって意味を決める(4) 入力文 wa wb wc wd we wf Wc1: Wg Wk Wb Wi Wj 一致度1 Wc2: Wg Wk We Wf Wl Wm 一致度2 こっち(Wc2:語義2)の方が 可能性が高そう(尤もらしい) 21 連想関係によって意味を決める(5) Cranes were used to lift building materials. (used to) lift building material 1. a large waterbird with long legs and necks. Wc1: large waterbird long leg neck 2. a large machine used to lift heavy loads. Wc2: large machine (used to) lift heavy load 22 連想関係によって意味を決める(6) Cranes were used to lift building materials. (used to) lift building material それぞれの語釈文に現れる単語 入力文中の単語の一致度 Wc1: large waterbird long leg neck Wc2: large machine (used to) lift heavy load 23 連想関係によって意味を決める(7) Cranes were used to lift building materials. (used to) lift building material 「一致度」だけではなかなか一致 しないことが多いので拡張! Wc1: large waterbird long leg neck Wc2: large machine (used to) lift heavy load 24 連想関係によって意味を決める(8) 入力文 wa wb wc wd we wf Wc1: Wg Wh Wb Wi Wh Wa Wx Wz Wq Wr Wc2: Wg Wk We Wf Wl Wm Wa Wn Wo Wj Wy Wq Wp Wd 類義語で拡張 類義語で拡張 25 連想関係によって意味を決める(9) 入力文 wa wb wc wd we wf Wc1: Wg Wh Wb Wi Wh Wa Wx Wz Wq Wr 一致度2 Wc2: Wg Wk We Wf Wl Wm Wa Wn Wo Wj Wy Wq Wp Wd 類義語で拡張 一致度4 類義語で拡張 26 連想関係によって意味を決める(10) レシーバー ①受話器。受信器。特に、耳につけてきくもの。 ②テニスなどで、相手のサーブを受けとめる側の人。 文1.片手でレシーバーを耳に当てる。 文2.レシーバーはサーブされたボールを2回バウンドする前に相手コー トに打ち返し、お互いに ラリーを続ける。 文3.レシーバーは、スパイクによって放たれるボールに対して、すばやく 反応しなければなりません。 文4.スピーカーの元祖を尋ねると、電話機の受話器(レシーバー)に行 き着きます。 27 連想関係によって意味を決める(11) レシーバー ①受話器。受信器。特に、耳につけてきくもの。 ②テニスなどで、相手のサーブを受けとめる側の人。 文1.片手でレシーバーを耳に当てる。 連想関係を利用し,どうにかして 文2.レシーバーはサーブされたボールを2回バウンドする前に相手コー 計算してみよ トに打ち返し、お互いに ラリーを続ける。 文3.レシーバーは、スパイクによって放たれるボールに対して、すばやく 反応しなければなりません。 文4.スピーカーの元祖を尋ねると、電話機の受話器(レシーバー)に行 き着きます。 28 単語の意味を決める-その他(1) • 意味素かシソーラスか? – 言語データを収集 →分析し,分類し,体系化すると,シソーラス →それをさらに抽象化すると,意味素 – シソーラスは修正が容易 • 不足分を補えばよし – 意味素は修正がたいへん • 全体の体系がくずれては困る 29 単語の意味を決める-その他(2) • 意味素かシソーラスか? – シソーラスは処理効率が悪い • 対応する事例を見つけないとならないので比較が多い – 意味素は処理効率がよい • 抽象化されているので,比較数が少ない – シソーラスは意味の弁別力が高い • 分類が細かい分,区別もつきやすい – 意味素は抽象度の度合いにより変化 30 単語の意味を決める-その他(3) • 格フレームの問題 – 格フレームの記述は高コスト(作るのが大変) – 例えば,機械翻訳では NTTのALT-J/E(日英翻訳) 約3000の意味素を使って,約6000の格フレーム – これだけ作っても,逆変換には使えない • J→Eとして作った格フレームの対応はJ→E方向のみ • E→Jが欲しければ,別に格フレームの対応が必要 31 単語の意味を決める-その他(4) • 動詞が存在しない文(言語表現は?) – 日本語では大いにありうる • 例:名詞句「A の B」は, 新聞記事 320000行中に248417例 出現 – 英語ではbe動詞の文 • 格文法,格フレームは使えない 32 単語の意味を決める-その他(5) • 名詞句「AのB」をあらためて考える – 人間はうまいこと意味を決めている 1.Bが述語相当語で事象を表し,AがBの格要素である 例:太郎の結婚,電車の通学 2.Bが相対名詞,同格名詞などで場所,時,理由,方法状況などをAを 基準に特定化する 例:ビルの前,彼のため 3.BがAの数量,性質,属性などを表す 例:バラの色,橋の長さ 4.Aが述語相当語で事象を表し,BがAの格要素である 例:通学の手段 5.AがBの所有者,場所,個数,種類,生産者,性質などを表す 例:先生の絵,東北の学校,大量のバラ 33 単語の意味を決める-その他(6) • 名詞句「AのB」をあらためて考える 主素性:主要な意味特徴を示す – 人間はうまいこと意味を決めている 1.Bが述語相当語で事象を表し,AがBの格要素である 椅子(thing),犬(animate),遊び(action) 例:太郎の結婚,電車の通学 2.Bが相対名詞,同格名詞などで場所,時,理由,方法状況などをAを 依存素性:他の素性との意味的依存性を示す 基準に特定化する 例:ビルの前,彼のため 「日本人」は「国nation」に「属すbelong-to-nation」 3.BがAの数量,性質,属性などを表す 例:バラの色,橋の長さ 機能素性:他の語との結合の仕方,役割を示す 4.Aが述語相当語で事象を表し,BがAの格要素である 例:通学の手段 「人間」は,動作主agent役割を持つので, 5.AがBの所有者,場所,個数,種類,生産者,性質などを表す 例:先生の絵,東北の学校,大量のバラ 機能素性role-agentをあてる 34 単語の意味を決める-その他(7) • もっと広い「AのB」もある(交代現象) – 人間はうまいこと意味を決めている 「こと」:彼が 行ったのは確かです. 「もの」:あそこで光っているのは灯台です. 「ひと」:勝負に勝ったのは元チャンピオンだ. 「とき」:この前会ったのは5年前だ. 「わけ」:野菜が高いのは品不足だからだ. 「その他」:彼女が車に乗り込むのを見た.(ところ) 「不可能」:勉強したのに,試験に落ちた. 35
© Copyright 2024 ExpyDoc