ことばとコンピュータ 2007年度1学期 第11回 本日の内容 • 照応詞が何を指しているか決める – 照応の解析に共通の処理手順 – 名詞の指示性の推定 – 定名詞の先行詞の推定 – 指示詞・ゼロ代名詞の先行詞の推定 2 一般的な共通の処理手順(1) 1. 基本的な文の構造を明らかにしておく • • • • • • 形態素解析 構文解析 (かかりうけ関係) 「は」のつく名詞...主題や焦点になりやすい 「が」のつく名詞...主題や焦点になりやすい その他の名詞 用言 といった先行詞になりそうな情報の取得 3 一般的な共通の処理手順(2) 2. 未決定の照応詞の候補を探す 3. 対応する先行詞があるかどうかを決める 照応解析処理に移る 1. 先行詞の候補となりそうなものを列挙 • 主題,焦点,名詞,用言など 2. どれが照応詞に対する先行詞として尤もらしい かを決定する • • 言語理論的な決定打はない ヒューリスティクスで対応 4 一般的な共通の処理手順(3) • ヒューリスティクス(経験的手法) – 人工知能分野のエキスパートシステムの考え方 – 試行錯誤的な方法 • 照応関係 – 文章中のさまざまな表現が複雑に絡んでいる – ある種の表現が存在→ある種の先行詞をさす可能性が 高い(経験則:推論規則) – 1つの照応関係の決定に1つの経験則が適用可能という ことはまれ→複数の経験則が同時に適用 – 適用する経験則ごとに確からしさを計算(確信度) 5 一般的な共通の処理手順(4) • 最終的に得点の高い候補を先行詞として決 定する Voting 決定 未決定照応詞 文章 形 態 素 解 析 構 格 文 解 解 析 析 照応詞判定 参照先判定 得 点 化 判 定 指示対象候補 • どんな手がかりや,規則を用いるかは照応詞 のタイプによって違う 6 名詞の指示性の推定(1) • 文章中の名詞が,既出のものさす場合 • 名詞が何をさしているのかを推定 – なぜ必要か? 例:機械翻訳(日英) 名詞に冠詞 a をつけるか the をつけるか 代名詞化できるかどうか 決定するには,名詞が何をさしているか明らかに する必要がある 7 名詞の指示性の推定(2) • 例: おじいさんは地面に腰をおろしました. やがておじいさんは眠ってしまいました. → The old man sat down on the ground. He soon fell asleep. 8 名詞の指示性の推定(3) • 文章中のそれぞれの名詞 – 既に出てきた名詞をさしているかどうかを決める • 名詞の分類を考えておく 名詞 総称名詞(犬はひとなつっこいです) 非総称名詞 定名詞(その犬はひとなつっこいです) 不定名詞 特定性(犬が三匹います) 不特定性(犬を飼っていますか?) 9 名詞の指示性の推定(4) • 文章中のそれぞれの名詞 総称名詞: – 既に出てきた名詞をさしているかどうかを決める 「犬」(類)の要素すべてか, 「犬」(類)自体をさす • 名詞の分類を考えておく 名詞 総称名詞(犬はひとなつっこいです) 非総称名詞 定名詞(その犬はひとなつっこいです) 不定名詞 特定性(犬が三匹います) 不特定性(犬を飼っていますか?) 10 名詞の指示性の推定(5) • 文章中のそれぞれの名詞 – 既に出てきた名詞をさしているかどうかを決める 非総称名詞: • 名詞の分類を考えておく 「犬」(類)の要素の一部をさす 名詞 総称名詞(犬はひとなつっこいです) 非総称名詞 定名詞(その犬はひとなつっこいです) 不定名詞 特定性(犬が三匹います) 不特定性(犬を飼っていますか?) 11 名詞の指示性の推定(6) • 文章中のそれぞれの名詞 – 既に出てきた名詞をさしているかどうかを決める 定名詞: 指示の対象が確定している • 名詞の分類を考えておく 不定名詞:指示の対象が確定していない 名詞 総称名詞(犬はひとなつっこいです) 非総称名詞 定名詞(その犬はひとなつっこいです) 不定名詞 特定性(犬が三匹います) 不特定性(犬を飼っていますか?) 12 名詞の指示性の推定(7) • 文章中のそれぞれの名詞 – 既に出てきた名詞をさしているかどうかを決める 特定性:指示するもの(犬)が実際に存在している • 名詞の分類を考えておく 不特定性:実際に存在していない 名詞 総称名詞(犬はひとなつっこいです) 非総称名詞 定名詞(その犬はひとなつっこいです) 不定名詞 特定性(犬が三匹います) 不特定性(犬を飼っていますか?) 13 名詞の指示性の推定(8) •定名詞... 文章中のそれぞれの名詞 – 既に出てきた名詞をさしているかどうかを決める 既に現れているものと照応する可能性がある! その他(総称名詞,不定名詞)... • 照応せず,その時,初めて出現したと考えられる 名詞の分類を考えておく 名詞 総称名詞(犬はひとなつっこいです) 非総称名詞 定名詞(その犬はひとなつっこいです) 不定名詞 特定性(犬が三匹います) 不特定性(犬を飼っていますか?) 14 名詞の指示性の推定(9) • 指示性の手がかりは? – 名詞自身が「固有名詞」か「普通名詞」か – 名詞の表層格が「が」などの格助詞か – 主題の手がかり,「は」などが付いているか – 述部の品詞,時制は何か – 修飾節の主部に指示性の語があるか – 修飾節の述部の時制は何か – 修飾語句が指示詞かどうか など 15 名詞の指示性の推定(10) テーブルの上に土産のみかんがあります. 彼らが昨日摘み取ったみかんは味がいいです. 下線を引いたみかんの指示性を決定する 16 名詞の指示性の推定(11) 彼らが昨日摘み取ったみかんは味がいいです. 彼ら かれら 彼ら 名詞 6 普通名詞 1 * 0 * 0 "代表表記:彼等" が が が 助詞 9 格助詞 1 * 0 * 0 NIL 昨日 きのう 昨日 名詞 6 時相名詞 10 * 0 * 0 "代表表記:昨日" 摘み取った つみとった 摘み取る 動詞 2 * 0 子音動詞ラ行 10 タ形 8 "代表表記:摘み取る" みかん みかん みかん 名詞 6 普通名詞 1 * 0 * 0 "代表表記:未完" は は は 助詞 9 副助詞 2 * 0 * 0 NIL 味 あじ 味 名詞 6 普通名詞 1 * 0 * 0 "漢字読み:訓 代表表記:味" が が が 助詞 9 格助詞 1 * 0 * 0 NIL いい いい いい 形容詞 3 * 0 イ形容詞アウオ段 18 基本形 2 "代表表記:いい" です です です 助動詞 5 * 0 無活用型 26 基本形 2 NIL . . . 特殊 1 句点 1 * 0 * 0 NIL EOS 17 名詞の指示性の推定(12) 彼らが昨日摘み取ったみかんは味がいいです. # S-ID:1 KNP:2006/06/29 テーブルの──┐ 上に──┐ 土産の──┐ │ みかんが──┤ あります. EOS # S-ID:2 KNP:2006/06/29 彼らが──┐ 昨日──┤ 摘み取った──┐ みかんは──┐ 味が──┤ いいです. EOS 18 名詞の指示性の推定(13) 不定 名詞 性 定名 詞性 総称 名詞 性 助詞「は」がつき,述語が現在形 0 2 3 名詞に係る節の述部が過去形 0 1 0 名詞に係る節に「は」か「が」がついた定名詞がある 0 1 0 名詞に係る節に助詞がついた定名詞がある 0 1 0 名詞に係る節に代名詞がある 0 1 0 助詞「は」がつき,述語が形容詞 0 3 4 普通名詞のとき 1 0 0 19 名詞の指示性の推定(14) 不定 名詞 性 定名 詞性 総称名 詞性 該当箇所 助詞「は」がつき,述語が現在形 名詞に係る節の述部が過去形 名詞に係る節に「は」か「が」がついた定 名詞がある 名詞に係る節に助詞がついた定名詞が ある 名詞に係る節に代名詞がある 助詞「は」がつき,述語が形容詞 普通名詞のとき 20 定名詞の先行詞の推定(1) • 名詞がさしている先行詞の候補 – 対象としている名詞の前後の主題,焦点, その他の名詞などいろいろありうる ただし, – 文章中に既に出ている主題,焦点は話題の 中心を担う →先行詞になりやすい,と考えられる 21 定名詞の先行詞の推定(2) • 名詞がさしている先行詞の候補 – 主題は前の文の焦点をさすことが多い – 焦点は次の文などで主題として参照される ことが多い – 互いに密接に関係して,つながりを強めあう 話の中心 となる 1つの文の中のそれぞれの語が話の中心に なる度合い 主題 > 焦点 > その他の名詞 22 定名詞の先行詞の推定(3) • 名詞がさしている先行詞の候補 – 主題は前の文の焦点をさすことが多い – 焦点は次の文などで主題として参照される ことが多い – 互いに密接に関係して,つながりを強めあう 話の中心 となる センタリング(centering) 1つの文の中のそれぞれの語が話の中心に なる度合い 主題 > 焦点 > その他の名詞 23 定名詞の先行詞の推定(4) • 主題や焦点を見つける – 「が」や「は」などの助詞をマークとして探す – 「が」格の指示詞・代名詞・ゼロ代名詞は主 題になりやすい – 焦点へのなりやすさ:「が」格以外の指示詞・代名 詞・ゼロ代名詞,名詞+「が」「も」「だ」「なら」「こそ」 などの順番 – その他,「を」「に」,句読点などなど こうした順番にあわせて,手がかりにし, 先行する名詞に重みを与える 24 定名詞の先行詞の推定(5) 主 題 表層表現の例 重 み ガ格の指示詞・代名詞・ゼロ代名詞 21 (名詞)は/には 20 ガ格以外の指示詞・代名詞・ゼロ代名詞 16 焦 点 • (名詞)が/も/だ/なら/こそ 15 (名詞)を/に/,/. 14 (名詞)へ/で/から/より 13 25 定名詞の先行詞の推定(6) • 主題や焦点の特定は難しい • 特に焦点はより難しい – 出現の時点では主題になっていないが,次の文 で主題になる可能性の高いもの – 正確に求めるのは困難 • 簡単な特徴を使って,近似する,以上のこと はなかなか手立てがない 26 定名詞の先行詞の推定(7) • 簡単な特徴を使って,近似する,以上のこと はなかなか手立てがない • その他 – 対象となっている照応詞と,候補の名詞の距離 – 照応詞である名詞と,先行詞の候補につく修飾 語が一致すると,可能性が高い などの情報も加えて,複数の情報の積み重ねを 用いて,尤もらしいものを選ぶ 27 定名詞の先行詞の推定(8) その時おじいさんはあまり遠くない所にある空き地 に火が燃えているのに気がつきました.赤い顔をし て,鼻の青い,恐ろしい目付きの五六人の男が,火 の周りに立っているのを見ました. 名詞「火」の指示性の推定を行う. 28 定名詞の先行詞の推定(8) その時おじいさんはあまり遠くない所にある空き地 に火が燃えているのに気がつきました.赤い顔をし て,鼻の青い,恐ろしい目付きの五六人の男が,火 の周りに立っているのを見ました. 普通名詞(1 0 0),名詞にかかる節に「が」のつく定名詞(0 1 0), 名詞にかかる節に助詞がついた定名詞(0 1 0), 修飾節に指示性の語がない(1 0 3)などと考えてみて... 不定名詞5 < 定名詞8 < 総称名詞10 という結果(中間)を得たとする.まだ決まらない. 29 定名詞の先行詞の推定(9) • 前の文のこの文での状態を調べる その時おじいさんはあまり遠くない所にある 空き地に火が燃えているのに気がつきました. 赤い顔をして,鼻の青い,恐ろしい目付きの 五六人の男が,火の周りに立っているのを見 ました. 主題:五六人の男,焦点:赤い顔,鼻,目付き 焦点:前文の「火」はこの文で焦点となっている 30 定名詞の先行詞の推定(10) • 名詞「火」についての総合評価 前文の「火」がこの文での焦点:15点 火と火の距離:4つ -4点 指示性の推定: (定名詞でない) -3点 その他の調整: +4点 12点 例えばですが,12点は,総称名詞の10点より高い得 点なので,火と火が照応関係にあるとする. 31 定名詞の先行詞の推定(11) • 精度について – 要因はさまざま – 何が効くのか – どういう組み合わせが有効か 総合的に精度よく推定を行うのは難しい – こうした方法では8割程度の正答率 • より深い意味解析や知識を用いた推論との統合が 必要 – ただし,文脈解析とこれらの知識の順序関係は不明で, 全体の整合性をとりながら,解析をすることは難しい 32 指示詞の先行詞の推定(1) • 名詞の先行詞を推定した時と同じような枠組 – 規則数や場合はたくさんに増えるので難易度大 • 指示代名詞の先行詞の候補 – 主題,焦点,その他の名詞 – 前文全体,既出の文章など – 用言など(事象をさす場合) – 文章中のものを指示していない(外界照応) 33 指示詞の先行詞の推定(2) 指示代名詞 コ系 名詞形態 これ(ら),ここ(ら) こちら,こっち 連体詞形態 この,こんな,こういう, こうした,こういった, このような 副詞形態 こう このように,こんなに, こんなふうに ソ系 ア系 ド系 34 指示詞の先行詞の推定(3) 1. 2. 3. 4. 先行詞の候補となる主題・焦点の重みや,それらから指示 詞までの距離 指示詞の種類による性質の違い 「~という○がある.この○は~」,名詞に係る指示詞の場 合,その名詞と同一の名詞が前方に見つかるかどうか 指示詞の属性と先行詞の候補の属性の類似度 (「ここ」(場所を表す),候補が「駅」とか) 先行詞の候補を指示詞の代わりに入れてみて,意味が通 じるかどうか.(「この実験」の「この」に候補,「化学反応」 +「の」を入れて通じるかどうか,意味的近さはシソーラス などを利用) などなど 5. 35 指示詞の先行詞の推定(4) ドル相場は,米新政権の経済政策に対する 期待の高まりなどから116円台に上昇した.こ のドル高は,米国と欧州各国との間の政策協 調をぎくしゃくさせている. 「このドル高」のさす内容は? 36 指示詞の先行詞の推定(5) ドル相場は,米新政権の経済政策に対する期待 の高まりなどから116円台に上昇した. このドル高は,米国と欧州各国との間の政策協調 をぎくしゃくさせている. 1. 「このドル高」の先行詞候補を計算 – 前の文の主題→ – 前の文の焦点→ – その他の名詞→ – 用言→ 前文全体,先行詞なし 37 指示詞の先行詞の推定(6) ドル相場は,米新政権の経済政策に対する期待 の高まりなどから116円台に上昇した. このドル高は,米国と欧州各国との間の政策協調 をぎくしゃくさせている. 2. 先行詞候補の重みを計算し,順序付け – 前の文の主題→ – 前の文の焦点→ – その他の名詞→ – 用言→ 前文全体,先行詞なし 38 指示詞の先行詞の推定(7) ドル相場は,米新政権の経済政策に対する期待 の高まりなどから116円台に上昇した. このドル高は,米国と欧州各国との間の政策協調 をぎくしゃくさせている. 3. 指示詞の場所に,各候補を置き換えてチェック – 前の文の主題→ – 前の文の焦点→ – その他の名詞→ – 用言→ 前文全体,先行詞なし 39 指示詞の先行詞の推定(8) • 人称代名詞の場合 先行詞は,人間か,擬人化されたもの 候補から,なるべく人間に近いものを探す – 先行詞の候補となる主題・焦点の重みや,それら から指示詞までの距離 – 指示詞の人称と先行詞の候補の人称の一致度 – 先行詞の候補の「人間」との意味的な距離 – 会話の場合,話者と調査の間の視点の移動など の情報 40 指示詞の先行詞の推定(9) • 人称代名詞の場合 (易) 太郎は次郎と一緒に花子の新居を訪ねた. 彼女は最近この町に引っ越してきた. – 「彼女」の先行詞の候補 → – 先行詞の尤もらしさをチェック 41 指示詞の先行詞の推定(10) • 人称代名詞の場合 (やや難) 太郎は次郎と一緒に花子の新居を訪ねた. 彼も最近この町に引っ越してきた. – 「彼」の先行詞の候補 → – 先行詞の尤もらしさをチェック 42 指示詞の先行詞の推定(11) • 人称代名詞の場合 (難) 太郎は次郎と一緒に三郎の家を訪ねた. 彼は最近この町に引っ越してきた. – 「彼」の先行詞の候補 → – 先行詞の尤もらしさをチェック 43 指示詞の先行詞の推定(12) • ゼロ代名詞 – どこが省略されているかを見つける おじいさんは地面に腰をおろしました. やがて眠ってしまいました. →省略(ゼロ代名詞)は? 用言に注目して格要素を元に考えるのが一般的 44 指示詞の先行詞の推定(13) • ゼロ代名詞 – 省略(ゼロ代名詞)要素の先行詞は? • 視点表現:「やる」「くれる」→前の文の主格が行為者 になりやすい • 知覚動詞:「思う」「欲しい」→一人称が多い • 様相表現:「だろう」「ようだ」「そうだ」→一人称になりに くい 45 指示詞の先行詞の推定(14) • ゼロ代名詞 用言の意味などを用いると解決しやすい例: S社は超小型PCを開発.高性能CPUを搭載し, 8月に出荷予定. 「ので」は「は」なら主格が一致,「が」なら一致せず 彼は風邪をひいたので,会社を休んだ. 彼が風邪をひいたので,会社を休んだ. 46 指示詞の先行詞の推定(15) • 文章の表層上のてがかりを駆使 • 動詞と格の関係 • 名詞と他の名詞との関係,似たような表現 • 聞き手の頭の中にある旧情報との関連 などなど →文章中の各語がどの語とどのような関係 で結びつくかをすべて考える必要あり 47
© Copyright 2024 ExpyDoc