言語体系とコンピュータ 2006年度2学期 第11回 本日の内容 • 照応詞が何をさしているのか決める • その前に, – 文脈について – 照応について • 照応解析 2 照応詞が何をさしているかを決める • 文脈が絡む,文脈の解析の1つの分野 • まずは,文脈とは?から 3 文脈とは(1) • 文脈解析: – 文と文の関係をとらえることで文章によって表さ れる概念と事象のつながりを明らかにする • 文脈とは: – 文の脈絡,文や語の文章上での論理的な関係な どの続き具合 – 理解するには,概念,事象間の関係が必要 →これらも含めて文脈ということもいえる 4 文脈とは(2) • 私たちが伝達したい内容 ~空間的,時間的に連続的につながっていたり, 推移があったり,外界の状態をさしたりと, さまざまな概念,事象が複雑に絡み合っている ↑↓ • 私たちが使える言語 ~1次元的,離散的な表現手段. 全ての情報を一度に伝えるのは難しい 5 文脈とは(3) • 私たちが伝達したい内容 ~空間的,時間的に連続的につながっていたり, 推移があったり,外界の状態をさしたりと, さまざまな概念,事象が複雑に絡み合っている ↑↓ • 私たちが使える言語 ~1次元的,離散的な表現手段. 全ての情報を一度に伝えるのは難しい →適切な文章の形に変えて伝達 6 文脈とは(4) • 話し手,伝え手 – 適切な文章の形に変えて伝達 – 1文で1つの事柄 – 1文で複数の事柄 – 複数文で1つの事柄 というパターンを使って表現 • 聞き手,受け手 – 文章を解釈し,伝えたい内容を復元 – 文章上の手がかりや自分の知識,外界の状況から判断 – 文と文,語と語,語と概念,概念どうしの対応の理解 →文脈の理解(context understanding) 7 文脈をとらえる研究(1) • 文脈解析 – 談話構造の理解(首尾一貫性,結束性,新情報・ 旧情報) – 照応,省略,指示の対象を決める – 文章構造の解析(文間,事象間の論理的関係) などの研究に関わる 8 談話の構造について • 一貫性(coherence)と結束性(cohesion) 一貫性: 文章(談話)全体の自然さやまとまりの良さ. 意味,概念的なつながりを指すことば. 例:参考になる本が本屋にあった. 本は赤色で安かった. それを私は早速買った. 面白かった. 9 一貫性(1) 赤色 参考になる本が本屋にあった. 本は赤色で安かった. それを私は早速買った. 認識 面白かった. 面白い 本屋 形態 認知 本 認識 あった 場所 動作主 可能化 参考になる 認識 安い 対象 理由 動作主 動作主 動作主 私 動作主 買った 時間 早速 10 一貫性(2) 赤色 本屋 参考になる本が本屋にあった. 本は赤色で安かった. それを私は早速買った. 面白かった. 形態 認知 本 面白い 事象間の意味的な関係 理由 動作主 動作主 私 いない関係 →文章の背景にあるつながりを示す 可能化 参考になる 安い 対象 動作主 文章中には陽に表現されて 動作主 認識 認識 言葉のさす概念, 認識 あった 場所 動作主 買った 時間 早速 11 談話の構造について • 一貫性(coherence)と結束性(cohesion) – 結束性: 文と文,語と語,文と語の表層的なつながり 例:参考になる本が本屋にあった. 本は赤色で安かった. それを私は早速買った. 面白かった 12 結束性(1) h-m 本 参考になる本が本屋にあった. 本は赤色で安かった. それを私は早速買った. 面白かった s-v rep. 本屋 あった h-m{at} ref. cj:等位接続 h:主要部 m:修飾要素 s:主語 v:動詞 ref.:参照 rep.:繰り返し 参考にな る h-m 赤色 本 h-m cj{and} 安い ref. 早速 ref. 私 それ h-m h-m ゼロ 代名詞 買った h-m ゼロ 代名詞 ゼロ 代名詞 面白い h-m ref. h-m 13 結束性(2) h-m 本 参考になる本が本屋にあった. 本は赤色で安かった. それを私は早速買った. 面白かった s-v rep. 本屋 あった h-m{at} ref. cj:等位接続 h:主要部 m:修飾要素 s:主語 v:動詞 ref.:参照 rep.:繰り返し 参考にな る h-m 赤色 本 h-m cj{and} 安い ref. 早速 ref. 私 それ h-m 文章上の表層的な関係を示す h-m つながりを示す表層的手がかり ゼロ 代名詞 買った h-m ゼロ 代名詞 ゼロ 代名詞 面白い h-m ref. h-m 14 結束性(3) h-m 本 参考にな る 参考になる本が本屋にあった. s-v rep. 本は赤色で安かった. 本屋 あった それを私は早速買った. h-m{at} 結束性は,表層的な関係で処理が可能 面白かった ref. h-m 現状では, cj:等位接続 h:主要部 赤色 本 m:修飾要素 s:主語 cj{and} h-m 安い 一貫性よりも,コンピュータで処理しやすい ref. v:動詞 早速 ref.:参照 rep.:繰り返し ref. 私 それ h-m 文章上の表層的な関係を示す h-m つながりを示す表層的手がかり ゼロ 代名詞 買った h-m ゼロ 代名詞 ゼロ 代名詞 面白い h-m ref. h-m 15 結束性の分類 • 代名詞+こそあど,指示表現,省略, 代入 (‘a new one’のoneとか’do so’のsoなど) ↑まとめて指示(代名詞,省略,代入)とも言える • 接続 – 接続詞が出現する前後の文や段落間の関係を 結びつける関係 • 語彙的結束性 – 表層に現われる2つの語の意味的な関係 16 結束性の分類 • 代名詞+こそあど,指示表現,省略, 代入 (‘a new one’のoneとか’do so’のsoなど) ↑まとめて指示照応(代名詞,省略,代入)とも言え る 照応,語彙的結束性は後ほど扱う • 接続 – 接続詞が出現する前後の文や段落間の関係を 結びつける関係 • 語彙的結束性 – 表層に現われる2つの語の意味的な関係 17 新情報と旧情報(1) • 文章:組み立ての基本原則 • 話し手: – 聞き手が解釈できる文章の構造を作成する必要 がある • 人間の記憶: – 直前に話されたものはよく記憶に残っている(短 期記憶) – この性質が談話の伝達でも使われている. 18 新情報と旧情報(2) 話し手 聞き手 提示―――情報―――意識にのぼる 新情報 初めて聞いたもの 知っていたが思い出したもの 19 新情報と旧情報(3) 話し手 聞き手 提示―――情報―――意識にのぼる 新情報 初めて聞いたもの 知っていたが思い出したもの 提示―新たな情報 20 新情報と旧情報(4) 話し手 聞き手 提示―――情報―――意識にのぼる 新情報 初めて聞いたもの 知っていたが思い出したもの 提示―新たな情報 より豊富な概念 新情報 を伝える 21 新情報と旧情報(5) 話し手 聞き手 提示―――情報―――意識にのぼる 新情報 提示―新たな情報 より豊富な概念 新情報 を伝える 初めて聞いたもの 知っていたが思い出したもの 既に意識に のぼっていた概念 旧情報になる 22 新情報と旧情報(6) 話し手 聞き手 提示―――情報―――意識にのぼる 新情報 提示―新たな情報 より豊富な概念 新情報 を伝える 初めて聞いたもの 知っていたが思い出したもの 既に意識に のぼっていた概念 旧情報になる 関係付ける 23 新情報と旧情報(7) 話し手 聞き手 提示―――情報―――意識にのぼる 新情報 提示―新たな情報 より豊富な概念 新情報 を伝える 初めて聞いたもの 知っていたが思い出したもの 既に意識に のぼっていた概念 旧情報になる 関係付ける 関係を表す情報が含まれている 強調したいこと 焦点 が含まれている(ことが多い) 24 主題と陳述(1) • また,話の方向を見失わないために... 提示――現在述べていること― (話の方向を見失わないため)の大まかな流れ ...主題 何について述べられているかを示す 「 我輩 は 猫である」 主題 ~ 我輩について述べられていると理解 「 猫である 」 は述部 陳述 ~ 主題についての説明 焦点を含むことが多い 25 主題と陳述(2) 我輩 は 猫である. 主題 陳述 (旧情報) 新情報 猫 は 主題 旧情報 よく寝る. 陳述 新情報 26 焦点 焦点: 前の文では主題となっていないが, 後の文では主題となる. 新情報―旧情報 主題―焦点 文章で示されている 内容を意味的につなぐ働き. 文章の組み立ての基本的原則 利用すると効率良く内容を伝えられる 27 情報伝達 • 話し手 – 伝えたい内容をまとめる – 述べる順序を考え、計画を練る 一貫性,結束性 新情報・旧情報,主題焦点 談話構造(を作り) • 聞き手 文章生成 – 談話構造を解釈(結束性を手がかりに) – 伝えようとされた一貫性を復元 • 文脈解析 入力文章の結束性を捉え,談話構造を解析 28 照応問題(1) • 照応・省略の分類 ある表現 が後に現れる 表現 と同じ内容・対象をさす 照応関係 anaphoric relation 29 照応問題(2) 机の上に大きな箱がのっていた. それは赤い箱だった. ここで大きな箱は先行詞(antecedent) それは照応詞(anaphor) 照応詞が現れる前に先行詞が既に現れている照応 → 前方照応(anaphora) 30 照応問題(3) 机の上にそれは確かにありました. 赤い箱があったのです. 先行詞が照応詞よりも後に現れる照応 →後方照応(cataphora) 31 照応問題(4) あの猫見て. どれ? 文章中に照応詞の照応先がないが 外界のあるものを指す →外界照応(exophora) 32 照応問題(5) 照応現象 外界照応 (exophora) 文脈照応 (endophora) 前方照応 (anaphora) 後方照応 (cataphora) *外界照応は扱わない. 33 照応問題(6) 僕はその時初めて「ちくわぶ」を知りました. (ちくわぶは)あまりおいしく感じなかったです. 既に聞き手,読み手の意識にあり,補完が容易な時, 照応詞が省略 →ゼロ代名詞(null-pronoun)(省略) 34 照応問題(7) 太郎は花子に一通の封筒を渡した. 花子はそれを読んだ. 封筒の中身 先行詞が明示的に文章中に該当する表現がない →間接的照応 (※常識などの知識を使って推論) 35 照応詞が何を指しているか決める • いろいろな項目 – 共通の処理手順 – 名詞の指示性の推定 – 定名詞の先行詞の推定 – 指示詞・ゼロ代名詞の先行詞の推定 36 一般的な共通の処理手順(1) 1. 基本的な文の構造を明らかにしておく • • • • • • 形態素解析 構文解析 (かかりうけ関係) 「は」のつく名詞...主題や焦点になりやすい 「が」のつく名詞...主題や焦点になりやすい その他の名詞 用言 といった先行詞になりそうな情報の取得 37 一般的な共通の処理手順(2) 2. 未決定の照応詞の候補を探す 3. 対応する先行詞があるかどうかを決める 照応解析処理に移る 1. 先行詞の候補となりそうなものを列挙 • 主題,焦点,名詞,用言など 2. どれが照応詞に対する先行詞として尤もらしい かを決定する • • 言語理論的な決定打はない ヒューリスティクスで対応 38 一般的な共通の処理手順(3) • ヒューリスティクス(経験的手法) – 人工知能分野のエキスパートシステムの考え方 – 試行錯誤的な方法 • 照応関係 – 文章中のさまざまな表現が複雑に絡んでいる – ある種の表現が存在→ある種の先行詞をさす可能性が 高い(経験則:推論規則) – 1つの照応関係の決定に1つの経験則が適用可能という ことはまれ→複数の経験則が同時に適用 – 適用する経験則ごとに確からしさを計算(確信度) 39 一般的な共通の処理手順(4) • 最終的に得点の高い候補を先行詞として決 定する Voting 決定 未決定照応詞 文章 形 態 素 解 析 構 格 文 解 解 析 析 照応詞判定 参照先判定 得 点 化 判 定 指示対象候補 • どんな手がかりや,規則を用いるかは照応詞 のタイプによって違う 40 名詞の指示性の推定(1) • 文章中の名詞が,既出のものさす場合 • 名詞が何をさしているのかを推定 – なぜ必要か? 例:機械翻訳(日英) 名詞に冠詞 a をつけるか the をつけるか 代名詞化できるかどうか 決定するには,名詞が何をさしているか明らかに する必要がある 41 名詞の指示性の推定(2) • 例: おじいさんは地面に腰をおろしました. やがておじいさんは眠ってしまいました. → The old man sat down on the ground. He soon fell asleep. 42 名詞の指示性の推定(3) • 文章中のそれぞれの名詞 – 既に出てきた名詞をさしているかどうかを決める • 名詞の分類を考えておく 名詞 総称名詞(犬はひとなつっこいです) 非総称名詞 定名詞(その犬はひとなつっこいです) 不定名詞 特定性(犬が三匹います) 不特定性(犬を飼っていますか?) 43 名詞の指示性の推定(4) • 文章中のそれぞれの名詞 総称名詞: – 既に出てきた名詞をさしているかどうかを決める 「犬」(類)の要素すべてか, 「犬」(類)自体をさす • 名詞の分類を考えておく 名詞 総称名詞(犬はひとなつっこいです) 非総称名詞 定名詞(その犬はひとなつっこいです) 不定名詞 特定性(犬が三匹います) 不特定性(犬を飼っていますか?) 44 名詞の指示性の推定(5) • 文章中のそれぞれの名詞 – 既に出てきた名詞をさしているかどうかを決める 非総称名詞: • 名詞の分類を考えておく 「犬」(類)の要素の一部をさす 名詞 総称名詞(犬はひとなつっこいです) 非総称名詞 定名詞(その犬はひとなつっこいです) 不定名詞 特定性(犬が三匹います) 不特定性(犬を飼っていますか?) 45 名詞の指示性の推定(6) • 文章中のそれぞれの名詞 – 既に出てきた名詞をさしているかどうかを決める 定名詞: 指示の対象が確定している • 名詞の分類を考えておく 不定名詞:指示の対象が確定していない 名詞 総称名詞(犬はひとなつっこいです) 非総称名詞 定名詞(その犬はひとなつっこいです) 不定名詞 特定性(犬が三匹います) 不特定性(犬を飼っていますか?) 46 名詞の指示性の推定(7) • 文章中のそれぞれの名詞 – 既に出てきた名詞をさしているかどうかを決める 特定性:指示するもの(犬)が実際に存在している • 名詞の分類を考えておく 不特定性:実際に存在していない 名詞 総称名詞(犬はひとなつっこいです) 非総称名詞 定名詞(その犬はひとなつっこいです) 不定名詞 特定性(犬が三匹います) 不特定性(犬を飼っていますか?) 47 名詞の指示性の推定(8) •定名詞... 文章中のそれぞれの名詞 – 既に出てきた名詞をさしているかどうかを決める 既に現れているものと照応する可能性がある! その他(総称名詞,不定名詞)... • 照応せず,その時,初めて出現したと考えられる 名詞の分類を考えておく 名詞 総称名詞(犬はひとなつっこいです) 非総称名詞 定名詞(その犬はひとなつっこいです) 不定名詞 特定性(犬が三匹います) 不特定性(犬を飼っていますか?) 48 名詞の指示性の推定(9) • 指示性の手がかりは? – 名詞自身が「固有名詞」か「普通名詞」か – 名詞の表層格が「が」などの格助詞か – 主題の手がかり,「は」などが付いているか – 述部の品詞,時制は何か – 修飾節の主部に指示性の語があるか – 修飾節の述部の時制は何か – 修飾語句が指示詞かどうか など 49 名詞の指示性の推定(10) テーブルの上に土産のみかんがあります. 彼らが昨日摘み取ったみかんは味がいいです. 下線を引いたみかんの指示性を決定する 50 名詞の指示性の推定(11) 彼らが昨日摘み取ったみかんは味がいいです. 彼ら かれら 彼ら 名詞 6 普通名詞 1 * 0 * 0 "代表表記:彼等" が が が 助詞 9 格助詞 1 * 0 * 0 NIL 昨日 きのう 昨日 名詞 6 時相名詞 10 * 0 * 0 "代表表記:昨日" 摘み取った つみとった 摘み取る 動詞 2 * 0 子音動詞ラ行 10 タ形 8 "代表表記:摘み取る" みかん みかん みかん 名詞 6 普通名詞 1 * 0 * 0 "代表表記:未完" は は は 助詞 9 副助詞 2 * 0 * 0 NIL 味 あじ 味 名詞 6 普通名詞 1 * 0 * 0 "漢字読み:訓 代表表記:味" が が が 助詞 9 格助詞 1 * 0 * 0 NIL いい いい いい 形容詞 3 * 0 イ形容詞アウオ段 18 基本形 2 "代表表記:いい" です です です 助動詞 5 * 0 無活用型 26 基本形 2 NIL . . . 特殊 1 句点 1 * 0 * 0 NIL EOS 51 名詞の指示性の推定(12) 彼らが昨日摘み取ったみかんは味がいいです. # S-ID:1 KNP:2006/06/29 テーブルの──┐ 上に──┐ 土産の──┐ │ みかんが──┤ あります. EOS # S-ID:2 KNP:2006/06/29 彼らが──┐ 昨日──┤ 摘み取った──┐ みかんは──┐ 味が──┤ いいです. EOS 52 名詞の指示性の推定(13) 不定 名詞 性 定名 詞性 総称 名詞 性 助詞「は」がつき,述語が現在形 0 2 3 名詞に係る節の述部が過去形 0 1 0 名詞に係る節に「は」か「が」がついた定名詞がある 0 1 0 名詞に係る節に助詞がついた定名詞がある 0 1 0 名詞に係る節に代名詞がある 0 1 0 助詞「は」がつき,述語が形容詞 0 3 4 普通名詞のとき 1 0 0 53 名詞の指示性の推定(14) 不定 名詞 性 定名 詞性 総称 名詞 性 54
© Copyright 2024 ExpyDoc