自然言語対話特論 後期 水曜日 2時限 後半

1月12日 前回の続き
談話解析
プラン認識に基づく理解

個々の発話


相手の心的状態(信念や意図)を変化させる行為
対話

世界に作用し何らかの目的(ゴール)を達成するた
めの計画(プラン)
発話の理解







駅の案内所での客と駅員の会話
客:モントリオール行きの列車は何時に出発しますか.
駅員A:3時15分です
駅員B:3時15分に7番ゲートからです.
ウィンザー行きの列車は何時に発車するかご存知ですか.
駅員A:はい
駅員B:3時15分に出発します.
行為の記述

乗車(行為者,列車,駅)





制約:発車駅(列車,駅)
出発場所(列車,場所)
出発時間(列車,時間)
前提条件: いる(行為者,場所,時間)
効果:乗車状態(行為者,列車)
「モントリオール行きの列車は何時
に発車しますか」 駅員の答え



客はモントリオール行きの列車の発車時刻を知りたがっ
ている
客はモントリオール行きの列車に乗りたいらしい
列車に乗るには客は下の前提条件を満たさなければな
らない.


前提条件の制約



いる(行為者,場所,時間)
発車駅,場所,時間
当駅は発車駅である.時間は聞かれたので答える.乗車
ゲートも答える必要がある.
「3時15分に7番ゲートからです.
1月12日
文章生成

文章生成




対話システム
翻訳システムの出力
要約システムの出力
質問応答システムの出力
文書生成システム

概念化された伝達内容を入力とするシステム


非記号的データを入力とするシステム


中間言語方式の機械翻訳
株式市場レポート,天気予報,スポーツの試合のレ
ポート
伝達意図を入力とするシステム

領域知識に関する質問応答システム
自然言語生成に必要な種々の
作業と資源
非記号的データ
話し手の意図
領域知識
概念化/
命題化
伝達内容
の選択
伝達内容
の構成
深層生成
談話構造に関する知識
領域に関する聞き手の
モデル
テキストプラン
談話関係
文境界 の表出 文法的
選択
の決定
参照表現
命題の
語選択 の選択
集約
テキスト
表層生成
語彙・文法知識
言語に関する聞き手
のモデル
深層生成

話し手の意図を入力とし,それを達成する
テキストの伝達内容を選択する
Lispプログラムについてアドバイスする
エキスパートシステムとユーザの対話






S1: どのような内容のアドバイスがほしいですか?
u1: プログラムの保守性を向上させるためのアドバイスをください.
s2: (setq x 1) は (setf x 1)に変更したほうがいいです.
u2: なぜ?
システムのゴール:setqからsetfへの書換えを実行するように
ユーザを説得する
s3:




私は今,
保守性向上の書換えを適用することによって,
プログラムの保守性を高めようとしています.
setqからsetfへの書換えは保守性向上の書換えの一つなのです.
表層生成




深層生成で生成された伝達内容(テキスト
プラン)をテキストに変換する作業
文境界の決定
構文の選択
語の選択
参照表現の選択
参照対象を特定するのに必要な情報

矢印で指している三角を言葉で指定するには?
参照表現の選択
基本語彙レベル
動物
獣
犬





動物にかまれた
獣にかまれた
犬にかまれた
ラブラドールにかまれた
隣の家のナナにかまれた
ラブラドール
隣の家のナナ
参照表現の選択
聞き手のモデルの考慮



聞き手が良く知っていると推定できる語を優先す
る.
それに該当する適当な語がないときは,説明的
な定義で言い換える.
説明的定義についても,聞き手が知っていると
推測される情報を優先する.
参照表現の選択
文脈の影響1

参照対象が未出の実体である場合

初めて談話に現れる実態を参照する場合



聞き手が既に知っていると推定できる実体を参照する場合


固有名詞または定名詞句で参照する
参照対象と同じクラスの実体が先行文脈に現れている場合


参照対象を特定するための情報を付加して表出する.
「昨日山田さんと行ったレストラン」
二つの実体を区別する属性を用いて代用詞を修飾する.
先行文脈には現れていないが,既出の実体から聞き手がそ
の存在を推論できる実体を参照する場合


定名詞句で参照する.
「次にキュウリを用意します.皮はきれいにむいてしましましょう」
参照表現の選択
文脈の影響2

参照対象が既出の実体である場合

参照対象が前文と現在の文でともに焦点になっている,又は参照対象が
既に先行文脈に現れていて,前文と現在の文でともに焦点になっている対
象が現在の文で省略されている場合



それ以外の場合


ゼロ代名詞又は指示詞が使える.
「山田さんはその日の朝ようやく八ヶ岳の絵を完成させました.さっそく幸子さ
んにφ見せました.
「音量を調節するつまみ」,「先ほど切ったタマネギ」,「最初の曲がり角」
大域的文脈(談話状況)から特定される実体


話し手・聞き手はそれぞれ一人称・二人称の呼称を用いて参照できる.
談話状況に存在する対象は「これ,それ,あれ」などの直示的参照表現で
参照する
修辞的関係の表出と文境界の
決定





<原因>(主部)太郎は今朝寝坊してしまった
(従属部)太郎は,昨晩夜ふかしをした
太郎は,昨晩夜ふかしをしたので,今朝寝坊し
てしまった.
<目的>「~するために」
<原因>「~する/したので」
修辞的関係表現の難しさ
接続表現の選択

<条件>という修辞的関係を表す英語の
接続表現




if
when
after
only if
修辞的関係表現の難しさ
文境界の決定




二つの命題が何らかの修辞的関係にあるとき,それらの
命題は適当な接続表現を使って一つの文にまとめること
が出来る.
しかし,さまざまな命題を無制限に一つの文に詰め込む
と,極端に読みにくい文ができる可能性がある.
例 新規書類が開いたら,文書をつくったあとに用紙設
定をしようとすると余白がずれる可能性があるので,文
書をつくる前に用紙設定をします.
例 新規書類が開いたら,文書をつくる前に用紙設定を
します.文書をつくったあとに用紙設定をしようとすると余
白がずれる可能性があります.
修辞的関係表現の難しさ
接続表現の省略

新規書類が開いたら,文書をつくる前に余白調
整などの用紙設定をします.(<動機づけ>)文
書をつくったあとに用紙設定をしようとすると余
白などがずれる可能性があります.
伝達内容の集約(集約規則)
1.
複数の命題が同一の主語をもつとき,それらを
一つの命題に集約することができる.

2.
金丸は大学院生だ.金丸は頭が良い.→金丸は頭
の良い大学院生だ.
複数の命題が同一の述語をもつとき,それらを
一つの命題に集約することができる.得られる
命題は,もとの命題に対する複数の主語を持つ

太郎は大学生だ.次郎は大学生だ.→太郎も次郎
も大学生だ
センテンスプラン
選択によって得られる一文当たりの内部表現
センテンスプラン
表層文字列
文法制約
「山田さんは昨年八ヶ岳の絵を描いた」
に相当するセンテンスプラン
描く
動作主:[1] 人&目上
名前:山田
動作対象:[2] 絵
クラス限定:山
名前:八ヶ岳
時間位置:[3] 昨年
発話行為:断定
接続関係:なし
主題:[1]
情報量:[3]<[2]
単一化文法の例








(0)
(1)
(2)
(3)
(4)
(5)
(6)
(7)
s’/Sem→s( )Sem.
s(Subcat)/Sem→Comp1, s([Comp1|Subcat])/Sem
pp/Sem→np/NP, p(NP)/Sem
s([pp/o(O), pp/ga(S)])/draw(S,O)→ ‘描く’
np/y 山田さん
np/p 絵
p(NP)/ga(NP)→が
p(NP)/o(NP)→を
意味主辞駆動生成の流れ
s’/draw(y,p)
(0)
(0)
s([])/draw(y,p)
(1)
s([pp/ga(y)])/draw(y,p)
pp/ga(y)
pp/o(p)
(2)
np/y
(4)
山田さん
p(y)/ga(y)
(6)
が
(1)
(2)
np/p
(5)
絵
p(p)/o(p)
(7)
を
s([pp/o(p), pp/ga(y)])/draw(y,p)
(3)
描く
合成のための生成:要約システム




出力の可読性を向上する機会を提供する.表やテンプ
レートはかなり不明瞭で読みにくい.
生成を使えばグラフィックスよりもコンパクトな要約とな
る場合もある.グラフィックスでも,画像の状況説明をし,
はっきりさせるにはテキストが必要なことは多い
生成では,さまざまなテキストプランニング戦略や語彙
選択戦略を用い,テキストを一貫性のあるものにする.
生成の過程で,自然言語表現やそれらの組み合わせ
方を選択することで,さまざまな集約や一般化操作を
合成中に行うことができる.
生成モジュールの構造
内容決定
文書構造化
文プランニング
表層的表出
何を伝えるのか
の決定
どう伝えるのか
の決定
合成
内容決定


伝達する情報の選択
情報をメッセージの系列で表す
文書構造化



出力の全体的な構造の決定
要約の修辞構造をプランニング
一貫性表現
文プランニング

メッセージ集約




メッセージから文への写像
複数メッセージ → 単一文
単一メッセージ → 複数文
語彙選択


意味表現中の特定の概念を表す語句を選択
固有名詞,定名詞句,不定名詞句,代名詞な
どの参照表現のタイプを選択
表層的表出

注釈づけされた表現を受け取り,文を生成
文章生成の応用

文書作成

技術文書





特許申請書
マニュアル
健康管理レポート
対話システム
要約システム
今後の課題

知識の獲得


知識ベースやモジュールの再利用


人手 → コーパスからの自動獲得
領域依存性
評価基準,評価


主観的な評価(人間による)
客観的な評価(計算機による)