シソーラス情報を用いた童話文章登場人物の 感情情報読み取りシステム 堂腰裕明 小山聡 栗原正仁 (北海道大学大学院情報科学研究科) 研究背景と目的 大規模シソーラスについて 近年の,コンピュータの能力の進化や応用の拡大に伴い,人 とコンピュータをつなぐインタフェースも,より高度なものや扱い やすいものなど,幅広く求められるようになっている. そのインタフェースの多機能化の方向の一つとして,人間の 感情の情報を利用しようというものがある.コンピュータによる 人間の感情情報の読み取りや,コンピュータからの感情情報 の発露など,感情の情報にはさまざまな利用法が考えられる. 本手法では,シソーラス情報として日本語Wordnetを利用した. 日本語Wordnetでは,単語をsynsetと呼ばれる同義語のグ ループに分類しており,このsynsetごとに簡単な意味を付加し, それぞれのsynset同士の関係を記述している.synsetごとの関 係としては,上位語,下位語などがある. 本手法では,文章とその受信者の感情に焦点を当てる.具 体的には,小説文章からの感情移入などを想定する.小説文 章に人間がどのように感情移入し,自身の感情へと反映させ るかを推測するため,その前段階として、文章表現が単純で易 しめな類の文章を童話文と定義し,それら童話文での登場人 物の感情を推測する. synset構造の例 上位語 joy (嬉しさ) emotion (情感) feeling (感) state (動静) synset: joy(嬉しさ) 喜び、歓び、悦楽、楽しさ、愉悦… 提案手法 登場人物ごとにそれぞれの 場面の感情を推測 与えられた小説文章 文章ごとに主語を判別 嬉しい! 文1:おじいさん 楽しい! 文2:おとうさん 文3:近所のおじさん 前処理 形態素解析および係り 受け解析・主語を判別 1.対象となる文章への前処理 本手法で用いる小説文章は,「青空文 庫」内で「児童書」とカテゴライズされた 中で,「文学」の分野とされたものに対し て,読解の敷居を下げるためにいくつか の前処理をしたものを用いる.前処理と は以下の四点である. 主語が曖昧な場合に補う 平仮名を自然な程度に漢字に直す 時系列がバラバラな場合正しく直す 悲しい… 各文ごとに感情を 示す語を判別 2.一文ごとに主語を判別 文章を係り受け解析し,さらに以下のよ うな処理を行うことで,一文ごとに主語を 判別する. 1.句点を持つ文節を主たる述語とする 2.述語文節に係る文節を主語候補とする 3.主語候補の中から、格助詞「は」や 「が」を見つける 4.格助詞「は」「が」を持つ主語候補の 登場人物のリストを予め与える 中で,述語に係るものを主語と判定 実験 結果と考察 「おおかみと七ひきの子やぎ」について,全 体を十一の場面に分割し,提案手法を用いて, 各場面における登場人物の感情をそれぞれ推 測した. また,大学生及び大学院生計九名に,十一 の場面に分割した小説文章を読んで,同様に 場面ごとの登場人物の感情を推測してもらい, 提案手法がどれだけ人間の感性と近い結果を 出せているか検証した. 推測する感情については,「喜び」「悲しみ」 「怒り」「楽しさ」の四つに,判断不能という意味 での「無」を加えた五つのうち,どれにあてはま るかという形で判定した. 右図が実験の結果である.黒字が人間の推 測した場面ごとの登場人物の感情であり,横 のパーセンテージが,実験者のうちどれだけ がその感情を推測したかを示している.赤字 がシステムの出力である. システムが拾い切れなかった感情について は,このシステムが直接的に感情を示す語に のみ反応し,文脈などで間接的に示している 部分を見逃しているためと思われる. また、「喜び」以外の感情の反応の弱さに関 して,日本語Wordnet内に収録されている語 や,実験に用いた文章内の語が,必ずしも上 位語にたどり着いていない場合が考えられる. 3.感情を示す語を判別 文章中の各語が属するsynsetに関し て,上位語をたどる. このとき,名詞においてはemotion (情感)やfeeling(感)のsynsetが上位 語に発見できる語を,感情を示している 語とする.同様に動詞については,feel (感じる)やexperience(感じる)を上位 語に探す. そうして,感情を表しているとされた語 を判別することで,各文について,それ ぞれ対応する登場人物がどのような感 情でいるか推測する. 出力結果一覧
© Copyright 2024 ExpyDoc