係り受け構造を用いた読みやすい文章への推敲支援

情報処理学会第69回全国大会
6Q-6
係り受け構造を用いた読みやすい文章への推敲支援
大長
達也†
丸山 広†
中村 太一†
東京工科大学†
1. はじめに
された修飾語を連文節としてまとめる必要があ
る.連文節を作るルールは以下の通りとする.
論理的でわかりやすい文章を書く能力には,
書き手の思いこみを排除した推敲を繰り返すこ
とが重要である.ワープロソフトには品詞の連
続,表記の揺れ,漢字の用法,文体の統一など,
誤りと表記の不統一を指摘する支援機能がすで
に実装されている.乾らは推敲作業を分析し,
係り受け関係がわかりにくい文から推敲すべき
文を発見するルールと推敲理由,推敲方法の分
類を行った[1].その結果発見ルール,推敲理由,
推敲方法の組み合わせで 35 件の推敲ルールを作
成したが,発見が難しい推敲箇所もあり,コン
ピュータに実装可能なルールを作成するのは困
難である.また,係り受け関係のわかりにくさ
以外の推敲のルールは未だ明確になっていない.
そこで本研究では「文のわかりやすさを向上
させる推敲」を支援することを目的として,文
書作成のテクニック[2]を基にわかりにくい文の
発見ルールを開発することで,文の係り受け構
造を基に文のわかりにくさを指摘する推敲支援
方法を実現する.
・隣り合った 2 つの文節間の係る関係が 1 対 1 あ
れば 1 つの連文節にまとめる.
・複数の語や連文節から係り受ける語は前にあ
る語と連文節にしない.
このルールで連文節を作成し,長い連文節ほ
ど前に置くルールに沿わない文を指摘する.図 1
に語順チェックの流れを示す.まず,(1),連文節
の作成ルールに基づき連文節を作成する.複数
の語から係り受ける語の,(2),係る語の文節数を
チェックする.(3),評価したブロックを 1 つの連
文節にまとめる.(4),(2)と(3)をすべての文節をま
とめ終わるまで続ける.文節数をチェックする
際に,接続詞の前後で文節が入れ替わると意味
が変わってしまうため,接続詞はチェックの対
象から除外する.
速く
(
1)
ライトを
消して
走る
連文節作成
走る
語順チェック
止まらずに
2. わかりにくい文
わかりにくい文の検出の
検出のルールと
ルールと修正ルール
修正ルール
速く(
1)
文の内容を読取り難い原因は,係り受け関係
のわかりにくさである.例えば,「速くライト
を消して止まらずに走る」という文は「速く」
「ライトを消して」「止まらずに」の 3 つの修
飾 語 が 「 走 る 」 に 係 っ て い る.しかし,「速
く」が「ライトを消す」に係るようにも読める.
このような係り受けのわかりにくい文は,長い
修飾語を前に置き,短い修飾語を後に置くこと
でわかりやすくなるとされている[2].この例文
では「ライトを消して/止まらずに/速く/走る」が
最もわかりやすい書き方となる.このような修
飾語の並びの文をわかりやすい文とし,この規
則に沿わない文を指摘することとする.
前述の例文を係り受け解析器により文節に分
けると「速く/ライトを/消して/止まらずに/走
る」となる.「ライトを/消して」のように分割
The Methodology for Writing Comprehensive Documents
Using Dependency Structure.
†
Tatsuya DAICHO †Hiroshi MARUYAMA
†
Taichi NAKAMURA; Tokyo University of Technology.
(
2)
ライトを消して(
2)
止まらずに(
1)
(
3)
速く ライトを消して 止まらずに 走る
図 1 語順チェック
語順チェックの
チェックの流れ
3. 検証方法
3.1. 対象とする
対象とする文書
とする文書
東京工科大学コンピュータサイエンス学部で
は,実験レポートの提出時に形式をチェックす
る実験支援システム[3]が稼働している.このシ
ステムは「指定の章立てであるか」,「文体,
句読点が統一されているか」,「図表参照がさ
れているか」をチェックする.この形式チェッ
クを通過した実験レポートの文章は形式が統一
されており章立ての構造を抽出しやすい.この
形式チェック済みの実験レポートに対しわかり
にくい文を指摘し,レポート推敲に利用しても
らうことで,本提案ルールの有効性を検証する.
2-433
情報処理学会第69回全国大会
3.2. わかりにくい文
わかりにくい文のチェックの
チェックの手順
最初に文章を文に分解し,係り受け解析器
「CaboCha」[4]を使用して係り受け解析する.
得られた係り受け情報を基に 2.で挙げた手法で
語順をチェックする.わかりにくいと判断した
文ユーザに示し,修正を促す.
選択するように質問したため,意味がわかりや
すい文ではなく短い文を選択した回答者がいた
ことが挙げられる.本手法ではわかりやすい文
にするためにあえて修飾語を長くすることもあ
り,短い文を選択すると推敲後の文が必ずしも
選択されない.60%以上の人がどちらかの文が読
みやすいと回答した 19 文について文字数を比較
3.3. 得られた結果
したところ,短い文が読みやすいと回答してい
られた結果
た文は 14 文であった.
117 名の学生が本システムを利用し,16305 文
判定手法に起因する理由は,今回は長い修飾
を収集し,のべ 3240 箇所を指摘した.1 回のレ
ポートにつき 2 回以上利用している学生は 46 人, 語を前に置くルールのみを利用しており,実装
したルールが不足していたことが考えられる.
3 回以上利用している学生は 33 人であった.利
文献[2]の手法ではわかりやすい文の作成方法と
用ログから推敲前後の文を抽出できた学生は 14
して,修飾語の長さの他に,より重要な内容を
人であり,195 文に対する推敲結果と推敲過程の
先に置く,語と語のつながりやすさを基に語順
文を得た.この 14 人がシステムに通した文章数
を入れ替えるという 2 つのルールが紹介されて
は取得したログの 60%を占めている.
いる.重要な内容を先に置くルールの例に,文
頭の「今後・実際に」などが挙げられる.本手
4. 評価
法では文頭に例のような短い語を置かれた場合,
4.1. 評価実験方法
わかりにくいと判定されてしまうが,実際にこ
の文節を後に置くと違和感がある.また,係り
推敲前と後の文の読みやすいかを比較評価し
先がわかりにくい場合,読点により文を区切る
た.評価対象の文は利用ログから抽出した推敲
ことで係り先がわかりやすくなるが,今回は読
前と後の文のうち,推敲により読みやすくなっ
点の打ち方によるわかりやすさの変化を考慮し
たと判定した文 129 文から 50 文をランダムに選
ていない.これらのルールを併用することで文
んだ.対象者は東京工科大学の学生,院生,教
のわかりやすさの向上が期待できる.
員あわせて 19 人である.
4.2. 評価実験の
評価実験の結果
集計結果を図 2 に示す.評価対象文 50 文のう
ち,60%以上の対象者から推敲後の文がわかり
やすい判断とされた文は 5 文,逆に 60%以上の
対象者から推敲前の文がわかりやすいと判断さ
れた文は 14 文だった.
図 2 評価実験結果
5. 考察
評価実験結果から,本研究の手法が有効であ
るとは言えなかった.理由は,読みやすい文を
6. おわりに
本研究では文のわかりやすさを向上させる手
法として,長い修飾語ほど前に置くというルー
ルを用い推敲すべき文の指摘を行った.本手法
を学生がレポート作成に利用した結果,本手法
は効果が薄いことがわかった.今後は推敲後の
文が読みやすいと評価された文と推敲前の文が
読みやすいと判断された文の比較を行い,効果
が出なかった原因を探る.また,今回実装しな
かったルールを適用した場合の効果を検証する.
参考文献
[1] 乾祐子,岡田直之:”長い文は常にわかりにくいか
~ わかりにくさの要因とその依存関係 ~”, 情報処
理学会 研究報告 Vol.2000, No.11, pp.63-70 (2000)
[2] 本多勝一:"日本語の作文技術", 朝日新聞社出版
局, (1982)
[3] 丸山広,中村太一:”テキストマイニング技術の活
用へ向けた実験支援システム”, 第 68 回情報処理学
会全国大会論文集, pp.639-640 (2006)
[4] 工藤拓,松本裕治:” チャンキングの段階適用によ
る 日 本 語 係 り 受 け 解 析 ”, 情 報 処 理 学 会 論 文 誌 ,
Vol.43, No.6, pp.1834-1842 (2002)
2-434