情報処理学会第69回全国大会 6Q-6 係り受け構造を用いた読みやすい文章への推敲支援 大長 達也† 丸山 広† 中村 太一† 東京工科大学† 1. はじめに された修飾語を連文節としてまとめる必要があ る.連文節を作るルールは以下の通りとする. 論理的でわかりやすい文章を書く能力には, 書き手の思いこみを排除した推敲を繰り返すこ とが重要である.ワープロソフトには品詞の連 続,表記の揺れ,漢字の用法,文体の統一など, 誤りと表記の不統一を指摘する支援機能がすで に実装されている.乾らは推敲作業を分析し, 係り受け関係がわかりにくい文から推敲すべき 文を発見するルールと推敲理由,推敲方法の分 類を行った[1].その結果発見ルール,推敲理由, 推敲方法の組み合わせで 35 件の推敲ルールを作 成したが,発見が難しい推敲箇所もあり,コン ピュータに実装可能なルールを作成するのは困 難である.また,係り受け関係のわかりにくさ 以外の推敲のルールは未だ明確になっていない. そこで本研究では「文のわかりやすさを向上 させる推敲」を支援することを目的として,文 書作成のテクニック[2]を基にわかりにくい文の 発見ルールを開発することで,文の係り受け構 造を基に文のわかりにくさを指摘する推敲支援 方法を実現する. ・隣り合った 2 つの文節間の係る関係が 1 対 1 あ れば 1 つの連文節にまとめる. ・複数の語や連文節から係り受ける語は前にあ る語と連文節にしない. このルールで連文節を作成し,長い連文節ほ ど前に置くルールに沿わない文を指摘する.図 1 に語順チェックの流れを示す.まず,(1),連文節 の作成ルールに基づき連文節を作成する.複数 の語から係り受ける語の,(2),係る語の文節数を チェックする.(3),評価したブロックを 1 つの連 文節にまとめる.(4),(2)と(3)をすべての文節をま とめ終わるまで続ける.文節数をチェックする 際に,接続詞の前後で文節が入れ替わると意味 が変わってしまうため,接続詞はチェックの対 象から除外する. 速く ( 1) ライトを 消して 走る 連文節作成 走る 語順チェック 止まらずに 2. わかりにくい文 わかりにくい文の検出の 検出のルールと ルールと修正ルール 修正ルール 速く( 1) 文の内容を読取り難い原因は,係り受け関係 のわかりにくさである.例えば,「速くライト を消して止まらずに走る」という文は「速く」 「ライトを消して」「止まらずに」の 3 つの修 飾 語 が 「 走 る 」 に 係 っ て い る.しかし,「速 く」が「ライトを消す」に係るようにも読める. このような係り受けのわかりにくい文は,長い 修飾語を前に置き,短い修飾語を後に置くこと でわかりやすくなるとされている[2].この例文 では「ライトを消して/止まらずに/速く/走る」が 最もわかりやすい書き方となる.このような修 飾語の並びの文をわかりやすい文とし,この規 則に沿わない文を指摘することとする. 前述の例文を係り受け解析器により文節に分 けると「速く/ライトを/消して/止まらずに/走 る」となる.「ライトを/消して」のように分割 The Methodology for Writing Comprehensive Documents Using Dependency Structure. † Tatsuya DAICHO †Hiroshi MARUYAMA † Taichi NAKAMURA; Tokyo University of Technology. ( 2) ライトを消して( 2) 止まらずに( 1) ( 3) 速く ライトを消して 止まらずに 走る 図 1 語順チェック 語順チェックの チェックの流れ 3. 検証方法 3.1. 対象とする 対象とする文書 とする文書 東京工科大学コンピュータサイエンス学部で は,実験レポートの提出時に形式をチェックす る実験支援システム[3]が稼働している.このシ ステムは「指定の章立てであるか」,「文体, 句読点が統一されているか」,「図表参照がさ れているか」をチェックする.この形式チェッ クを通過した実験レポートの文章は形式が統一 されており章立ての構造を抽出しやすい.この 形式チェック済みの実験レポートに対しわかり にくい文を指摘し,レポート推敲に利用しても らうことで,本提案ルールの有効性を検証する. 2-433 情報処理学会第69回全国大会 3.2. わかりにくい文 わかりにくい文のチェックの チェックの手順 最初に文章を文に分解し,係り受け解析器 「CaboCha」[4]を使用して係り受け解析する. 得られた係り受け情報を基に 2.で挙げた手法で 語順をチェックする.わかりにくいと判断した 文ユーザに示し,修正を促す. 選択するように質問したため,意味がわかりや すい文ではなく短い文を選択した回答者がいた ことが挙げられる.本手法ではわかりやすい文 にするためにあえて修飾語を長くすることもあ り,短い文を選択すると推敲後の文が必ずしも 選択されない.60%以上の人がどちらかの文が読 みやすいと回答した 19 文について文字数を比較 3.3. 得られた結果 したところ,短い文が読みやすいと回答してい られた結果 た文は 14 文であった. 117 名の学生が本システムを利用し,16305 文 判定手法に起因する理由は,今回は長い修飾 を収集し,のべ 3240 箇所を指摘した.1 回のレ ポートにつき 2 回以上利用している学生は 46 人, 語を前に置くルールのみを利用しており,実装 したルールが不足していたことが考えられる. 3 回以上利用している学生は 33 人であった.利 文献[2]の手法ではわかりやすい文の作成方法と 用ログから推敲前後の文を抽出できた学生は 14 して,修飾語の長さの他に,より重要な内容を 人であり,195 文に対する推敲結果と推敲過程の 先に置く,語と語のつながりやすさを基に語順 文を得た.この 14 人がシステムに通した文章数 を入れ替えるという 2 つのルールが紹介されて は取得したログの 60%を占めている. いる.重要な内容を先に置くルールの例に,文 頭の「今後・実際に」などが挙げられる.本手 4. 評価 法では文頭に例のような短い語を置かれた場合, 4.1. 評価実験方法 わかりにくいと判定されてしまうが,実際にこ の文節を後に置くと違和感がある.また,係り 推敲前と後の文の読みやすいかを比較評価し 先がわかりにくい場合,読点により文を区切る た.評価対象の文は利用ログから抽出した推敲 ことで係り先がわかりやすくなるが,今回は読 前と後の文のうち,推敲により読みやすくなっ 点の打ち方によるわかりやすさの変化を考慮し たと判定した文 129 文から 50 文をランダムに選 ていない.これらのルールを併用することで文 んだ.対象者は東京工科大学の学生,院生,教 のわかりやすさの向上が期待できる. 員あわせて 19 人である. 4.2. 評価実験の 評価実験の結果 集計結果を図 2 に示す.評価対象文 50 文のう ち,60%以上の対象者から推敲後の文がわかり やすい判断とされた文は 5 文,逆に 60%以上の 対象者から推敲前の文がわかりやすいと判断さ れた文は 14 文だった. 図 2 評価実験結果 5. 考察 評価実験結果から,本研究の手法が有効であ るとは言えなかった.理由は,読みやすい文を 6. おわりに 本研究では文のわかりやすさを向上させる手 法として,長い修飾語ほど前に置くというルー ルを用い推敲すべき文の指摘を行った.本手法 を学生がレポート作成に利用した結果,本手法 は効果が薄いことがわかった.今後は推敲後の 文が読みやすいと評価された文と推敲前の文が 読みやすいと判断された文の比較を行い,効果 が出なかった原因を探る.また,今回実装しな かったルールを適用した場合の効果を検証する. 参考文献 [1] 乾祐子,岡田直之:”長い文は常にわかりにくいか ~ わかりにくさの要因とその依存関係 ~”, 情報処 理学会 研究報告 Vol.2000, No.11, pp.63-70 (2000) [2] 本多勝一:"日本語の作文技術", 朝日新聞社出版 局, (1982) [3] 丸山広,中村太一:”テキストマイニング技術の活 用へ向けた実験支援システム”, 第 68 回情報処理学 会全国大会論文集, pp.639-640 (2006) [4] 工藤拓,松本裕治:” チャンキングの段階適用によ る 日 本 語 係 り 受 け 解 析 ”, 情 報 処 理 学 会 論 文 誌 , Vol.43, No.6, pp.1834-1842 (2002) 2-434
© Copyright 2024 ExpyDoc