文章中の語彙の初出課を判定するシステム デモあり 中野光 北村達也(甲南大学知能情報学部) 1 単語レベル判定システムに関連する先行研究 • • • • • • 語彙チェッカー (川村, 1998) 単語親密度チェッカー (川村, 北村, 2008) IDFに基づくシステム (北村, 川村, 2009) J-LEX (松下, 2014) これやさしいか (伊藤ら, 2014) かぶとエディタ (住田, 北村, 2014) (1) 連語に対応していない (2) 既習,未習がわかれば十分という意見あり (3) メジャーな教科書に準拠したシステムが必要 「みんなの日本語初級 I 第2版」,「同 II 第2版」に準拠した既習/未習判定システム 『みんなちぇっかー (仮)』を開発 (連語にも対応) 2 みんなちぇっかー (仮) みんなの日本語のWebページからアクセス可 Webブラウザ上で動作します 入力エリア 出力エリア: 指定した課に対して既習語 を黒,未習語を赤で表示 課を指定 (プルダウンメニュー) 単語リストPDFファイルへのリンク チェックボタン 3 処理の流れ 単語リスト:単語を課とともに表示 4 処理例 文章 形態素解析 MeCab を利用 形態素と単語リストの照合 単語リスト内の連語の照合 色分け表示 「みんなの日本語初級 I 第2版」, 「みんなの日本語初級 II 第2版」 の語彙リスト リスト表示 • 連語の高速な照合を実現 • 連語の末尾が活用しても照合可能 既習語は黒 未習語は赤 既習語は黒 未習語は赤 10課で判定した結果 25課で判定した結果 5 ご注意とお願い • 基本的に文型は判定対象外です • 形態素解析の誤りによる誤判定が生じ得ます • Facebookページにフィードバックをお寄せください 謝辞 本研究は,(株) スリーエーネットワークの協力を得て行われた.本研究の一部は,平成26年度科研費基盤研究(B)(24320096) および私立 大学等経常費補助金特別補助「大学間連携等による共同研究」の支援を得て行われた.また,甲南大学知能情報学部 田中豪君の協力を得た.
© Copyright 2025 ExpyDoc