ポスター - 北村達也

文章中の語彙の初出課を判定するシステム
デモあり
中野光 北村達也(甲南大学知能情報学部)
1 単語レベル判定システムに関連する先行研究
• 
• 
• 
• 
• 
• 
語彙チェッカー (川村, 1998)
単語親密度チェッカー (川村, 北村, 2008)
IDFに基づくシステム (北村, 川村, 2009)
J-LEX (松下, 2014)
これやさしいか (伊藤ら, 2014)
かぶとエディタ (住田, 北村, 2014)
(1)  連語に対応していない
(2)  既習,未習がわかれば十分という意見あり
(3)  メジャーな教科書に準拠したシステムが必要
「みんなの日本語初級 I 第2版」,「同 II 第2版」に準拠した既習/未習判定システム
『みんなちぇっかー (仮)』を開発 (連語にも対応)
2 みんなちぇっかー (仮)
みんなの日本語のWebページからアクセス可
Webブラウザ上で動作します
入力エリア
出力エリア: 指定した課に対して既習語
を黒,未習語を赤で表示
課を指定
(プルダウンメニュー)
単語リストPDFファイルへのリンク
チェックボタン
3 処理の流れ
単語リスト:単語を課とともに表示
4 処理例
文章
形態素解析
MeCab を利用
形態素と単語リストの照合
単語リスト内の連語の照合
色分け表示
「みんなの日本語初級 I 第2版」,
「みんなの日本語初級 II 第2版」
の語彙リスト
リスト表示
•  連語の高速な照合を実現
•  連語の末尾が活用しても照合可能
既習語は黒
未習語は赤
既習語は黒
未習語は赤
10課で判定した結果
25課で判定した結果
5 ご注意とお願い
•  基本的に文型は判定対象外です
•  形態素解析の誤りによる誤判定が生じ得ます
•  Facebookページにフィードバックをお寄せください
謝辞 本研究は,(株) スリーエーネットワークの協力を得て行われた.本研究の一部は,平成26年度科研費基盤研究(B)(24320096) および私立
大学等経常費補助金特別補助「大学間連携等による共同研究」の支援を得て行われた.また,甲南大学知能情報学部 田中豪君の協力を得た.