MeCab 辞書定義ファイル

1. Seed 辞書の準備
辞書, コーパス
設定ファイル
中間ファイル
Seed 辞書 (csv)
プログラム
6. 配布辞書作成
mecab-dict-gen
配布用辞書 (csv)
7. 解析用辞書作成
mecab-dict-index
2. 設定ファイルの準備
4. 学習用バイナリ辞書作成
設定ファイル
char.def
unk.def
rewrite.def
feature.def
dicrc
mecab-dict-index -l
学習用
バイナリ辞書
CRF
パラメータ
mecab-cost-train
5. CRFパラメタの学習
配布用
バイナリ辞書
学習コーパス
MeCab の出力と
同一フォーマット
エンドユーザが行う部分
3. 学習コーパスの準備
表層レベル
表層レベル
美しい
川
形容詞,自立,*,*,形容詞・イ段,基本形,美しい,
ウツクシイ,ウツクシイ
名詞,一般,*,*,*,*,川,カワ,カワ
Unigram素性
Unigram素性
形容詞,自立,*,*,形容詞・イ段,
基本形,美しい
名詞,一般,*,*,*,*,川
左文脈
形容詞,自立,*,*,
形容詞・イ段
連接
右文脈
名詞,一般