1. Seed 辞書の準備 辞書, コーパス 設定ファイル 中間ファイル Seed 辞書 (csv) プログラム 6. 配布辞書作成 mecab-dict-gen 配布用辞書 (csv) 7. 解析用辞書作成 mecab-dict-index 2. 設定ファイルの準備 4. 学習用バイナリ辞書作成 設定ファイル char.def unk.def rewrite.def feature.def dicrc mecab-dict-index -l 学習用 バイナリ辞書 CRF パラメータ mecab-cost-train 5. CRFパラメタの学習 配布用 バイナリ辞書 学習コーパス MeCab の出力と 同一フォーマット エンドユーザが行う部分 3. 学習コーパスの準備 表層レベル 表層レベル 美しい 川 形容詞,自立,*,*,形容詞・イ段,基本形,美しい, ウツクシイ,ウツクシイ 名詞,一般,*,*,*,*,川,カワ,カワ Unigram素性 Unigram素性 形容詞,自立,*,*,形容詞・イ段, 基本形,美しい 名詞,一般,*,*,*,*,川 左文脈 形容詞,自立,*,*, 形容詞・イ段 連接 右文脈 名詞,一般
© Copyright 2024 ExpyDoc