1/15 1-2-9 ニューラルネットワークを用いた 母音範疇の獲得モデルに関する研究 日本音響学会 2007年 秋季研究発表会 2007年9月19日 宮澤 幸希, 白勢 彩子, 菊池 英明 早稲田大学 人間科学学術院 研究の目的 生得か学習か、何を学ぶのか 2/15 言語認知のメカニズムを明らかにする → 学習過程に注目 → 乳児の言語獲得能力の明確化を目指す 明示的なフィードバック(教示)を必要としない 話者や環境の変化に対して頑強 言語経験による 学習 ? 生得的な 言語機構(制約) 言語獲得モデルによる学習実験 3/15 言語の獲得と知覚の メカニズム 先行研究から得られた知見 母国語音韻体系の知覚 子音範疇化と母音マグネット効果 4/15 同 定 率 ・ 弁 別 率 [%] 100 90 80 70 60 50 40 30 20 10 0 カテゴリA 同定率 カテゴリB 同定率 2刺激の弁別率 1 2 3 4 5 刺激番号 6 図. 子音範疇化知覚 生後間もない乳児も 子音範疇を知覚 7 8 誕生直後: 言語間で共通の子音 生後7ヶ月: 母国語の子音のみ 生後6ヶ月で母国語の母音範疇を獲得(Jusczyk,2000) 子音ほど明確な範疇化知覚は示さない 異なる話者が発した母音も、同一の音として知覚 母国語音韻体系の知覚 生得的な制約と学習 生後6ヶ月の乳児は、2種類の人工音素を、 2分間の聴取で聞き分けた(Kuhl,2004) 5/15 きわめて短期間で、異なる範疇の存在を知覚 生得的な制約をもつメカニズムが、学習によって 特定の言語に最適化されるという考え 制約の例 : 聴覚系の応答特性?神経回路の配線? 学習の例 : 成人の音声の統計的分布 モデルによるシミュレーションを行なう 6/15 言語獲得のモデル 母音範疇の形成過程を再現するモデル 7/15 SOMの利用 Self-Organizing Maps(SOM, Kohonen,1989) 大脳皮質感覚野の情報処理を参考に考案 入力信号の分布傾向を教師なしで分類可能 入力信号のカテゴリ数を推定可能 大脳一次聴覚野のモデル として適当と仮定 母音範疇の獲得モデル SOMモデルを使用してシミュレーションを行なう 母音体系と母音数の獲得過程 どの程度の学習量で獲得できるか 先行実験 有声・無声子音の獲得モデル 8/15 入力:成人英語話者のVOTの統計的分布 結果:SOMが獲得した有声・無声子音境界は、 人間の境界とほぼ等しかった(宮澤ら,2006) 結論: 言語獲得における /d/ 同 自己組織的機構と、 定率 (%) 統計的分布に 基づいた学習の 重要性が示された 100 Human Chinchilla SOM Model 80 60 40 20 0 0 10 20 30 40 VOT(ms) 50 60 70 80 母音範疇の獲得モデル 入力値と評価値 SOMの入力データ 入力データ 9/15 評価データ 日本語話し言葉コーパス(CSJ)講演再朗読音声 (60代男性)のF1, F2 (フレーム長 : 20ms) 無音部、ノイズ部、エラーデータを除去 F1, F2, (F2-F1)、過去2フレーム分の F1, F2, (F2-F1)を加えた9次元の特徴量 学習結果の評価データ CSJの音素ラベルデータに基づき、母音中心を 正解情報つきデータセットを作成 母音範疇の獲得モデル モデルの概要 制約なし条件( -Bias モデル) 10/15 言語に特化した機構のないモデル SOMは重み0で初期化 制約あり条件( +Bias モデル) 分散収束理論に基づく母音体系のF1,F2 の値を 分散収束理論に基づく母音体系 入力として、あらかじめSOMの学習を行っておく 乳児の母音知覚能力が、一次聴覚野の神経細胞の 結合状態として生得的に備わっている、と仮定 母音範疇の獲得モデル 評価方法 母音範疇を求める 11/15 「密度ヒストグラムによるクラスタ数推定法(寺島ら,1996)」を使用 SOMのクラスタを統合して、カテゴリ数と境界を求める 評価データと比較して、正解率を求める カテゴリ数:5 正解率:0.728 12/15 実験結果と結論 実験結果 各実験条件の結果 10 学習量10~100 -Bias +Bias 10 0 50 0 10 00 15 00 25 00 50 00 10 00 0 15 00 0 20 00 0 50 00 0 0.8 0.7 0.6 正 0.5 解 0.4 率 0.3 0.2 0.1 0 LearningSteps[回] 学習量100~1000 -Bias +Bias 制約あり(+Bias)の ほうが正解率高、 母音数5に近い 制約あり(+Bias)と 制約なし(-Bias)の 差はなくなる 10 0 50 0 10 00 15 00 25 00 50 00 10 00 0 15 00 0 20 00 0 50 00 0 10 7 カ 6 テ 5 ゴ 4 リ 3 数 2 [個] 1 0 13/15 LearningSteps[回] 上表. 学習量とカテゴリ数 下表.学習量と正解率 14/15 まとめ 母音範疇の獲得過程を、生得的な制約を 除いた/仮定したモデルによって再現した 学習の初期段階では、制約が有効に機能した 言語獲得の初期段階において、 生得的な仕組みが効果的に働いている可能性 制約の種類に関しては、より詳細な検討が必要 学習が進行すると、生得的な制約の あり/なし による差は少なくなる 15/15 今後の研究方針 範疇化知覚の獲得に関する詳細な検討 言語理解にとって、カテゴリカルな知覚形式は どのような利点があるのか? 音声の統計的分布はどのような性質をもつか? 音韻全体の獲得過程を再現するモデル 必要な特徴量選択の問題 時間的に変化する特徴量の扱い 獲得した音韻情報の統合による単語の学習
© Copyright 2024 ExpyDoc