1/15 1-2-9 ニューラルネットワークを用いた母音範疇の獲得モデルに関する研究日本音響学会 2007年秋季研究発表会 2007年9月19日宮澤幸希, 白勢彩子, 菊池英明早稲田大学人間科学学術院研究の目的生得か学習か、何を学ぶのか 2/15  言語認知のメカニズムを明らかにする → 学習過程に注目 → 乳児の言語獲得能力の明確化を目指す   明示的なフィードバック（教示）を必要としない話者や環境の変化に対して頑強言語経験による学習？生得的な言語機構（制約）言語獲得モデルによる学習実験 3/15 言語の獲得と知覚のメカニズム先行研究から得られた知見母国語音韻体系の知覚子音範疇化と母音マグネット効果 4/15 同定率・弁別率 [%] 100 90 80 70 60 50 40 30 20 10 0  カテゴリA 同定率  カテゴリB 同定率 2刺激の弁別率 1 2 3 4 5 刺激番号 6 図. 子音範疇化知覚  生後間もない乳児も子音範疇を知覚 7 8  誕生直後：言語間で共通の子音生後7ヶ月：母国語の子音のみ生後6ヶ月で母国語の母音範疇を獲得（Jusczyk,2000）   子音ほど明確な範疇化知覚は示さない異なる話者が発した母音も、同一の音として知覚母国語音韻体系の知覚生得的な制約と学習  生後6ヶ月の乳児は、2種類の人工音素を、 2分間の聴取で聞き分けた（Kuhl,2004）   5/15 きわめて短期間で、異なる範疇の存在を知覚生得的な制約をもつメカニズムが、学習によって特定の言語に最適化されるという考え   制約の例：聴覚系の応答特性？神経回路の配線？学習の例：成人の音声の統計的分布モデルによるシミュレーションを行なう 6/15 言語獲得のモデル母音範疇の形成過程を再現するモデル 7/15 SOMの利用  Self-Organizing Maps（SOM,    Kohonen,1989）大脳皮質感覚野の情報処理を参考に考案入力信号の分布傾向を教師なしで分類可能入力信号のカテゴリ数を推定可能大脳一次聴覚野のモデルとして適当と仮定母音範疇の獲得モデル  SOMモデルを使用してシミュレーションを行なう   母音体系と母音数の獲得過程どの程度の学習量で獲得できるか先行実験有声・無声子音の獲得モデル 8/15    入力：成人英語話者のVOTの統計的分布結果：SOMが獲得した有声・無声子音境界は、人間の境界とほぼ等しかった（宮澤ら,2006）結論：言語獲得における /d/ 同自己組織的機構と、定率 (%) 統計的分布に基づいた学習の重要性が示された 100 Human Chinchilla SOM Model 80 60 40 20 0 0 10 20 30 40 VOT(ms) 50 60 70 80 母音範疇の獲得モデル入力値と評価値  SOMの入力データ入力データ     9/15 評価データ日本語話し言葉コーパス（CSJ）講演再朗読音声（60代男性）のF1, F2 （フレーム長： 20ms）無音部、ノイズ部、エラーデータを除去 F1, F2, （F2-F1）、過去2フレーム分の F1, F2, （F2-F1）を加えた9次元の特徴量学習結果の評価データ  CSJの音素ラベルデータに基づき、母音中心を正解情報つきデータセットを作成母音範疇の獲得モデルモデルの概要  制約なし条件（ -Bias モデル）    10/15 言語に特化した機構のないモデル SOMは重み0で初期化制約あり条件（ +Bias モデル）   分散収束理論に基づく母音体系のF1，F2 の値を分散収束理論に基づく母音体系入力として、あらかじめSOMの学習を行っておく乳児の母音知覚能力が、一次聴覚野の神経細胞の結合状態として生得的に備わっている、と仮定母音範疇の獲得モデル評価方法  母音範疇を求める    11/15 「密度ヒストグラムによるクラスタ数推定法（寺島ら,1996)」を使用 SOMのクラスタを統合して、カテゴリ数と境界を求める評価データと比較して、正解率を求めるカテゴリ数：5 正解率：0.728 12/15 実験結果と結論実験結果各実験条件の結果 10 学習量10～100  －Bias ＋Bias 10 0 50 0 10 00 15 00 25 00 50 00 10 00 0 15 00 0 20 00 0 50 00 0 0.8 0.7 0.6 正 0.5 解 0.4 率 0.3 0.2 0.1 0  LearningSteps[回]  学習量100～1000  －Bias ＋Bias 制約あり（+Bias）のほうが正解率高、母音数5に近い制約あり（+Bias）と制約なし（-Bias）の差はなくなる 10 0 50 0 10 00 15 00 25 00 50 00 10 00 0 15 00 0 20 00 0 50 00 0 10 7 カ 6 テ 5 ゴ 4 リ 3 数 2 [個] 1 0 13/15 LearningSteps[回] 上表. 学習量とカテゴリ数下表．学習量と正解率 14/15 まとめ   母音範疇の獲得過程を、生得的な制約を除いた／仮定したモデルによって再現した学習の初期段階では、制約が有効に機能した    言語獲得の初期段階において、生得的な仕組みが効果的に働いている可能性制約の種類に関しては、より詳細な検討が必要学習が進行すると、生得的な制約のあり／なしによる差は少なくなる 15/15 今後の研究方針  範疇化知覚の獲得に関する詳細な検討    言語理解にとって、カテゴリカルな知覚形式はどのような利点があるのか？音声の統計的分布はどのような性質をもつか？音韻全体の獲得過程を再現するモデル    必要な特徴量選択の問題時間的に変化する特徴量の扱い獲得した音韻情報の統合による単語の学習