1/20 2E3-1 音声による子音カテゴリカル知覚の 習得モデルに関する研究 第20回 人工知能学会 全国大会 2006年6月8日 宮澤 幸希, 白勢 彩子, 菊池 英明 早稲田大学 人間科学学術院 研究の目的 生得か学習か、何を学ぶのか 2/20 言語認知のメカニズムを明らかにする → 学習過程に注目 → 新しい音声言語理解技術の開発を目指す 乳児が母語を獲得するプロセス 言語経験による 学習 生得的な 言語機構 生得的な機構を除いた聴覚系モデルによる学習実験 3/20 発表の概要 言語認知の特徴 先行研究から得られた知見 子音カテゴリカル知覚とは 学習モデルによる実験 カテゴリカル知覚を再現するモデル 実験結果と結論 カテゴリカル知覚を再現できたか? 4/20 言語認知の特徴 先行研究から得られた知見 5/20 人間の言語知覚の特性 無意識に獲得 誰でも母語を話せるようになる 明示的なフィードバック(教師情報)を必要としない 環境適応 誰の声でも、同じ音素として認識できる 正確に聞き取れない状況でも理解できる → 現在の音声言語理解技術における問題 子音カテゴリカル知覚とは 有声・無声子音の音響特徴 6/20 図. 無声破裂子音/t/, 有声破裂子音/d/のスペクトログラム 子音カテゴリカル知覚とは どのような知覚現象か? 7/20 音響特徴を連続的に変えた子音を聞いても 連続的には知覚されず、変化が一定の範囲 内であれば同一の音として知覚される 図. 連続的に変化 させた子音に対する /d/, /t/同定曲線 (Ryalls, 2003) 同 定 率 (%) 100 90 80 70 60 50 40 30 20 10 0 /d/ /t/ -73 -61 -48 -36 -24 -12 0 11 VOT(ms) 22 33 43 54 66 77 子音カテゴリカル知覚とは どのように獲得されるのか? 70 生まれたばかりの乳児でも、 子音カテゴリカル知覚を示す 8/20 カテゴリの異なる子音を聴取 カテゴリが同じ子音を聴取 60 50 誕生直後:一般的な子音 生後六ヶ月:母語の子音のみ 図. 生後1ヵ月の乳児を対象とした 子音聴取実験 (Eimas, 1971) 青線は、点線を境に子音カテゴリを 変えている(/b/から/p/) 赤線は変えていない(/b/) 平 均 40 吸 啜 回 数 30 (回) 20 10 0 1 2 3 4 5 6 時間(分) 7 8 9 9/20 学習モデルによる実験 カテゴリカル知覚を再現するモデル 10/20 学習過程に注目した聴覚系モデル Self-Organizing Maps(SOM, Kohonen考案) 感覚神経のメカニズムを参考に考案 教師なし学習を実現する学習モデル 特定の課題に対応していない SOMによる言語獲得過程シミュレーション 学習に使えるのは、環境から与えられる情報のみ SOMによる言語獲得実験 環境から何を学習するのか? 11/20 音響特徴は、言語や子音の種類ごとに偏りがある 母語の音響特徴の頻度分布を利用して、 子音カテゴリの聞き分けを学習できるだろうか? 12 図. アメリカ英語話者の /d/, /t/音発話に おけるVOT頻度分布 (Blumstein, 1980) 10 /d/ 8 /t/ 頻 度 6 (回) 4 2 0 -120 -100 -80 -60 -40 -20 0 VOT(ms) 20 40 60 80 100 子音カテゴリ学習実験 動物実験を参考に 動物もカテゴリカル知覚が可能(Kuhl&Miller) 12/20 チンチラネズミが/d/, /t/音を弁別 VOT値、話者数、学習の手順が報告されている 弁別境界値も示されている(33.5ms) この実験と同条件でSOMの学習を行う VOT値の頻度分布は記載なし → 予測 子音カテゴリ学習実験 実験条件 13/20 英語話者の発話(条件1) 動物実験から予測(条件2) 実験1と2を考慮した頻度分布モデル(条件3, 下図) 120 100 頻 度 (回) 80 /d/ /t/ 60 40 20 0 -120 -100 -80 -60 -40 -20 0 20 VOT(ms) 40 60 80 100 図. 条件1、条件2 から作成した VOT頻度分布 子音カテゴリ学習実験 SOMによる学習 VOT値をベクトルコードに変換 14/20 入力値同士の相関関係を表現 指標VOT値をもとに、子音のカテゴリを決定 図. 指標 VOT値 図. 入力パターン 15/20 実験結果と結論 カテゴリカル知覚を再現できたか? 実験結果 カテゴリ境界 16/20 学習の結果、SOMが獲得した子音カテゴリの 境界は、人間の知覚境界とほぼ等しかった 100 /d/ 80 同 60 定 率 40 (%) Human Chinchilla SOM Model 20 0 0 図. 学習を終えたときのSOM (実験条件3, 2回目の結果) 10 20 30 40 50 60 70 80 VOT(ms) 図. 獲得されたカテゴリ境界 実験結果 頻度分布との関係 17/20 VOT頻度分布の境界で、SOMのカテゴリも変化 図. 連続VOT値に対するSOMの応答 (実験条件3, 2回目の結果) 実験結果 各実験条件の結果 18/20 条件1 – アメリカ英語の環境 条件2 – 動物実験と同じ手続き 条件3 – 条件1と2に基づく 表. 各条件のカテゴリ境界 値はカテゴリが/d/から/t/に 変わったときのVOT値 (ms) 全ての条件で、人間や動物の境界に近い 19/20 本研究のまとめ 有声・無声音のカテゴリカル知覚を、 生得的な機構を除いた聴覚系モデルに よって実現した 自己組織的メカニズムが、言語経験に 基づいて正しい子音カテゴリを獲得した 20/20 今後の研究方針 有声・無声子音だけでなく、音韻全体の 獲得過程を再現するモデルの研究を行う 必要な特徴量選択の問題 時間的に変化する特徴量の扱い カテゴリカル知覚に関する詳細な検討 言語理解にとって、カテゴリカルな知覚形式は どのような利点があるのか? 聴覚神経系をより精密に再現 21/20 補記 モデルの詳細 22/20 補記:SOMの計算について 1. 2. 初期状態では、全ての参照 ベクトルはランダムな値 入力・参照ベクトルの内積が 最大になるノードが勝利する 3. 勝利ノードと近傍ノードの 参照ベクトルが、入力ベク トルに近づくよう強化される 4. 強化関数は勝利ノードからの 距離を横軸とする正規分布を 模した放物線とした 5. 参照ベクトルは、絶対値が 1になるように正規化される 入力ベクトルx (ζ,ζ ,,ζ ) 1 2 n 勝利ノードc mc・ x maxi {mi・ x} 勝利ノードの近傍ノード i番目のノードの 参照ベクトル mi (μi1,μi 2 ,,μin ) 23/20 補記:カテゴリカル知覚に関する検討 カ テ ゴ リ 間 の 距 離 第一出力層 第二出力層 10 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 VOT入力値ペア 7 8 9 10
© Copyright 2024 ExpyDoc