音声による子音カテゴリカル知覚の習得モデルに関する

1/20
2E3-1
音声による子音カテゴリカル知覚の
習得モデルに関する研究
第20回 人工知能学会 全国大会
2006年6月8日
宮澤 幸希, 白勢 彩子, 菊池 英明
早稲田大学 人間科学学術院
研究の目的
生得か学習か、何を学ぶのか
2/20

言語認知のメカニズムを明らかにする
→ 学習過程に注目
→ 新しい音声言語理解技術の開発を目指す

乳児が母語を獲得するプロセス
言語経験による
学習
生得的な
言語機構
生得的な機構を除いた聴覚系モデルによる学習実験
3/20
発表の概要

言語認知の特徴
先行研究から得られた知見
 子音カテゴリカル知覚とは

学習モデルによる実験
カテゴリカル知覚を再現するモデル

実験結果と結論
カテゴリカル知覚を再現できたか?
4/20
言語認知の特徴
先行研究から得られた知見
5/20
人間の言語知覚の特性

無意識に獲得



誰でも母語を話せるようになる
明示的なフィードバック(教師情報)を必要としない
環境適応


誰の声でも、同じ音素として認識できる
正確に聞き取れない状況でも理解できる
→ 現在の音声言語理解技術における問題
子音カテゴリカル知覚とは
有声・無声子音の音響特徴
6/20
図. 無声破裂子音/t/, 有声破裂子音/d/のスペクトログラム
子音カテゴリカル知覚とは
どのような知覚現象か?

7/20
音響特徴を連続的に変えた子音を聞いても
連続的には知覚されず、変化が一定の範囲
内であれば同一の音として知覚される
図. 連続的に変化
させた子音に対する
/d/, /t/同定曲線
(Ryalls, 2003)
同
定
率
(%)
100
90
80
70
60
50
40
30
20
10
0
/d/
/t/
-73 -61 -48 -36 -24 -12
0
11
VOT(ms)
22
33
43
54
66
77
子音カテゴリカル知覚とは
どのように獲得されるのか?
70

生まれたばかりの乳児でも、
子音カテゴリカル知覚を示す
8/20
カテゴリの異なる子音を聴取
カテゴリが同じ子音を聴取
60
50
誕生直後:一般的な子音
生後六ヶ月:母語の子音のみ
図. 生後1ヵ月の乳児を対象とした
子音聴取実験 (Eimas, 1971)
青線は、点線を境に子音カテゴリを
変えている(/b/から/p/)
赤線は変えていない(/b/)
平
均 40
吸
啜
回
数 30
(回)
20
10
0
1
2
3
4
5
6
時間(分)
7
8
9
9/20
学習モデルによる実験
カテゴリカル知覚を再現するモデル
10/20
学習過程に注目した聴覚系モデル

Self-Organizing Maps(SOM, Kohonen考案)
感覚神経のメカニズムを参考に考案
 教師なし学習を実現する学習モデル
 特定の課題に対応していない

SOMによる言語獲得過程シミュレーション

学習に使えるのは、環境から与えられる情報のみ
SOMによる言語獲得実験
環境から何を学習するのか?


11/20
音響特徴は、言語や子音の種類ごとに偏りがある
母語の音響特徴の頻度分布を利用して、
子音カテゴリの聞き分けを学習できるだろうか?
12
図. アメリカ英語話者の
/d/, /t/音発話に
おけるVOT頻度分布
(Blumstein, 1980)
10
/d/
8
/t/
頻
度 6
(回)
4
2
0
-120 -100
-80
-60
-40
-20
0
VOT(ms)
20
40
60
80
100
子音カテゴリ学習実験
動物実験を参考に

動物もカテゴリカル知覚が可能(Kuhl&Miller)





12/20
チンチラネズミが/d/, /t/音を弁別
VOT値、話者数、学習の手順が報告されている
弁別境界値も示されている(33.5ms)
この実験と同条件でSOMの学習を行う
VOT値の頻度分布は記載なし → 予測
子音カテゴリ学習実験
実験条件



13/20
英語話者の発話(条件1)
動物実験から予測(条件2)
実験1と2を考慮した頻度分布モデル(条件3, 下図)
120
100
頻
度
(回)
80
/d/
/t/
60
40
20
0
-120 -100 -80
-60
-40
-20
0
20
VOT(ms)
40
60
80
100
図. 条件1、条件2
から作成した
VOT頻度分布
子音カテゴリ学習実験
SOMによる学習

VOT値をベクトルコードに変換


14/20
入力値同士の相関関係を表現
指標VOT値をもとに、子音のカテゴリを決定
図. 指標
VOT値
図. 入力パターン
15/20
実験結果と結論
カテゴリカル知覚を再現できたか?
実験結果
カテゴリ境界

16/20
学習の結果、SOMが獲得した子音カテゴリの
境界は、人間の知覚境界とほぼ等しかった
100
/d/ 80
同
60
定
率
40
(%)
Human
Chinchilla
SOM Model
20
0
0
図. 学習を終えたときのSOM
(実験条件3, 2回目の結果)
10
20
30
40
50
60
70
80
VOT(ms)
図. 獲得されたカテゴリ境界
実験結果
頻度分布との関係

17/20
VOT頻度分布の境界で、SOMのカテゴリも変化
図. 連続VOT値に対するSOMの応答 (実験条件3, 2回目の結果)
実験結果
各実験条件の結果

18/20
条件1
– アメリカ英語の環境

条件2
– 動物実験と同じ手続き

条件3
– 条件1と2に基づく
表. 各条件のカテゴリ境界
値はカテゴリが/d/から/t/に
変わったときのVOT値 (ms)
 全ての条件で、人間や動物の境界に近い
19/20
本研究のまとめ


有声・無声音のカテゴリカル知覚を、
生得的な機構を除いた聴覚系モデルに
よって実現した
自己組織的メカニズムが、言語経験に
基づいて正しい子音カテゴリを獲得した
20/20
今後の研究方針

有声・無声子音だけでなく、音韻全体の
獲得過程を再現するモデルの研究を行う



必要な特徴量選択の問題
時間的に変化する特徴量の扱い
カテゴリカル知覚に関する詳細な検討


言語理解にとって、カテゴリカルな知覚形式は
どのような利点があるのか?
聴覚神経系をより精密に再現
21/20
補記
モデルの詳細
22/20
補記:SOMの計算について
1.
2.
初期状態では、全ての参照
ベクトルはランダムな値
入力・参照ベクトルの内積が
最大になるノードが勝利する
3.
勝利ノードと近傍ノードの
参照ベクトルが、入力ベク
トルに近づくよう強化される
4.
強化関数は勝利ノードからの
距離を横軸とする正規分布を
模した放物線とした
5.
参照ベクトルは、絶対値が
1になるように正規化される
入力ベクトルx  (ζ,ζ ,,ζ )
1
2
n
勝利ノードc
mc・ x 
maxi {mi・ x}
勝利ノードの近傍ノード
i番目のノードの
参照ベクトル
mi  (μi1,μi 2 ,,μin )
23/20
補記:カテゴリカル知覚に関する検討
カ
テ
ゴ
リ
間
の
距
離
第一出力層
第二出力層
10
9
8
7
6
5
4
3
2
1
0
1
2
3
4
5
6
VOT入力値ペア
7
8
9
10