音声による子音カテゴリカル知覚の習得モデルに関する

1/15
1-2-9
ニューラルネットワークを用いた
母音範疇の獲得モデルに関する研究
日本音響学会 2007年 秋季研究発表会
2007年9月19日
宮澤 幸希, 白勢 彩子, 菊池 英明
早稲田大学 人間科学学術院
研究の目的
生得か学習か、何を学ぶのか
2/15

言語認知のメカニズムを明らかにする
→ 学習過程に注目
→ 乳児の言語獲得能力の明確化を目指す


明示的なフィードバック(教示)を必要としない
話者や環境の変化に対して頑強
言語経験による
学習
?
生得的な
言語機構(制約)
言語獲得モデルによる学習実験
3/15
言語の獲得と知覚の
メカニズム
先行研究から得られた知見
母国語音韻体系の知覚
子音範疇化と母音マグネット効果
4/15
同
定
率
・
弁
別
率
[%]
100
90
80
70
60
50
40
30
20
10
0

カテゴリA 同定率

カテゴリB 同定率
2刺激の弁別率
1
2
3
4
5
刺激番号
6
図. 子音範疇化知覚

生後間もない乳児も
子音範疇を知覚
7
8

誕生直後:
言語間で共通の子音
生後7ヶ月:
母国語の子音のみ
生後6ヶ月で母国語の母音範疇を獲得(Jusczyk,2000)


子音ほど明確な範疇化知覚は示さない
異なる話者が発した母音も、同一の音として知覚
母国語音韻体系の知覚
生得的な制約と学習

生後6ヶ月の乳児は、2種類の人工音素を、
2分間の聴取で聞き分けた(Kuhl,2004)


5/15
きわめて短期間で、異なる範疇の存在を知覚
生得的な制約をもつメカニズムが、学習によって
特定の言語に最適化されるという考え


制約の例 : 聴覚系の応答特性?神経回路の配線?
学習の例 : 成人の音声の統計的分布
モデルによるシミュレーションを行なう
6/15
言語獲得のモデル
母音範疇の形成過程を再現するモデル
7/15
SOMの利用

Self-Organizing Maps(SOM,



Kohonen,1989)
大脳皮質感覚野の情報処理を参考に考案
入力信号の分布傾向を教師なしで分類可能
入力信号のカテゴリ数を推定可能
大脳一次聴覚野のモデル
として適当と仮定
母音範疇の獲得モデル

SOMモデルを使用してシミュレーションを行なう


母音体系と母音数の獲得過程
どの程度の学習量で獲得できるか
先行実験
有声・無声子音の獲得モデル
8/15



入力:成人英語話者のVOTの統計的分布
結果:SOMが獲得した有声・無声子音境界は、
人間の境界とほぼ等しかった(宮澤ら,2006)
結論:
言語獲得における /d/
同
自己組織的機構と、 定率
(%)
統計的分布に
基づいた学習の
重要性が示された
100
Human
Chinchilla
SOM Model
80
60
40
20
0
0
10
20
30
40
VOT(ms)
50
60
70
80
母音範疇の獲得モデル
入力値と評価値

SOMの入力データ
入力データ




9/15
評価データ
日本語話し言葉コーパス(CSJ)講演再朗読音声
(60代男性)のF1, F2 (フレーム長 : 20ms)
無音部、ノイズ部、エラーデータを除去
F1, F2, (F2-F1)、過去2フレーム分の
F1, F2, (F2-F1)を加えた9次元の特徴量
学習結果の評価データ

CSJの音素ラベルデータに基づき、母音中心を
正解情報つきデータセットを作成
母音範疇の獲得モデル
モデルの概要

制約なし条件( -Bias モデル)



10/15
言語に特化した機構のないモデル
SOMは重み0で初期化
制約あり条件( +Bias モデル)


分散収束理論に基づく母音体系のF1,F2
の値を
分散収束理論に基づく母音体系
入力として、あらかじめSOMの学習を行っておく
乳児の母音知覚能力が、一次聴覚野の神経細胞の
結合状態として生得的に備わっている、と仮定
母音範疇の獲得モデル
評価方法

母音範疇を求める



11/15
「密度ヒストグラムによるクラスタ数推定法(寺島ら,1996)」を使用
SOMのクラスタを統合して、カテゴリ数と境界を求める
評価データと比較して、正解率を求める
カテゴリ数:5
正解率:0.728
12/15
実験結果と結論
実験結果
各実験条件の結果
10
学習量10~100

-Bias
+Bias
10
0
50
0
10
00
15
00
25
00
50
00
10
00
0
15
00
0
20
00
0
50
00
0
0.8
0.7
0.6
正 0.5
解 0.4
率 0.3
0.2
0.1
0

LearningSteps[回]

学習量100~1000

-Bias
+Bias
制約あり(+Bias)の
ほうが正解率高、
母音数5に近い
制約あり(+Bias)と
制約なし(-Bias)の
差はなくなる
10
0
50
0
10
00
15
00
25
00
50
00
10
00
0
15
00
0
20
00
0
50
00
0
10
7
カ 6
テ 5
ゴ 4
リ 3
数 2
[個] 1
0
13/15
LearningSteps[回]
上表. 学習量とカテゴリ数
下表.学習量と正解率
14/15
まとめ


母音範疇の獲得過程を、生得的な制約を
除いた/仮定したモデルによって再現した
学習の初期段階では、制約が有効に機能した



言語獲得の初期段階において、
生得的な仕組みが効果的に働いている可能性
制約の種類に関しては、より詳細な検討が必要
学習が進行すると、生得的な制約の あり/なし
による差は少なくなる
15/15
今後の研究方針

範疇化知覚の獲得に関する詳細な検討



言語理解にとって、カテゴリカルな知覚形式は
どのような利点があるのか?
音声の統計的分布はどのような性質をもつか?
音韻全体の獲得過程を再現するモデル



必要な特徴量選択の問題
時間的に変化する特徴量の扱い
獲得した音韻情報の統合による単語の学習