スライド 1

3-Q-31
構音障害者を対象としたSSMを用いた音声認識の検討
石井 良,滝口 哲也,有木 康雄(神戸大学)
研究背景・目的
構音障害
聴覚・言語障害者は全国に約34万人(平成18年度厚生労
働省)
福祉分野における情報技術の発展の重要性
構音障害者の講演の補助等
手足の不自由などで音声に頼るしかない場合
構音障害者の音声認識が実現
構音障害とは
言葉を正しく明瞭に発音できない症状
構音障害の原因の一つ:脳性麻痺
出生前や出生時に受けた外傷のため筋肉の制御が難しい
アテトーゼ(不随意運動)が生じる
特にアテトーゼの生じやすい状況
-意図的動作時
-緊張状態
Frequency
構音障害者の雇用機会の増加,社会的
自立につながる
構音障害者
健常者音声へ変換
Frequency
健常者
Time
障害者
MFCC+ΔMFCC
障害者
MFCC+ΔMFCC
障害者
MFCC+ΔMFCC
GMM
GMM
GMM
健常者
MFCC+ΔMFCC
健常者
健常者
MFCC+ΔMFCC MFCC+ΔMFCC
認識
変換
健常者
HMM
HMM
変換
HMM作成
Time
GMM
特徴量は
MFCC(12次元)+ΔMFCC(12次元)
・混合正規分布
P( Xt , Yt | λ
μ
M
( X, Y )
μ

μ
( X, Y )
m
)  αm N ([X , Y ] ; μ
T
t
m 1
( X)
m
(Y)
m



T T
t
( XX )

( X,Y )

m


m  (YX )
m
( X,Y )
m


( XY )
m
( YY )
m
, m



( X, Y )
Xt :障害者特徴量
Yt :健常者特徴量
・変換式
M
y t   hm (xt )[μ
m 1
hm (xt ) 
(Y)
m
 m
αm N (xt ; μ

M
( YX )
( X)
m
α
N
(
x
;
μ
i
t
i 1
(
, m
( XX ) 1
m
( XX )
( X)
i
, i
) (x t  μ
( X)
m
)]
)
( XX )
)
実験結果
実験条件
FIG.1中B
GMM1
HMM1
テスト1
健常者
216単語
216単語
FIG.2中C
GMM2
HMM2
テスト2
健常者
障害者
108単語(Aセット) 108単語(Aセット)
108単語(Aセット)
108単語(Bセット)
FIG.2中D
GMM3
HMM3
健常者
障害者
108単語(Aセット) 108単語(Aセット)
障害者
216単語
216単語
Fig. 1 Word recognition results
変換108単語(A
セット)
テスト3
)
108単語(Bセット)
問題点と今後の課題
学習単語数の減少
Fig. 2 Word recognition results
・SSM
Stereo Based
Stochastic
Mapping