日本エム・イー学会甲信越支部 長野地区シンポジウム原稿

第12回日本生体医工学会甲信越支部長野地区シンポジウム
P300 型 BCI の聴覚刺激のための合成音声の検討
出來田 竜也*,橋本 昌巳**,大谷 真**,香山 瑞恵**
*信州大学大学院理工学系研究科,**信州大学工学部
A basic study on synthetic sound for auditory stimulus P300 based BCI
Tatsuya DEKITA*, Masami HASHIMOTO**, Makoto OTANI**, Mizue KAYAMA**
*Graduate School of Science and Technology, Shinshu University, **Faculty of Engineering, Shinshu University.
はじめに
1.
肢体不自由者のための意思伝達支援システムと
して,指さしによる文字盤活用や,装具に組み込ん
だマイクロ・スイッチなどそれぞれの運動能力に合
わせて作製したもの[1]があげられる.しかし,重度
の運動機能の低下が伴う場合には,脳波などを応用
した BCI(Brain-Computer Interface)の利用が期待さ
れている.
本研究では,聴覚刺激を用いた BCI において直接
選択可能な音声を呈示音として用いるシステム構
築を目指して基礎的研究を行った.
音声判別実験
2.
BCI に使用する音声は複数の選択肢の中から迷
うことなく明確に認識できることが重要である.こ
こではテキスト読み上げソフトウェア
“AqTk2Demo”[2]を用いて作成した単音を呈示し,
正しく認知できるか検証した.
2.1.
実験方法
呈示音声は“AqTk2Demo”で作成した「あ」と
「か」で,作成パラメータはサンプリングレート
8000Hz,モノラル(量子化ビット数 16 bit),聴取音
に誤答した.内観報告として女声(ar_rm3)が聞きや
すさの点で優れているとの報告があった.この実験
よりテキスト読み上げソフトウェアを用いて作成
した音声は作成のパラメータによって正しく認知
でき,女声が聞きとりやすいことが示された.
P300 成分導出実験
3.
音声を用いてオドボール課題と四者択一課題を
行った.2 音以上の音声を呈示した場合に P300 が
誘発可能であるか確認することが目的である.
3.1.
実験方法
呈示音声は“CeVIO
Creative Studio Free”[3]を用
いて作成し,「うえ」
「した」「みぎ」「ひだり」を用
意した.今回このソフトを使用した理由は前回より
も音声の聞きやすさが向上したからである.作成パ
ラメータはサンプリングレート 48000 Hz,モノラル
(量子化ビット数 16bit),聴取音圧 60dB,長さが約
250 ms である.
図 1 に実験システムを示す.音刺激は 1.0 sec ご
とにオーディオインタフェースを通し,密閉型ヘッ
ドホンを用いて被験者に呈示した.導出電極位置は
国際 10-20 法に準拠し,正中前頭部 Fz,正中中心部
圧 60dB,長さが約 120 ms である.音色として女声
Cz,正中頭頂部 Pz とし,基準電極を両耳朶連結 A1
(ar_rm3)と男声(ar_m5)の 2 種類を用いた.4 つの音
+A2,接地電極(ボディアース)を Fpz とした.脳波
声 を オ ー デ ィ オ イ ン タ フ ェ ー ス (UA-5
EDIROL:ROLAND) を 介 し , ヘ ッ ド ホ ン
(SENNHEISER : HDA200)でランダムに各 20 回呈示
し,「あ」又は「か」を回答させた.被験者は同意
の得られた 20 代健常男性 4 名である.
2.2.
実験結果・考察
正答率は被験者 A,B が 100 %,被験者 C,D が
97.5 %であった.被験者 C,D は男声(ar_m5)の場合
図 1 : 実験システム図
第12回日本生体医工学会甲信越支部長野地区シンポジウム
は,Ag-AgCl 皿電極(NE-121B: 日本光電)により生
体アンプ(MME-3116:日本光電)に取り込む.雑音除
去のための帯域フィルタは低域で 0.53Hz,高域で
60Hz のカットオフ周波数,増幅率 100 μV/V に設
定した. 生体アンプの出力をデータ収録ボード
(DAQPad-6016: National Instruments)を介して,サン
プリング周波数 1kHz,量子化ビット数 16bit で PC
に取り込み,LabVIEW(National Instruments)で各種
図 2 : オドボール課題 脳波例(被験者 A
Pz)
信号処理を行った.また,アーチファクト除去のた
め眼電図を記録し,±50μV を超える電位が生じた
試行を分析対象から除外した.被験者には,標的刺
激を認知した場合にカウンタでカウントさせた.実
験はシールドルーム内の安静椅子座位で行った.
3.1.1.
オドボール課題
音声刺激として 2 種類の単語音(「うえ」
「した」)
を用いた.刺激呈示頻度は 1:3 のオドボール課題で
図 3 : 四者択一課題 脳波例(被験者 A Pz)
ある.各音声 3 回ずつ標的刺激として計 6 試行行っ
ール課題と同じ潜時の範囲で最大値を比較すると,
た. 被験者は 20 代健常男性 3 名である.
標的刺激は 8.5 μV,3 つの非標的刺激の内で最大
3.1.2.
四者択一課題
音声刺激として 4 種類の単語音(「うえ」「した」
の振幅は 5.0 μV であった.被験者 A,B,D,E,
F の標的刺激振幅平均は,最大で 7.8 μV,最小で
「みぎ」「ひだり」)を用いた.呈示頻度は 1:1:1:1
3.9 μV であり非標的刺激振幅平均は,最大で 4.5
である.各音声 1 回ずつ標的刺激とし計 4 試行行っ
μV,最小で 2.1μV であった.
た.被験者は 20 代健常男性 5 名である.
3.3.
3.2.
実験結果
3.2.1.
オドボール課題
考察
オドボール課題では標的刺激時の振幅が十分大
きいことが示された.しかし,四者択一課題では,
波形評価方法には,刺激前 100 ms の平均値を基
標的刺激時の振幅が減少し,非標的刺激に対して十
線とし,その基線から P300 までの電位差を振幅と
分な振幅差が得られなかった.BCI への応用を考慮
して扱うベースライン法を用いた.評価のために潜
すると振幅差による判別は困難であると考えられ
時 250 ms~500 ms の陽性ピークを P300 振幅として
る.
計測した.
4.
オドボール課題の脳波(Pz)例を図 2 に示す.この
例では標的刺激の P300 振幅が 11.6 μV,非標的刺
激の同じ時間帯の最大値が 3.0 μV であり,標的刺
激時に十分に大きな振幅が得られている.被験者 A,
B,C の標的刺激振幅平均はそれぞれ 11.8 μV,7.1
μV,8.0 μV,非標的刺激振幅平均はそれぞれ 3.1
μV,1.3μV,0.9μV であり,いずれにおいても
P300 成分が導出できたと言える.
3.2.2.
四者択一課題
四者択一課題の脳波(Pz)例を図 3 に示す.オドボ
まとめ
四者択一課題では判別に十分な振幅差が得られ
なかった.今後は,振幅差が大きくなるような音声
のパラメータや実験条件について検討し,音声刺激
による BCI の構築を目指す.
参考文献
[1] 千島亮,奈良篤史,橋本昌巳,伊東一典“筋委縮性
側索硬化症(ALS)者における意思伝達支援の現状と
脳波応用の可能性”, 生体医工,47(2),190-198,
2009.
[2] “ テ キ ス ト 読 み 上 げ ソ フ ト 「 AqTk2Demo 」”
http://www.a-quest.com/demo/aqtk2demo.html
[3] “ テ キ ス ト 読 み 上 げ ソ フ ト 「 CeVIO Creative
StudioFree」
”http://cevio.jp/about/