第12回日本生体医工学会甲信越支部長野地区シンポジウム P300 型 BCI の聴覚刺激のための合成音声の検討 出來田 竜也*,橋本 昌巳**,大谷 真**,香山 瑞恵** *信州大学大学院理工学系研究科,**信州大学工学部 A basic study on synthetic sound for auditory stimulus P300 based BCI Tatsuya DEKITA*, Masami HASHIMOTO**, Makoto OTANI**, Mizue KAYAMA** *Graduate School of Science and Technology, Shinshu University, **Faculty of Engineering, Shinshu University. はじめに 1. 肢体不自由者のための意思伝達支援システムと して,指さしによる文字盤活用や,装具に組み込ん だマイクロ・スイッチなどそれぞれの運動能力に合 わせて作製したもの[1]があげられる.しかし,重度 の運動機能の低下が伴う場合には,脳波などを応用 した BCI(Brain-Computer Interface)の利用が期待さ れている. 本研究では,聴覚刺激を用いた BCI において直接 選択可能な音声を呈示音として用いるシステム構 築を目指して基礎的研究を行った. 音声判別実験 2. BCI に使用する音声は複数の選択肢の中から迷 うことなく明確に認識できることが重要である.こ こではテキスト読み上げソフトウェア “AqTk2Demo”[2]を用いて作成した単音を呈示し, 正しく認知できるか検証した. 2.1. 実験方法 呈示音声は“AqTk2Demo”で作成した「あ」と 「か」で,作成パラメータはサンプリングレート 8000Hz,モノラル(量子化ビット数 16 bit),聴取音 に誤答した.内観報告として女声(ar_rm3)が聞きや すさの点で優れているとの報告があった.この実験 よりテキスト読み上げソフトウェアを用いて作成 した音声は作成のパラメータによって正しく認知 でき,女声が聞きとりやすいことが示された. P300 成分導出実験 3. 音声を用いてオドボール課題と四者択一課題を 行った.2 音以上の音声を呈示した場合に P300 が 誘発可能であるか確認することが目的である. 3.1. 実験方法 呈示音声は“CeVIO Creative Studio Free”[3]を用 いて作成し,「うえ」 「した」「みぎ」「ひだり」を用 意した.今回このソフトを使用した理由は前回より も音声の聞きやすさが向上したからである.作成パ ラメータはサンプリングレート 48000 Hz,モノラル (量子化ビット数 16bit),聴取音圧 60dB,長さが約 250 ms である. 図 1 に実験システムを示す.音刺激は 1.0 sec ご とにオーディオインタフェースを通し,密閉型ヘッ ドホンを用いて被験者に呈示した.導出電極位置は 国際 10-20 法に準拠し,正中前頭部 Fz,正中中心部 圧 60dB,長さが約 120 ms である.音色として女声 Cz,正中頭頂部 Pz とし,基準電極を両耳朶連結 A1 (ar_rm3)と男声(ar_m5)の 2 種類を用いた.4 つの音 +A2,接地電極(ボディアース)を Fpz とした.脳波 声 を オ ー デ ィ オ イ ン タ フ ェ ー ス (UA-5 EDIROL:ROLAND) を 介 し , ヘ ッ ド ホ ン (SENNHEISER : HDA200)でランダムに各 20 回呈示 し,「あ」又は「か」を回答させた.被験者は同意 の得られた 20 代健常男性 4 名である. 2.2. 実験結果・考察 正答率は被験者 A,B が 100 %,被験者 C,D が 97.5 %であった.被験者 C,D は男声(ar_m5)の場合 図 1 : 実験システム図 第12回日本生体医工学会甲信越支部長野地区シンポジウム は,Ag-AgCl 皿電極(NE-121B: 日本光電)により生 体アンプ(MME-3116:日本光電)に取り込む.雑音除 去のための帯域フィルタは低域で 0.53Hz,高域で 60Hz のカットオフ周波数,増幅率 100 μV/V に設 定した. 生体アンプの出力をデータ収録ボード (DAQPad-6016: National Instruments)を介して,サン プリング周波数 1kHz,量子化ビット数 16bit で PC に取り込み,LabVIEW(National Instruments)で各種 図 2 : オドボール課題 脳波例(被験者 A Pz) 信号処理を行った.また,アーチファクト除去のた め眼電図を記録し,±50μV を超える電位が生じた 試行を分析対象から除外した.被験者には,標的刺 激を認知した場合にカウンタでカウントさせた.実 験はシールドルーム内の安静椅子座位で行った. 3.1.1. オドボール課題 音声刺激として 2 種類の単語音(「うえ」 「した」) を用いた.刺激呈示頻度は 1:3 のオドボール課題で 図 3 : 四者択一課題 脳波例(被験者 A Pz) ある.各音声 3 回ずつ標的刺激として計 6 試行行っ ール課題と同じ潜時の範囲で最大値を比較すると, た. 被験者は 20 代健常男性 3 名である. 標的刺激は 8.5 μV,3 つの非標的刺激の内で最大 3.1.2. 四者択一課題 音声刺激として 4 種類の単語音(「うえ」「した」 の振幅は 5.0 μV であった.被験者 A,B,D,E, F の標的刺激振幅平均は,最大で 7.8 μV,最小で 「みぎ」「ひだり」)を用いた.呈示頻度は 1:1:1:1 3.9 μV であり非標的刺激振幅平均は,最大で 4.5 である.各音声 1 回ずつ標的刺激とし計 4 試行行っ μV,最小で 2.1μV であった. た.被験者は 20 代健常男性 5 名である. 3.3. 3.2. 実験結果 3.2.1. オドボール課題 考察 オドボール課題では標的刺激時の振幅が十分大 きいことが示された.しかし,四者択一課題では, 波形評価方法には,刺激前 100 ms の平均値を基 標的刺激時の振幅が減少し,非標的刺激に対して十 線とし,その基線から P300 までの電位差を振幅と 分な振幅差が得られなかった.BCI への応用を考慮 して扱うベースライン法を用いた.評価のために潜 すると振幅差による判別は困難であると考えられ 時 250 ms~500 ms の陽性ピークを P300 振幅として る. 計測した. 4. オドボール課題の脳波(Pz)例を図 2 に示す.この 例では標的刺激の P300 振幅が 11.6 μV,非標的刺 激の同じ時間帯の最大値が 3.0 μV であり,標的刺 激時に十分に大きな振幅が得られている.被験者 A, B,C の標的刺激振幅平均はそれぞれ 11.8 μV,7.1 μV,8.0 μV,非標的刺激振幅平均はそれぞれ 3.1 μV,1.3μV,0.9μV であり,いずれにおいても P300 成分が導出できたと言える. 3.2.2. 四者択一課題 四者択一課題の脳波(Pz)例を図 3 に示す.オドボ まとめ 四者択一課題では判別に十分な振幅差が得られ なかった.今後は,振幅差が大きくなるような音声 のパラメータや実験条件について検討し,音声刺激 による BCI の構築を目指す. 参考文献 [1] 千島亮,奈良篤史,橋本昌巳,伊東一典“筋委縮性 側索硬化症(ALS)者における意思伝達支援の現状と 脳波応用の可能性”, 生体医工,47(2),190-198, 2009. [2] “ テ キ ス ト 読 み 上 げ ソ フ ト 「 AqTk2Demo 」” http://www.a-quest.com/demo/aqtk2demo.html [3] “ テ キ ス ト 読 み 上 げ ソ フ ト 「 CeVIO Creative StudioFree」 ”http://cevio.jp/about/
© Copyright 2024 ExpyDoc