スライド 1 - arsvi.com:立命館大学生存学研究

障害学会第6回大会
音声認識ソフトを用いた学習権保障のための仕組み
(於立命館大学朱雀キャンパス)
立命館大学先端総合学術研究科
櫻井 悟史・鹿島 萌子・池田 雅広
0.はじめに
・問題意識
要約筆記者にかかる負担等を軽減する方法の模
索
・本報告の目的
大学・大学院の講義・各種研究会・シンポジウム
の口頭報告における聴覚障害者への情報保障・学
習権保障を、音声を文字に自動変換するソフト(以
下「音声認識」)によって行なう仕組みの紹介
・使用するもの
アドバンスト・メディア社の音声認識エンジン
AmiVoice 「議事録作成支援システム」
(以下「支援システム」)
・現段階
AmiVoiceをカスタマイズするためのデータ集め終
了
1.ノートテイク・パソコン要約筆記の
問題点
音声情報である講義内容を即時に紙に書
く、あるいは、タイピングすることで、障害
学生へ伝える方法
・問題点
①情報の欠落の問題
ノートテイク:全体の10~20%程度伝達可能
PC要約筆記:全体の30%から70%程度伝達
可能(能力により差が生じる)
⇒限られた情報量のため、情報を聞き落とし
てしまう可能性がある。
②文字伝達の速度・遅延の問題
話すスピードと書くスピードのギャップにより、
授業への遅れも生じやすい。
③支援者への事前訓練・習熟した技術
の要求
2.音声認識を用いた先行研究
NTTサイバースペース研究所(以下、「NTT」)
による聴覚障害者への会議情報保障支に関
する一連の研究
音声認識エンジンVoiceRex の使用
・約20分程度の音声を用いた話者適応の必要
・言語モデル
汎用モデル(登録単語数約63000語)+追加
登録
・認識率:8割程度
聴覚障害者の了解率:6割程度
・話者・聴覚障害者への負担大
⇒訂正語句の表示方式の工夫を図る
特徴
・音声認識エンジン自体に手を加えずに
音声認 識率の向上を模索
・話者、聴覚障害者、訂正者の三者に注
目
*AmiVoiceの場合
・言語モデルをカスタマイズすることで音声認識率の向上を図る
・複数の訂正者の同時訂正によって訂正者の負担の軽減化
5. 各種ソフトの説明
5.1 AmiVoice Recorder5.22
3. AmiVoiceとは
・ソフト
① 「AmiVoice Recorder」
(150万円/1ライセンス、以下「レコーダー」)
② 「AmiVoice Rewriter」
(50万円/1ライセンス、以下「リライター」)
③ 「言語モデルカスタマイズ」(300万円)
④ 「Control Server」
(50万円/1ライセンス、以下「コントロールサーバー」)
⑤ 「ControlServerViewer」(以下、ビューアー)
音声を録音・認識するソフト
音声デバイス・エンジンモードの選択→「録音する」、「音声認
識を行う」、「チャンネル」のチェックボックスをチェック→録音ボ
タンを押す(複数の話者の場合、話者振り分け機能を使用)→
画面下部の音声認識結果表示部に、文字通り認識された結果
が表示される。
5.2 AmiVoice Rewriter5.2
認識結果を修正・編集するソフト
認識候補を選択→音声が自動再生→認識結果を修正・確定
→テキストデータへ書き起こし
*ショートカット機能による時間の短縮
ex.繰り返し再生:Ctrl+スペースキー
認識候補単語の選択:Ctrl+上下キー
編集結果の確定:Ctrl+Enterキー
・特徴
話者適応(話者のクセ等を学習させること)の不必要
言語モデルのカスタマイズ化
複数のカスタマイズしたエンジンを搭載可能
使用例:「公共論史」(2009/6/26)
*注意
あくまで議事録を残すために作成されたシステムであり、本研究
ではそれを応用しているにすぎない
4. 「支援システム」を用いた情報保障システムの
構造図解
使用するPC:3台
リコーダーによる録音・認識
必要な人材:2~3名
リライターによる修正・確定
エディターへの書き起こし
5.3 AmiVoice ControlServer5.0+ AmiVoice
ControlServer Viewer
話者の音声
・コントロール・サーバー
①ワイヤレス・レシーバーで電波を受信
②オーディオ・インターフェイスによってノイズを
除去
③レコーダーで除去された音声を録音(PC1)
④コントロール・サーバーで認識、テキスト化
(PC3)
⑤テキストをリライターで編集・修正(PC1&2)*
⑥ビューアーによって音声認識結果を表示
(PC3)
複数台のパソコンで、認識結果を同時にリアルタイムで編
集するためのソフト
録音・保存を行なうホストコンピュータ
・ビューアー
NTTの先行研究の知見を踏まえ、二つのモードを搭載
①「連続表示」モード(認識した語句をそのまま出力せず、訂
正した後に表示させる確定型訂正方式に近い)
⇒誤字修正が終わったテキストから表示
②「認識結果を表示する」モード(認識した語句をそのまま出
力せず、訂正した後に表示させる速報型訂正方式に近いもの)
⇒認識結果が全て薄い灰色の文字で表示され、誤字修正
後確定すると、灰色の文字が黒字に変化
プロジェクターでスクリーンへ表示
*使用前の設定変更で切り替え可能
*字のフォント・スタイル・サイズ・使用言語も自由に変更可
*修正への時間・修正者への負担を考慮し、2台のリライターを
使用
6. AmiVoiceの言語モデルをカスタマイズするためのデータ
[音声データ+テキストデータ=vtext]
・立命館大学大学院先端総合学術研究科 公共論史(担当講師:立岩真也):18時間
[テキストデータ]
・岡原正幸・立岩真也, 1995, 「自立の技法」, 安積純子・尾中文哉・岡原正幸・立岩真也, 『生の
技法―─家と施設を出て暮らす障害者の社会学』, 藤原書店, 第6章, pp.147-164
・――――, 1995, 「「出て暮らす」生活」, 安積純子・尾中文哉・岡原正幸・立岩真也, 『生の技法
―─家と施設を出て暮らす障害者の社会学』, 藤原書店, 第2章, pp.57-74
・――――, 1995, 「はやく・ゆっくり──自立生活運動の生成と展開」, 安積純子・尾中文哉・岡原
正幸・立岩真也, 『生の技法──家と施設を出て暮らす障害者の社会学 増補改訂
版』, 藤原書店, 第7章, pp.165-226
・――――, 1995, 「私が決め、社会が支える、のを当事者が支える──介助システム論」, 安積純
子・尾中文哉・岡原正幸・立岩真也, 『生の技法──家と施設を出て暮らす障害者の
社会学 増補改訂版』, 藤原書店, 第8章, pp.227-265
・――――, 1995, 「自立生活センターの挑戦」, 安積純子・尾中文哉・岡原正幸・立岩真也, 『生
の技法──家と施設を出て暮らす障害者の社会学 増補改訂版』, 藤原書店, 第9章,
pp.267-321
・立岩真也, 2000, 『弱くある自由へ――自己決定・介護・生死の技術』, 青土社
・立岩真也, 2004, 『ALS――不動の身体と息する機械』, 医学書院
・2008, 「異なる身体のもとでの交信――本当の実用のための仕組と思想」, 科学研究費・新学
術領域研究(研究課題提案型)提出書類(一部略)
・2009, 「第6回障害学会大会報告要旨」
7. 今後の課題
AmiVoiceは、多岐に渡る専門的な用語が飛び交う大学・大学院の授業等の場からすれば、魅力的である。
だが、かかる予算の問題が残る。
・実用するためのソフト一式をそろえるために数百万円必要
・誤字修正者等に支払う人件費
・年間保守で年2回言語モデルカスタマイズを行なえるが、新たな言語モデルを導入しようとすれば、再び数
百万単位の金額が必要
現段階では、聴覚障害者への情報保障・学習権保障の仕組みとしては高額すぎると言わざる
を得ない。
今後は、第6回障害学会大会の登壇報告の際に実験的に試用するなど、実践の積み重ねを行なうこ
とで、可能性を追求していきたい。
*参考文献
・水島昌英・織田修平・政瀧浩和・古家賢一・片岡章俊, 2007, 「音声認識を用いた会議支援情報保障システムに対する話者の発話行動の分析」『電子情報通信学会
技術研究報告 WIT 福祉情報工学』108:21-26
・――――, 2008, 「音声認識による会議情報支援システム使用時の話者及び訂正者の負担度の評価」『電子情報通信学会技術研究報告 WIT 福祉情報工学』
60:31-36
・水島昌英・織田修平・政瀧浩和・古家賢一・羽田陽一, 2009, 「音声認識を用いた会議情報保障支援システムにおける話者と訂正者の連携支援機能の評価」『電子
情報通信学会技術研究報告 WIT 福祉情報工学』58:17-22
・織田修平・水島昌英・古家賢一・片岡章俊, 2007, 「音声認識を通した不完全な出力結果に対する聴覚障害者の了解性と満足度の分析」『電子情報通信学会技術
研究報告 WIT 福祉情報工学』109:27-32
・――――, 2008, 「音声認識による会議情報保障支援に対する聴覚障害者の心的負担の分析」『電子情報通信学会技術研究報告 WIT 福祉情報工学』108:103108
・織田修平・水島昌英・古家賢一・政瀧浩和・羽田陽一, 2009, 「音声認識を用いた会議情報保障支援システムの社内会議における検証」『電子情報通信学会技術研
究報告 WIT 福祉情報工学』58:11-16
・斉藤佐和監修, 2002, 『聴覚障害学生サポートガイドブック――ともに学ぶための講義保障支援の進め方』日本医療企画
・吉川あゆみ・広田典子・太田晴康・白沢麻弓, 2001, 『大学ノートテイク入門――聴覚障害学生をサポートする』, 人間社