機能構造とGUIを用いた 音声インタフェースのユーザビリティの改善

機能構造とGUIを用いた
音声インタフェースの
ユーザビリティの改善
小林研究室
実用化班4年
熊井 朋之
研究目的・背景
研究テーマ
様々なアプリケーションにおける
音声インタフェースのユーザビリティの改善
研究背景
音声インタフェース・・・一般的なインタフェースとして
認知されていない
既存の音声インタフェースの問題点

何と言っていいのか分かりにくい
(音声コマンドが分からない・想像したコマンド名とのミスマッチ)

音声入力の結果どうなったのか分かりにくい
(システムの状態遷移などの情報フィードバックの不足)
ユーザビリティの低下→使われないインタフェースに
提案手法
機能構造+GUIによるユーザビリティ改善

開く
機能構造
アプリケーションの持つ機能を
ツリー構造で記述
ファイル
ライブラリに追加
・・・

フルモード
表示
視覚エフェクト
・・・
一時停止
上げる
音量
下げる
字幕
オン
・・・
再生
DL
・・・
・・・
メディアプレイヤー
オフ
オフ
提案手法
機能構造+GUIによるユーザビリティ改善

GUIによる情報提供



現在の状態
入力可能単語
認識結果 etc.
可視化
システム透過性の改善
システム理解の促進
システムを使用 (GUI、音声)しながらの
システム構造・音声コマンドの自然学習
パス探索
ツリー構造による記述



音声入力:コマンド推定からパス探索に
単語の連続入力や、ショートカットが可能な探索
探索範囲や厳密さの調整も可能
文法の自動作成


探索範囲からの文法の生成
単語順番の制限あり/なしの指定可能
開く
ファイル
・・・
•探索範囲や認識単語・文法を制限する
ライブラリに追加
フルモード
表示
再生
DL
・・・
一時停止
上げる
音量
下げる
字幕
オン
・・・
•探索範囲や文法を制限しない
オフ
・・・
メディアプレイヤー
コマンドの位置が分からないときに探せる
視覚エフェクト
・・・
•認識精度の向上
•ユーザの意識する空間量軽減
•ツリー構造であることの印象大
オフ
パス探索
ツリー構造による記述



音声入力:コマンド推定からパス探索に
単語の連続入力や、ショートカットが可能な探索
探索範囲や厳密さの調整も可能
文法の自動作成


探索範囲からの文法の生成
単語順番の制限あり/なしの指定可能
開く
ファイル
・・・
•「再生」, 「音量」, 「上げる」
フルモード
表示
視覚エフェクト
メディアプレイヤー
DL
・・・
一時停止
上げる
音量
下げる
字幕
オン
・・・
再生
オフ
・・・
・・・
•「一時停止」
•「音量 上げる」
ライブラリに追加
オフ
実験

全機能をフラットに記述した音声インタフェースと提案手法の比較
実験タスク・・・アプリケーションの操作を想定した、
問題文からの該当コマンド名の検索
•その他被験者の振る舞いなど
90
80
70
達成率[%]
比較項目
•タスク達成率
•設問辺り達成時間
•アンケートによる主観的評価
1セット目
2セット目
100
60
50
40
30
20
•達成率:フラット2回目<ツリー1回目
初心者でも目的のコマンドを
実行できる可能性が高い
10
0
グループ1
フラット
グループ2
フラット
グループ1
ツリー
SystemResponceAccuracy 7
6
•アンケート評価:フラット<ツリー
グループ2
ツリー
グループ2ツリー
グループ2フラット
5
Speed
4
3
Likability
2
ツリーの構造の方が
使い勝手が良いと感じる人が多い
1
0
Cognitive
Demand
Habitability
Annoyance