機能構造とGUIを用いた 音声インタフェースの ユーザビリティの改善 小林研究室 実用化班4年 熊井 朋之 研究目的・背景 研究テーマ 様々なアプリケーションにおける 音声インタフェースのユーザビリティの改善 研究背景 音声インタフェース・・・一般的なインタフェースとして 認知されていない 既存の音声インタフェースの問題点 何と言っていいのか分かりにくい (音声コマンドが分からない・想像したコマンド名とのミスマッチ) 音声入力の結果どうなったのか分かりにくい (システムの状態遷移などの情報フィードバックの不足) ユーザビリティの低下→使われないインタフェースに 提案手法 機能構造+GUIによるユーザビリティ改善 開く 機能構造 アプリケーションの持つ機能を ツリー構造で記述 ファイル ライブラリに追加 ・・・ フルモード 表示 視覚エフェクト ・・・ 一時停止 上げる 音量 下げる 字幕 オン ・・・ 再生 DL ・・・ ・・・ メディアプレイヤー オフ オフ 提案手法 機能構造+GUIによるユーザビリティ改善 GUIによる情報提供 現在の状態 入力可能単語 認識結果 etc. 可視化 システム透過性の改善 システム理解の促進 システムを使用 (GUI、音声)しながらの システム構造・音声コマンドの自然学習 パス探索 ツリー構造による記述 音声入力:コマンド推定からパス探索に 単語の連続入力や、ショートカットが可能な探索 探索範囲や厳密さの調整も可能 文法の自動作成 探索範囲からの文法の生成 単語順番の制限あり/なしの指定可能 開く ファイル ・・・ •探索範囲や認識単語・文法を制限する ライブラリに追加 フルモード 表示 再生 DL ・・・ 一時停止 上げる 音量 下げる 字幕 オン ・・・ •探索範囲や文法を制限しない オフ ・・・ メディアプレイヤー コマンドの位置が分からないときに探せる 視覚エフェクト ・・・ •認識精度の向上 •ユーザの意識する空間量軽減 •ツリー構造であることの印象大 オフ パス探索 ツリー構造による記述 音声入力:コマンド推定からパス探索に 単語の連続入力や、ショートカットが可能な探索 探索範囲や厳密さの調整も可能 文法の自動作成 探索範囲からの文法の生成 単語順番の制限あり/なしの指定可能 開く ファイル ・・・ •「再生」, 「音量」, 「上げる」 フルモード 表示 視覚エフェクト メディアプレイヤー DL ・・・ 一時停止 上げる 音量 下げる 字幕 オン ・・・ 再生 オフ ・・・ ・・・ •「一時停止」 •「音量 上げる」 ライブラリに追加 オフ 実験 全機能をフラットに記述した音声インタフェースと提案手法の比較 実験タスク・・・アプリケーションの操作を想定した、 問題文からの該当コマンド名の検索 •その他被験者の振る舞いなど 90 80 70 達成率[%] 比較項目 •タスク達成率 •設問辺り達成時間 •アンケートによる主観的評価 1セット目 2セット目 100 60 50 40 30 20 •達成率:フラット2回目<ツリー1回目 初心者でも目的のコマンドを 実行できる可能性が高い 10 0 グループ1 フラット グループ2 フラット グループ1 ツリー SystemResponceAccuracy 7 6 •アンケート評価:フラット<ツリー グループ2 ツリー グループ2ツリー グループ2フラット 5 Speed 4 3 Likability 2 ツリーの構造の方が 使い勝手が良いと感じる人が多い 1 0 Cognitive Demand Habitability Annoyance
© Copyright 2024 ExpyDoc