視覚情報を話題の対象とする 音声対話システム

サンプルシナリオ2
-視覚情報を話題の対象とする音声対話シ
ステム京都大学情報学研究科
知能情報学専攻 奥乃研
M2 山肩 洋子
音声認識語彙(コップ類)
音声認識語彙数: 19
画像認識モデル: 14
対象オブジェクト数: 6(内、コップ類6)
サンプルシナリオ
ユーザの意図する物体が存在しない場合
 ユーザは「コーヒーカップ」と発話
 画像認識結果により音声認識結果を絞り込み
 ユーザモデルが不完全だったため「色」情報を
要求⇒「赤」
 目標物体を発見・受理⇒ユーザモデルの学習
次回から1の段階で正しい目標物体を発見