はじめに 第9期輪講会/第2回 • テーマはインタラクション系の基礎力強化& テーマ探し • このあたりから・・・ – 本会議 (http://www.aamas2004.org/) – (W3) Agent Tracking: Modeling Other Agents from Observations (MOO 2004) – (W10) Coalition and Teams 早稲田大学理工学部 情報学科 深澤研究室 M0 石黒真 発表日:2004年9月1日 @ NII 発表論文 Using Sparse Visual Date to Model Human Activities in Meeting • “Using Sparse Visual Date to Model Human Activities in Meeting” – (W3)MOO2004 – Paul E.Rybski, Manuela M.Veloso Paul E. Rybski, Manuela M. Veloso @ Robotics Institute, Carnegie Mellon University 筆者について • Paul E. Rybski – Robotics Institute, Carnegie Mellon University – 博士課程終了 – Human/Robot interface, Distributed robot system • Manuela M. Veloso – Carnegie Mellon University – CS学科教授 – CORAL project, 推論・プランニング・検索アルゴリズム, ロボットサッカー 論文の構成 • • • • • • バックグラウンド。CAMEOの簡単な紹介 関連研究(今回は省略します) アーキテクチャ 分類アルゴリズム Experiment Summary/Future Work 1 1.1 背景 • ユーザとインタラクションを行い日常の作業をサ ポートするエージェント • エージェントはユーザの”状態”を把握しておくべき – 担当プロジェクト – スケジュール… • 本論文ではフォーマルな会議室を想定 – センサで有益な情報収集 – ユーザの質問に答えられなければならない • “私のいない間に決まった項目は何だ?” • “スライド15の三番目の丸はなんですか?” – アシスタントとして有益であること • これは難しい問題だ!! – インターフェース/データソース – 場所 1.2 CAMEO 2.1 CALO • CAMEO : Camera Assisted Meeting Event Observer – 参加者の状態を観測 – 各画像をマージし1つのパノラマ画像に • 分析結果をセントラルPCに送る • CAMEOはCALOシステムの一部 – Cognitive Agent that Learns and Organize – 日常のビジネス/プライベートをサポート – タスクの補助 – 予測可能なイベントの提案・準備 – 予測不可能な事態の対処 – 個人の状態 – 会議全体の状態 2.2 CALOアーキテクチャ Processed Audio/Speech • CAMEOはSemantic Labeledされたデータ やイベントをデータサーバにおく • CALOエージェントがユーザ端末からサーバ に対してクエリを出す Instrumented Whiteboard Presentation Software CAMEO Event Timeline Database/Server CALO Agent CALO Agent 2 2.3 CAMEOアーキテクチャ Raw Video Global Meeting State Classification Image Mosaic Free Detection/ Tracking Individual Person State Classification Logging 3 分類アルゴリズム • 状態を正確に分類するために以下の方法を 用いる – 隠れマルコフモデル – カルマンフィルタ – Dynamic Bayesian Network Replay Meeting Simulator 3.1 隠れマルコフモデル(HMM) • マルコフモデル(Markov Model) • 隠れマルコフモデル(Hidden Markov Model) – 状態列の遷移を記述するためのモデル – 全ての可能な系列が記述され各系列に確率が割 り当てられる 0.2 [ ow ] [t] 0.5 [ ey ] [m] 0.8 Onset: C1: 0.5 C2: 0.2 C3: 0.3 [t] 0.7 Mid: C3: 0.2 C4: 0.7 C5: 0.1 3.2 カルマンフィルタ 0.4 0.1 Mid [ ow ] [ aa ] 0.9 0.3 Onset 0.5 [ ah ] – 各状態はいつくかの出力値をある確率分布に 従って持つ – 自然言語処理やDNA解析などに用いられる 0.6 End FINAL End: C4: 0.1 C6: 0.5 C7: 0.4 • システムの状態推定を行うためのフィルタリ ング理論 – 誘導ミサイルやGPSなどに応用されている P([C1, C1, C4, C4, C6, C6])= (0.3×0.7×0.9×0.1×0.4×0.6) ×(0.5×0.5×0.7×0.7×0.5×0.5)+ (0.3×0.7×0.1×0.4×0.4×0.6) ×(0.5×0.5×0.7×0.1×0.5×0.5)= 0.0001477 3 3.3 Dynamic Bayesian Networks (DBNs) • 隠れマルコフモデルとカルマンフィルタによっ て得られるグラフ – 状態遷移モデル 3.4 状態予測 • 人間状態予測 – 今回は右下図の4つの状態に分類 – 各状態の位置情報はガウス分布(μ,Σ)を持つ – 相対位置で測定 Sitting Hidden State X1 X2 Xi Stand Observation Y1 Y2 Sit Standing Yi • 会議の状態 – 参加者の状態のセットで決まる – M={S, T, D} • S: allowable States • T: Transition matrix • D: minimum Duration – 未知状態の検出は例外報告を行う Presentation Meeting Start Meeting End General Discussion 4 Experiment 4.1 人間の状態予測 • CAMEOでの会議測定シミュレーション – 人間 – 会議全体 • 測定環境 – – – – 高解像度モザイクビデオフレーム(1764×357pixels) 毎秒3フレーム CPU 3.0GHz Pentium 4 4 • 315フレーム中エラーは29フレーム – ほとんどが座るとき – もっと例を食わせればパフォーマンスは向上する のではないか 4.2 会議全体の状態予測 • 参加者全体の状態を見て判定 • 新たな会議状態、解決できない順序は分類 化できない 5.2 Future Work • 顔検出アルゴリズムの強化 – カラーヒストグラムを使い上半身まで検出 – DBNにより多くのデータを渡すことができる • ミーティング状態モデルの増加 5.1 Summary • ユーザの情報を正確に得るためにCAMEOを 開発した • 得られた位置情報はDBNにより分類化され る • 得られた情報により個人の状態・会議全体の 状態を把握できる • 実験により成果を得た 5.3 感想 • 実験がやや不満足 – もっと動いて欲しかった – ミーティング状態がうやむや • これはエージェントがメインの話ではない – CAMEO+CALOの話も • アプリケーションテーマとしてはおもしろそうだ 5 (参考文献) • エージェントアプローチ人工知能(Stuart Russell・Peter Norvig) • http://www.chikatsulab.g.dendai.ac.jp/s_forum/pdf/2001/12_hada.pdf • http://www.dir.co.jp/flash/20040430.html 以上です。 ご清聴ありがとうございました。 第9期輪講会/第2回 早稲田大学理工学部 情報学科 深澤研究室 M0 石黒真 @NII, 2004/9/1 6
© Copyright 2025 ExpyDoc