第9期輪講会/第2回 - 深澤研究室 - 早稲田大学

はじめに
第9期輪講会/第2回
• テーマはインタラクション系の基礎力強化&
テーマ探し
• このあたりから・・・
– 本会議 (http://www.aamas2004.org/)
– (W3) Agent Tracking: Modeling Other Agents
from Observations (MOO 2004)
– (W10) Coalition and Teams
早稲田大学理工学部
情報学科 深澤研究室 M0
石黒真
発表日:2004年9月1日
@
NII
発表論文
Using Sparse Visual Date to
Model Human Activities in
Meeting
• “Using Sparse Visual Date to Model
Human Activities in Meeting”
– (W3)MOO2004
– Paul E.Rybski, Manuela M.Veloso
Paul E. Rybski, Manuela M. Veloso
@
Robotics Institute,
Carnegie Mellon University
筆者について
• Paul E. Rybski
– Robotics Institute, Carnegie Mellon University
– 博士課程終了
– Human/Robot interface, Distributed robot system
• Manuela M. Veloso
– Carnegie Mellon University
– CS学科教授
– CORAL project, 推論・プランニング・検索アルゴリズム,
ロボットサッカー
論文の構成
•
•
•
•
•
•
バックグラウンド。CAMEOの簡単な紹介
関連研究(今回は省略します)
アーキテクチャ
分類アルゴリズム
Experiment
Summary/Future Work
1
1.1 背景
• ユーザとインタラクションを行い日常の作業をサ
ポートするエージェント
• エージェントはユーザの”状態”を把握しておくべき
– 担当プロジェクト
– スケジュール…
• 本論文ではフォーマルな会議室を想定
– センサで有益な情報収集
– ユーザの質問に答えられなければならない
• “私のいない間に決まった項目は何だ?”
• “スライド15の三番目の丸はなんですか?”
– アシスタントとして有益であること
• これは難しい問題だ!!
– インターフェース/データソース
– 場所
1.2 CAMEO
2.1 CALO
• CAMEO : Camera Assisted Meeting Event
Observer
– 参加者の状態を観測
– 各画像をマージし1つのパノラマ画像に
• 分析結果をセントラルPCに送る
• CAMEOはCALOシステムの一部
– Cognitive Agent that Learns and Organize
– 日常のビジネス/プライベートをサポート
– タスクの補助
– 予測可能なイベントの提案・準備
– 予測不可能な事態の対処
– 個人の状態
– 会議全体の状態
2.2 CALOアーキテクチャ
Processed
Audio/Speech
• CAMEOはSemantic Labeledされたデータ
やイベントをデータサーバにおく
• CALOエージェントがユーザ端末からサーバ
に対してクエリを出す
Instrumented
Whiteboard
Presentation
Software
CAMEO
Event Timeline
Database/Server
CALO
Agent
CALO
Agent
2
2.3 CAMEOアーキテクチャ
Raw Video
Global Meeting
State Classification
Image Mosaic
Free Detection/
Tracking
Individual Person
State Classification
Logging
3 分類アルゴリズム
• 状態を正確に分類するために以下の方法を
用いる
– 隠れマルコフモデル
– カルマンフィルタ
– Dynamic Bayesian Network
Replay
Meeting
Simulator
3.1 隠れマルコフモデル(HMM)
• マルコフモデル(Markov Model)
• 隠れマルコフモデル(Hidden Markov Model)
– 状態列の遷移を記述するためのモデル
– 全ての可能な系列が記述され各系列に確率が割
り当てられる
0.2
[ ow ]
[t]
0.5
[ ey ]
[m]
0.8
Onset:
C1: 0.5
C2: 0.2
C3: 0.3
[t]
0.7
Mid:
C3: 0.2
C4: 0.7
C5: 0.1
3.2 カルマンフィルタ
0.4
0.1
Mid
[ ow ]
[ aa ]
0.9
0.3
Onset
0.5
[ ah ]
– 各状態はいつくかの出力値をある確率分布に
従って持つ
– 自然言語処理やDNA解析などに用いられる
0.6
End
FINAL
End:
C4: 0.1
C6: 0.5
C7: 0.4
• システムの状態推定を行うためのフィルタリ
ング理論
– 誘導ミサイルやGPSなどに応用されている
P([C1, C1, C4, C4, C6, C6])=
(0.3×0.7×0.9×0.1×0.4×0.6) ×(0.5×0.5×0.7×0.7×0.5×0.5)+
(0.3×0.7×0.1×0.4×0.4×0.6) ×(0.5×0.5×0.7×0.1×0.5×0.5)=
0.0001477
3
3.3 Dynamic Bayesian Networks
(DBNs)
• 隠れマルコフモデルとカルマンフィルタによっ
て得られるグラフ
– 状態遷移モデル
3.4 状態予測
• 人間状態予測
– 今回は右下図の4つの状態に分類
– 各状態の位置情報はガウス分布(μ,Σ)を持つ
– 相対位置で測定
Sitting
Hidden State
X1
X2
Xi
Stand
Observation
Y1
Y2
Sit
Standing
Yi
• 会議の状態
– 参加者の状態のセットで決まる
– M={S, T, D}
• S: allowable States
• T: Transition matrix
• D: minimum Duration
– 未知状態の検出は例外報告を行う
Presentation
Meeting Start
Meeting End
General Discussion
4 Experiment
4.1 人間の状態予測
• CAMEOでの会議測定シミュレーション
– 人間
– 会議全体
• 測定環境
–
–
–
–
高解像度モザイクビデオフレーム(1764×357pixels)
毎秒3フレーム
CPU 3.0GHz
Pentium 4
4
• 315フレーム中エラーは29フレーム
– ほとんどが座るとき
– もっと例を食わせればパフォーマンスは向上する
のではないか
4.2 会議全体の状態予測
• 参加者全体の状態を見て判定
• 新たな会議状態、解決できない順序は分類
化できない
5.2 Future Work
• 顔検出アルゴリズムの強化
– カラーヒストグラムを使い上半身まで検出
– DBNにより多くのデータを渡すことができる
• ミーティング状態モデルの増加
5.1 Summary
• ユーザの情報を正確に得るためにCAMEOを
開発した
• 得られた位置情報はDBNにより分類化され
る
• 得られた情報により個人の状態・会議全体の
状態を把握できる
• 実験により成果を得た
5.3 感想
• 実験がやや不満足
– もっと動いて欲しかった
– ミーティング状態がうやむや
• これはエージェントがメインの話ではない
– CAMEO+CALOの話も
• アプリケーションテーマとしてはおもしろそうだ
5
(参考文献)
• エージェントアプローチ人工知能(Stuart Russell・Peter
Norvig)
• http://www.chikatsulab.g.dendai.ac.jp/s_forum/pdf/2001/12_hada.pdf
• http://www.dir.co.jp/flash/20040430.html
以上です。
ご清聴ありがとうございました。
第9期輪講会/第2回
早稲田大学理工学部
情報学科 深澤研究室 M0
石黒真
@NII, 2004/9/1
6