3次元パーティクルフィルタと EMD を用いた選手の追跡 神戸大学大学院 工学研究科情報知能学専攻 CS17 有木研究室 西濃 拓郎 自動映像生成技術 視点固定映像 状況認識 上面図生成 映像生成 ~選手がシュート!! 解説生成 www.***.com 研究目的 動画を解析して状況認識を行う 選手やボールを追跡して3次元位置 解説は主にイベントを中心に行われている 情報を獲得し、ゴールやファウル、 シュートといったイベントを検出する 物体の3次元位置情報を用いて イベントを検出する www.***.com システムの概要図 入力動画 T=T+1 Particle Filter SVMによる選手の検出 × × × 状態遷移 尤度評価 リサンプリング 出力動画 www.***.com 3Dパーティクルフィルタ 状態量:x px , p y ; vx , v y ; ax , a y (n) (n) (n) (n) (n) (n) (n) T 3次元ワールド座標空間に状態量をとることで、 奥行きを考慮したより現実に近いモデルでの追跡が可能 z y x www.***.com 尤度評価 複数の特徴をベースとした尤度を組み合わせることに よってオクルージョンに頑健な尤度とする ① ② ③ p( zt | xt ) pD pH pC ①検出結果ベースの尤度 ②ヒストグラム特徴ベースの尤度 ③相関値ベースの尤度 www.***.com 尤度評価 Detection ①検出結果ベースの尤度 pD 手法:SVM Step1.Matching Matrix を計算する Tracker Matching Matrix S N s(tr, det) g (tr, det) (c(det) pN (det p)) SVMスコア ptr Step2.各trackerと最もマッチする検出結果det*を決定する Step3.尤度を計算する pD I (tr)( c( p) pN ( p det* )) www.***.com 尤度評価 ②ヒストグラム間距離ベースの尤度 p H 手法:EMD ・オクルージョン時に有用 ・距離をガウス分布に入れて尤度とする pH pN (distEMD ) ③相関値ベースの尤度 pC 手法:正規化相互相関値 pC i, j {I (i, j ) I } {T (i, j ) T } 2 2 { I ( i , j ) I } { T ( i , j ) T } i , j i , j www.***.com EMD Earth Mover’s Distance (EMD) [1] 定義 「2つの離散分布において、一方の分布を他方の分布に変 換するための最小コスト」 線形計画問題の一つである輸送問題の解に基づいて計算さ れる距離尺度 需要地の需要を満たすように供給地から需要地へ 輸送を行う場合の最小輸送コストを解く問題 オクルージョンに強い特徴量として注目されている[2], [3] [1]Y. Rubner, C. Tomasi, and L. Guibas,“The earth mover’s distance as a metric for image retrieval”, IJCV2000. [2]A. Adam, E. Rivlin, and H. Shimshoni,”Robust Fragments-based Tracking using the Integral Histogram”, CVPR2006. [3]Q, Zhao, S. Brennan, H. Tao,”Differential EMD Tracking”, ICCV2007. 2009/12/24 IEICE 中間報告 www.***.com EMDの実装 H-S空間2次元ヒストグラム 供給量 供給地集合 P {( p1, wp1 ),, ( pm , wpm )} 特徴ベクトル EMD 需要量 需要地集合 Q {(q1, wq1 ),, (qn , wqn )} d ij m n (p k 1 ik q jk ) 2 n WORK ( P, Q) d ij f ij i 1 j 1 輸送量 : fij EMD ( P, Q ) WORK ( P, Q ) m n i 1 j 1 f ij 2009/12/1 研究室内発表会 www.***.com 実験条件 視点固定サッカー映像 画像サイズ 1280×720 [pixel] Frame rate 30 [fps] 映像 平均330 [frame] ×12 総追跡人数 221人 Particle Filter パーティクル数:200 評価方法 追跡成功フレーム数 追跡精度 全フレーム数 追跡人数 www.***.com 実験結果 pD pH × × pC Accuracy(%) NCC 70.30 × Bhattacharyya NCC 72.41 × NCC 73.64 ○ Bhattacharyya NCC 75.52 EMD ・Bhattacharyya距離よりもEMDの方が精度がよい ・検出結果を尤度として用いることで精度が向上 www.***.com まとめと今後の予定 まとめ EMDを用いることでオクルージョンに頑健な追跡が可能 となった 検出結果を尤度としてパーティクルフィルタの枠組みに取 り入れることで精度が向上した 今後の予定 イベントの検出 選手とボールの3次元位置情報 オフサイドの検出 www.***.com ご清聴ありがとうございました 3D Particle Filter State: x ( n ) px , p y ; vx , v y ; ax , a y (n) (n) (n) (n) Transition Likelihood p( xT | xT 1 ) p( zT | xT ) (n) (n) T Resampling × × N × p( xT 1 | ZT 1 ) p( xT | ZT 1 ) p( xT | ZT ) T T 1 www.***.com Bhattacharyya距離 ① Bhattacharyya距離 RGB空間1次元ヒストグラム p[k ] 255 B( p, q) 1 p[k ] q[k ] k 0 BB q[k ] BG BR Bdist BB2 BG2 BR2 p( zt | xt ) 1 2 | | e ( Bdist ) 2 2| | k ⇒ヒストグラムを用いることで、姿勢の変化にも頑健な尤度評価が可能 www.***.com 供給地 w p1 d11 d12 f11 需要地 wq1 wp 2 wp3 d13 d 23 f12 f13 wq 2 d 33 f 23 f 33 wq 3 ・・・・・ wpm d mn d 3n f 3n ・・・・・ f mn wqn www.***.com 制約条件 供給地から需要地の一方向にしか輸送されない fij 0 (1 i m,1 j n) 供給地 i から供給できる容量は供給量 w pi を超過しない n f j 1 ij wpi (1 i m) 需要地 j が受け取れる容量は需要量 wqj 以下であること m f i 1 ij wqi (1 j n) 供給地から移動する輸送量(総フロー) m n f i 1 j 1 ij n m i 1 j 1 min( wpi , wqi ) www.***.com ヒストグラム間距離計算(ユークリッド距離) > 1 1 0 0 0 コスト4 0 1 1 0 1 0 0 0 0 1 0 コスト2 ユークリッド距離で右図と左図で画像のヒストグラム間の距離を計算する際、対 応する色のビンの値がそのままコストに影響するため、それぞれコスト4とコスト 2となる。 この結果より右図の画像同士がよく似ていると判断されてしまう。 www.***.com ヒストグラム間距離(EMD) 1 5 1 < コスト2 コスト5 EMDを用いた距離計算では上図に示すようにビンが1つずれる毎に輸送コ ストが1かかると仮定する。この結果より、左図の画像同士が類似している と判断される。 www.***.com Integral Histogram とは Fatih Porikli, “Integral Histogram: A Fast Way to Extract Histogram in Cartesian Space”, In Proc. IEEE Conf. on Computer Vision and Pattern Recognition (CVPR), 2005. 複数の領域のヒストグラムを高速に計算するために考案された手法 Integral Image (Cumulative Image) とよく似た考え方 www.***.com Integral Image (1/2) ある画像について特定領域内の画素値をあらかじめ計算しておくといった 中間的表現を用いることによって、各矩形領域を高速に計算する手法 s ( x, y ) <定義> x 0 ii ( x, y ) x ' x y ' y i ( x' , y ' ) 元画像の画素値 以下の再帰関数を利用 ii ( x, y ) s( x, y) s( x, y 1) i( x, y) ii( x, y) ii( x 1, y 1) s( x, y) ただし s(x, y) は累積的な列の和で s( x,1) 0 ii(1, y ) 0 y i( x, y) www.***.com Integral Image (2/2) Integral Image は元画像を一度捜査することで計算される Integral Image を使うことで画像内の矩形領域内に含まれる画素値の和を 4つの要素の参照のみで計算できるようになる A B 1 2 D C 3 4 点1の Integral Image の値は領域Aに含まれる画素値の和である。同様に 点2はA+B、点3はA+C、点4はA+B+C+D。したがって領域Dに含まれる画 素値の和は(4+1) - (2+3)で計算できる。 OpenCV の “cvIntegral” で実装されている www.***.com Integral Histogram H ( x1 1, x2 1, b) x1 N1 H ( x1 , x2 1, b) x2 N2 H ( x1 1, x2 , b) H ( x1 , x2 , b) H ( x1 , x2 , b) H ( x1 1, x2 , b) H ( x1 , x2 1, b) H ( x1 1, x2 1, b) Q( f ( x1, x2 )) 座標(x1,x2)におけるIntegral Histogram b:ビン数 座標(x1,x2)のヒストグラム www.***.com 従来の尤度評価方法 正規化相互相関値 R( x, y) {T (i, j)T}{I ( x i, y j) I} i, j {T (i, j)T} {I ( x i, y j) I} 2 i, j 2 i, j 画素レベルで比較しているため、同じ人物でも少し 姿勢が崩れれば相関値が大きく下がってしまう www.***.com
© Copyright 2024 ExpyDoc