Motion Detection And Analysis

静止背景における動物体の検
出と追跡
陳 謙
2004年10月19日
問題の定義
関心のある物体を除いて移動物体は存在しない。
 カメラの位置、方向は固定、焦点距離などの内部パ
ラメータも固定
 この場合、移動物体は存在しない場合、カメラが撮
影していた画像は不変(静止)である
 この前提のもとで、画像の中の画素を
① 背景
② 移動物体
の2種類に分類して、移動物体の抽出と追跡を行う。

処理の手順





背景のモデリング(背景画像の構築)
入力画像と背景画像との画素間の差を計算
して、移動物体の画素を抽出する
フィルタリング処理によりノイズを除去
隣接している画素をグルーピングする
フレーム間における物体の追跡を行い、物体
の軌跡を求める
入力画像(背景モデリング)
背景のモデル(背景画像)
抽出した移動物体
入力画像
実画像の例
抽出した移動物体の領域
背景画像
Segmentation Results
Foreground extraction of first target at
20mph
Foreground extraction of second target
at 20mph
Results
背景のモデリング

画像内に移動物体が存在しない瞬間があれば、そ
の瞬間の画像を背景画像とすることができる。

しかし、一般的に、移動物体の存在の判断が難しく
て、しかも、背景像が変化することが多い。
背景が変化している






光源の位置が変化する(太陽!!)
外部照明条件が変化する。(雲、影、反射な
ど)
内部照明条件が変化する(扉、窓の開閉、照
明灯のOn/Off)
移動物体が絶えることはない。(交差点など)
背景物体の変動(木の揺れ、水面の波
カメラの露出の変化(自動露出など)
背景のモデリング



画像系列から静止画像を構築すること
背景画像の動的更新
拡張した背景モデリング
 複数の画素値
 画素値モデリング(分布、変動など)
動物体の対処
一般的に、静止環境に設定しているカメラから撮影さ
れた画像には、次の特徴がある:
 画像全体の中に、移動物体が示す面積が少ない
 移動物体が停止しないし、静止している時間はきわ
めて短い
このことから、動画像の中の画素には、背景が写って
いる時間(回数、頻度、確率)が圧倒的に長い こと
が言える
移動物体の存在する環境における背
景の獲得




数秒間から数分間の動画像を撮影する
画像の各画素に対して、出現頻度(確率)について
分析を行う
出現頻度が最も高い明るさ・色をその画素の背景の
明るさ・色とする
具体的に、ヒストグラムに基く方法 と 確率モデリ
ングに基く方法がある。
背景のモデリング4
(Gaussian分布による背景のモデリング)
画像の各画素に現れる画素値が 正規分布に従う
と仮定する
 各画素に対して、ひとつのGaussian分布を割当て、
入力画素値により、そのGaussian分布のパラメータ
(平均・分散)を調整する
 分散が基準値を超えた画素は、モデリング不能の
画素とする(画素値が常に変動しているか、変動し
ない時間が短すぎる)
 Gaussian分布の平均値を背景の画素値とする。

Gaussian分布


式:
  X t ,  ,  
1
2 
可視化:
(2-Dimensional)
n
2

1
2
e

1
 X t   t T  1  X t   t 
2
背景のモデリング5
(ヒストグラムによる背景モデリング)


各画素に現れる画素値のヒストグラムを構築する
出現頻度の最も高い画素値(あるいは上位N個の
画素値の平均)をその画素の背景の画素値とする
色空間



RGB色空間を用いると、背景モデリングの処
理は、影の影響に敏感に影響される
明るさ情報と色情報が分離している色空間を
用いれば、陰の影響を軽減することが可能で
ある
たとえば、YUV色空間
色空間

背景画像と入力画像:

各成分(Y, U, V)の差分画像:
Track objects

Objects are tracked from frame to frame
using:




Location
Direction of motion
Size
Colour
Gaussian Mixture Model


Stauffer & Grimson (2000)
各画素のにおけるK 個 gaussian分布を管理
する


平均値 µ, 標準偏差 と 重み 
入力画素はどれかのgaussian分布にマッチ
していれば、背景と判別する
中間値モデル(Median Value Model)





Cucchiara, Grana, Piccardi & Prati (2003)
各画素について、N フレーム前までの履歴を
管理する
背景画素値は中間値である
入力画素の画素値と背景画素値との差が閾
値以下であれば、背景と判別する
|I(p), B(p)| < T
適応(Adaptation)

GM と MV はともに照明の変動に適応する



しかし、適応の途中、誤検出が多く発生する
従って、画像中の多くの領域は、“動物体”として
抽出されてしまう
GM モデルの適応は遅いが、複数の背景値
に対応できる
静止背景における移動物体の検出の
応用
監視
セキュリティ(保安、警備)監視カメラ
交通状況の監視
人数の統計 など
形状計測
視体積交差法
ユーザインタフェース
目の検出、指の検出など