SIFTとGraph Cutsを用いた

SIFTとGraph Cutsを用いた
物体認識及びセグメンテーション
須賀 晃,福田恵太,滝口哲也,有木康雄(神戸大)
電子情報通信学会2008年総合大会
研究背景
物体認識は,ロボットの視覚やHead Mounted Displayなどの
基礎となる技術
ICタグによる認識手法では,自然物に対応できない点やコス
ト面に問題がある
⇒画像処理による物体認識


ロボットが物体を検出し,その物体を掴むといった動作には,
詳細な物体領域の切り出しが必要
⇒認識とセグメンテーションの両方が必要

1
電子情報通信学会2008年総合大会
物体認識
物体認識における問題点


物体の写り方による特徴の変化・消失


撮影環境による特徴の変化


物体の回転,スケール変化,自己オクルージョン
照明変化
他の物体の遮蔽などによる特徴の消失

相互オクルージョン
局所特徴を用いた物体認識手法
2
電子情報通信学会2008年総合大会
SIFT :Scale-Invariant Feature Transform
1. スケール変化に対しての不変性
特徴点の検出と記述を行
うアルゴリズム
画像の回転,スケール変
化,照明変化に頑健な特
徴量の記述が可能
主に画像間のマッチング
や物体認識に用いられる
使用例: AIBOビジョンシ
ステム(SONY)




3
Detection of extremum
2. 回転に対しての不変性
電子情報通信学会2008年総合大会
8 orientations
領域セグメンテーション
エネルギー最小化による手法


Snakes, Level Set Method, Graph Cuts
Graph Cuts



4
境界情報と領域情報を用いたセグメンテーション
大域的な最小解を求めることが可能
電子情報通信学会2008年総合大会
Graph Cuts
1. グラフの作成
n-link
・・・境界情報
近傍画素との類似度を表し,類
似している程高いコスト値を持つ
t-link
・・・領域情報
物体と背景の色ヒストグラムを
混合ガウス分布モデルに適用.
物体または背景に近い程高いコ
スト値を持つ
2. グラフのカット
与えられたコストを用いて,
min cut/max flowアルゴリズ
ムによって画像のセグメン
テーションを行う
5
電子情報通信学会2008年総合大会
提案手法
セグメンテーション(Graph Cuts)
認識(SIFT)
回転・スケール変化・照明変化に不変な特
徴量記述アルゴリズム
セグメンテーション問題をエネルギー最小化
問題として解く手法
メリット
画像間の高精度な局所的な対応
付けやマッチングが可能
メリット
領域と境界の両方の情報を用い
たセグメンテーションが可能
デメリット
局所情報のため,全体領域が捉え
られない
デメリット
予め人間が物体と背景のラベル
(seed)を与える必要がある
統合




デメリットを補い合う形で統合
SIFT特徴の投票処理により物体を認識
物体上に得られたSIFT特徴をGraph Cutsの物体seedとして
用いる
認識とセグメンテーションの両方を自動で行うことが可能
6
電子情報通信学会2008年総合大会
投票処理による認識
モデル画像の基準点(中心点)を
定め,各特徴点に対して位置ベ
クトル(Δx,Δy)を算出


入力画像が与えられると,マッチ
ングの取れた各特徴点は,それら
の基準点へ投票を行う
 input

X

x

 x 2  y 2  cos    mod el  input

input
 mod el


 input
Y  y

 x 2  y 2  sin    mod el  input
input

 mod el
 y 
  arctan 
 x 




 {input, model} :スケール
{input,model} :オリエンテーション
入力画像中に対象物体が存在すると,各特徴
点から求められる基準点が同じ位置に集まるた
め,その位置に多くの投票が集まることになる
7
電子情報通信学会2008年総合大会
セグメンテーション
seedの作成



seed ・・・ 物体or背景を示すラベル
物体上に取れたSIFT特徴を,Graph Cutsの物体seedとして用
いることで,自動でセグメンテーションを行う
物体seed

認識したクラスタに投票した特徴点を
物体seedとして使用
背景seed

8
物体seedを用いて,モデル画像をア
フィン変換し,その外側領域を背景
seedとして使用
自動で作成したseedの例
電子情報通信学会2008年総合大会
実験
実験環境


モデル画像




テスト画像


9
20物体(コップ,携帯電話etc…)
各物体を45度ずつ撮影
1物体あたり8枚
様々な大きさ,角度で撮影
50枚
電子情報通信学会2008年総合大会
実験結果


認識精度
再現率
適合率
0.83
1.00
セグメンテーション精度
物体領域の誤検出ピク セル数+背景領域の誤検出ピクセル数
 100
全ピクセル数
エラー率
5.9%
10
電子情報通信学会2008年総合大会
セグメンテーション結果
(a) コップ
(d) カン,携帯電話
(b) 人形
(e) 5種類の本
(c) 靴
11
電子情報通信学会2008年総合大会
まとめと今後の課題

まとめ


SIFTとGraph Cutsを組み合わせることで,認識とセグメンテー
ションを自動で行うことが可能となった
今後の課題


12
SIFT特徴があまり取れない物体は認識率が低く,seedが少な
い・偏りのある場合にセグメンテーションのエラー率が高い
モデル数の増加に伴うマッチングの計算時間の増加
電子情報通信学会2008年総合大会
ご清聴ありがとうございました
13
電子情報通信学会2008年総合大会