SIFTとGraph Cutsを用いた 物体認識及びセグメンテーション 須賀 晃,福田恵太,滝口哲也,有木康雄(神戸大) 電子情報通信学会2008年総合大会 研究背景 物体認識は,ロボットの視覚やHead Mounted Displayなどの 基礎となる技術 ICタグによる認識手法では,自然物に対応できない点やコス ト面に問題がある ⇒画像処理による物体認識 ロボットが物体を検出し,その物体を掴むといった動作には, 詳細な物体領域の切り出しが必要 ⇒認識とセグメンテーションの両方が必要 1 電子情報通信学会2008年総合大会 物体認識 物体認識における問題点 物体の写り方による特徴の変化・消失 撮影環境による特徴の変化 物体の回転,スケール変化,自己オクルージョン 照明変化 他の物体の遮蔽などによる特徴の消失 相互オクルージョン 局所特徴を用いた物体認識手法 2 電子情報通信学会2008年総合大会 SIFT :Scale-Invariant Feature Transform 1. スケール変化に対しての不変性 特徴点の検出と記述を行 うアルゴリズム 画像の回転,スケール変 化,照明変化に頑健な特 徴量の記述が可能 主に画像間のマッチング や物体認識に用いられる 使用例: AIBOビジョンシ ステム(SONY) 3 Detection of extremum 2. 回転に対しての不変性 電子情報通信学会2008年総合大会 8 orientations 領域セグメンテーション エネルギー最小化による手法 Snakes, Level Set Method, Graph Cuts Graph Cuts 4 境界情報と領域情報を用いたセグメンテーション 大域的な最小解を求めることが可能 電子情報通信学会2008年総合大会 Graph Cuts 1. グラフの作成 n-link ・・・境界情報 近傍画素との類似度を表し,類 似している程高いコスト値を持つ t-link ・・・領域情報 物体と背景の色ヒストグラムを 混合ガウス分布モデルに適用. 物体または背景に近い程高いコ スト値を持つ 2. グラフのカット 与えられたコストを用いて, min cut/max flowアルゴリズ ムによって画像のセグメン テーションを行う 5 電子情報通信学会2008年総合大会 提案手法 セグメンテーション(Graph Cuts) 認識(SIFT) 回転・スケール変化・照明変化に不変な特 徴量記述アルゴリズム セグメンテーション問題をエネルギー最小化 問題として解く手法 メリット 画像間の高精度な局所的な対応 付けやマッチングが可能 メリット 領域と境界の両方の情報を用い たセグメンテーションが可能 デメリット 局所情報のため,全体領域が捉え られない デメリット 予め人間が物体と背景のラベル (seed)を与える必要がある 統合 デメリットを補い合う形で統合 SIFT特徴の投票処理により物体を認識 物体上に得られたSIFT特徴をGraph Cutsの物体seedとして 用いる 認識とセグメンテーションの両方を自動で行うことが可能 6 電子情報通信学会2008年総合大会 投票処理による認識 モデル画像の基準点(中心点)を 定め,各特徴点に対して位置ベ クトル(Δx,Δy)を算出 入力画像が与えられると,マッチ ングの取れた各特徴点は,それら の基準点へ投票を行う input X x x 2 y 2 cos mod el input input mod el input Y y x 2 y 2 sin mod el input input mod el y arctan x {input, model} :スケール {input,model} :オリエンテーション 入力画像中に対象物体が存在すると,各特徴 点から求められる基準点が同じ位置に集まるた め,その位置に多くの投票が集まることになる 7 電子情報通信学会2008年総合大会 セグメンテーション seedの作成 seed ・・・ 物体or背景を示すラベル 物体上に取れたSIFT特徴を,Graph Cutsの物体seedとして用 いることで,自動でセグメンテーションを行う 物体seed 認識したクラスタに投票した特徴点を 物体seedとして使用 背景seed 8 物体seedを用いて,モデル画像をア フィン変換し,その外側領域を背景 seedとして使用 自動で作成したseedの例 電子情報通信学会2008年総合大会 実験 実験環境 モデル画像 テスト画像 9 20物体(コップ,携帯電話etc…) 各物体を45度ずつ撮影 1物体あたり8枚 様々な大きさ,角度で撮影 50枚 電子情報通信学会2008年総合大会 実験結果 認識精度 再現率 適合率 0.83 1.00 セグメンテーション精度 物体領域の誤検出ピク セル数+背景領域の誤検出ピクセル数 100 全ピクセル数 エラー率 5.9% 10 電子情報通信学会2008年総合大会 セグメンテーション結果 (a) コップ (d) カン,携帯電話 (b) 人形 (e) 5種類の本 (c) 靴 11 電子情報通信学会2008年総合大会 まとめと今後の課題 まとめ SIFTとGraph Cutsを組み合わせることで,認識とセグメンテー ションを自動で行うことが可能となった 今後の課題 12 SIFT特徴があまり取れない物体は認識率が低く,seedが少な い・偏りのある場合にセグメンテーションのエラー率が高い モデル数の増加に伴うマッチングの計算時間の増加 電子情報通信学会2008年総合大会 ご清聴ありがとうございました 13 電子情報通信学会2008年総合大会
© Copyright 2025 ExpyDoc