パターンと図形の検出(続) 画像処理 特徴点の記述とマッチング スケールと回転に不変な特徴記述(SIFT) 2値特徴量(BRIEF, 2015年度 (第12回) ORB) 対応点マッチング 図形要素検出 ハフ変換 一般化ハフ変換 ランダム化ハフ変換 中島 克人 顕著性マップ 特徴統合理論 情報メディア学科 顕著性マップ [email protected] 2 特徴点の記述とマッチング 特徴点の記述とマッチング スケールと回転に不変な特徴記述 両者の対応する特徴点をマッチングして,物体の探索を行う カメラ画像による物体の検出や追跡問題では探索対象物の 見え(スケールや回転)が変化する事が多い 探索対象 探索対象 入力(探索対象)画像 入力(探索対象)画像 テンプレートマッチングでは実時間処理が困難 スケールや回転角度の異なるテンプレートが沢山用意 それらの全てを走査すると多大な処理時間 SIFT(Scale-Invariant スケールや回転角度に関わらず,変化しない特徴量を探索 対象画像と探索対象画像内の特徴ある点からそれぞれ抽出 Feature Transform) スケールと回転に不変な特徴記述の代表例 記述力は高いが計算時間に難有り BRIEF(スケール・回転依存)/ORB(スケールと回転不変) 両者の対応する特徴点をマッチングして,物体の探索を行う 3 特徴点の記述とマッチング SIFT(Scale-Invariant スケールと回転に不変な特徴記述 記述力を犠牲にし,計算時間の短縮を図ったもの 4 特徴点の記述とマッチング Feature Transform) SIFT(Scale-Invariant Feature Transform) 3. 特徴量を記述 1. DoGを用いてスケール付特徴点を検出 2. 各特徴点のオリエンテーションを求める オリエンテーションを上になるように矩形局所領域を回転 各特徴点でスケールに合せた矩形の局所領域内の各画素で勾配強 この矩形領域を4×4のブロックに分割し,ブロックごとに勾配方向 度と勾配角度を求める 勾配強度を重みとして,勾配角度別(ex.36方向)にヒストグラム作成 最大度数の80%を超えるビンが求めるオリエンテーション この8ビンヒストグラムを4×4個並べたものがSIFT特徴量(128次元) 図11.17 オリエンテーションの算出 ヒストグラム(今度は8方向)を作成 5 図11.18 特徴量の記述 6 画像処理 1 特徴点の記述とマッチング SIFT(Scale-Invariant 特徴点の記述とマッチング Feature Transform) 2値特徴量(BRIEF, 4. 2枚の画像間でマッチング SIFTに対し,記述力を犠牲にして計算時間を短縮 スケールと回転角度が異なっても同じ点は同じ特徴量を持つため, 2値特徴量(0/1のビット列)なら相違度はハミング距離計 算で求まる BRIEF(Binary Robust Independent Elementary Features) 画像間でのマッチングが取れる 図11.19 SIFTの特徴点検出例 ランダムに選択された2点の画素値の差の符号の列を特徴ベクトル とする ORB(Oriented FAST Rotated BRIEF) ランダムではなく,学習に基づいて選択したペア画素値の符号列を 詳細略 用いる 学習は教師無しで,ペア間の相関が低く,ビットの分散が大きいもの を選ぶ BRIEFはスケール・回転依存,ORBはスケール・回転不変 図11.20 2値特徴量のサンプリングペア 8 7 特徴点の記述とマッチング 図形要素検出 対応点マッチング 特徴点間で特徴量の類似度を計算 ハフ変換(Hough transform) 本来直線である部分を途切れ途切れかも知れないエッジ (輪郭)から「直線」として推定する手法 特徴空間内のユークリッド 距離等を使用 全てのペア間で距離を計算 最も近いペアの距離が 2番目に近いペアの距離 よりある比率(k)以上近け れば,そのペアが対応する と見なす kの値が小さいとマッチング 数(とマッチングミス)が 増加 図11.21 対応点の探索 ハフ変換(直線成分検出)の実例 図11.22 2画像間の対応点とマッチング 9 図形要素検出 ORB) 10 図形要素検出 ハフ変換 画像中の直線 ハフ変換(続) 交点の求め方 式11.30 x,y:画素位置 a,b:傾きと切片 a,b空間を小さな格子状のセルに分割し,「直線を引く」代わりに, そのセルを通過するかどうかを「投票」し,最も票数(度数)が多い セルを交点とする 極座標表現 画像中の直線上の 点(x,y)を通る直線 a,b空間の値域は -∞~+∞であり,無限のセルが必要となるため, a,b空間に代えて,直線のρ,θによる極座標表現を用いる 式11.31 式11.23 画像中の直線上の点 群に対応する a,b空 間上の直線を引くと, 交点が求める a と b 図11.23 x,y:画素位置 ρ:直線までの距離 θ:法線の角度 (0≦θ≦π) xy画像空間とabパラメータ空間 11 図11.24 xy画像空間とρθパラメータ空間 12 画像処理 2 図形要素検出 図形要素検出 ハフ変換(続) 極座標表現(続) 左上:入力画像 ρ,θ空間上では,画像位置(x,y)を通る直線はsin関数となる 式11.33 ハフ変換(直線成分検出)の例 右上:エッジ検出(赤線) 左下:投票結果 ただし, 青○が投票の多い場所 右下:青○に 投票はa,b空間と同様, ρ,θ空間上のセルで 行い,投票の多い点 のρ,θを求める直線 と推定する 対応する直 線(赤線)を 入力画像に 重ねた結果 図11.24 xy画像空間とρθパラメータ空間 図11.25 13 図形要素検出 ハフ変換(円検出) ハフ変換(円検出)の例 直線での考え方を円に拡張 入力画像:1セントコイン(r=27)と25セントコイン(r=34.5) (x-a)2+(y-b)2 =r2 であるので, (x,y)画像空間 vs. (a,b,r)パラメータ空間(3次元) と考える 投票は3次元のパラメータ空間上で行なう エッジ画像:コインの周囲とコイン内部にもエッジが存在 図11.26 円のパラメータ空間 投票結果:r=27とr=34.5に多数の投票が入る 検出結果:投票の多いパラメータセットに対して円を描画 図11.27 15 図形要素検出 ハフ変換を不定形の図形の検出にも拡張 16 ランダム化ハフ変換(randomized Hough transform) ハフ変換を高速・高精度化するための方式 ハフ変換は円よりも複雑な定型図形(数式で表せる図形) にも拡張可能だが,計算資源(時間,メモリ)が増大 cf. 楕円は5次元のパラメータ空間 動,回転,拡縮)を同時に表現 一般化ハフ変換では形状は別途定義し,姿勢(ポーズ)のみ を4つのパラメータで表現 び,その2点を通る直線のパラ メータをρθ空間に「実数で」 投票する(適当な回数) 式11.34 式11.35 図11.28 入力画像の特徴点で闇雲に投票することをやめる セル単位の投票は精度が悪いので実数のパラメータセットを求める 2つの特徴点をランダムに選 ハフ変換でのパラメータ空間は形状と姿勢(ポーズ=平行移 詳細略 円の検出例 図形要素検出 一般化ハフ変換(generalized Hough transform) 14 図形要素検出 円の式は 直線の検出例 形状モデル表現と形状定義表 投票されたρθパラメータを管 理し,新たに投票されたパラメー タが閾値以下の差異ならば,両 者を統合 統合時のパラメータは投票数で 重み付けした平均値とする 直線以外の図形でも同様 17 ランダム化ハフ変換 18 画像処理 3 顕著性マップ 顕著性マップ 特徴統合理論(feature-integration theory) 人間の視覚は,形状,色,明るさ等の簡単な情報を組合わせ て物体を識別 顕著性マップ(saliency map) イッチ(L.Itti)の方法 画素値,色空間,勾配方向 の3つの特徴マップを作成し, それらを統合 上記理論に基づき,注意を引き付けるべき各特徴を数値化し, 2次元のマップに投影 イッチ(L.Itti)の方法 詳細略 画素値,色空間,勾配方向の3つの特徴マップから注目度を計算 まず,ガウシアンピラミッドを作成(σ=2~8程度) 画素値の特徴マップは異なるσのガウシアン平滑化画像間の差を足 し合わせる Σ(σ1,σ2)=(2,5)+(2,6)+(3,6)+(3,7)+… 色空間の特徴マップはRGBチャネル間の値差を元に,勾配方向の特 徴マップは45度刻みのガボールフィルタを用いて,やはり異なるσも のを足し合わせる 最後に,画素値,色空間,勾配方向の3つの特徴マップを統合 19 図11.29 顕著性マップの概念図 20 画像処理 4
© Copyright 2024 ExpyDoc