画像処理論 第5回 佐藤 洋一 生産技術研究所 情報理工学系研究科電子情報学専攻/情報学環 http://www.hci.iis.u-tokyo.ac.jp/~ysato/ 前回講義の復習 コーナー特徴 Moravecオペレータ ZHオペレータ、KRオペレータ Tomasi-Kanadeオペレータ Harrisオペレータ SUSANオペレータ SIFT特徴 コーナーとして望ましい性質 輝度変化の大きさとそのパターン 画像フレーム間における対応付けに必要 平坦な領域→対応づけのための手掛かりが無い 一つの方向にのみ輝度変化が見られる領域 →エッジ方向に関して対応付けができない(オプティカルフ ローにおけるapature problemに相当) コーナーとして望ましい性質 輝度変化の大きさとそのパターン 画像フレーム間における対応付けに必要 平坦な領域→対応づけのための手掛かりが無い 一つの方向にのみ輝度変化が見られる領域 →エッジ方向に関して対応付けができない(オプティカルフ ローにおけるapature problemに相当) Tomasi-Kanadeオペレータ 1. 領域 W に対して、行列Cの固有値 λ1 , λ2 を計算 2 ∂I ∑ ∂x C= W ∂I ∂I ∑ ∂x ∂y W ∂I ∂I ∑ x y ∂ ∂ W 2 ∂I ∑ W ∂y W 2. min(λ1 , λ2 ) が大きい点 領域A内の輝度変化パターンと固有値との関係 両方とも小さい → I 片方が小さい → II 両方大きい → III I II III Harrisオペレータ Tomasi-Kandeオペレータの近似版 min(λ1 , λ2 ) の代わりに以下の評価式を用いる R = λ1λ2 − k (λ1 + λ2 ) 2 = Det(C ) − kTr(C ) 2 kは任意の値に設定(通常はk=0.04程度) SIFTアルゴリズム SIFT特徴の例 DoGピラミッドからの極値検出 特徴点の絞り込み 主曲率にもとづく絞り込み 固有値計算を用いない判別 低コントラスト点の削除 推定されたサブピクセル位置でのDoG出力値 回転に対する正規化 特徴ベクトルによる特徴量記述 128次元ベクトルの正規化 → 照明変化の影響の軽減 本日の講義の内容 ライン特徴の検出 ハフ変換 一般化ハフ変換 幾何学的ハッシング ライン特徴の検出 エッジ点からの直線の検出 ハフ変換(Hough transform)が良く用いられる パラメータ空間への投票により直線を検出 ハフ変換による直線の検出 画像空間とパラメタ空間の関係 画像中の直線の表現(傾きmと切片c) y y = mx + c c c = −mx + y (x,y) x エッジ点(x,y)を通る全ての直線 m パラメタ空間(m,c)内の直線 パラメタ空間における投票 画像中の各エッジ点ごとにパラメタ空間で直線を追加 画像中の直線に対応するパラメタ(m,c)にピーク →ハフ変換の基本的な考え方 c y c = − xm + y (x,y) c = − x′m + y′ (x’,y’) x m ハフ変換における投票空間 パラメタ空間を離散化して投票→2次元配列P[m,c] 配列Pにおけるピークが直線に対応 ピークの“鋭さ”が直線の強さを示す ハフ変換による投票の例 ハフ変換の改良(1) y = mx + c による表現の問題 y軸に平行な直線で傾きmが無限大 パラメタ空間(m,c)にばらつきが存在 より偏りのないパラメタ空間 ( ρ , θ ) を利用 x cos θ + y sin θ = ρ 直線を表すパラメタ空間 ハフ変換の改良(2) パラメタ空間への投票のコストの問題 (x,y)を通る全ての直線に対する投票 エッジ検出オペレータのgradientを利用 gradient方向を利用して直線の範囲を限定 gradient強度により投票を重み付け ハフ変換の改良(3) 精度向上のためにパラメタ値を実数のまま記録 既に記録されているパラメタと同じであれば、そのパラメタの 投票数を1増やす 同じものがなければ新しいパラメタを追加 ハフ変換による曲線の検出 曲線検出も直線と同様 ( x − a ) 2 + ( y − b) 2 = r 2 エッジ点(x,y)に対して、上式を満たす全パラメタ組(a,b,r)へ投 票する 一般に、曲線が次式で与えられれば検出可能 f ( x, y , a ) = 0 a は曲線を表すパラメタ。直線ならば a = ( ρ , θ ) ランダムハフ変換 ハフ変換を効率的に行うための工夫 各エッジ点ではなく、エッジ点の組による投票 例:直線検出の場合 ランダムハフ変換 n点で一意に決定される図形に対し、以下を繰り返す 画像中のエッジ点からn点の組をランダムに選ぶ n点の組に対応する図形のパラメタを計算 求めたパラメタをパラメタ空間に投票 パラメタ空間にピークが見つかれば終了 RANSAC (Random Sample Consensus)と関係 ハフ変換の長所・短所 長所 線の一部欠損に対して頑健 パラメタ空間への投票を並列化が可能 本数に依存せずに一括処理可能 短所 パラメタ空間への投票の計算コストが高い 投票空間におけるピーク検出が容易ではない 求められるのは線分ではない(端点は不明) 短い線は検出が困難 パラメタ数の増加とともに急激にコストが増大 ハフ変換による直線検出の利用例 J. Xiao and Y. Furukawa, “Reconstructing the world’s museums”, ECCV2012 (Best Student Paper Award) 一般化ハフ変換 ハフ変換を輪郭が定義されている物体全般に拡張 ハフ変換 エッジ点(x,y)が与えられたときに、 f ( x, y, a ) = 0 パラメタを投票 一般化ハフ変換 輪郭形状をもとに、投票するパラメタの表を事前準備 最初に、物体の姿勢と大きさが一定の場合 を満たす テンプレートと形状定義表 テンプレートの基準点Qを定義 輪郭線上の点Pにおいて、接線方向θごとに基準点Qの位置 (距離rと方向α)を記録 xPi Q ri cos α i y P Q = r sin α i i i パラメタ空間における投票 1. 各エッジ点(x,y)において、gradientからエッジ方向θを計算 2. 形状定義表を参照し、基準点の候補位置Qに投票 3. 全ての投票後に、候補位置Qにピークがあれば、対象物体を その位置に検出 Q xQ = x + r (θ ) cos[α (θ )] Q yQ = y + r (θ ) sin[α (θ )] 回転・スケールの考慮 一般には、対象物体の回転とスケールは未知 基準点位置算出の際に、回転 Φ とスケール S を考慮 Φ Pi ( x, y ) Sri Q αi + Φ θ = θi + Φ xQ = x + Sri cos(α i + Φ ) yQ = y + Sri sin(α i + Φ ) この場合のパラメタ空間は ( x, y, S , Φ ) の4次元となる (1) パラメタ空間における投票 1. 各エッジ点(x,y)において、gradientからエッジ方向θを計算 2. 全ての回転Φ・スケール S に対して、式(1)と形状定義表を 参照し、基準点の候補位置Qに投票 3. 形状定義表のインデックスとなるエッジ方向は θ − Φ 最後に、パラメタ空間 ( x, y, S , Φ )においてピークを検出する Pi ( x, y ) Sri Q αi + Φ θ = θi + Φ θ −Φ 一般化ハフ変換のまとめ 任意の輪郭形状をもった物体を取扱可能 輪郭がとぎれていたり、一部が遮蔽されているような場合で も検出可能 回転とスケールを考慮した場合のパラメタ空間が4次元とな り、計算コストが急激に増大 幾何学的ハッシング 一般化ハフ変換と似た物体検出法 モデル準備: 姿勢に対する不変特徴をハッシュテーブルに記録 幾何学的ハッシング モデル検出: 画像中特徴点から2点を基底として選択 各特徴点について、ハッシュテーブルのエントリに投票 最高得点のモデル・基底を検証 y 画像中特徴点 A1,4 A6,5 A1,4 A6,5 3 5 1 6 5 A1,4 A6,5 4 1 1 A1,4 A6,5 2 3 A1,4 A1,4 4 2 A6,5 5 モデルA x 4 3 2 基底1-3の時、(A, 1-4)で最高得点 幾何学的ハッシング 特長 モデル数が多くても問題ない モデルの検出とアラインメントを同時実行 並列処理に向く 基底数の違い 2点による基底→スケール・回転・平行移動 3点による基底→アフィン変換(上記+シアー変形) 一般化ハフ変換との違い 一般化ハフ変換→全てのスケールと回転 幾何学的ハッシング→基底の組数だけ 本日の講義内容のまとめ ライン特徴の検出 ハフ変換 一般化ハフ変換 幾何学的ハッシング 参考資料 Ballard&Brown 4.3章 画像処理標準テキスト 3.2章、6.3章 Hartley 4.7.1 Geometric Hashing論文 CVonline
© Copyright 2024 ExpyDoc