高階グラフカット 石川 博 名古屋市立大学 大学院システム自然科学研究科 名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム エネルギー最小化 1階(クリークが2画素まで) データ Y X を探す クリーク 滑らか Y に近い クリーク E ( X ) g v ( X v ) huv ( X u , X v ) vV ( u ,v ) 各画素 各画素 名古屋市立大学大学院システム自然科学研究科 隣接画素 v に Xv (= 0 or 1)を割り当てる MIRU2009: 第12回 画像の認識・理解シンポジウム 高階エネルギー 3階(クリークが4画素まで) E ( X ) g v ( X v ) huv ( X u , X v ) vV ( u ,v ) クリーク k ( u , v , s ,t ) uvst クリーク (Xu, Xv, Xs, Xt ) クリーク 一般階 E( X ) C f C C ( XC ) クリーク 名古屋市立大学大学院システム自然科学研究科 C : クリークの集合 X C ( X v )vC MIRU2009: 第12回 画像の認識・理解シンポジウム 高階エネルギーでより細かく分類 良い(低エネルギー) 悪い(高エネルギー) より良い(低エネルギー) より悪い(高エネルギー) A C B 名古屋市立大学大学院システム自然科学研究科 D MIRU2009: 第12回 画像の認識・理解シンポジウム 1階エネルギーで区別できない例 良い(低エネルギー) 悪い(高エネルギー) 良い: 53 良い: 53 悪い: 14 悪い: 14 名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム 3階エネルギーを使うと区別できる より良い(低エネルギー) より悪い(高エネルギー) A C B D A: 15 03 421 A: 160 43012 B: 12 B: 60 C: 10 C: 50 D: 0 D: 10 名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム 本研究の貢献 任意の高階2値マルコフ確率場 E ( X ) E ( X 1 , , X n ) を1階に変換 C f C C (XC ) ~ ~ E ( X ) E ( X 1 ,, X n ,, X m) g v ( X v ) huv ( X u , X v ) vV ( u ,v ) 変数を追加 多値の場合には融合移動で対応可能 名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム 2値変数の関数 擬ブール関数 (PBF Pseudo-Boolean Function) 2値変数(0 or 1)の実数値関数 常に 多項式として 一意に書ける 1変数 x : E(x) = E0 (1x) + E1 x 2変数 x, y : E(x,y) = E00 (1x) (1y) + E01 (1x) y + E10 x (1y) + E11 x y 3変数 x, y, z : E(x, y, z) = E000 (1x) (1y) (1z) + E001 (1x) (1y) z +…+ E111 x y z n階2値MRF = (n+1)次PBF 名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム 2階(3次)の場合 Kolmogorov & Zabih. PAMI2004 Freedman & Drineas. CVPR2005 3次 PBF を 2次 に変換.次式を使う xyz max w( x y z 2 ) w ={0,1} xyz 000 0 max w ( 2 ) max{ 0, 2} 0 001 0 max w ( 1 ) max{ 0, 1} 0 011 0 max w 0 max{ 0,0} 0 w w w 111 1 max w 1 max{ 0, 1} 1 w 名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム 2階(3次)の場合 xyz max w( x y z 2) w a < 0 なら だから a xyz min a w( x y z 2) w min a xyz min a w( x y z 2) x , y , z x , y , z , w 最小化問題の中(minの内側)では、 a xyz を a w( x y z 2) に置き換えられる 名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム さらに高階(高次)の場合 xyz max w( x y z 2) w xyzt max w( x y z t 3) w xyztu max w( x y z t u 4) w x1 xd max wx1 xd (d 1) w min a x1 xd min a wx1 xd (d 1) ただし a < 0 ならば 名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム さらに高階(高次)の場合 a > 0, d > 3 の場合、類似公式は知られていない (殆どのエネルギーは変換できない)→ 本研究の貢献 そのような公式を想像してみる: xyzt min w( 1次式 ) ( 2次式 ) w 左辺は対称式 (2つの変数の値を入れ替えても変わらない) 従って右辺も対称式である必要がある 名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム 対称式 事実 任意の対称式は基本対称式についての 多項式として書くことができる 従って、もし f (x, y, z, t) が2次対称式ならば、 多項式 P(u,v) で次のように書ける: f ( x, y, z, t ) P(s1 ,s2) 1次, 2次の s1 x y z t 基本対称式 s 2 xy yz zx xt yt zt 名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム 4次の場合 xyzt min w( 1次対称式 ) ( 2次対称式 ) w xyzt min w(Pa(ss11) b )Q( sc1s,1s 2 )d s2 e w P( s1 ) a s1 b Q(s1 , s2 ) s12 s1 s2 s1 x y z t s2 xy yz zx xt yt zt s1 ( x y z t ) 2 x 2 y 2 z 2 t 2 2s2 s1 2s2 ( x 2 x, y 2 y, etc.) 2 Q(s1 , s2 ) c s1 d s2 e 名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム 4次の場合 xyzt min w( 1次対称式 ) ( 2次対称式 ) w xyzt min w( a s1 b ) c s1 d s2 e w a, b, c, d, e を虱潰しに探索→ xyzt min w( 2s1 3) s2 w min w 2( x y z t ) 3 w xy yz zx xt yt zt 名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム 5次の場合 同様に xyztu min v(2r1 3) w(r1 3) r2 ( v , w) r1 x y z t u r2 xy yz zx xt yt zt xu yu zu tu 順次高次の公式を見つけていくと… 名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム 一般次数の公式 d x1 xd min wi ki ( S1 2i) 1 S 2 w1 ,, wnd i 1 nd S1 xi , i 1 d 1 nd 2 d 1 d ただし d S 2 xi x j i 1 j i 1 が奇数でi ndの場合 1 d k 2 それ以外の場合 d i 注意:一般の多項式に含まれる単項式の数は次数に ついて指数的に増える 名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム 例 xyz min w ( x y z ) 1 xy yz zx w xyzt min w 2( x y z t ) 3 w xy yz zx xt yt zt min xy yz 2 xyz 3 xyzt x , y , z ,t { xy yz 2v ( x y z) 1 2( xy yz zx) x , y , z ,t ,v , w min 3w 2( x y z t ) 3 3xy yz zx xt yt zt } 名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム 多値の場合: 融合移動 ラベルの集合を L {l1 ,, l N }とする 配置 Y は各 v にラベル Yv L を与える 融合移動 Lempitsky et al. ICCV2007 繰り返し以下のように Y を更新: 1. 提案配置 P を生成する 2. Y とP を合成する 合成は2値問題を定義する: 「各 v についてYvをPvに変えるか変えないか」 名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム 多値の場合: 融合移動 0 1 0 1 Y P 1 0 1 1 0 1 1 0 0 0 0 0 X 融合移動 繰り返し以下のように Y を更新: 1. 提案配置 P を生成する 2. Y とP を合成する 合成は2値問題を定義する: 「各 v についてYvをPvに変えるか変えないか」 名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム 多値の場合: 融合移動 0 01 10 1 Y P 10 0 1 1 0 01 01 10 01 0 0 10 X 融合移動 繰り返し以下のように Y を更新: 1. 提案配置 P を生成する 2. Y とP を合成する 合成は2値問題を定義する: 「各 v についてYvをPvに変えるか変えないか」 名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム 融合移動とQPBO QPBO (Roof duality) Hammer et al. 1984, Boros et al. 1991, 2006 Kolmogorov & Rother PAMI2007, Rother et al. CVPR2007 劣モジュラなエネルギーは大域的に最小化 劣モジュラでなくても、各サイトに 0, 1, or unlabeled を割り当てる 融合移動において、unlabeled となったサイト は変えないようにすると、エネルギーは増えな いことが保障される。 名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム 実験: FoEによる画像復元 FoE (Fields of Experts) Roth&Black CVPR2005 自然画像のための高階事前分布 E (Y ) C f C C C (YC ) : クリークの集合 YC (Yv ) vC 1 2 f C (YC ) i log 1 J i YC 2 i 1 2 ( N v Yv ) f{v} (Y{v} ) 2 2 K C: C: 名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム 実験: FoEによる画像復元 元画像 名古屋市立大学大学院システム自然科学研究科 ノイズ入り 1階 3階 MIRU2009: 第12回 画像の認識・理解シンポジウム 実験: FoEによる画像復元 エネルギー (小さい方がよい) PSNR (大きい方がよい) 45000 40000 35000 32 30000 25000 29 31 30 28 20000 27 15000 10000 5000 26 25 24 0 Lanら = 10 = 20 Potetz 本研究 Lanら Lanら ECCV2006 Potetz CVPR2008 本研究 名古屋市立大学大学院システム自然科学研究科 Potetz 本研究 ~8時間 ~30分 1分以内 MIRU2009: 第12回 画像の認識・理解シンポジウム まとめ 1階(普通のグラフカット) Kolmogorov & Zabih Freedman & Drineas 2階まで変換できるが最小化できない QPBO 2階まで変換できて、最小化できる 本研究 任意階で変換できて、最小化できる 名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム 御清聴ありがとうございました ソフトウェア公開中 http://www.nsc.nagoya-cu.ac.jp/~hi/indexJ.html 名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム
© Copyright 2024 ExpyDoc