物体表現と物体認識 第5回 Marr のパラダイム 世界座標系表現 3D 表現 観測者中心座標系表現 2-1/2D 表現 融合・内そう 明るさ 3D 特徴抽出 モジュール 模様 線画 2D 画像 両眼 動き 表現法の分類 表面表現法 – 基本面の集まりで表現 関数表現法 – 関数形(生成ルール)で表現 体積表現法 – 基本体積の集まりで表現 表面表現法 • 基本面の集合として表現 面 どの面 * 見える面の集合 * 全ての面の集合 面の定義 * 法線方向の不連続 * ガウス曲率 * 色・明るさ --- 使用が容易 維持が容易 大島白井システム 見えに基づく面表現 法線方向の不連続 R7 AA(+) R6 A 4(+) R3 A5(+) A9(+) AD(+) RC RB AB(+) A1(+) R8 R1 A8(+) R5 Model RD モデルの使用法 System 固有空間法 画像(ベクトル)の圧縮法 寄与の大きい固有ベクトルを抽出 大きなサイズの画像列を10次元程度に 固有空間法 トレーニング画像 画像の特徴を表わす空間から固有ベクト ルを抽出 入力画像(高次元)を寄与の大きい固有ベ クトルが張る低次元空間に射影 固有空間法による認識例 固有空間法の特徴 補間が可能 平行移動に弱い 隠蔽に弱い 固有窓法による車両認識 画像を窓に分割 窓画像をベクトル化し固有ベクトルを抽出 し窓表現をおこなう 各窓の投票による認識 固有窓方式認識システム トレーニング画像 固有空間 投票 認識結果 投票空間 : 位置 x 画像番号 入力画像 A車の中心 投票方法 wi tj 投票空間 : 位置 x 画像番号 窓の選択 3つの条件により安定な窓を選択 – Detectability – Reliability – Uniqueness Detectability 1枚の画像から安定に抽出できるか? 低 高 Reliability 画像の微少変動でも窓は安定か? a2 不安定 b2 b2 a2 a1 b1 安定 a1 b1 固有空間 Uniqueness 他に類似の窓が存在しないか? a1 a2 unique a1 b1 a2 b1 固有空間 トレーニング画像 乗用車とワゴン車の2台の模型で実験 15度ずつ回転した画像を撮影 入力画像 屋内実験の結果 角度 090 135 270 285 345 165 270 300 315 330 11 6 150 30 39 7 7 56 155 7 19 7 いくつの見えが必要か? アスペクト表現 アスペクト = トポロジー的に見えを分類 アスペクトグラフ C AD ABD D A ACD B A D AB CD AC BC B BD BCD アスペクトの生成法 Face Label F1 F2 F3 F4 F5 F6 F7 F8 1 1 1 0 0 0 0 0 Visible Invisible アスペクトの生成法2 アスペクト法を用いた認識システム ウイングエンジ表現法 • 通常CADシステムで使用 トポロジー情報 エッジ --- ウイングエッジ表現 幾何情報 面 --- 面方程式 頂点 --- 頂点座標 トポロジー情報 PCW NCCW PVert Nface Pface NVert NCW PCCW システム全体 body f1 f2 f3 e1 e2 e3 en v1 v2 v3 vn fn <vantage> Well-tessellated sphere rep represent directions as points on the unit sphere (usually geodesic dome) moving the points on the sphere out by their associated magnitude (usually the distance between a surface point and the mass center) 曲面の記述 曲率 ガウス曲率 拡張ガウス像 曲線のパラメータ化 1. curve -- s arc length s a(s) = ( x(s), y(s) ) a(s) 2. tangent of a curve a’(s) = ( x’(s), y’(s) ) 3. curvature of a curve a”(s) = ( x”(s), y”(s) ) |a”(s)| -- curvature a' ( s) s a( s s) a' ( s s) a(s ) a' ( s) a" ( s) s a' ( s) a' ( s s) 例(円) y 1. Arc length, s s r 2. coordinates r y r sin r sin s r as xs , ys r coss , r sin s r r s r x x r cos r cos s 3. tangent a' s sin s , cos s r r 4. curvature a" s cos s r r , sin s r r 1 r 2 as a" s 1 r a' s as S 曲率の定義 The normal direction (n) toward the empty side. a" s k s ns 曲率による曲線表現 s=0 a b b c d a d arc length c b a s=0 c s=0 d a a b c スケールスペース a + a b + + e d c b f h d a c e g i j k 曲面の曲率 法断面 法曲率 法断面でない 法曲率の最大と最小 = 主曲率 主方向 主曲率 平面: 全ての方向で同じ K1 K2 0 0 球: 全ての方向で同じ K1 K2 円筒: K1 0 K2 0 0 K2 0 0 K2 0 楕円面: K1 双曲面: K1 ガウス曲率と平均曲率 Gaussian curvature K1K2 K K1 K 2 Mean curvature H 2 K1 0 K 0 K2 0 H 0 K1 0 K 0 K2 0 H 0 K1 0 K 0 K2 0 H 0 K1 0 K 0 K2 0 H 0 K1 0 K 0 K2 0 H ? 放物点 ガウス曲率=0の点をつないだ曲線 K 0 K 0 楕円点 K 0 双曲点 放物点 F. Kleinの実験 F.Klein の仮説: 顔の美は放物線の分布 に関係する F.Kleinの実験: アポロ像上の全ての放 物面点をプロット F.Klineの結果: 曲線分布に特別な法則 性はなかった 主曲率線(lines of curvature) 主方向( Principal direction) 最大曲率方向、最小曲率方向 主曲率線 主方向をつないだ曲線 PD PD PD 主曲率線の例 主曲率線上の変曲点 観測方向に不変な特徴 ガウスマップ 1.ガウス写像 2.拡張ガウス像(EGI) 3.拡張ガウス像を用いた認識システム ガウス写像 gauss map 1D gauss map 2D 拡張ガウス像 Extended Gaussian Image (EGI) n1 A1 n4 n1 Gauss mapping n6 n6 n3 n4 A1 n3 n5 n5 n2 n2 球面上に面積に対応した質量をプロットしたもの 拡張ガウス像の例 side view top view Cylinder Ellipsoid 拡張ガウス像の特性 1. EGIが同一になることは、2つの凸多面体の 合同条件 2. ガウス球上での写像面積と実物体の面積の 比はガウス曲率に等しい 3. 球面上でのEGIの重みはガウス曲率の逆数 4. EGIの重心は球の中心 5. 物体の回転とEGIの回転は同期 EGIとガウス曲率の関係 S O 0 O K lim object O large (K: small) O (K: large) small Gaussian sphere S O small S O large S small S large EGIの実装 単位球面の分割 •全てのセルはほぼ同じ大きさ •全てのセルはほぼ同じ形状 •測地ドームである 準正規測地ドーム EGIの使用法 10 20 0 5 8 0 5 8 0 viewing direction EGI table 複素拡張ガウス像 垂直距離と面積を複素重みにエンコード nk k An k dk 0 Pn k An k e jdk 複素EGI n1 A1 n4 n1 Gauss mapping n6 n6 A1e jd1 n3 n4 n3 d1 n5 n2 Origin n5 n2 EGIを使用したビンピッキングシステム Photometric stereo Needle map segmentation isolated regions Region selection target region Photometric stereo precise needle map EGI generation EGI EGI matching object attitude Grasp planning キャリブレーション 照度差ステレオのための参照表 ハンドアイキャリブ ビンピッキングシステム 関数ベース表現 1. 超楕円面 3. 一般化円筒 4. 拡張スネーク 5. 球面関数 超楕円面 楕円面の一般化 x 2 y 2 z 2 [ ] [ ] [ ] 1 a b c 楕円面 1 2 1 超楕円面 2 1 1 2 2 2 x 2 y 2 1 z 1 a b c a b size parameters c 1 shape parameters 2 超楕円面 0.1 1 0.1 2 1 2 2 1.9 1 1 1.9 1 input scene Segmentation result Superquadric representation of a rock grasp plan grasp execution 石拾い(火星探査ロボット用) Symmetry seeking 表現 Snakesの3次元版 x s V ( s, x ) rA (s) : axis position r ( s, x) V ( s, x) rA ( s) エネルギーの定義 内部エネルギー 軸の位置をなるべく保つ Eaxis aV ( s) VA ( s) ds 2 なるべく円形の形状 Ecir br (s) r (s, x) dsdx 2 外部エネルギ 明るさの勾配のある位置に形状 Egrad c G I (V ( s, x)) dsdx 2 2 内部エネルギー+外部エネルギーを最小化 画像からのポテンシャル場 外部エネルギー場 形状生成過程 形状生成過程(ビデオ) 円上表現 2D 形状 l i 同一の長さでサンプル i 1 i i 1 O 円上へマップ 2次元でのマッチング 1 7 2 6 5 4 similar shapes? contours rotation 2 1 0 3 3 7 4 6 5 circular representations 3次元球上投影 Regularization Each Mech has roughly equal area Each mesh has the same topology エネルギー最小化メッシュ 球面の変形 – 内部エネルギー 滑らかさ – 外部エネルギー データ点 特徴 ほぼ同一の面積をもつように P3 P P3 Q P1 G Q P2 P1 G P2 球上属性イメージ Spherical Attribute Image (SAI) Gaussian Curvature Deformed Surface SAI マッチング例 一般化円筒 空間中の軸曲線とそれにそった断面形状 の変化による体積 3次元カーブ S 断面 一般化円筒のクラス分け Warped Skewed Layered GC axis Cross section planes Straight Torridal Cross sections Right Circular Open Transformation rule Polygonal Homogeneous Bilinear Linear Uniform Straight Homogeneous Generalized Cylinders r b R(s) s C(t) n 1. a(s) is a linear func 2. n-b planes are parallel 3. All cross sections have the same shape but may vary in size. モジュール表現 Human Arm Forearm Hand 階層表現 抽出法 Initial light-strip image initial axis estimation preliminary center and axis estimation Corn with smoothed radius function completed analysis ACRONYM USERS Data Structure HI-LEVEL MOOELER LIBRARY CONTEXT GRAPH OBJECT GRAPH modelary module (user → GC) GRAPHICS MODULE prediction module PREDICTOR & PLANNER OBSERVABILITY GRAPH INTERPRETATION GRAPH SURFACE MAPPER PICTURE GRAPH PIX PIX EDGE MAPPER MATCHER interpretation module description module (image → GC) 拘束伝播 特徴の長さの予測 p (1´ f ) / d P [ pl , ph] 対応する特徴の発見 M [ml , mh] L、f、dなどのパラメ ータの範囲の新た な拘束 N ' M AND P [nl , nh] nll (1´ f ) / d nh (1´ f ) / d 解析例 Edge image (PIX) GC description Interpretation graph 拘束伝播例 7 < WING-WIDTH < 12 1000 < M < 12000 7 < WING-WIDTH < 10.5677531 2199 < M < 3322 MATCH -- L1011!!! 2356 < M < 2489 体積表現法 物体固有の座標系で表現 z x y r ( z) x 2 y 2 1. 蓄積が容易 2. 使用が難しい r z 基本物体の集合表現 空間中に占める領域をボクセルで表現 球の集合 1つの物体を表現するのに多くの基本物体が 必要 2次元クアッドトリー 1 2 4 5 Quad-tree 3 6 13 7 8 9 10 11 12 14 15 16 17 18 19 20 21 22 23 24 25 3 3 1 2 4 5 6 7 中間ノード 空ノード 実ノード 13 8 11 12 14 15 20 21 9 10 16 17 22 23 18 19 24 25 3次元オクトトリー オクトトリ表現 – 2次元のクアドトリの3次元版 2 2 0 6 7 3 7 3 3 5 1 1 Oct-tree 中間ノード 空ノード 実ノード Constructive solid geometry(CSG)表現 プリミティブ物体とそれの論理演算で複雑な物体 を表現 CADシステムへの入力 通常CSGからウイングエッジ表現に自動変換 CSGの文法 <CSG rep> :: <primitive solid> | move <CSG Rep> by <Motion params> <CSG Rep><operation><CSG Rep> leaf node: either primitive or motion params other node: Boolean operations (UNION, DIF, INT) セル分割表現 G *複数の表現が存在 まとめ 表面表現法 – 基本面の集まりで表現 » アスペクトグラフ » 拡張ガウス像 » ウイングエッジ表現 関数表現法 – 関数形(生成ルール)で表現 » » » » 一般化円筒 超楕円 Symmetry Seeking 球属性像 体積表現法 – 基本体積の集まりで表現 » constructive solid geometry » オクトトリー
© Copyright 2024 ExpyDoc