藤吉研究室ミーティング - MPRG : 機械知覚

TextonBoost:Joint Appearance, Shape and
Context Modeling for Multi-Class Object
Recognition and Segmentation
伊原有仁
はじめに

一般物体認識

TextonBoost:Joint Appearance, Shape and Context Modeling for
Multi-Class Object Recognition and Segmentation
[J.Shotton et al. ECCV’06]
CRFモデルの作成
Alpha-expansion graph-cut algorithmによるセグメンテーション
TextonBoost
Image Database

Microsoft Researchで提供されている591枚の画像




学習用画像 45%
検証用画像 10%
テスト用画像 45%
21クラスに分類

Building, grass, tree, cow, sheep, sky, aeroplane, water, face, car
bike, flower, sign, bird, book, chair, road, cat, dog, body, boat
手作業でラベル付け
TextonBoost
Conditional Random Field モデルの作成

shape, texture, color, location, edgeの情報を1つの
モデルとして扱う
TextonBoost
Shape-texture potentials(1/3)

Texton

17種類のfilter bank
出力値を用いたマハラノビス距離による
k-meansクラスタリング
Texton mapの生成
TextonBoost
Shape-texture potentials(2/3)

Texton mapから特徴量抽出

Shape filterの使用(Integral imageによる効率化)
矩形領域 r にtexton t がどれだけ存在しているか

矩形領域の面積をA

i1→A,i2→0,i3→A/2
TextonBoost
Shape-texture potentials(3/3)

Textonの位置による特徴量の変化
TextonBoost
Joint Boosting(1/2)

マルチクラス識別器の構築
注目クラスは残りのクラスに対して弱識別器を構築
TextonBoost
Joint Boosting(2/2)

マルチクラス識別器の構築
評価値の算出
重みの更新
TextonBoost
Color potentials

Gaussian Mixture Model

CIELab
パラメータの算出
TextonBoost
Edge potentials

Pottsモデル

近傍ピクセルが異なるラベルであるか調べる
TextonBoost
Location potentials

絶対位置における確率(LUTで保持)

例:skyなら画像の上の方に反応がある
TextonBoost
Sub-sampling

メモリの軽減

設定したグリッド上を計算
– 3×3, 5×5
TextonBoost
Random feature selection

特徴量をランダムで選択
精度の保持と学習の高速化
TextonBoost
セグメンテーション

最大化するラベルcの決定

Alpha-expansion graph-cut algorithm
TextonBoost
実験:Boosting accuracy
(a) 弱識別器の数とエラー
(b)弱識別器の数と精度
276枚の学習用画像
学習回数5000回
特徴量選択有:42時間
特徴量選択無:14,000時間
TextonBoost
実験:Object class recognition and segmentation
TextonBoost
実験:セグメンテーションと認識精度&速度比較

Unary classifier only において有効

Texton Boostは効果的
TextonBoost
セグメンテーション失敗例
TextonBoost
クラス毎の精度

全体の精度は72.2%
TextonBoost
異なるデータベースによる出力例

異なるデータベースにおいても認識可能
TextonBoost
各モデルの出力例

CRFモデルにおいて各モデル毎の結果




(a) 入力画像
(b) 識別器のみ(Shape-texture)
(c) Colorモデルなし
(d) 全てのモデルを使用
TextonBoost
おわりに

Texton Boost





appearance, shape, context情報を同時に捉える特徴量
Boostingとピクセルごとの効果的な学習法
特徴量の共有とIntegral imageの組み合わせによるラベリング
意味のあるcontext情報の追加
物体の構造

object ‘parts’
TextonBoost