Principal Components Analysis and Neural Network

Principal Components Analysis and Neural Network
Implementation of Photometric Stereo
Yuji Iwahori, Robert J. Woodham,
Ardeshir Bagheri (1995)
1 Introduction
Photometric Stereo(照度差ステレオ)の実装
Principal Components Analysis (主成分分析)
ある空間から、次元を落として部分空間を抽出す
るための線形処理テクニック。計算能力の問題
(ill-conditioned)を解決するために用いる。
Neural Network
非パラメットリック関数を近似する特性を利用し
て、入力空間とそれに対応する表面配向のマッ
ピングを学習する。データは校正球面から得る。
影や相互反射の影響による信頼性の評価に用
いる。
2 Photometric Stereo (1)
物体の表面
z  f ( x, y)
:Z方向は観察者への方向
正射影によって、2次元画像に投影される
表面法線ベクトル
[n1, n2, n3]
:ベクトル長は1とする
画像照度方程式
E( x, y)  R(n1, n2 , n3 )
E( x, y) :画像照度
R(n1 , n2 , n3 ) :反射率マップ
2 Photometric Stereo (2)
p方向からの光源によって、p画像を使用する時の
画像照度方程式
E1 ( x, y )  R1 (n1 , n2 , n3 )
E2 ( x, y )  R2 (n1 , n2 , n3 )

E p ( x, y )  R p (n1 , n2 , n3 )
全ての照明の方向がほぼ同一線上にあった場合
問題発生(ill-conditioned)
Principal Components Analysis(主成分分析)
3 Principal Components Analysis (1)
PCAは多変量解析の手法の一つ。もとの変数間
の類似性に基づいて、新たな少数の変数へと集
約する。
新たな変数
主成分
主成分は対象データの「分散」を最大化するよう
に設定される。また、主成分同士は互いに独立で
ある。
最終的に変数を集約するために、もとの変数より
も少ないだけの主成分を抽出する。
3 Principal Components Analysis (2)
主成分を求めるために、共分散行列の固有方
程式を解き、固有値と固有ベクトルを求める。
2
共分散行列は、対角要素が各変量の分散 si 、そ
れ以外の第ij要素はi番目の変量とj番目の変量の
共分散 sij となっている行列のこと。
 s12

 s12
S 
 
s
 1p
s12
s2
2

s2 p
 s1 p 

 s2 p 

  
2
 s p 
3 Principal Components Analysis (3)
1. p入力画像からp×pの共分散行列 K を計算する。
2. 固有ベクトル kと固有値 kを求める。(k  1,2,..., p)
列が k であるp×p行列を とする。
画像照度を [ E1, E 2, E3,...,Ep] とする。
主成分: [ A1, A2, A3,..., Ap]
主成分Akの分散の
 A1 
 E1 
A 
E 
 2   T  2 
  
  
 
 
 Ap 
 E p 
全体に占める割合
k

p
i 1
i
4 NN Functional Approximation
4.1 RBF Networks and OLS Learning (1)
Radial Basis Function neural network
多次元解析に用いられる非関数近似の方法の一つ。学習
によってフィードフォワードネットワークを構成する。
基底関数
ガウス関数
基底関数の出力を線形結合することによって
ネットワークの出力とする。
Orthogonal Least Squares (直交最小2乗法)
近似値と観測値との残差の2乗を求め、それを最小とする
ような近似関数を求める方法。基底関数の中心を選択す
るのに適用される。十分なネットワークが構成されるまで、
その手続きは繰り返される。
4 NN Functional Approximation
4.1 RBF Networks and OLS Learning (2)
RBFネットワークは2層から
成る(図はPの隠れ層と、3つ
の出力層から成る)。
1度の学習手続きによって、
ニューロンが1つずつネット
ワークに追加される。2乗和
誤差が目標値に達するか、
またはニューロンの数が最
大になるまで繰り返される。
図: Radial Basis Function
Neural Network
本手法では2つのRBFネットワークを構成
第1のネットワークは入力から表面配向を予測
[ A1 , A2 , A3 ]
[n1 , n2 , n3 ]
4 NN Functional Approximation
4.2 A 2nd Network Estimates Confidence
さらに入力を逆に予測するようなネットワークを生成
第2のネットワークは出力された表面配向から入力を予測
[ A1 , A2 , A3 ]
[n1 , n2 , n3 ]
実際の入力と逆予測された入力を比較し、信頼評価を行う
(影や相互反射に影響される領域)。
A1
A2
A3
'
n1
n2
n3
RBF
NN 1
RBF
NN 2
A1
'
A2
'
A3
d  ( A1  A1 ) 2  ( A2  A2 ) 2  ( A3  A3 ) 2
'
'
'
5 Experiments
5.1 Experimental Setting
5.2 Calibration
陶器の球体(キャリブレーション用)と陶器の男性の顔を
使用する。ともに同じ物質であり、同じ反射特性を持つ。
光学台に対象物を取り付け、光源の角度を約2度ずつず
らしながら7方向からの画像を撮影する。
5 Experiments
5.3 Results (1)
共分散行列 K 、固有ベクトル 、固有値 k は以下となる。
1.5058
1.4394

1.4006

K  103  1.4009
1.4003

1.4372
1.4288

1.4394 1.4006 1.4009 1.4003 1.4372 1.4288
1.3937 1.3712 1.3337 1.3224 1.3795 1.3731
1.3712 1.3687 1.2887 1.2664 1.3462 1.3423

1.3337 1.2887 1.3209 1.3303 1.3412 1.3329
1.3224 1.2664 1.3303 1.3531 1.3403 1.3336

1.3795 1.3462 1.3412 1.3403 1.3862 1.3874
1.3731 1.3423 1.3329 1.3336 1.3874 1.4073
0.3597  0.0392 0.2414
0.3799 0.2899 0.2344

0.3709 0.6472 0.2223

  0.3694  0.3248 0.2213
 0.3693  0.6235 0.1592

 0.3801 0.0056  0.2307
0.3796 0.0355  0.8426

1 7   103  9.5662
0.7499
0.3628  0.2608
0.0893  0.0331 0.6855
 0.4604 0.1362  0.3658
 0.1585  0.2822 0.3555
 0.4020 0.2612  0.2233
 0.1699  0.7745  0.3521
 0.0459
0.3179
0.1671
0.1470
 0.4875
0.1728

0.6913
 0.4120

 0.2228
0.1168
0.1166 0.0398 0.0084 0.0024 0.0012 0.0009
固有値の大きい順に3つの主成分を用いる
5 Experiments
5.3 Results (2)
キャリブレーションによって得られた値をプロット
照度(E1,E2,E3)は直線に沿って集中し高い相関がある。
一方、主成分(A1,A2,A3)は相関が低くなっている。
図(a) Plot of (E1,E2,E3)
図(b) Plot of (A1,A2,A3)
5 Experiments
5.3 Results (3)
RBFネットワークの学習
キャリブレーションによって得た、(A1,A2,A3)と
(n1,n2,n3)の対応を各ネットワークに学習させる。
第1のネットワーク
一般化
第2のネットワーク
妥当評価
50世代まで学習
100世代まで学習
図(a) (A1,A2,A3) to (n1,n2,n3) 図(b) (n1,n2,n3) to (A1,A2,A3)
5 Experiments
5.3 Results (4)
観察者(カメラ)の方向を向いた像の画像の場合
(a) 7つの入力画像の一つ
(b) 勾配角度(表面法線ベクトルと観察方向のベクトル間の角度)
(c) アスペクト(表面法線ベクトルのXY平面上への射影)
(d)信頼評価d(明るい領域は信頼が低い、影や相互反射)
(a) Boy-1 image
(b) Boy-1 slope
(c) Boy-1 aspect
(d) Boy-1 confidence
5 Experiments
5.3 Results (5)
位置を変更した像の画像の場合
(a) 7つの入力画像の一つ
(b) 勾配角度(表面法線ベクトルと観察方向のベクトル間の角度)
(c) アスペクト(表面法線ベクトルのXY平面上への射影)
(d)信頼評価d(明るい領域は信頼が低い、影や相互反射)
(a) Boy-2 image
(b) Boy-2 slope
(c) Boy-2 aspect
(d) Boy-2 confidence
6 Conclusion
照度差ステレオの新しい実装方法を提案
•主成分分析によって対象データの次元を減少させる。
•RBFニューラルネットワークとOLSによって、入力空間
と表面法線ベクトルとの対応マッピングを生成。
•RBFニューラルネットワークによって、影や相互反射の
影響を受けている領域の信頼評価。
この実装方法は、経験的な手法によってのみ行われ、
光源方向や反射率等の条件を必要としない。対象物
体と同じ物質(同じ反射率)からなる物体の校正による
データさえあればよい。