Resume - 計算神経科学研究室

初期視覚領野の情報表現に関する研究
室蘭工業大学 工学部情報電子工学系学科 計算神経科学研究室 小松 友也
1
はじめに
我々は物体を眼で見て,それが何であるかを判断する.そ
の判断を行うまでには,様々なニューロンが眼から送られ
てきた情報を処理し,次のニューロンへと情報を渡してい
る.特に,初期の段階で処理を行う V1 では,ニューロンの
持つ様々な特徴への選択性によって視覚情報が符号化され,
伝達されている.単純型細胞のニューロンの受容野は刺激
の傾きに対する選択性を持っている.その受容野は,始め
から持っている訳ではない.普段の生活での経験や,成長
過程で学習し,受容野を形成していくのである.その受容
野は,興奮性の領域の両端に抑制性の領域があり,外側に
向かうにつれ減衰していることから,局所的な受容野であ
図 1: スパースコーディングにより獲得した受容野の一部.
ることが分かっている.V1 のニューロンが学習を行った結
果,ガボール状の受容野は刺激の傾きに対して選択性を持
3
ち,自然画像に適している.
先行研究でも行われていたスパースコーディングによる受
これまでの先行研究は,V1 ニューロンの線形和で入力情
容野の獲得を行う.スパースコーディングは,多くのニュー
報が表現できるように受容野の獲得を行うという,生成モ
ロンの反応を抑え,一部のニューロンだけが反応する受容
デルの考え方で進められてきた.こうした研究には,数値
野を獲得する.その受容野は,局所的で V1 ニューロンに
計算による主成分分析の受容野の獲得や,スパースコーディ
よく似た特性を持つことが知られている.この線形シミュ
ングを用いたニューロンの学習 [1] などがある.しかし,本
レーションでは,膜電位 ui を出力として扱っている.学習
来は,脳内演算は非線形な演算によって行われている.
に用いた入力画像は,512 × 512 の画像を 16 × 16 pixel に
本研究では, なぜ V1 ニューロンがガボール状の受容野を
切り出したものを,4480 枚を用いて,ニューロン数は,192
獲得したのかを, 非線形性を考慮したシミュレーションを行
個で行った.学習は次式で与えられる評価関数 E が小さく
い再検討する.
2
なるように学習させる.
ニューロンモデル
ニューロンの動作を理論的に考察するには,モデル化を
E=
行う必要がある.実際のニューロンは非線形で複雑な演算
モデルは次式で表すことができる.
i=1
N
!
i=1
S
"u #
i
(3)
σ
入力データが与えられるごとに評価関数 E が小さくなるよ
(1)
うに次式で更新する.


n
N
n
"
#
!
!
!
λ
ui 
∆ua = −2ρ1 −
Ij waj +
ui
waj wij + S !
(4)
σ
σ
重,θi は閾値,非線形関数 f (x) を通すことで出力 yi が求
められる.非線形関数 f (x) の例として挙げられるものと
j=1
yi wij
i=1
j=1
式 (4) で更新した ui を用いて,結合荷重 wij を次式で更新
しては,階段関数や,シグモイド関数が用いられる.また,
次式を用いると入力の予測値 Iˆ を得ることができる.
Iˆj =
ui wij )2 + λ
と値が単調増加する関数である.学習は,まず膜電位 ui を
Ij wij − θi )
式 (1) で,ui は膜電位,n はニューロン数,wij は結合荷
N
!
N
!
数,σ は u をスケーリングするための係数である.式 (3) の
$ %
第 2 項がスパースコーディングによる拘束項である.S uσi
"
#
u2
は,今回は log 1 + σi2 を用いた.ui の絶対値が増加する
より提案されたニューロンモデルがある.このニューロン
j=1
(Ij −
このとき,n はピクセル数,N はニューロン数,λ は正の定
つつ簡潔な数式で表せるモデルに,McCulloch と Pitts に
n
!
n
!
j=1
を行っている.しかし,ニューロンの特徴的な性質を保ち
yi = f (ui − θi ) = f (
線形シミュレーション
する.
∆wab
(2)
j=1
=
*
−2ρ2 (−ua ) Ib −
N
!
i=1
ui wib
+
(5)
これを繰り返し,評価関数 E が収束するまで学習させる.
式 (2) で,入力画像 Ij が結合荷重 wij の成分をどのくらい
ρ はそれぞれの学習率である.パラメータは,ρ1 = 0.1,
持っているかを,出力 yi が表している.
1
図 2: α = 1 のときのシグモイド関数.
図 3: 非線形な学習により獲得した受容野.
0.1, σλ
ρ2 =
= 0.14 で行った.獲得した受容野の一部を図
1 に示す.V1 ニューロンのようなガボール状の側抑制機構
を持つ受容野が見られる.一つひとつの受容野は疎であり,
ほとんど 0 に近い箇所が多数で,一部分のみが大きな重み
を持つ受容野を獲得した.非線形な V1 ニューロンであって
も,ただ誤差を小さくするだけではなく,スパースコーディ
ングのような拘束条件を加え学習していると考えられる.
4
非線形シミュレーション
線形シミュレーションのスパースコーディングによる学
習をもとに,非線形性を考慮して受容野の学習を行った.線
形近似では膜電位 ui をそのまま出力として用いたが,次式
図 4: スパースコーディングの検証結果.(a) スパースネス
の非線形関数 f (ui ) を用いることで非線形性を考慮した.
f (ui ) =
1
1 + exp(−αui )
の拘束条件の係数を増加した場合.(b) 非線形関数を変更
した場合.
(6)
大きくすることで,影響を大きくするものである.拘束項
この非線形関数は図 2 になり,シグモイド関数である.学
の係数の値は,10 倍の
= 1.4 で行う.2 は,膜電位 u が
0 のときに,出力 f (x) も 0 に近い値にすることでニュー
ロン応答を抑えるものである.これは非線形関数 f (u) を,
習方法については,式 (4),(5) の膜電位 ui を,出力 f (ui )
におきかえて行う.入力データは線形シミュレーションで
用いたものを用い,ニューロン数は 100 個で行う.u の更
λ
σ
f (u − β) として β を変更することで,図 2 のグラフを正負
の方向へ移動させることができる.パラメータは,β = 1 で
新回数は 100 回,w の更新回数は 896,000 枚分学習させた.
パラメータは,ρ1 = 0.1,ρ2 = 0.1, σλ = 0.14, α = 0.75 で
行った.1,2 で獲得した受容野をそれぞれ図 4(a),図 4(b)
行った.
に示す.先ほどと同様に,どちらも滑らかに変化している
学習して獲得した受容野を図 3 に示す.図 3 を見てみる
ことが分かるが,ガボール状の局所的な受容野ではないこ
と,ある程度滑らかに変化していることが分かるが,局在し
とが分かる.この結果から,スパースコーディングだけで
たガボール状の受容野を確認することはできなかった.こ
は V1 ニューロンのような受容野を獲得することはできな
れは,非線形関数を通すことで,スパースコーディングの
いことが確認できた.非線形性を考慮した場合,スパース
効果が弱くなったためであると考えられる.膜電位 u が 0
コーディングの他に別の拘束項が必要であると考えられる.
のとき,非線形関数 f (u) の値は 0.5 である.スパースコー
5
ディングは,出力をなるべく 0 に抑えようとする項である
まとめ
本研究では,従来の線形近似による受容野の獲得をもと
が,ほとんどの出力がある程度の値を持っていたために,十
に,非線形を考慮した V1 ニューロンの受容野の獲得を行
分な効果は得られなかったと考えられる.
い,なぜガボール状の受容野を獲得したのかを再検討した.
先の結果から,スパースコーディングを用いて非線形性
非線形性を考慮したシミュレーションの結果,スパースコー
を考慮するだけで,ガボール状で局所的な受容野は得るこ
ディングのみではガボール状の受容野を獲得することはで
とができるのか検証を行った.検証方法としては,次の二
きなかった.今後の課題としては,スパースコーディングの
つの方法が挙げられる.
他にどのような拘束項を加えるかなど検討する必要がある.
1. スパースコーディングによる拘束項の係数 λ を大きく
参考文献
する.
[1] B.A.Olshausen & D.J.Field,Emergence of simple-cell
receptive field properties by learning a sparse code for
natural images,Nature, Vol. 381, pp. 607–609 (1996).
2. 非線形関数 f (u) の変更.
スパースコーディングの効果が薄いということは,拘束項
の値が小さいという可能性がある.1 は,拘束項の係数を
2