確率モデルによる 画像処理技術入門

物理フラクチュオマティクス論
Physical Fluctuomatics
第1回 確率的情報処理の概観
1st Review of probabilistic information processing
東北大学 大学院情報科学研究科 応用情報科学専攻
田中 和之(Kazuyuki Tanaka)
[email protected]
http://www.smapip.is.tohoku.ac.jp/~kazu/
本講義のWebpage:
http://www.smapip.is.tohoku.ac.jp/~kazu/PhysicalFluctuomatics/2007/
2007/4/17
物理フラクチュオマティクス論(東北大)
1
本講義の参考図書
田中和之著: 確率モデルによる画像処理技術入門,
森北出版, 2006.
田中和之編著: 臨時別冊・数理科学SGCライブラリ
「確率的情報処理と統計力学 ---様々なアプローチと
そのチュートリアル」, サイエンス社,2006.
2007/4/17
物理フラクチュオマティクス論(東北大)
2
本講義の参考文献
田中和之・樺島祥介編:ミニ特集/ベイズ統計・統計力学と情報処理, 計測と
制御 2003年8月号.
樺島祥介編:小特集/確率を手なづける秘伝の計算技法~古くて新しい確率・
統計モデルのパラダイム~,電子情報通信学会誌 2005年9月号.
K. Tanaka: Statistical-mechanical approach to image processing (Topical
Review), Journal of Physics A: Mathematical and General, vol.35, no.37,
pp.R81-R150, 2002.
H. Nishimori: Statistical Physics of Spin Glasses and Information
Processing, ---An Introduction, Oxford University Press, 2001.
M. Opper and D. Saad D (eds): Advanced Mean Field Methods --- Theory
and Practice, MIT Press, 2001.
C. M. Bishop: Pattern Recognition and Machine Learning, Springer,
2006.
2007/4/17
物理フラクチュオマティクス論(東北大)
3
情報通信技術のもたらした恩恵
コンピュータの家電化(高速化と低価格化)
インターネットの普及(大容量通信)
情報通信技術(Information & Communications
Technology; ICT)の恩恵の実感
より高度な賢さに対する要請
単に安くて高速であればよいというわけではない
2007/4/17
物理フラクチュオマティクス論(東北大)
4
情報処理の守備範囲の推移
数値計算のための情報処理
作業手順が与えられている.
理詰めの情報処理
法則・命題群からの予測
コンピュータの発達により現実化
現実世界の情報処理
現象の起こる要因の多様性
必要なデータが完全に得られるわけではない.
大量のデータは得られるが必要な情報の抽出が難しい.
「すぐ分かること」と「本当に知りたいこと」のギャップからくる
不確実性→何とかして克服したい!!
2007/4/17
物理フラクチュオマティクス論(東北大)
5
これからのコンピュータに対する要請
人並みの能力
ユーザーの意を汲んでくれる能力(知識)
失敗や経験を次に生かす能力(学習)
「すぐ分かること」と「本当に知りたいこと」の
ギャップからくる不確実性を如何に埋めるか?
知識と不確実性を数式化
不確実性をともなうデータにおける情報処理の実現
2007/4/17
物理フラクチュオマティクス論(東北大)
6
不確実性を伴う情報処理の数理モデル
不確実性の数学的表現→確率・統計
モデル化
確率推論
医療診断
故障診断
危険予知
ネットワーク構造をもつ
数理モデル(ベイジアンネットワーク)
ノードは事象,矢印は
条件付き確率に対応
不確実性を伴うデータに耐えうる推論システム
閉路のあるグラフ
単純な機能を持つたくさんの要素が関連し合い,互
いに協力して複雑・高度な機能を生み出す.
重要な概念のひとつ
2007/4/17
物理フラクチュオマティクス論(東北大)
7
確率的情報処理のモデル化とアルゴリズム
ベイズの公式
確率的情報処理
確率モデル
モンテカルロ法
近似アルゴリズム
モンテカルロ法
マルコフ連鎖モンテカルロ法
乱択アルゴリズム
遺伝的アルゴリズム
近似アルゴリズム
確率伝搬法
平均場法
2007/4/17
ポイントは
ランダムネスと近似
物理フラクチュオマティクス論(東北大)
8
確率的画像処理
田中和之著: 確率モデルによる画像処理技術入門,
森北出版,2006.
確率的画像処理手法によるノイズ除去
基本単位は画素
画素上の数字は
ディスプレイの
光の強度
192
202
190
202
219
120
100
218
110
最も簡単な既存のフィルター
192 202 190


Average202 219 120  173
100 218 110


192
202
190
202
173
120
100
218
110
信号処理の知見をもとにした画像処理の確率モデル化
マルコフ確率場モデル
2007/4/17
アルゴリズム化
物理フラクチュオマティクス論(東北大)
確率的画像処理
9
確率的画像処理
田中和之著: 確率モデルによる画像処理技術入門, 森北出版, 2006.
劣化画像(ガウス雑音)
確率的画像処理手法
MSE:520
MSE: 2137
ローパスフィルター
MSE:860
2007/4/17
ウィナーフィルター
MSE:767
物理フラクチュオマティクス論(東北大)
メジアンフィルター
MSE:1040
10
誤り訂正符号
Y. Kabashima and D. Saad: J. Phys. A: Vol.37, No.6, 2004.
松嶋,和田山他著:小特集「ターボ符号・LDPC 符号と繰り返し復
号の理論」, 電子情報通信学会誌, vol.88, no.4, 2005.


符号化


G  J 0

J0
ノイズ

n


G   J
伝送路
  
J  J0  n

復号化
ターボ符号,低密度パリティ検査符号(LDPC)と呼ばれる繰り返し計
算型の高性能の復号アルゴリズムができる.
2007/4/17
物理フラクチュオマティクス論(東北大)
11
誤り訂正符号
Y. Kabashima and D. Saad: J. Phys. A: vol.37, no.6, 2004.
松嶋,和田山他著:小特集「ターボ符号・LDPC 符号と繰り返し復号の理
論」, 電子情報通信学会誌, vol.88, no.4, 2005.
送信ミス
010
000001111100000
符号化
001001011100001
復号
多数決
最も簡単な誤り訂正符号
0
1
0
010
パリティ検査符号
ターボ符号・低密度パリティ検査符号(LDPC)
高性能の復号アルゴリズムへと進化
2007/4/17
物理フラクチュオマティクス論(東北大)
12
誤り訂正符号
1
1
1
0
0
0
  
J  J0  n
0
1
0
0
J
1
0
0
1
0
1
1
復号
誤り
検出
物理フラクチュオマティクス論(東北大)
0
?
0
0

1
1
0
2007/4/17
0
0
1
J0
0
0
0
0
0
1
0
1
1
0
0
0
0
0

n
1
0
1
1
0
Noise
1
0
1

G  J 0
0
0

1
1
1

1
1
0
0
並べ
替え
1
0
0
100111010
1
100
111
符号化
010
0
1
0
0

G   J

13
CDMA復調法の性能評価
T. Tanaka, IEEE Transactions on Information Theory,
Vol.48, No.11, pp.2888-2910, 2002
移動体通信にスピングラス理論が使える.
ノイズ
話し手の信号

拡散符号系列
2007/4/17
無線
通信
他人の
会話
拡散符号系列

復号処理
基地局の
受信信号
物理フラクチュオマティクス論(東北大)
この復調方式をベイズ
の公式で確率モデル化
すると磁性体の物理モ
デルで表される.
14
公開鍵暗号
Y. Kabashima, T. Murayama and D. Saad, Phys. Rev. Lett., 2000.
ゴルフコース問題と情報の秘匿
カップが天辺にあれば
何度得ってもボールは
もどってくる
鍵
カップが底にあれば
どこから打ってもボー
ルはカップインする.
エネルギー関数による暗号設計の基本戦略
2007/4/17
物理フラクチュオマティクス論(東北大)
15
人工知能
ベイジアンネット
繁桝算男, 本村陽一, 植野真臣共著:ベイジアンネットワーク概説,培風館, 2006.
AC
AR
AS
AW
確率推論システム
2007/4/17
確率伝搬法
(Belief Propagation)
の提案による実用化の進展
物理フラクチュオマティクス論(東北大)
16
情報通信トラフィック
堀口剛, 電子情報通信学会誌2005年9月号.
確率モデルがインターネットのパケット流制御に使える.
物理モデルのある種のダイ
ナミックスとして書き換えら
れる.
どの経路を通ってパケットが届けられるかは
その経路の距離と途中のルーターの混みぐ
あいによって決まる.
2007/4/17
物理フラクチュオマティクス論(東北大)
17
ネットワークにおけるハブの役割の統計解析
例:仙台からベネチアまで飛行機で移動したいとしたら
ジェノバ
新潟
仙台
東京成田
ミラノ
札幌
ベネチア
ハブ空港のおかげで
世界的距離が短くなる
(スモールワールド).
フィレンツェ
もしすぐ近くの空港としか航空便
がなければ何回乗り継ぎをしな
ければならなくなるだろう.
もしすべての空港間で航
空便が運行していたら何
台飛行機が必要だろう.
ハブの役割を果たす空港は多い必要はないが,ある程度の数は必要.
ハブの役割にも種類がある(日本のハブ空港,アジアのハブ空港,世界のハブ空港).
空港のネットワークに階層構造が生まれる.
空港間・航空会社間の競争の原理
から生み出され,最適化されている.
さまざまのネットワークにおける共通の数理の存在
2007/4/17
物理フラクチュオマティクス論(東北大)
18
自然現象と物理モデル
水はなぜ氷になるのだろう?
冬になると何故,結露が起こるのだろう?
鉄は何故,磁石になるのだろう?
鉄や銅は何故,電流は流すのだろう?
低温になると電気抵抗がなくなる物質があるらしい!!
高温になると鉄は磁石にならなくなるらしい!!
・
・
・
2007/4/17
物理フラクチュオマティクス論(東北大)
19
強磁性体と確率モデル


線分で結ばれたノード対の
スピン同士が同じ向きを向
くほど確率が高くなるよう
に確率モデルを設計
2007/4/17

スピンがいくつか集まると周りのスピンの状
態をよく見ながら自分の状態を決めないとい
けなくなる もっとたくさん集まったらどうなるか?
物理フラクチュオマティクス論(東北大)
20
強磁性体の確率モデルと More is different
p
p
p


マルコフ連鎖モン
テカルロ法による
サンプリング
p




p が小さい
p が大きい
無秩序状態
秩序状態
More is different.
ある p の値の付近で
ゆらぎが大きくなる.
量が増えれば質が変わる
2007/4/17
物理フラクチュオマティクス論(東北大)
21
たくさんが関連して集まり構成されたシステム:
情報と物理が扱う対象に共通する概念
ビットが集まってデータを形成し,コトとなる.
主な研究対象
情報工学:コト
データ
物理:モノ
0,1
ビット
101101
110001
01001110111010
10001111100001
10000101000000
11101010111010
1010
コト(データ)
物質・自然現象
並びをきちんと決めることによって意味のある文章になる.
共通点:たくさんが関連
分子が集まって物質を形成し,モノになる.
分子
分子同士は引っ張り合っている.
2007/4/17
物理フラクチュオマティクス論(東北大)
モノ(物質)
22
確率的情報処理における計算の壁
不確実性を確率・統計を用いて表現することの代償
起こりやすいことも起こりづらいこともまじめ
に考慮して計算
計算量的困難
近似アルゴリズムの導入による計算困難の打破
2007/4/17
物理フラクチュオマティクス論(東北大)
23
ポイントは何か
2N 通りの和が計算できるか?
    f x , x ,, x 
x1 T,F x2 T,F
xN T,F
1
2
このプログラムでは
N=10個のノードで1秒かかるとしたら
N=20個で約17分,
N=30個で約12日,
N=40個で約34年かかる.
N
a  0;
for(x1  T or F){
for(x2  T or F){

for(x N  T or F){
a  a  f  x1 , x2 , , xL ;
}

}
}
2007/4/17
物理フラクチュオマティクス論(東北大)
N 重ループ
24
何故,確率的情報処理に物理的視点が有効なのか?
物質はたくさんの分子から構成されている
(1 mol の中に 約N=1023個の分子)
分子と分子の間には分子間力が働いている.
 f x , x ,, x 
1
x1
x2
2
N
xN
のような多重和の大規模計算が宿命(厳密計算は断念)
近似理論によるアプローチ
統計科学による情報処理も同じ多重和の計算が要請される.
物理学的計算手法の情報処理への使い回しが可能
2007/4/17
物理フラクチュオマティクス論(東北大)
25
確率的情報処理の要約
問題設定:社会的・工学的要請
情報通信技術,像情報処理,人工知能
モデル化:統計科学にもとづく定式化
評価関数,事後確率としての確率モデル化
アルゴリズム設計:物理的計算技法の転用
平均場理論をはじめとする近似理論の活用
性能評価:できれば統計的かつ解析的に行いたい!!
性能限界の導出
物理的手法の
転用が可能
アルゴリズム動作の統計的解析
2007/4/17
物理フラクチュオマティクス論(東北大)
26
モノの理とコトの技の学術的循環
コトの技を通して
モノの理を鍛える
モノの理による
新たなコトの技の
創出
共通の数理
情報統計力学
確率的情報処理
学術的循環
学術的循環
統計科学
物質の性質・自然現象の理解・予言
データからの情報の抽出・加工
モノの理
物理学
コトの技
情報工学
田中和之編著: 数理科学別冊「確率的情報処理と統計力学 ---様々な
アプローチとそのチュートリアル---」,サイエンス社,2006年9月刊行.
2007/4/17
物理フラクチュオマティクス論(東北大)
27
確率的情報処理 (Probabilistic Information
Processing) のWebを介しての更なる拡大
ポイントはやはり「たくさんが関連」
ICT 技術の要請に耐えうる統計科学
通信理論・像情報処理・確率推論
データマイニング
統計科学
複雑ネットワーク科学
計算理論
統計的学習理論
情報統計力学
確率的情報処理のこれからの数理的基盤
コトの物理学としての定着
2007/4/17
物理フラクチュオマティクス論(東北大)
28
本日のまとめ
確率的情報処理の意義
確率的情報処理の事例紹介
自然現象とMore is different
More is different の確率的情報処理への転用
次回以降
確率・統計の基礎知識(第2回,第3回)
確率過程(第4回)
線型モデル(第5回)
・
・
・
2007/4/17
物理フラクチュオマティクス論(東北大)
29