物理フラクチュオマティクス論 Physical Fluctuomatics 第1回 確率的情報処理の概観 1st Review of probabilistic information processing 東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka) [email protected] http://www.smapip.is.tohoku.ac.jp/~kazu/ 本講義のWebpage: http://www.smapip.is.tohoku.ac.jp/~kazu/PhysicalFluctuomatics/2007/ 2007/4/17 物理フラクチュオマティクス論(東北大) 1 本講義の参考図書 田中和之著: 確率モデルによる画像処理技術入門, 森北出版, 2006. 田中和之編著: 臨時別冊・数理科学SGCライブラリ 「確率的情報処理と統計力学 ---様々なアプローチと そのチュートリアル」, サイエンス社,2006. 2007/4/17 物理フラクチュオマティクス論(東北大) 2 本講義の参考文献 田中和之・樺島祥介編:ミニ特集/ベイズ統計・統計力学と情報処理, 計測と 制御 2003年8月号. 樺島祥介編:小特集/確率を手なづける秘伝の計算技法~古くて新しい確率・ 統計モデルのパラダイム~,電子情報通信学会誌 2005年9月号. K. Tanaka: Statistical-mechanical approach to image processing (Topical Review), Journal of Physics A: Mathematical and General, vol.35, no.37, pp.R81-R150, 2002. H. Nishimori: Statistical Physics of Spin Glasses and Information Processing, ---An Introduction, Oxford University Press, 2001. M. Opper and D. Saad D (eds): Advanced Mean Field Methods --- Theory and Practice, MIT Press, 2001. C. M. Bishop: Pattern Recognition and Machine Learning, Springer, 2006. 2007/4/17 物理フラクチュオマティクス論(東北大) 3 情報通信技術のもたらした恩恵 コンピュータの家電化(高速化と低価格化) インターネットの普及(大容量通信) 情報通信技術(Information & Communications Technology; ICT)の恩恵の実感 より高度な賢さに対する要請 単に安くて高速であればよいというわけではない 2007/4/17 物理フラクチュオマティクス論(東北大) 4 情報処理の守備範囲の推移 数値計算のための情報処理 作業手順が与えられている. 理詰めの情報処理 法則・命題群からの予測 コンピュータの発達により現実化 現実世界の情報処理 現象の起こる要因の多様性 必要なデータが完全に得られるわけではない. 大量のデータは得られるが必要な情報の抽出が難しい. 「すぐ分かること」と「本当に知りたいこと」のギャップからくる 不確実性→何とかして克服したい!! 2007/4/17 物理フラクチュオマティクス論(東北大) 5 これからのコンピュータに対する要請 人並みの能力 ユーザーの意を汲んでくれる能力(知識) 失敗や経験を次に生かす能力(学習) 「すぐ分かること」と「本当に知りたいこと」の ギャップからくる不確実性を如何に埋めるか? 知識と不確実性を数式化 不確実性をともなうデータにおける情報処理の実現 2007/4/17 物理フラクチュオマティクス論(東北大) 6 不確実性を伴う情報処理の数理モデル 不確実性の数学的表現→確率・統計 モデル化 確率推論 医療診断 故障診断 危険予知 ネットワーク構造をもつ 数理モデル(ベイジアンネットワーク) ノードは事象,矢印は 条件付き確率に対応 不確実性を伴うデータに耐えうる推論システム 閉路のあるグラフ 単純な機能を持つたくさんの要素が関連し合い,互 いに協力して複雑・高度な機能を生み出す. 重要な概念のひとつ 2007/4/17 物理フラクチュオマティクス論(東北大) 7 確率的情報処理のモデル化とアルゴリズム ベイズの公式 確率的情報処理 確率モデル モンテカルロ法 近似アルゴリズム モンテカルロ法 マルコフ連鎖モンテカルロ法 乱択アルゴリズム 遺伝的アルゴリズム 近似アルゴリズム 確率伝搬法 平均場法 2007/4/17 ポイントは ランダムネスと近似 物理フラクチュオマティクス論(東北大) 8 確率的画像処理 田中和之著: 確率モデルによる画像処理技術入門, 森北出版,2006. 確率的画像処理手法によるノイズ除去 基本単位は画素 画素上の数字は ディスプレイの 光の強度 192 202 190 202 219 120 100 218 110 最も簡単な既存のフィルター 192 202 190 Average202 219 120 173 100 218 110 192 202 190 202 173 120 100 218 110 信号処理の知見をもとにした画像処理の確率モデル化 マルコフ確率場モデル 2007/4/17 アルゴリズム化 物理フラクチュオマティクス論(東北大) 確率的画像処理 9 確率的画像処理 田中和之著: 確率モデルによる画像処理技術入門, 森北出版, 2006. 劣化画像(ガウス雑音) 確率的画像処理手法 MSE:520 MSE: 2137 ローパスフィルター MSE:860 2007/4/17 ウィナーフィルター MSE:767 物理フラクチュオマティクス論(東北大) メジアンフィルター MSE:1040 10 誤り訂正符号 Y. Kabashima and D. Saad: J. Phys. A: Vol.37, No.6, 2004. 松嶋,和田山他著:小特集「ターボ符号・LDPC 符号と繰り返し復 号の理論」, 電子情報通信学会誌, vol.88, no.4, 2005. 符号化 G J 0 J0 ノイズ n G J 伝送路 J J0 n 復号化 ターボ符号,低密度パリティ検査符号(LDPC)と呼ばれる繰り返し計 算型の高性能の復号アルゴリズムができる. 2007/4/17 物理フラクチュオマティクス論(東北大) 11 誤り訂正符号 Y. Kabashima and D. Saad: J. Phys. A: vol.37, no.6, 2004. 松嶋,和田山他著:小特集「ターボ符号・LDPC 符号と繰り返し復号の理 論」, 電子情報通信学会誌, vol.88, no.4, 2005. 送信ミス 010 000001111100000 符号化 001001011100001 復号 多数決 最も簡単な誤り訂正符号 0 1 0 010 パリティ検査符号 ターボ符号・低密度パリティ検査符号(LDPC) 高性能の復号アルゴリズムへと進化 2007/4/17 物理フラクチュオマティクス論(東北大) 12 誤り訂正符号 1 1 1 0 0 0 J J0 n 0 1 0 0 J 1 0 0 1 0 1 1 復号 誤り 検出 物理フラクチュオマティクス論(東北大) 0 ? 0 0 1 1 0 2007/4/17 0 0 1 J0 0 0 0 0 0 1 0 1 1 0 0 0 0 0 n 1 0 1 1 0 Noise 1 0 1 G J 0 0 0 1 1 1 1 1 0 0 並べ 替え 1 0 0 100111010 1 100 111 符号化 010 0 1 0 0 G J 13 CDMA復調法の性能評価 T. Tanaka, IEEE Transactions on Information Theory, Vol.48, No.11, pp.2888-2910, 2002 移動体通信にスピングラス理論が使える. ノイズ 話し手の信号 拡散符号系列 2007/4/17 無線 通信 他人の 会話 拡散符号系列 復号処理 基地局の 受信信号 物理フラクチュオマティクス論(東北大) この復調方式をベイズ の公式で確率モデル化 すると磁性体の物理モ デルで表される. 14 公開鍵暗号 Y. Kabashima, T. Murayama and D. Saad, Phys. Rev. Lett., 2000. ゴルフコース問題と情報の秘匿 カップが天辺にあれば 何度得ってもボールは もどってくる 鍵 カップが底にあれば どこから打ってもボー ルはカップインする. エネルギー関数による暗号設計の基本戦略 2007/4/17 物理フラクチュオマティクス論(東北大) 15 人工知能 ベイジアンネット 繁桝算男, 本村陽一, 植野真臣共著:ベイジアンネットワーク概説,培風館, 2006. AC AR AS AW 確率推論システム 2007/4/17 確率伝搬法 (Belief Propagation) の提案による実用化の進展 物理フラクチュオマティクス論(東北大) 16 情報通信トラフィック 堀口剛, 電子情報通信学会誌2005年9月号. 確率モデルがインターネットのパケット流制御に使える. 物理モデルのある種のダイ ナミックスとして書き換えら れる. どの経路を通ってパケットが届けられるかは その経路の距離と途中のルーターの混みぐ あいによって決まる. 2007/4/17 物理フラクチュオマティクス論(東北大) 17 ネットワークにおけるハブの役割の統計解析 例:仙台からベネチアまで飛行機で移動したいとしたら ジェノバ 新潟 仙台 東京成田 ミラノ 札幌 ベネチア ハブ空港のおかげで 世界的距離が短くなる (スモールワールド). フィレンツェ もしすぐ近くの空港としか航空便 がなければ何回乗り継ぎをしな ければならなくなるだろう. もしすべての空港間で航 空便が運行していたら何 台飛行機が必要だろう. ハブの役割を果たす空港は多い必要はないが,ある程度の数は必要. ハブの役割にも種類がある(日本のハブ空港,アジアのハブ空港,世界のハブ空港). 空港のネットワークに階層構造が生まれる. 空港間・航空会社間の競争の原理 から生み出され,最適化されている. さまざまのネットワークにおける共通の数理の存在 2007/4/17 物理フラクチュオマティクス論(東北大) 18 自然現象と物理モデル 水はなぜ氷になるのだろう? 冬になると何故,結露が起こるのだろう? 鉄は何故,磁石になるのだろう? 鉄や銅は何故,電流は流すのだろう? 低温になると電気抵抗がなくなる物質があるらしい!! 高温になると鉄は磁石にならなくなるらしい!! ・ ・ ・ 2007/4/17 物理フラクチュオマティクス論(東北大) 19 強磁性体と確率モデル 線分で結ばれたノード対の スピン同士が同じ向きを向 くほど確率が高くなるよう に確率モデルを設計 2007/4/17 スピンがいくつか集まると周りのスピンの状 態をよく見ながら自分の状態を決めないとい けなくなる もっとたくさん集まったらどうなるか? 物理フラクチュオマティクス論(東北大) 20 強磁性体の確率モデルと More is different p p p マルコフ連鎖モン テカルロ法による サンプリング p p が小さい p が大きい 無秩序状態 秩序状態 More is different. ある p の値の付近で ゆらぎが大きくなる. 量が増えれば質が変わる 2007/4/17 物理フラクチュオマティクス論(東北大) 21 たくさんが関連して集まり構成されたシステム: 情報と物理が扱う対象に共通する概念 ビットが集まってデータを形成し,コトとなる. 主な研究対象 情報工学:コト データ 物理:モノ 0,1 ビット 101101 110001 01001110111010 10001111100001 10000101000000 11101010111010 1010 コト(データ) 物質・自然現象 並びをきちんと決めることによって意味のある文章になる. 共通点:たくさんが関連 分子が集まって物質を形成し,モノになる. 分子 分子同士は引っ張り合っている. 2007/4/17 物理フラクチュオマティクス論(東北大) モノ(物質) 22 確率的情報処理における計算の壁 不確実性を確率・統計を用いて表現することの代償 起こりやすいことも起こりづらいこともまじめ に考慮して計算 計算量的困難 近似アルゴリズムの導入による計算困難の打破 2007/4/17 物理フラクチュオマティクス論(東北大) 23 ポイントは何か 2N 通りの和が計算できるか? f x , x ,, x x1 T,F x2 T,F xN T,F 1 2 このプログラムでは N=10個のノードで1秒かかるとしたら N=20個で約17分, N=30個で約12日, N=40個で約34年かかる. N a 0; for(x1 T or F){ for(x2 T or F){ for(x N T or F){ a a f x1 , x2 , , xL ; } } } 2007/4/17 物理フラクチュオマティクス論(東北大) N 重ループ 24 何故,確率的情報処理に物理的視点が有効なのか? 物質はたくさんの分子から構成されている (1 mol の中に 約N=1023個の分子) 分子と分子の間には分子間力が働いている. f x , x ,, x 1 x1 x2 2 N xN のような多重和の大規模計算が宿命(厳密計算は断念) 近似理論によるアプローチ 統計科学による情報処理も同じ多重和の計算が要請される. 物理学的計算手法の情報処理への使い回しが可能 2007/4/17 物理フラクチュオマティクス論(東北大) 25 確率的情報処理の要約 問題設定:社会的・工学的要請 情報通信技術,像情報処理,人工知能 モデル化:統計科学にもとづく定式化 評価関数,事後確率としての確率モデル化 アルゴリズム設計:物理的計算技法の転用 平均場理論をはじめとする近似理論の活用 性能評価:できれば統計的かつ解析的に行いたい!! 性能限界の導出 物理的手法の 転用が可能 アルゴリズム動作の統計的解析 2007/4/17 物理フラクチュオマティクス論(東北大) 26 モノの理とコトの技の学術的循環 コトの技を通して モノの理を鍛える モノの理による 新たなコトの技の 創出 共通の数理 情報統計力学 確率的情報処理 学術的循環 学術的循環 統計科学 物質の性質・自然現象の理解・予言 データからの情報の抽出・加工 モノの理 物理学 コトの技 情報工学 田中和之編著: 数理科学別冊「確率的情報処理と統計力学 ---様々な アプローチとそのチュートリアル---」,サイエンス社,2006年9月刊行. 2007/4/17 物理フラクチュオマティクス論(東北大) 27 確率的情報処理 (Probabilistic Information Processing) のWebを介しての更なる拡大 ポイントはやはり「たくさんが関連」 ICT 技術の要請に耐えうる統計科学 通信理論・像情報処理・確率推論 データマイニング 統計科学 複雑ネットワーク科学 計算理論 統計的学習理論 情報統計力学 確率的情報処理のこれからの数理的基盤 コトの物理学としての定着 2007/4/17 物理フラクチュオマティクス論(東北大) 28 本日のまとめ 確率的情報処理の意義 確率的情報処理の事例紹介 自然現象とMore is different More is different の確率的情報処理への転用 次回以降 確率・統計の基礎知識(第2回,第3回) 確率過程(第4回) 線型モデル(第5回) ・ ・ ・ 2007/4/17 物理フラクチュオマティクス論(東北大) 29
© Copyright 2024 ExpyDoc