講義の計画 確率計算のための 漸化式と動的プログラミング(1) 統計数理研究所 伊庭幸人 A.確率計算のための漸化式と動的プログラミング 転送行列,backward-forward, sum-product, viterbiなどの逐次的な アルゴリズムのまとめとさまざまな一般化,応用について述べる. B. 情報理論再入門 情報理論のうち最も基本となる可逆な情報源圧縮について, 初歩から,MDL原理,ベイズ統計との関連まで. 今年の中央大学での講義3日目の再編集版. C.大数の法則,大偏差,カノニカル分布 確率論の初歩から統計力学との関連まで. 全体のテーマ 学んだはず?のこと,これから学ぶはずのこ と, をより高度かつ総合的な立場からみなおす ⇒ ほぼ独立な3テーマを選んだ 今日のテーマ A.確率計算のための漸化式と動的プログラミング 転送行列,backward-forward, sum-product, viterbiなどの逐次的な アルゴリズムのまとめとさまざまな一般化,応用について述べる. 絵で考えたのと,式で考えたのが, ぴったり対応させられるようになればよい MCMC モンテカルロ関係の講義は今年度は ここではやらない 総合研究大学院大学 「計算推論科学II」 統計数理研究所(広尾) 聴講希望は伊庭まで 1月15日(月) 22日(月) 29日(月) 2月5日(月) 参考書(1) C M Bishop Pattern Recognition and Machine Learning Springer-Verlag 主に Chap.8とChap.13 グラフィカルモデル(Chap.8)はサンプルとして はじめて聞くひとはやさしいところだけ理解すればよい 著者のサイトからダウンロード可能.おすすめ. 大体知っているひとは全体のつながりを再確認しよう 1 参考書(2) ベイズ統計=生成過程からのモデル化 S M Aji and R J McEliece (2000) 一般化分配則による統一的視点 The generalized distributive law IEEE Transactions on Information Theory, 46 pp. 325-343. ↓ 北川源四郎 連続値変数,逐次モンテカルロ法 時系列解析入門 岩波書店 樺島・上田 BPからloopy BPへ 統計科学のフロンティア11 計算統計1 伊庭ほか 逐次モンテカルロ法,マルコフ連鎖モンテカルロ法 統計科学のフロンティア12 計算統計2 浅井 HMMによるゲノム解析,確率文脈自由文法(PCFG) 統計科学のフロンティア9 生物配列の統計 MCMCなどの位置づけ ベイズの公式でひっくりかえす 好きな変数に既知の値(データ)を入れて, 残りを確率変数だと思ってよい HMM(隠れマルコフ模型) xとyを反転 Xi X i+1 ベイズの公式でひっくり返す計算のために MCMC,逐次モンテカルロ,変分ベイズ ビリーフプロパゲーション viterbi などが使われる HMMを式で書くと A. データ全体を与えたときの状態推定 Smoothing(平滑化) 同時確率 事後分布 2 B. 時刻nまでのデータを与えたときの状態推定 C.周辺尤度の計算 Filtering(フィルタリング) likelihood(尤度) これから,遷移確率などのパラメータ を推定する オンライン推定として重要 問題C(尤度の計算)から考える 漸化式(前向き) 計算の量∼ (状態の数)のN乗 計算の量∼ (状態の数)掛けるN 行列記法 状態数をD ⇒ D次元行列をベクトルに演算 1 2 3 4 5 6 D=2 1 2 1 2 3 転送行列法 (統計物理の用語) 1 2 3 4 3 問題Bも同時に解けている 問題Aをどうするか 1 2 3 4 1 2 3 漸化式(後向き) ↑時系列から入った人は注意 後向き漸化式の別表現 4 4 5 5 前と同じ 6 新しい部分 6 グラフと式で説明すると・・ 赤丸は共通 時系列解析で好まれる書き方 北川 「時系列解析入門」 岩波書店 4 統計物理 対応 1次元スピン系(1次元イジング鎖など) 1 2 3 4 4 5 6 無向グラフの描き方1 人間の目と蛸の目(並行進化) タコには盲点が無い 1 2 3 4 1 無向グラフの描き方2 2 3 4 5 各因子(ファクター) ごとに出てくる変数を全部 繋いで完全グラフ(クリーク) にする 確率分布に限定しない 規格化を考えない ほうが便利 参考: ファクターグラフ 緑を全部固定したとき 1 2 4 1 2 3 一意に因子分解の形を決めない ⇒ アルゴリズムを論じるためには より正確な表現が必要 3 4 赤の対が独立でない 赤の対が独立 1 2 3 描き方1 ⇒ 描き方2 ほぼ自明 描き方2 ⇒ 描き方1 Hammersley Cliffordの定理 条件が必要: 任意の状態について確率の値>0 4 この講義では普通の無向グラフだけですますの でやや怪しいところも出てくるかも 5 グラフ表現の意味 高次マルコフ,第2隣接以上の相互作用 ある種の条件を満たす 「式の集合」「分布の集合」「モデルの集合」 を抜き出すフィルター Q 次マルコフ Q 隣接 状態数 D ↓ 状態数 条件式のようなもの メタモデル マルコフ場,2次元イジング 計算の手間: 「帯」が有利 断面の大きさ K 次数 D 家系図(ループなし): ツリー 家系図 母 父 子 確率 ⇒ メンデルの法則 母 父 子 詳細は「ベイズ統計と統計物理」 伊庭幸人 岩波書店 2003 参照 6 root root sum-product algorithm 葉から根 root 根から葉 行ったり来たり root ★ ★★ 「帰り」で「行き」の結果を再利用する 所は似ているけれど,★★とは 違うと思う.sum-productは HMMで普通使われる★の型に近い 7 家系図(ループあり) 他の方法との関係 ループが多くても使える 漸化式の方法 (この講義) 有限回で終わる 厳密(数値誤差以外) 変分的手法 loopy belief prop. マルコフ連鎖 モンテカルロ (MCMC) ある値に収束 収束しても近似 動き続ける 無限回平均で厳密 平均場近似 漸化式の方法 ⇒ 近似分布 D. 全部のデータを与えたときの状態のサンプリング 漸化式の方法 条件付き分布からの サンプリングに使う 状態が連続値をとる場合 システム方程式 システム雑音 観測方程式 観測雑音 のサンプルを生成 宿題 一般化 状態空間 モデル 8 問題点 状態が連続値をとる場合の漸化式 積分の計算がたいへん 和を積分で 確率を確率密度でおきかえる 積分を近似するより「モデル全体をHMMで近似する」 と考えたほうがよいが,いずれにせよ大変 2変数 ∞ ∞状態 ⇒ 2重積分 2変数,2次マルコフ ∞ ∞ ×∞ ∞状態 ⇒ 4重積分 12次マルコフ ⇒ 12重積分 4重を100状態ずつ 100の4乗 ⇒ 1憶状態 2変数 or 1変数で2次マルコフ くらいまでなら可能 北川 「時系列解析入門」 岩波書店 より実際的な方法 がとれる状態を離散化 がとれる状態を離散化 1.ガウス and 線形 2変数 or 1変数 2次 解析的に積分(ガウス積分) ⇒平均と共分散行列の漸化式 カルマンフィルタ 2.非ガウス or 非線形 1変数 逐次モンテカルロ法 (パーティクル・フィルタ, GAの特殊形) マルコフ連鎖モンテカルロ法 などを使う 統計科学のフロンティア12 計算統計II 線形ガウス状態空間モデル 岩波書店 注意1 カルマンフィルタにも B.フィルタリング カルマンサンプラー のほかに, A.平滑化,C.尤度計算,D.サンプリング が全部揃っている(原理同じ,A,Dは導出面倒) を状態変数に使うなどでARモデルなど さまざまなモデルを表現できる. オンラインでBを使うことが一番多いので 「カルマンフィルタ」で全部を代表することが多い 9 注意2 2変数の線形ガウス状態空間モデル, それを解く カルマンフィルタ 各式は,2つの式を連立させたものになる 2状態の隠れマルコフモデル 各式は2変数の線形の式 まったく違うので注意! 2変数 ⇔ ∞ ∞状態! (たとえば共分散の時間発展は非線形) 10
© Copyright 2024 ExpyDoc