奈良女子大集中講義 バイオインフォマティクス (9) 相互作用推定 阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター 講義予定 • 9月5日 – – – – 分子生物学概観 分子生物学データベース 配列アラインメント 実習1(データベース検索と配列アラインメント) • 9月6日 – – – – モチーフ発見 隠れマルコフモデル カーネル法 進化系統樹推定 • 9月7日 – – – – タンパク質立体構造予測 相互作用推定 スケールフリーネットワーク 実習2(構造予測) 内容 • 相互作用の種類 • 遺伝子ネットワーク推定 • タンパク質相互作用推定 相互作用の種類 • 遺伝子間相互作用 – どの遺伝子が、どの遺伝子を、どのように制御する か? • タンパク質間相互作用 – どのタンパク質と、どのタンパク質が結合するか? • 化合物-タンパク質間相互作用 – どの化合物と、どのタンパク質が結合するか? • タンパク質-DNA間相互作用 – どのタンパク質が、DNAのどの部分に結合するか ? 遺伝子発現データからの遺伝子ネットワーク推定 • DNAマイクロアレイ・ DNAチップ技術の進歩 により、数千種類の遺 伝子の発現量が同時に 測定可能となった • そこで、環境変化(熱シ ョック、栄養状態)や発 生、細胞分裂時の遺伝 子の時系列データを観 測して、その結果から 遺伝子の制御関係(ネ ットワーク)を推定 ネットワーク推定のための離散モデル • ブーリアンネットワーク – 発現状態を 0,1 の2値で表現し、ブール関数により制御規 則を表現 – デジタル回路と本質的に同じ • ベイジアンネットワーク – 制御規則を確率的な規則を用いて表現 • ペトリネットモデル – トークンの遷移規則により制御規則を表現 ネットワーク推定のための連続モデル • 線形微分方程式系 – 線形の微分方程式で制御規則を表現 • 非線形微分方程式系 – 非線形の微分方程式で制御規則を表現 • グラフィカルモデリング – 変数の因果関係をグラフと確率を用いて表現 • ハイブリッドペトリネット – 微分方程式 + ペトリネット 線形微分方程式系を用いたネットワーク推定(1) • vi(t): 遺伝子 vi の時刻 t における発現量 • 各遺伝子の発現量の変化が以下の微分方程式に従うと仮定 • 問題: t=Δ, 2Δ, 3Δ, 4Δ, … における vi(t) の値が与えられたとし て、すべての ai,j を推定 dvi (t ) ai , 0 ai ,1v1 (t ) ai , 2 v2 (t ) ai ,n vn (t ) dt • 推定法: dvi(t)/dt を (vi(t+Δ) - vi(t))/Δ で近似 ⇒ 差分方程式 vi (t ) vi (t ) ai , 0 ai ,1v1 (t ) ai , 2 v2 (t ) ai ,n vn (t ) • vi(t+Δ) - vi(t) は定数とみなせるので、この式は ai,j を 未知変数とする連立一次方程式 • 最小二乗法などを用いて最適な解を計算 線形微分方程式系を用いたネットワーク推定(2) • • vi(t): 遺伝子 vi の時刻 t にお ける発現量 問題: t=Δ, 2Δ, 3Δ, 4Δ, … に おける vi(t) の値が与えられた として、すべての ai,j を推定 dv1 (t ) a1,0 a1,1v1 (t ) a1, 2 v2 (t ) a1,3v3 (t ) dt dv2 (t ) a2,0 a2,1v1 (t ) a2, 2 v2 (t ) a2,3v3 (t ) dt dv3 (t ) a3,0 a3,1v1 (t ) a3, 2 v2 (t ) a3,3v3 (t ) dt dv1 (t ) 1.5 1.2 v2 (t ) dt dv2 (t ) 2.0 0.5 v1 (t ) 1.2 v3 (t ) dt dv3 (t ) 1.0 1.3 v1 (t ) dt • この例のグラフと微分方程式の関係はイメージ図であり正確ではない ドメイン間相互作用に基づくタンパク質相互作用推定 • タンパク質はドメインとよばれる部品から構成 されていると考えられる • ドメイン間相互作用を直接計測するのは難し いか、一部のタンパク質間相互作用は実験に より計測可能 • 既知のタンパク質間相互作用データからドメ イン間相互作用を予測 • 未知のタンパク質間相互作用を、予測したドメ イン間相互作用から推定 ドメイン間相互作用の予測(例) • 左側の3種類の相互作用データから、右のドメイン間相互作用 を推定 P1 P3 D1 D2 P5 D1 D3 D4 D1 D3 D5 D4 D5 D6 P2 D2 D5 D4 D7 D8 P4 D8 P4 D7 D2 D4 ドメイン間相互作用の確率モデル • 確率モデル[Deng et al., 2002] – どれか1組ドメインが相互作用すれば、 タンパク質どうしが相互作用 – 各ドメインペアの相互作用の確率は独立 – Pij=1: タンパク質 Pi と Pj が相互作用 – Dmn=1: ドメイン Dm と Dn が相互作用 Prob( Pij 1) 1 Pi Dm Dn Pj (1 Prob(D mn Dmn Pij 1)) アソシエーション法 • 既知データからのドメインどうしの相互 作用の確率を頻度に基づいて推定 • Imn: ドメインペア Dm, Dn を含むタンパ ク質のペアのうち、相互作用しているペ アの個数 • Nmn: ドメインペア Dm, Dn を含むタンパ ク質のペアの個数 Prob( Dmn I mn 1) : N mn Pi Dm Dn Pj EM法 • 尤度を以下(L)のように定義し、それを極大化する一般手 法である EM法 を適用 • fp: false positive rate, fn: false negative rate • Pij: Pi と Pj が相互作用する確率 • Oij: Pi と Pj の相互作用が観測される確率 fp P r(Oij 1 | Pij 0) fn P r(Oij 0 | Pij 1) P r(Oij 1) P r(Oij 1, Pij 1) P r(Oij 1, Pij 0) P r(Pij 1)(1 fn) (1 P r(Pij 1)) fp L (P r(Oij 1) Oij (1 P r(Oij 1))1Oij まとめ • 相互作用予測 – 様々な相互作用の種類がある • 遺伝子間相互作用、タンパク質間相互作用、 ... • 遺伝子間相互作用推定(遺伝子ネットワーク推定) – 様々な数理モデルを用いた様々な方法が提案されている – しかし、決定版とよべる方法はなく、高精度の予測は難しい • タンパク質間相互作用推定 – こちらも、様々な方法が提案されている – やはり、決定版とよべる方法はなく、高精度の予測は難しい • 参考文献 1. 阿久津:バイオインフォマティクスの数理とアルゴリズム、共立出版、2007.
© Copyright 2025 ExpyDoc