奈良女子大集中講義 - Kyoto University Bioinformatics

奈良女子大集中講義
バイオインフォマティクス (9)
相互作用推定
阿久津 達也
京都大学 化学研究所
バイオインフォマティクスセンター
講義予定
• 9月5日
–
–
–
–
分子生物学概観
分子生物学データベース
配列アラインメント
実習1(データベース検索と配列アラインメント)
• 9月6日
–
–
–
–
モチーフ発見
隠れマルコフモデル
カーネル法
進化系統樹推定
• 9月7日
–
–
–
–
タンパク質立体構造予測
相互作用推定
スケールフリーネットワーク
実習2(構造予測)
内容
• 相互作用の種類
• 遺伝子ネットワーク推定
• タンパク質相互作用推定
相互作用の種類
• 遺伝子間相互作用
– どの遺伝子が、どの遺伝子を、どのように制御する
か?
• タンパク質間相互作用
– どのタンパク質と、どのタンパク質が結合するか?
• 化合物-タンパク質間相互作用
– どの化合物と、どのタンパク質が結合するか?
• タンパク質-DNA間相互作用
– どのタンパク質が、DNAのどの部分に結合するか
?
遺伝子発現データからの遺伝子ネットワーク推定
• DNAマイクロアレイ・
DNAチップ技術の進歩
により、数千種類の遺
伝子の発現量が同時に
測定可能となった
• そこで、環境変化(熱シ
ョック、栄養状態)や発
生、細胞分裂時の遺伝
子の時系列データを観
測して、その結果から
遺伝子の制御関係(ネ
ットワーク)を推定
ネットワーク推定のための離散モデル
• ブーリアンネットワーク
– 発現状態を 0,1 の2値で表現し、ブール関数により制御規
則を表現
– デジタル回路と本質的に同じ
• ベイジアンネットワーク
– 制御規則を確率的な規則を用いて表現
• ペトリネットモデル
– トークンの遷移規則により制御規則を表現
ネットワーク推定のための連続モデル
• 線形微分方程式系
– 線形の微分方程式で制御規則を表現
• 非線形微分方程式系
– 非線形の微分方程式で制御規則を表現
• グラフィカルモデリング
– 変数の因果関係をグラフと確率を用いて表現
• ハイブリッドペトリネット
– 微分方程式 + ペトリネット
線形微分方程式系を用いたネットワーク推定(1)
• vi(t): 遺伝子 vi の時刻 t における発現量
• 各遺伝子の発現量の変化が以下の微分方程式に従うと仮定
• 問題: t=Δ, 2Δ, 3Δ, 4Δ, … における vi(t) の値が与えられたとし
て、すべての ai,j を推定
dvi (t )
 ai , 0  ai ,1v1 (t )  ai , 2 v2 (t )    ai ,n vn (t )
dt
• 推定法: dvi(t)/dt を (vi(t+Δ) - vi(t))/Δ で近似 ⇒ 差分方程式
vi (t  )  vi (t )
 ai , 0  ai ,1v1 (t )  ai , 2 v2 (t )    ai ,n vn (t )

• vi(t+Δ) - vi(t) は定数とみなせるので、この式は ai,j を
未知変数とする連立一次方程式
• 最小二乗法などを用いて最適な解を計算
線形微分方程式系を用いたネットワーク推定(2)
•
•
vi(t): 遺伝子 vi の時刻 t にお
ける発現量
問題: t=Δ, 2Δ, 3Δ, 4Δ, … に
おける vi(t) の値が与えられた
として、すべての ai,j を推定
dv1 (t )
 a1,0  a1,1v1 (t )  a1, 2 v2 (t )  a1,3v3 (t )
dt
dv2 (t )
 a2,0  a2,1v1 (t )  a2, 2 v2 (t )  a2,3v3 (t )
dt
dv3 (t )
 a3,0  a3,1v1 (t )  a3, 2 v2 (t )  a3,3v3 (t )
dt
dv1 (t )
 1.5  1.2 v2 (t )
dt
dv2 (t )
 2.0  0.5 v1 (t )  1.2 v3 (t )
dt
dv3 (t )
 1.0  1.3 v1 (t )
dt
•
この例のグラフと微分方程式の関係はイメージ図であり正確ではない
ドメイン間相互作用に基づくタンパク質相互作用推定
• タンパク質はドメインとよばれる部品から構成
されていると考えられる
• ドメイン間相互作用を直接計測するのは難し
いか、一部のタンパク質間相互作用は実験に
より計測可能
• 既知のタンパク質間相互作用データからドメ
イン間相互作用を予測
• 未知のタンパク質間相互作用を、予測したドメ
イン間相互作用から推定
ドメイン間相互作用の予測(例)
• 左側の3種類の相互作用データから、右のドメイン間相互作用
を推定
P1
P3
D1
D2
P5
D1
D3
D4
D1 D3
D5
D4
D5
D6
P2
D2
D5
D4
D7
D8
P4
D8
P4
D7
D2
D4
ドメイン間相互作用の確率モデル
• 確率モデル[Deng et al., 2002]
– どれか1組ドメインが相互作用すれば、
タンパク質どうしが相互作用
– 各ドメインペアの相互作用の確率は独立
– Pij=1: タンパク質 Pi と Pj が相互作用
– Dmn=1: ドメイン Dm と Dn が相互作用
Prob( Pij  1)  1 
Pi
Dm
Dn
Pj
 (1  Prob(D
mn
Dmn Pij
 1))
アソシエーション法
• 既知データからのドメインどうしの相互
作用の確率を頻度に基づいて推定
• Imn: ドメインペア Dm, Dn を含むタンパ
ク質のペアのうち、相互作用しているペ
アの個数
• Nmn: ドメインペア Dm, Dn を含むタンパ
ク質のペアの個数
Prob( Dmn
I mn
 1) :
N mn
Pi
Dm
Dn
Pj
EM法
• 尤度を以下(L)のように定義し、それを極大化する一般手
法である EM法 を適用
• fp: false positive rate, fn: false negative rate
• Pij: Pi と Pj が相互作用する確率
• Oij: Pi と Pj の相互作用が観測される確率
fp  P r(Oij  1 | Pij  0)
fn  P r(Oij  0 | Pij  1)
P r(Oij  1)  P r(Oij  1, Pij  1)  P r(Oij  1, Pij  0)
 P r(Pij  1)(1  fn)  (1  P r(Pij  1)) fp
L   (P r(Oij  1) Oij (1  P r(Oij  1))1Oij
まとめ
• 相互作用予測
– 様々な相互作用の種類がある
• 遺伝子間相互作用、タンパク質間相互作用、 ...
• 遺伝子間相互作用推定(遺伝子ネットワーク推定)
– 様々な数理モデルを用いた様々な方法が提案されている
– しかし、決定版とよべる方法はなく、高精度の予測は難しい
• タンパク質間相互作用推定
– こちらも、様々な方法が提案されている
– やはり、決定版とよべる方法はなく、高精度の予測は難しい
• 参考文献
1.
阿久津:バイオインフォマティクスの数理とアルゴリズム、共立出版、2007.