タンパク質 の折り畳み問題と シミュレーション入門

タンパク質の折り畳み問題と
シミュレーション入門
 タンパク質の折り畳み問題の背景
 分子動力学法 (Molecular Dynamics; MD)
 ブラウン動力学法 (Brownian Dynamics; BD)
2006年 9月
東京理科大学 基礎工学部 安藤格士
タンパク質の折り畳み問題。
「アミノ酸配列が与えられたとき、そのタンパク
質のとる立体構造を予測せよ。」
「タンパク質はどのようにして折り畳むのか?」
50年来未解決の難問
題!
立体構造形成は
ひとりでに起きる。
タンパク質は水溶液中で自己組織化する。
タンパク質の3次元立体構造は自由エネルギー最小
の状態に対応する(Anfinsenのドグマ)。
タンパク質-水系の正確なエネルギーを計算できれば、
立体構造を物理化学原理に基づいて予測できる!
Levinthalのパラドックス。
アミノ酸100個からなるタンパク質自身がランダムサーチで全ての構造を経験し
ながら天然構造に至るとする。1つのアミノ酸は3つの構造をとりうるとする。す
るとタンパク質全体で可能な構造の数は、
3100 個
=515377520732011331036461129765621272702107522001 個
=5×1047 個
仮にある構造から別の構造に移るのに、100 ピコ秒(10ー10秒)かかるとすると、
タンパク質の折り畳みにかかる時間は、
5×1047×10ー10秒 = 1.6×1030 年
しかし、実際のタンパク質はミリ秒のオーダーで折り畳む。すなわち、タンパク質
は全ての構造をランダムにサーチしているのではない!
シミュレーションでタンパク質の折り畳む様子を見てみたい!
“タンパク質の折り畳み問題“は
なぜ重要?
タンパク質は生き物の体の中でたいへん重要な働きをしている。
いくつかのタンパク質は病気とも深く関わっている。また、タンパク質の
立体構造情報は、その機能を説明、予測するために必須である。更に、
病気に関わるタンパク質に結合する薬を作る際にも、構造情報は重要
である。
今日では、様々な生物のゲノム配列が解読さている。その結果、機能
が分からない遺伝子や病気に関わる遺伝子が多く存在することが明ら
かとなった。
従って、タンパク質の折り畳みを理解することにより、そのような遺伝子
の機能を予測したり、効率的に薬を開発することが出来るようになる。
更には、新しい機能を持った“ナノマシーン”としてのタンパク質をデザイ
ンする道が開ける。
“タンパク質の折り畳み問題“は
なぜ難しい?
コンピュータシミュレーションの立場から見ると、
1.
現在、最先端のコンピュータを利用したとしても、原子レベルでタン
パク質折り畳みの全過程をシミュレーションすることは難しい。
2.
現在利用されているシミュレーションのエネルギー関数とそのパラ
メータに、タンパク質の折り畳みシュミレーションを再現できるだけ
の精度があるのか否か分かっていない。
…, let me recount a conversation with Francis in 1975 (who won the Novel prize
for discovering the structure of DNA). Crick stated that "it is very difficult to
conceive of a scientific problem that would not be solved in the coming twenty
years … except for a model of brain function and protein folding". Although Crick
was more interested in brain function, he did state that both problems were difficult
because they involve many cooperative interactions in three-dimensional space.
(Levitt M, “Through the breach.” Curr. Opin. Struct. Biol. 1996, 1, 193-194)
分子動力学法(MD)。
互いに力を及ぼしあって運動しているN個の原子からなる系のニュート
ンの運動方程式は、
d 2 ri t 
(1)
mi
 Fi t  (i  1, 2,  , N )
2
dt
ここで、ri, miはそれぞれ原子iの位置ベクトルおよび質量であり、Fi(t)は
原子iが他の粒子から受ける力。これがMD計算で解くべき方程式。
また、 Fi(t)は、
Fi   iV r1 , r2 ,  , rN 
(2)
により計算できる。ここでV(r1,r2,・・・,rN)はポテンシャルエネルギーで
あり、∇iは
である。



i  i
j
k
x
y
z
(3)
運動方程式を差分近似して解く。
時刻tに対してΔtだけ未来および過去の位置ri(t±Δt)のTaylor展開を
Δt3まで正確に行うと,

1 
1 
2
ri t  t   ri t   ri t t  ri t t  ri t t 3  Ot 4  (4a)
2
6

1 
1 
2
ri t  t   ri t   ri t t  ri t t  ri t t 3  Ot 4  (4b)
2
6
となる。両辺を加えると、
ri t  t   ri t  t   2ri t   ri t t 2  Ot 4 

(5)
ここで、式(1)を用いると、
ri t  t   2ri t   ri t  t  
となる。この式(6)を逐次解けばよい。
1
Fi t t 2  Ot 4 
mi
(6)
タンパク質を形作る力。
静電相互作用
van der Waals相互作用
水素結合
疎水性相互作用(疎水性の原子が、水を
避けるように会合すること。油が水との接
触を避けて凝集するのと同様。すなわち、
水の存在が重要!)
シミュレーションで使う
エネルギー関数。
Vtotal 
Φ
r
Θ
結合項
結合角項

K b r  r0  
2
bonds

K    0  
2
angles

水素結合項
O
r
H
 K 1  cosn   

dihedrals
 Cij Dij 
 12  10  


 van der Waals
r
Hbonds rij
ij

 i , j pairs

二面角項
 Aij Bij 
qi q j
 12  6  
r
 electrosta tic r
r
ij
ij

 i , j pairs ij
計算時間
が最もかか
る部分。

van der Waals項
静電相互作用項
+
r
r
ー
MDシミュレーションの系。
水分子なし
水分子あり
原子数: 304
原子数: 304+7,377=7,681
MDの系
MDは膨大な計算量が必要。
MDのタイムステップ(Δt)は1フェムト(10-15)秒
程度が限界。
← Δtは系の最も速い運度周期よりも十分短い時間に設定する必
要がある。タンパク質の場合、最も速い運動である結合の伸縮は1014秒程度の周期であるため、Δtは1フェムト秒程度が選ばれる。
膨大な数の水分子を扱わなければならない。
← vdW、静電相互作用を計算する原子のペアーはN2で増える。
↓
長時間の計算は困難。数ナノ秒がやっと。
タンパク質の運動とMDの
タイムスケール。
ポリンタンパク質のイオン透過
タンパク質の弾性振動
α-helixの形成
β-hairpinの形成
結合の伸縮
タンパク質の折り畳み
10-15
10-12
10-9
10-6
10-3
100
(fs)
(ps)
(ns)
(μs)
(ms)
(s)
分子動力学法
時間
通常のMD法ではタンパク質の折り畳みをシミュレーショ
ンするのは非常に難しい!
もっと高速、もっと大規模に!
専用計算機
MDM (Molecular Dynamics Machine)、MD-Grape:
理化学研究所
MDエンジン: 大正製薬・富士ゼロックス
並列化
計算を多数のCPUに分配し、高速化を図る。ただし、
データ通信の速度がリミットとなる。
現在、MDシミュレーションプログラムの多くは(例えば、
AMBER, CHARMm, GROMOS, NAMD, MARBLE など)
並列コンピュータで計算が可能になっている。
ブラウン動力学法(BD)。
溶媒である水分子の効果をランダムな力として
計算に組み込む。そのため、水分子を分子とし
て個々に扱う必要がない。(ブラウン運動の基本
的な理論は1905年、アインシュタインにより定
式化されました。)
水の粘性抵抗が大きく粒子の速度がすぐに減衰
してしまうと仮定した運動方程式のため、長いタ
イムステップを設定することができる。
BD法は長時間のシミュレーションに適している。
BDシミュレーションの系。
水分子なし
水分子あり
原子数: 304
原子数: 304+7,377=7,681
BDの系
BDのアルゴリズム。
熱浴に接している粒子系の運動はLangevin方程式
d 2 ri
dr
mi 2   i i  Fi  R i
dt
dt
(7)
で記述される。ここで、mi, riはそれぞれ質量と位置を表す。ζiは粘性係数であり、
ストークスの法則 ζi = 6πaiStokesηで決められる。aiStokesはStokes半径、ηは水
の粘度 である。Fiは系から受ける力、Riは水分子から受けるランダムな力であり、
平均〈Ri(t)〉= 0, 分散〈Ri(t) Rj(0)〉= 6ζikBTδ(t)で表される。粘性抵抗が大きく、
慣性項を無視できるとすると、(7)式の左辺を0とし、
d ri
i
 Fi  R i
dt
(8)
単位時間 Δtにおける原子 iの変位は、
ri (t  t )  ri (t ) 
Fi (t )
i
t 
2kBT
i
t ωi
(9)
ここで、ωiはガウス分布から得られるランダムなノイズベクトルである。これらの
式(8)、(9)に従う運動をブラウン動力学(Brownian dynamics)と呼ぶ。
BDの計算速度。
1ナノ秒のシミュレーションに必要な計算時間
アルゴリ
ズム
コンピュータ
原子数
計算時間
(分)
高速化
率
MD
Pentium4 2.8
GHz
7,681
2,057
1.00
BD
Pentium4 2.8
GHz
304
38.8
53.0
BD
+MTS†
Pentium4 2.8
GHz
304
12.8
161
BD
+MTS†
IBM Regatta 8
CPU
304
3.4
605
†MTS(Multiple
time step)アルゴリズム: 最も計算時間のかかる項(非
共有結合のエネルギー)の計算頻度を少なくする方法。
α-へリックスの度
合
BDでの折り畳みシミュレーション
(α-へリックス) 。
1.0
0.8
0.6
0.4
0.2
0
0
100
200
300
シミュレーション時間 (ナノ秒)
400
β-ヘアピンの度合
BDでの折り畳みシミュレーション
(β-ヘアピン) 。
1.0
0.8
0.6
0.4
0.2
0
0
100
200
300
シミュレーション時間 (ナノ秒)
400
タンパク質の運動とBDの
タイムスケール。
ポリンタンパク質のイオン透過
タンパク質の弾性振動
α-helixの形成
β-hairpinの形成
結合の伸縮
タンパク質の折り畳み
10-15
10-12
10-9
10-6
10-3
(fs)
(ps)
(ns)
(μs)
(ms)
分子動力学法
ブラウン動力学法
100 時間
(s)
BD法を用いることで、
長時間のシュミレー
ションが可能となりまし
た。
まとめ。
タンパク質の折り畳み問題は生物学における非常に重要な問題の1
つである。また、この問題を解決することにより、新しいゲノム生物学
への扉が開かれると考えらる。
分子動力学法(MD)は、ニュートンの運動方程式を差分化して解く。
MDではタイムステップが1フェムト秒程度、かつ膨大な数の水分子を
扱う必要があるため、長時間のシミュレーションは困難。
しかし、タンパク質の折り畳み、大きな構造変化はミリ秒程度のタイ
ムスケールで起きる。
専用計算機、並列化等の工夫によりMDの計算を高速化、大規模な
系に適用可能になってきた。
ブラウン動力学法(BD)は長時間シュミレーションを可能とする1つの
アプローチです。