研究年次報告書

Zhang独立主幹研究ユニット
Zhang Initiative Research Unit
独立主幹研究員 張 永健(理博)
Kam Y. J. ZHANG (Ph.D.)
キーセンテンス:
1. タンパク質フォールディング問題
2. タンパク質構造の計算予測
3. X線結晶の位相問題
4. 構造に基づくドラッグデザイン
5. スキャフォールドとフラグメントに基づくドラッグデザイン
キーワード:
タンパク質フォールディング、構造予測、位相問題、ドラッグデザイン、X 線結晶学
研究概要
タンパク質フォールディング問題の解決は 正確なエネルギー関数の欠如と最小エネルギー構造探索にか
かる非常に高い計算コストによって阻まれてきた。我々はフォールディング問題を解決するために X 線回
折データを擬エネルギー関数として用いることによって エネルギー関数を構造探索から切り離そうとし
ている。我々は効率的な探索方法を開発し 天文学的な構造探索問題に取り組むために 高度な計算技術
を利用している。
1. X 線データを制約として使用したタンパク質フォールディング予測(Shrestha,
Zhang)
ロゼッタアルゴリズムはアミノ酸配列のみを使用した原子レベルにおいての高解像度構造の予測には最も
強力な方法である。しかしながらロゼッタ自由エネルギーは多くの生成された予測構造の中で最良の構造
をいつも確認できるわけではないことを発見した。さらに、構造空間での探索はロゼッタのプロトコルの
中でもう一つの障害である。我々は予測された構造をX線データにマッチさせることによって得たスコア
を統合することによって、最小エネルギー構造を捕捉するためのロゼッタスコア関数を駆動するアルゴリ
ズムを提案した。我々はロゼッタの統合されたパッケージの構造の中で分子置換法ライブラリを組み入れ
るクラスを設計した。我々は分子置換法による解を見つけるために最低限必要となる精度を決定するため
に、特定のアミノ酸配列にロゼッタを使用して多量の予測構造を生成した。
2. 分子置換方法をロゼッタタンパク質フォールディングエンジンに統合
(Berenger, Zhang)
ロゼッタでX線データを利用するには X 線回折空間において構造モデルの方位や位置を訂正する必要があ
る。これは EPMR や PHASER などの分子置換法によって実現することができる。我々はこれらの二つの
スタンドアロンプログラムを再使用することができるライブラリに変換した。我々は現在これらのプログ
ラムがロゼッタの生成するタンパク質構造モデルに対してどのようにかつどのくらいの制約で使用できる
か評価をしている。探索空間のサイズおよび分子置換法を使用することによって追加される計算コストの
ために 我々は計算効率を上げる方法を開発してきた。MPI 版ロゼッタを使用し同時に多くの CPU を要す
る作業をスーパーコンピューターでスケジュールする必要の代わりに 我々は簡単に作動できてクラスタ
ーシステムの仕事量に弾性的に適合できるバッチジョブを使用することがより効率的であることを発見し
た。
3. SAXS データをタンパク質フォールディング予測に組み入れる
(Takahashi, Zhang)
ロゼッタによるタンパク質立体構造予測法はタンパク質のアミノ酸配列情報からその3次元構造を予測す
ることに成功を収めてきた。しかしその予測精度はタンパク質の大きさやオリゴマー状態が増加するにつ
研究年報
れて低下する。これまで、実験から得たデータをさらに組み入れることによって予測性能を向上させるこ
とができることが実証された。そこで我々は分子の外形情報を得ることができる X 線小角散乱(SAXS:
Small-Angle X-ray Scattering)データを使用することを提案する。このデータを用いることによって、モ
ンテカルロサンプリングを行う必要があるエネルギー空間を縮小することが出来る。我々は電子密度マッ
プを利用するためにロゼッタのアルゴリズムを調査し、また電子密度マップがいくつかのタンパク質の構
造を精緻化するために使用できることを確かめた。同様に分子外形情報も予測構造精緻化に用いることが
できると期待される。
------------------Key Sentence :
1.
Protein folding problem
2.
Computational protein structure prediction
3.
X-ray crystallographic phase problem
4.
Structure based drug design
5.
Scaffold and fragment based drug design
6.
Key Word :
Protein folding, structure prediction, phase problem, drug design, X-ray crystallography
Outline
Purpose of Research
The solution to the protein folding problem has been hindered by the lack of precise energy function
and the prohibitive computational cost for the search of global energy minimum conformation. We seek
to separate the energy function from the conformational search by providing the X-ray diffraction data
as a pseudo energy function to solve the folding problem. We develop efficient search methods and
utilize advanced computational techniques to tackle the astronomical conformational search problem.
1. Protein folding prediction using X-ray data as constraints (Shrestha, Zhang)
Rosetta algorithm is the most powerful method for the prediction of high resolution structures at
atomic level using only the amino acid sequence. However, we have found that the Rosetta free energy
cannot always identify the best structure among many others generated. Furthermore, conformational
space search is another bottleneck inside the Rosetta protocol. We have proposed an algorithm to drive
the Rosetta score function to trap the lowest energy conformation by integrating the score from the
match of the predicted structure against X-ray data. We have designed classes to incorporate the
molecular replacement libraries within the structure Rosetta integrated package. We have generated a
large numbers of structures using Rosetta for specific amino acid sequences to determine minimum
accuracy required to find the molecular replacement solution.
2. Integration of molecular replacement methods into the Rosetta protein folding engine (Berenger,
Zhang)
To utilize X-ray data in Rosetta requires the correct orientation and position of the structure model in
diffraction space. This can be achieved by molecular replace methods, such as EPMR and PHASER. We
have transformed these two standalone programs into libraries we can reuse. We are currently
evaluating how and within which limits these tools can be used in order to work on Rosetta-generated
protein models. Because of the size of the search space, as well as the computational cost added by
using molecular replacement, we have been developing methods to increase the computational
efficiency. Instead of using the MPI version of Rosetta and having the need for the supercomputer to
schedule jobs with many CPU available at the same time, we found that it’s more efficient to use batch
jobs which can run easily and adapt elastically to the cluster load.
平成 21 年度
3. Incorporating SAXS data into protein folding prediction (Takahashi, Zhang)
Although the Rosetta structure prediction methodology has been successful to predict the 3D structure
of a protein from its amino acid sequences, its accuracy decreases with increasing protein size and
oligomeric state. It has been demonstrated that its performance can be enhanced by incorporating
additional experimental data. We propose to use Small-angle X-ray scattering (SAXS) data that
contains the molecular envelope information. Using this data, we can narrow down the area in energy
space for Monte Carlo sampling. We have checked that Rosetta algorithm to utilize density map, and
also confirmed that the density map can be used to refine the structures of several proteins. The
envelope data can be expected to refine the predicted structures.
研究年報
Principal Investigator
張
永健
Kam Y. J. Zhang
Research Staff
高橋
亮
Ryo
Takahashi
Rojan Shrestha
Francois Berenger
Assistant and Part-timer
蠏
裕子
Hiroko Kani