ヒトプロテオーム立体構造全自動モデリングとそのデータベース

2006年CASP7コンテストにおける
自動サーバによるタンパク質モデリング:
日本、 米国、欧州の実力
(北里大・薬、 *理研・GSC)
○岩舘 満雄*、寺師 玄記、加納 和彦、
高谷 大輔、細井 亜紀男、大田 数広、
竹田-志鷹 真由子*、梅山 秀明*
平成18年11月15日 構造活性シンポジウム(新潟)
RIKEN FAMSBASE公開しました
http://famshelp.gsc.riken.jp/famsbase
遺伝学研究所GTOPの
RPS-BLASTのアライメン
トをモデリング
NCBI NRに対してRPSBLASTを行いアライメントの
重複を省いてモデリング
ヒト・ラット・マウスについてよ
り詳細情報とともにモデリン
グ結果を収録
ヒトだけに焦点を絞り高頻度
の更新と詳細情報収録を目
的としている
Server in CASP
Publish
Server Answer
(every week)
Query
Sequence
Server
Deadline
48 hr
Human Predictor
CASP
Deadline
for each target
time
All 100タンパク3000等の構造生
Target of CASP7
CM rate
0.7
63.9%
物学的プロジェクトの国際
47.8%
的な進展と共にホモロジー
モデリング適用可のター
CM rate
ゲットが増加してきている
0.6
0.5
45.3%
0.4
•88 targets are release on 10 Nov 2006
0.3
0.2
0.1
Classification using SVM
number of servers
80
タンパク質自動予測家達が
•57 CM (Comparative
Modeling) targets
70
0
casp5
casp6
casp7
増加してきており、統計情報
43 in CASP6,
24 in CASP5
を取るのに都合が良くなって
50
きている
40
60
•31 FR (Fold Recognition) targets
30
47 in CASP6,
29 in CASP5
20
10
0
casp5
casp6
casp7
Umeyama teams
Method of Umeyama Server Teams
Expand free energy from 3D
CIRCLE:
Using some important
server-answers,
modeling
to 1D using
experimental
data by FAMS
and estimating structures by threading program
FUNCTION
Using some homology-searching programs
(SPARKS2, BLAST, FASTA) , modeling by FAMS
and using a function of e-value, homology% and Secondary
Structure
FAMSD:
Using some homology-searching programs (SPARKS2, BLAST, FASTA) ,
modeling by FAMS and another function of e-value, homology% and
Secondary Structure and estimating structures by threading program
FAMS
Using multiple-alignment FAMS, ab-initio modeling and estimating
structures by threading program
GDT_TS(Global Distance Test Total Score)
GDT_TS=(GDT_P1+ GDT_P2+ GDT_P4+ GDT_P8)/4
Where
GDT_Pn Percent of residues under Ca distance cutoff <=n.0 Å.
example
8.1Å
3.5Å
Chain A
5.7Å
2.2Å
5.3Å
0.8Å 1.9Å
6.5Å
GDT_P1=(1/9)*100
GDT_P2=(2/9)*100
GDT_P4=(4/9)*100
GDT_P8=(8/9)*100
4.2Å
Chain B
GDT_TS=41.7
GDT_TS and model quality
50
40
30
20
100
60
70
80
90
χ1 assessment
•Correctの残基数
•CASPのCMサーバー部門でよく用いられる
Cβ
N
ここの回転角の精度
Cα
C
O
Correct : | χ1experimental - χ1model | <=40°
Assessments of CASP7 All 88 targets.
GDT_TS
χ1 in 3.5Å Ca accuracy
1
5291.52
Zhang-Server
1
5612
ROBETTA
2
4976.37
HHpred2
2
5549
Pmodeller6
3
4959.04
Pmodeller6
3
5432
Pcons6
4
4926.6
CIRCLE
4
5374
FAMSD
5
4917.05
Pcons6
5
5336
FAMS
6
4913.53
HHpred3
6
5325
Zhang-Server
7
4909.65
ROBETTA
7
5223
CIRCLE
8
4902.41
BayesHH
8
5085
FUNCTION
9
4886.08
FAMSD
9
5012
SAM_T06_server
10
4879.27
UNI-EID_expm
10
4979
Bilab-ENABLE
Umeyama teams
Assessments of CASP7 57 CM targets from SVM.
GDT_TS
χ1 in 3.5Å Ca accuracy
1
4125.32
Zhang-Server
1
5010
ROBETTA
2
3949.26
FAMSD
2
4900
Pmodeller6
3
3947.64
UNI-EID_expm
3
4882
FAMS
4
3944.64
CIRCLE
4
4879
FAMSD
5
3939.36
HHpred2
5
4855
Pcons6
6
3937.69
HHpred3
6
4748
CIRCLE
7
3928.55
beautshot
7
4748
Zhang-Server
8
3925.04
BayesHH
8
4633
FUNCTION
9
3914.24
FAMS
9
4594
Bilab-ENABLE
10
3898.92
SP3
10
4571
CaspIta-FOX
Umeyama teams
Assessments of CASP7 31 FR targets from SVM.
GDT_TS
χ1 in 3.5Å Ca accuracy
1
1166.2
Zhang-Server
1
649
Pmodeller6
2
1129.96
Pmodeller6
2
602
ROBETTA
3
1056.55
ROBETTA
3
577
Pcons6
4
1037.01
HHpred2
4
577
Zhang-Server
5
1033.1
Pcons6
5
559
MetaTasser
6
1031.74
MetaTasser
6
523
SAM_T06_server
7
981.96
CIRCLE
7
503
HHpred2
8
977.37
BayesHH
8
495
FAMSD
9
975.84
HHpred3
9
488
HHpred1
10
973.37
HHpred1
10
475
CIRCLE
Umeyama teams
Assessments of CASP7 57 CM targets from SVM.
GDT_TS
χ1 in 3.5Å Ca accuracy
1
4125.32
Zhang-Server
1
5010
ROBETTA
2
3949.26
FAMSD
2
4900
Pmodeller6
3
3947.64
UNI-EID_expm
3
4882
FAMS
4
3944.64
CIRCLE
4
4879
FAMSD
5
3939.36
HHpred2
5
4855
Pcons6
6
3937.69
HHpred3
6
4748
CIRCLE
7
3928.55
beautshot
7
4748
Zhang-Server
8
3925.04
BayesHH
8
4633
FUNCTION
9
3914.24
FAMS
9
4594
Bilab-ENABLE
10
3898.92
SP3
10
4571
CaspIta-FOX
FAMSモデリングプログラムにはχ1の確度を高める効果がある
日本
米国
欧州
Assessments of CASP7 31 FR targets from SVM.
GDT_TS
χ1 in 3.5Å Ca accuracy
1
1166.2
Zhang-Server
1
649
Pmodeller6
2
1129.96
Pmodeller6
2
602
ROBETTA
3
1056.55
ROBETTA
3
577
Pcons6
4
1037.01
HHpred2
4
577
Zhang-Server
5
1033.1
Pcons6
5
559
MetaTasser
6
1031.74
MetaTasser
6
523
SAM_T06_server
7
981.96
CIRCLE
7
503
HHpred2
8
977.37
BayesHH
8
495
FAMSD
9
975.84
HHpred3
9
488
HHpred1
10
973.37
HHpred1
10
475
CIRCLE
日本
米国
欧州
Server in CASP
Publish
Server Answer
(every week)
Query
Sequence
Server
Deadline
48 hr
Human Predictor
Automated
Procedure
CASP
Deadline
for each target
time
Virtual Servers
•サーバーの答えを使うサーバー:meta server
•選ぶだけのサーバー:meta selector
Virtual Servers
• fams_ace:
– 3D1Dとコンセンサスで選ぶmeta selecter
• CIECLE-FAMS :
– 3D1Dで選ぶmeta selecter
• fams-multi :
– 3D1Dで複数のモデルを選び、
– 100%のmulti-FAMSを実行するmeta server
Assessments of CASP7 CM targets.
GDT_TS
χ1 in 3.5Å Ca accuracy
1
4125.32
Zhang-Server
1
5010
ROBETTA
2
3949.26
FAMSD
2
4900
Pmodeller6
3
3947.64
UNI-EID_expm
3
4882
FAMS
4
3944.64
CIRCLE
4
4879
FAMSD
5
3939.36
HHpred2
5
4855
Pcons6
6
3937.69
HHpred3
6
4748
CIRCLE
7
3928.55
beautshot
7
4748
Zhang-Server
8
3925.04
BayesHH
8
4633
FUNCTION
9
3914.24
FAMS
9
4594
Bilab-ENABLE
10
3898.92
SP3
10
4571
CaspIta-FOX
4102.61 fams_ace
4037.85 CIRCLE_FAMS
4023.57 fams_multi
5115
CIRCLE_FAMS
5070
fams_multi
Assessments of CASP7 FR targets.
GDT_TS
χ1 in 3.5Å Ca accuracy
1
1166.2
Zhang-Server
1
649
Pmodeller6
2
1129.96
Pmodeller6
2
602
ROBETTA
3
1056.55
ROBETTA
3
577
Pcons6
4
1037.01
HHpred2
4
577
Zhang-Server
5
1033.1
Pcons6
5
559
MetaTasser
6
1031.74
MetaTasser
6
523
SAM_T06_server
7
981.96
CIRCLE
7
503
HHpred2
8
977.37
BayesHH
8
495
FAMSD
9
975.84
HHpred3
9
488
HHpred1
10
973.37
HHpred1
10
475
CIRCLE
615
1093.69 fams_ace
1091.55 CIRCLE_FAMS
1023.07 fams_multi
CIRCLE_FAMS
568
fams_ace
516
fams_multi
Assessments of CASP7 All targets.
χ1 in 3.5Å Ca accuracy
GDT_TS
1
5291.52
Zhang-Server
1
5612
ROBETTA
2
4976.37
HHpred2
2
5549
Pmodeller6
3
4959.04
Pmodeller6
3
5432
Pcons6
4
4926.6
CIRCLE
4
5374
FAMSD
5
4917.05
Pcons6
5
5336
FAMS
6
4913.53
HHpred3
6
5325
Zhang-Server
7
4909.65
ROBETTA
7
5223
CIRCLE
8
4902.41
BayesHH
8
5085
FUNCTION
9
4886.08
FAMSD
9
5012
SAM_T06_server
10
4879.27
UNI-EID_expm
10
4979
Bilab-ENABLE
5196.3 fams_ace
5129.4 CIRCLE_FAMS
5046.64 fams_multi
5730CIRCLE_FAMS
5586
fams_multi
5135
fams_ace
Assessments of CASP7 CM targets.
GDT_TS
χ1 in 3.5Å Ca accuracy
1
4125.32
Zhang-Server
1
5010
ROBETTA
2
3949.26
FAMSD
2
4900
Pmodeller6
3
3947.64
UNI-EID_expm
3
4882
FAMS
4
3944.64
CIRCLE
4
4879
FAMSD
5
3939.36
HHpred2
5
4855
Pcons6
6
3937.69
HHpred3
6
4748
CIRCLE
7
3928.55
beautshot
7
4748
Zhang-Server
8
3925.04
BayesHH
8
4633
FUNCTION
9
3914.24
FAMS
9
4594
Bilab-ENABLE
10
3898.92
SP3
10
4571
CaspIta-FOX
4131.52 fams_ace_STD3SS_ori
4102.61 fams_ace
4037.85 CIRCLE_FAMS
4023.57 fams_multi
5115
CIRCLE_FAMS
5070
fams_multi
Zhang-Serverはコンセンサスのアルゴリズム
をとっていると考えられる
Conclusions
• 日米欧の実力はCMでは拮抗、FRでは少し遅れをとっ
ていると言える
• コンセンサスは主鎖の評価で高得点を取るのに重要
• コンセンサスと物理的関数(特に3D1D)の組み合わせ
は強力なツールとなりうる
• 主鎖のみならず側鎖をも評価に含めると、物理的関数
が要求される
• 難易度の高いターゲットにおいても物理的関数は要求
される。