Document

タンパク質の立体構造と
機能予測
遺伝子の機能予測
機能が似ている
タンパク質の立体構造が似ている
塩基配列(遺伝子)が似ている
アミノ酸の配列が似ている
配列が似ていれば機能も似ている
配列の類似度の計算
蛋白質の立体構造解析からの考察
IsiB
KKIGLFYGTQTGKTE
SVAEIIRDEFGNDVV
TLHDVSQAEVTDLND
YQYLIIGCPTWNIGE
LQSDWEGLYSELDDV
DFNGKLVAYFGTGDQ
IGYADNFQDAIGILE
EKISQRGGKTVGYWS
TDGYDFNDSKALRNG
KFVGLALDEDNQSDL
TDDRIKSWVAQLKSE
FGL
タンパク質の機能
・構造タンパク質
(細胞骨格,表皮ケラチン,ウイルスのキャプシドタンパク質など)
・輸送・貯蔵タンパク質
(ヘモグロビン・ミオグロビン,フェリチンなど)
・制御タンパク質
(ホルモン,シグナル伝達系分子,転写因子など)
・免疫系タンパク質
(免疫グロブリンなど)
・酵素タンパク質
など多様.
蛋白質:ペプチド結合したアミノ酸群
Phe(F)
(疎水性)
様々な物理化学的な
性質を持った側鎖が
Ala(A)
主鎖のペプチド結合で
(疎水性) 連なる
N
Leu(L)
(疎水性)
Asp(D)
Cα
H
C
(親水性)
Thr
(親水性)
P
脂肪族
A
I V
L
M
疎水性
F
芳香族
G
C
Y
W
S
N
T
O
Q
負荷電
D
Cys(C)
(親水性)
E
K
H
R
正荷電
アミノ酸は全部で20種類
親水性
Val(V)
(疎水性)
フォールディング(折り畳み)という現象
温度や変性剤濃度
によって可逆に変化
天然状態(N)
変性状態(D)
非常に多種の構造の集合
大きく広がっている
ほとんど唯一の構造
小さくコンパクトに折りたたまっている
・折り畳みは、原則としてその蛋白質以外の分子の介助を必要としない。アミノ酸
配列の情報だけで、天然状態の立体構造が決定される。
・どうやってコンパクトになるか? → (1)主鎖の水素結合(2)側鎖間の疎水性相互作用
・あるアミノ酸配列がどうやって一つの構造を決めるのか???
立体構造の描画スタイル
ワイアフレーム
ボール&スティック
4 1
バックボーン
リボン
空間充填
3
2
分子表面
PDBコード:1fxd(ferredoxin II), Rasmol / Chimeプラグインで描画
タンパク質立体構造の分類と比較
立体構造比較の重要性
1.
2.
「データ整理」:立体構造データ数は近年急増(約4万エントリ)
「進化」:立体構造は配列より進化的に保存しやすい
(1) 配列では見つからない遠いホモログの発見
 → 機能推定につながる
 → 生物の初期進化の解明
(2) 精確なアライメント
3.
「物理化学」:構造データベースの統計から、タンパク質の物理
化学的な性質が明らかになる可能性
(1)アミノ酸の2次構造傾向
(2)安定な2次構造のパッキング
(3)リガンド結合のパターン
アミノ酸配列と立体構造の関係
ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44%)
大腸菌(1ag9A)
ピロリ菌(1fueA)
SeqID = 44 %
RMSD = 1.2 Å
RMSDは平均二乗偏差
(Root Mean Square Deviation)
配列が似ていれば立体構造も似ている
1fueA
1ag9A
2:GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD:59
***** * ** * ** * * *
* * * ** ***
* **
*
2:AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE:61
1fueA 60:LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT:116
* ** ** ***
* *
* * *** * * *
*
**
1ag9A 62:AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW:120
アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある
ピロリ菌・フラボドキシン(1fueA)
大腸菌・フラボドキシン(1ag9A)
大腸菌・走化性タンパク質CheY
(3chy)
8%, 4.4Å
44%, 1.2Å
構造比較
BLAST
N
C
C
N
N
PSI-BLAST
構造比較
14%, 3.2Å
C
C
N
2
1
3
4
5
C
C
ラット・NADPH シトクロームP450
還元酵素 C末ドメイン (1ja1A2)
N
N
ヒト・キノン還元酵素(1d4aA)
構造は配列より進化的に保存がよい  構造比較から新たなホモログが発見できる
立体構造の変化
アミノ酸配列の変化と立体構造の変化の相関(グロビン族)
アミノ酸配列の類似度
立体構造の変化はアミノ酸配列の変化と相関
配列が30%以上一致していれば、RMSDは2Å以下
2つの構造の類似性
ネコの前足
ホモロジー (homology ,相同):
進化的起源を共有することによる類似
多くの場合、分子機能なども類似している
アナロジー (analogy, 相似)
イルカの胸びれ
サルの前足
進化的起源とは無関係な類似
多くの場合、分子機能など他の属性は似ていない。
物理化学的な構造の偏好が原因とされる。
チョウの羽
トリの翼
“Flavodoxin-like” fold
ピロリ菌・フラボドキシン(1fueA)
大腸菌・フラボドキシン(1ag9A)
大腸菌・走化性タンパク質CheY
(3chy)
8%, 4.4Å
44%, 1.2Å
Analogy
Homology
N
C
N
N
C
Homology
“CheY-like”
14%, 3.2Å
C
superfamily
C
N
2
1
C
C
ラット・NADPH シトクロームP450
還元酵素 C末ドメイン (1ja1A2)
N
ヒト・キノン還元酵素(1d4aA)
“Flavoproteins” superfamily
N
3
4
5
スーパーフォールドの例
TIM beta/alpha barrel (c.1)
[26 superfamily]
Triosephosphate isomerase
1n55A(c.1.1.1)
KHG/KDPG aldolase 1euaA(c.1.10.1)
Imidazole glycerol phosphate synthase subunit hisF
1thfD(c.1.2.1)
D-ribulose-5-phosphate 3-epimerase 1h1yA(c.1.2.1)
全般に解糖系の酵素が多い。基質、酵素反応は極めて多彩。
「形」の比較による弱い相同性認識
機能未知の立体構造データから機能を予測するには?
似た構造を探す
機能未知立体構造
1p9vA
Hypothetical protein YddE
Escherichia coli
RMSD=3.1 A
SeqID = 14.8 %
Rel for Sfam = 94.2%
Rel for Fold = 99.2%
機能既知立体構造
1bwzA
Diaminopimelate epimerase
Hemophilus influenzae
論理の流れ
1.立体構造が似ているなら相同(ホモロガス)
2. 相同(ホモロガス)なら分子機能も似ているはず
3. 構造類似性は機能の類似性を意味する
モデリングした構造の精度と用途
SeqID = 100 %
反応メカニズムの理解
リガンドの設計
SeqID = 50 %
高分子のドッキング
低分子のドッキング
[分子置換法による精密化]
SeqID = 30 %
部位特異的置換のサポート
[NMRの精密化]
[電顕等の粗い電子密度へのフィット]
Ab initio
保存している表面残基の発見
D.Baker and A.Sali
Science Vol 294 93-96
タンパク質の相同性の判断基準
100 90 80 70 60
同一残基率(Sequence Identity)(%)
50 40
30
20
35
25
15
10
0
5
同一残基率30%以上
配列解析
BLASTのE-value < 0.0001
PSI-BLASTのE-value < 0.0001
立体構造比較が必要
同一残基率が25%以下の場合の相同性の判断基準
(1) 立体構造の類似性が高い(DALIのZスコア、MATRASのRdisスコア)
(2) 同一残基率がそこそこ高い(PSI-BLASTでヒットする、SeqID>=15%ぐらい)
(3) 分子機能に類似性がある(補酵素、酵素反応、基質、代謝経路等の共通性等)
(4) 基質・補酵素の結合部位が類似しており、そのアミノ酸が保存(モチーフ)
(5) ドメイン構成の共通性
(6) スーパーフォールドの場合は、特別な注意が必要
タンパク質の立体構造の検索
PDB (Protein Data Bank)
タンパク質の構造データに関するデータベース.
構造データに関する世界で唯一の機関.
54,298個の立体構造データが登録されている.
http://www.rcsb.org/pdb/
Protein Data Bank
http://www.rcsb.org/pdb/
Growth of Protein Data Bank
登録された立体構造データ数の推移
・結晶化技術の向上
・タンパク質3000プロジェクトなど
酵素(タンパク質)の反応
触媒反応機構をもつタンパク質.
酵素(E) + 基質(S) → 酵素基質複合体(ES) →
酵素(E) + 生成物(P)
リゾチーム
細菌の細胞壁(ペプ
チドグリカン;N-アセ
チル-D-グルコサミン;
NAG)
リゾチームは
真正細菌の細胞壁を構成する多糖類を加水分解する酵素である。この
作用により細菌を溶かしているように見えることから溶菌酵素とも呼ば
れる。ヒトの場合涙や鼻汁、母乳などに含まれている
酵素複合体の立体構造を予測する
~高能率の酵素の作製を目指して~
+
A B C
A
B
C
D
E
D E F
F
細胞壁の糖重合体
(糖の6量体)
リゾチーム
コンピュータ上で予測された
酵素基質複合体の構造
コンピュータにより基質と相互作用すると推測された
アミノ酸残基(赤:実験と一致したアミノ酸残基)
実験からは分からない
がコンピュータから推測
されたもの
A
Arg73
Asp101 Gly102 Asn103
B
Asp101 Asn103
C
Asn59
Trp62
Trp63
Asn103 Ala107
D
Glu35
Asn46
Asp52
Leu56
Gln57
Ala107 Val109
E
Glu35
Asn44
Arg45
Asn46
Asp52
Gln57
Ala110
F
Lys33
Phe34
Glu35
Asn37
Asn44
Arg45
Asn46
Arg114
酵素複合体の立体構造を予測する
~製薬分野への応用~
薬の候補となる物質
(絞り込まれて少なくなった)
薬の候補となる物質(基質)
X
コンピューターを使って
薬の候補となる物質を
絞り込む
●
病気の原因になるタンパク質(酵素)
どれに結合するのか分からない
結合するものを効率よく探す
ことができる
タンパク質の立体構造データの入手(1)
lysozyme
タンパク質の立体構造データの入手(2)
1,658が解析されている
タンパク質の立体構造データの入手(3)
1HEL
タンパク質の立体構造データの入手(4)
ファイル内容を見る
タンパク質の立体構造データの入手(5)
定義: header
アクセッション番号: accession
タンパク質名:source
参考論文: reference
タンパク質の立体構造データの入手(6)
アミノ酸配列:SEQRES
二次構造:HELIX,SHEET
タンパク質の立体構造データの入手(7)
タンパク質の原子座標:ATOM
タンパク質の立体構造データの入手(8)
データを入手する
タンパク質立体構造ビューア
・Rasmol
http://www.umass.edu/microbio/rasmol/
・Cn3D
http://www.ncbi.nlm.nih.gov/Structure/
CN3D/cn3d.shtml
・Chime
http://www.umass.edu/microbio/chime/
・Molscript
http://www.avatar.se/molscript/
・ProteinExplorer
http://www.umass.edu/microbio/chime/pe_beta/pe/
protexpl/frntdoo2.htm
etc.
タンパク質立体構造ビューア(Rasmol)の入手(1)
http://www.openrasmol.org/software/RasMol_2.7.3.MAC/index.html
旧バージョン
最新は2.7.5
デスクトップに保存し、ダブルクリックで解凍する。
必要に応じてHelp Fileも。
タンパク質立体構造ビューア(Rasmol)の入手(2)
ターミナルを開いて、
・デスクトップフォルダに移動
・rasmol_32BIT ファイルを「実行可能」にする
アイコンが “exec” に変わったら、それをダブルクリックして実行する。
タンパク質の立体構造の表示(1)
立体構造を表示させるには、”rasmol>”というプロンプトに対して、
“load Desktop/1HEL.pdb”のように load コマンドを打つ。
初期状態では、ワイヤーフレームモデル、CPKカラー(原子種毎の色分け)で表示される。
分子の向きはマウスドラッグで変更できる。
タンパク質の立体構造の表示(2)
メニューバーをクリックして、Display→Ribbons、Colours→Structure を選ぶ。
αヘリックスは赤、βシート(βストランド)は黄色で表示される。
タンパク質の立体構造の表示(3)
Glu35 と Asp52 が触媒残基なので、目立つようにしてみる。
select コマンドで Glu35 と Asp52 を選択し、Display→Ball&Stick
残基全体が赤や黄色になり原子種がわからないので、Colours→CPK
選択した残基(原子)だけに変更が反映される。全原子を選択するには select all。
マウスで原子をクリックすると、
その番号、原子種、残基名等が表示される。
タンパク質の立体構造の表示(4)
触媒残基間の距離は、異種生物の lysozyme であってもほぼ等しく保存されている。
触媒残基にあるカルボキシル基の最近接酸素間の距離を測定してみる。
メニューバーから Settings→Pick Distance を選び、注目する2原子をクリックする。
ここでは目視で近い酸素(赤球)をクリックする(順序はどちらでもいい)。
クリックした原子が点線で結ばれ、
原子間の距離が表示される(単位:Å)。
コマンドラインにも数値が出力される。
絵が小さくて見づらければ zoom 200 等
とコマンドを打って拡大する。
元に戻すには zoom 100。
また、元通りクリックした原子名が分かる
ようにするには、Settings→Pick Ident。
その他、結合角、二面角、ラベル等いろ
いろなモードがある。