分子細胞生物 I

10/20/2015
生命科学科3年後期�
分子細胞生物�I
バイオインフォマティクスの基礎と応用 藤 博幸
関西学院大学理工学部生命医化学科
タンパク質のバイオインフォマティクス
protein informatics
タンパク質のアミノ酸配列�
機能や構造の情報は配列に全てコードされている�
予測
prediction
配列�
デザイン
design
機能�
予測
prediction
構造�
タンパク質のバイオインフォマティクスのゴール
���������これら3者の関係を明らかにする事�
一本のアミノ酸配列からの構造・機能予測は困難�
相同なアミノ酸配列の比較から構造や機能を推測する
������=相同配列の比較解析�
1. イントロダクション
○ 分子生物学の現状の理解
○ バイオインフォマティクスとその分子生物学における役割
○ タンパク質を解析することの意義
2. 相同タンパク質
�
○ 相同タンパク質とは?
�●�種分化と遺伝子重複
�●�ホモロジーとアナロジー
�●�ファミリー、スーパーファミリー
○ 相同タンパク質の分子進化の性質
�● �保存的な配列の変化
�● �一次構造上の変異の不均一性
�● �分子時計�
�● �立体構造の保存
�● �機能部位の保存
相同タンパク質とは?�
相同タンパク質の形成
・種分化����orthologue
・遺伝子重複
paralogue�(種分化以前に生じた場合)
���� 機能の多様化に特に重要
分子進化�(Molecular Evolution)
�上の機構で分岐した遺伝子に突然変異が生じることで、
�配列が変化していくこと
�基本ステップは
���○�アミノ酸置換
���○�挿入/欠失��
遺伝
自分のコピーを作成すること
分子レベルでは、完全な複製
ATGCAGGCTAA
↓
ATGCAGGCTAA
分子進化の原動力 = コピーミス
分子進化の基本ステップ
(1)置換 ATGCAGGCTAA
↓
ATGCCGGCTAA
(2)挿入/欠失 ATGCAGGCTAA
ATGGCTAA
種分化�
祖先型の生物�
α
10
20
30
40
50!
human VLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFDLSH!
::: ::.:.::::::.:.:..::::::::::: :::::::::::::.::!
mouse VLSGEDKSNIKAAWGKIGGHGAEYGAEALERMFASFPTTKTYFPHFDVSH!
10
20
30
40
50!
!
60
70
80
90
100!
human GSAQVKGHGKKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKL!
::::::::::::::::..:..:.::.:.::::::::::::::::::::::!
mouse GSAQVKGHGKKVADALASAAGHLDDLPGALSALSDLHAHKLRVDPVNFKL!
60
70
80
90
100!
!
110
120
130
140 !
human LSHCLLVTLAAHLPAEFTPAVHASLDKFLASVSTVLTSKYR! !
::::::::::.: ::.:::::::::::::::::::::::::!
mouse LSHCLLVTLASHHPADFTPAVHASLDKFLASVSTVLTSKYR!
20/141!
110
120
130
140 !
突然変異�
種分化�
α
α
生物の種分化を反映したタンパク質の増加�
進化�
突然変異(mutation)と置換(substitution)
突然変異は集団中の個体に生じる
※ 進化に寄与するのは体細胞ではなく生殖系列
の細胞に生じる突然変異
突然変異(mutation)と置換(substitution)
有害な突然変異は、集団から除去される
(負の選択 or 純化淘汰)
突然変異(mutation)と置換(substitution)
有利な突然変異は急速に集団中に広まり
集団全体がその突然変異遺伝子で置き換
えられる (正の選択)
工業暗化
(industrial melanism)
白と黒の体色を持つオオモリエダシャク
19世紀後半から、ヨーロッパの工業都市が発展するにつれて、その付近
するガ(蛾)に暗色の変異が増加した
田園都市では淡色型の方が目立ちにくくて小鳥に捕食されずに生き残る
対して工業地帯では煤煙でまわりが黒くなっているため暗化型のほうが
にくいため
適応度 (fitness)
ある個体の子供の内の、繁殖年齢まで達したものの数
中立説
自然選択の否定ではない。
あくまでも、タンパク質をコードする遺伝子の
分子レベルの進化についての説
突然変異(mutation)と置換(substitution)
突然変異(mutation)と置換(substitution)
中立な突然変異の頻度はランダムに浮動し
確率的に集団中に固定 (選択的に中立)
固定にいたる途中の過程 多型(polymorphism)
タンパク質をコードする遺伝子における
分子レベルの変化の大部分は中立的
中立な変化 自然選択
Susumu Ohno�
(1928 - 2000)
Evolution by Gene Duplication (1970)�
Evolu&onary fate and func&onal consequence Gene A
Gene A'
duplication
Gene A
Non-processed
pseudogene A
Function A
Non-functionalization
(pseudogenization)
Gene A
Gene B
Neofunctionalization
Functions A + B
Gene A'
Subfunctionalization
Gene A''
Functions A' + A'' = A
●機能遺伝子の生成
・重複遺伝子が異なる機能を獲得した例(globin superfamily)
600-800 Million years ago
embryonal gene
fetal gene
adult gene
pseudo gene
Myoglobin Chromosome 22
450-500
> 300
〜260
150-200
100-140
40-80(?)
40-50
〜35
ε Gγ Aγ δ β ξ2 Ψα1 α1 θ Ψβ Ψξ1 Ψα2 α2 Chromosome11
Hemoglobinβ
Chromosome16
Hemoglobinα
重複+変異による
グロビン蛋白質の進化 Fundamentals of Molecular evotution, GENOMES second edition, Molecular Biology of the Cell 4th editionを改変 *Myoglobin:
・モノマーで機能
4つのサブ
ユニットが
協調的に
働き4分子の
酸素と結合 *Hemoglobin:
・ヘテロテトラマー
で機能
・各発生段階で発現
するsubunitの組み合
わせを変える
↓
酸素分子との親和性
が変化し、段階に応
じた機能が微調整さ
れる
ex.)
α2γ2(胎児期)> α2β2, α2δ2(成体) 遺伝子重複�
祖先配列�
遺伝子重複�
アミノ酸の変化�
機能の変化��
相同タンパク質�
: : : : : : :
: : : : : : :
:
:
:
:
1つの祖先から、機能の多様化を反映した複数のタンパク質が生成�
進化�
祖先遺伝子�
遺伝子重複による
α、βの形成�
ヒト、ラット
�の種分化�
paralogous
ヒト��������������ラット��������ヒト�������������ラット����
ヘモグロビンα����ヘモグロビンβ
orthologous
相同配列の比較解析
相同性�(Homology)
�共通祖先遺伝子に由来する配列の類似性
機能や立体構造が一致あるいは類似している
ことが多い。�
データベース検索
機能あるいは構造既知の配列からの類似性を
検出することで、機能や構造を予測�
問い合わせ配列�
配列DB
検出された有意な
類似性を示す配列�
が構造あるいは機能既知ならば�
もし、
問い合わせ配列も同様の機能あるいは構造を有する。�
A major objective of the analysis of protein sequences is to discover which share a common ancestor. Determining an evolutionary relationship is useful because it generally implies a common or similar function.
Hubbard,T.J.P. (1997) Current Opinion in Str. Biol. 7, 190-193.
Similarity
Homology
(相同)
Divergent
Evolution
Analogy(相似)
Convergent
Evolution
Accidental
Similarity
立体構造の分類や
比較では、これを
Analogyと呼んで
いる�
Twilight Zone
Homologyは本来定性的な言葉
80% homologyとか30% homologyという
言い方は正しくない。
Identity (一致度)が正しい。�
ファミリー(family),�スーパーファミリー(superfamily)
ファミリー:相同なタンパク質で、お互いにアミノ酸配列の類似性�
の高い一群�
�
�
スーパーファミリー:それらのメンバー間のアミノ酸配列での�
類似性は微弱であっても、機能や立体構造に類似性が観察�
されるファミリーの。進化的に遠い関係にある相同タンパク質を、�
近縁な相同タンパク質により形成されるファミリーと区別する�
ためDayhoffにより作られた用語。�
※ Dayhoffは、配列一致度50%を基準としてファミリーと�
スーパーファミリーを区別した。しかし、ファミリー、スーパー�
ファミリーの分類の明確な基準はない。�
family1
family2
family3
Superfamily A
相同タンパク質の分子進化の性質�
1)  多くのアミノ酸置換は保存的
��スコア・テーブル
2)�置換や挿入/欠失は、一次構造中不均一に生じる
��機能的制約と構造的制約 (疎水コア、モチーフ)
3)�分子時計
��置換の数は分岐後の時間に比例
4)�類縁蛋白質の立体構造は保存される
��ホモロジー・モデリングの根拠
5) 機能も基本的には保存的である�
多くのアミノ酸置換は保存的
スコア・テーブル
進化の過程での置換の生じるやすさを数値化�
G A S T P L I M V D N E Q F Y W K R H C G 5 A 1 2 S 1 1 2 T 0 1 1 3 P -1 1 1 0 6 L -4 -2 -3 -2 -3 6 I -3 -1 -1 0 -2 2 5 M -3 -1 -2 -1 -2 4 2 6 V -1 0 -1 0 -1 2 4 2 4 D 1 0 0 0 -1 -4 -2 -3 -2 4 N 0 0 1 0 -1 -3 -2 -2 -2 2 2 E 0 0 0 0 -1 -3 -2 -2 -2 3 1 4 Q -1 0 -1 -1 0 -2 -2 -1 -2 2 1 2 4 F -5 -4 -3 -3 -5 2 1 0 -1 -6 -4 -5 -5 9 Y -5 -3 -3 -3 -5 -1 -1 -2 -2 -4 -2 -4 -4 7 10 W -7 -6 -2 -5 -6 -2 -5 -4 -6 -7 -4 -7 -5 0 0 17 K -2 -1 0 0 -1 -3 -2 0 -2 0 1 0 1 -5 -4 -3 5 R -3 -2 0 -1 0 -3 -2 0 -2 -1 0 -1 1 -4 -4 2 3 6 H -2 -1 -1 -1 0 -2 -2 -2 -2 1 2 1 3 -2 0 -3 0 2 6 C -3 -2 0 -2 -3 -6 -2 -5 -2 -5 -4 -5 -5 -4 0 -8 -5 -4 -3 12 (1) G,A,S, T, P: small hydrophilic residues
(2) L, I, M, V: hydrophobic residues
(3) D, N, E, Q: nagatively charged residues and the relatives
(4) F, Y, W: aromatic residues
(5) K, R, H: positively charged residues
(6) C: Cys
INDEL = Insertion and Deletion 挿入/欠失�
表面のループなどで
生じやすく、内部の
疎水コアや二次構造
(αヘリック、βストランド)
などでは生じにくい�
構造を変化させないような場所に生じやすい�
2)�置換や挿入/欠失は、一次構造中不均一に生じる
��機能的制約と構造的制約 (疎水コア、モチーフ)
�
Motif A
酵素の活性中心�
Motif B
多量体の
会合面�
Motif C
��疎水コア
側鎖のパッキングが
密なため。表面近傍は
逆に置換や挿入/欠失
が生じやすい。�
手順
リゾチームのアミノ酸配列
!
>LYC_HUMAN ヒト Lysozyme C MKALIVLGLVLLSVTVQGKVFERCELARTLKRLGMDGYRGISLANWMCLAKWESGYNTRATNYNAGDRST DYGIFQINSRYWCNDGKTPGAVNACHLSCSALLQDNIADAVACAKRVVRDPQGIRAWVAWRNRCQNRDVR QYVQGCGV >LYC1_BOVIN ウシ Lysozyme C 1 MKALIILGFLFLSVAVQGKVFERCELARTLKKLGLDGYKGVSLANWLCLTKWESSYNTKATNYNPGSEST DYGIFQINSKWWCNDGKTPNAVDGCHVSCSELMENDIAKAVACAKQIVSEQGITAWVAWKSHCRDHDVSS YVEGCTL >LYC_CHICK ニワトリ Lysozyme C MRSLLILVLCFLPLAALGKVFGRCELAAAMKRHGLDNYRGYSLGNWVCAAKFESNFNTQATNRNTDGSTD YGILQINSRWWCNDGRTPGSRNLCNIPCSALLSSDITASVNCAKKIVSDGNGMNAWVAWRNRCKGTDVQA WIRGCRL >LYC2_ONCMY マス Lysozyme C II MRAVVVLLLVAVASAKVYDRCELARALKASGMDGYAGNSLPNWVCLSKWESSYNTQATNRNTDGSTDYGI FQINSRYWCDDGRTPGAKNVCGIRCSQLLTADLTVAIRCAKRVVLDPNGIGAWVAWRLHCQNQDLRSYVA GCGV >LYC_BOMMO カイコ Lysozyme MQKLIIFALVVLCVGSEAKTFTRCGLVHELRKHGFEENLMRNWVCLVEHESSRDTSKTNTNRNGSKDYGL FQINDRYWCSKGASPGKDCNVKCSDLLTDDITKAAKCAKKIYKRHRFDAWYGWKNHCQGSLPDISSC �
>LYSP_DROME ハエ Lysozyme P MKAFLVICALTLTAVATQARTMDRCSLAREMSKLGVPRDQLAKWTCIAQHESSFRTGVVGPANSNGSNDY GIFQINNKYWCKPADGRFSYNECGLSCNALLTDDITNSVKCARKIQRQQGWTAWSTWKYCSGSLPSINSC F 手順
リゾチームのアミノ酸配列 マルチプル・アラインメント
二次構造情報を重ねて表示�α helix
�β strand
!
��ヒト
��ウシ
��マス
ニワトリ
�カイコ
��ハエ�
CLUSTAL W (1.81) multiple sequence alignment!
!
LYC_HUMAN
-MKALIVLGLVLLSVTVQGKVFERCELARTLKRLGMDGYRGISLANWMCLAKWESGYNTR!
LYC1_BOVIN -MKALIILGFLFLSVAVQGKVFERCELARTLKKLGLDGYKGVSLANWLCLTKWESSYNTK!
LYC2_ONCMY ----MRAVVVLLLVAVASAKVYDRCELARALKASGMDGYAGNSLPNWVCLSKWESSYNTQ!
LYC_CHICK
-MRSLLILVLCFLPLAALGKVFGRCELAAAMKRHGLDNYRGYSLGNWVCAAKFESNFNTQ!
LYC_BOMMO
-MQKLIIFALVVLCVGSEAKTFTRCGLVHELRKHGFEENL---MRNWVCLVEHESSRDTS!
LYSP_DROME MKAFLVICALTLTAVATQARTMDRCSLAREMSKLGVPRDQ---LAKWTCIAQHESSFRTG!
:
. .
.:. ** *. :
*.
: :* * : **. * !
!
LYC_HUMAN
ATNYNAGDRSTDYGIFQINSRYWCNDGKTPGAVNACHLSCSALLQDNIADAVACAKRVVR!
LYC1_BOVIN ATNYNPGSESTDYGIFQINSKWWCNDGKTPNAVDGCHVSCSELMENDIAKAVACAKQIVS!
LYC2_ONCMY ATNRN-TDGSTDYGIFQINSRYWCDDGRTPGAKNVCGIRCSQLLTADLTVAIRCAKRVVL!
LYC_CHICK
ATNRN-TDGSTDYGILQINSRWWCNDGRTPGSRNLCNIPCSALLSSDITASVNCAKKIVS!
LYC_BOMMO
KTNTN-RNGSKDYGLFQINDRYWCS--KGASPGKDCNVKCSDLLTDDITKAAKCAKKIYK!
LYSP_DROME VVGPANSNGSNDYGIFQINNKYWCKPADGRFSYNECGLSCNALLTDDITNSVKCARKIQR!
..
. *.***::***.::**.
. . * : *. *: ::: : **::: !
!
LYC_HUMAN
DPQGIRAWVAWRNRCQNRDVRQYVQGCGV!
LYC1_BOVIN E-QGITAWVAWKSHCRDHDVSSYVEGCTL!
LYC2_ONCMY DPNGIGAWVAWRLHCQNQDLRSYVAGCGV!
LYC_CHICK
DGNGMNAWVAWRNRCKGTDVQAWIRGCRL!
LYC_BOMMO
R-HRFDAWYGWKNHCQGS--LPDISSC--!
LYSP_DROME Q-QGWTAWSTWK-YCSGS--LPSINSCF-!
:
** *: * .
: .* !
モチーフ:相同蛋白質のファミリーを特徴づける
�����進化の過程で保存
シグナル:進化的起原を共有しない複数のファミリー
�����のメンバーに見い出される
�����進化の過程で必ずしも保存されない
�����ex) 糖鎖修飾シグナル
������ リン酸化シグナル��
※�立体構造の分野での、構造モチーフは、超二次構造といった
意味であり、ファミリー内での保存という意味はなく、むしろシグナル
のように、様々な構造の文脈の中で頻出するパターンを意味する。配列
のモチーフに対応する言葉としては、homologous core structureなどがある。�
A型インフルエンザウイルス
ゲノムは8本のRNAに
分かれている
保存的なサイトではなく、変異の激しいサイトが
重要である場合がある。�
ホストの抗体による攻撃�
抗体によって認識
されるアミノ酸�
他のアミノ酸に置換する
ことで抗体の攻撃を逃れる�
ウイルス粒子�
表面抗原�
○�変異の激しいサイトも一次構造上は不均一
○�抗原性決定部位は立体構造表面にある
○�核酸レベルでの比較が重要(同義置換と非同義置換)
→�正の選択(positive selection) or 適応進化(adaptive evolution)の検出�
3)�分子時計
��置換の数は分岐後の時間に比例�
関与する生物学的機能の
重要性によって進化速度
は異なる。�
相違度�
+
*
+
+
*
+
+
+
*
*
*
*
*
���分岐時間
(化石などから推定)�
分子系統解析の根拠を与える�
オーソロガスな相同配列を使うと生物種の系統関係を表す
系統樹を構築できる。
ヒト
イヌ
チンパンジー
ゴリラ
ヒト
ニホンザル
チンパンジー
オランウータン
オランウータン
ニホンザル
イヌ
ゴリラ
無根系統樹
有根系統樹
4)�類縁蛋白質の立体構造は保存される
��ホモロジー・モデリングの根拠�
進化的な関係が遠いもの(配列一致度が小さいもの)
では、
�・二次構造の数や長さが大きく異なること
�・二次構造の相対的な配向や局所的なトポロジーは
��異なること
が多い。
相同な蛋白質では基本的なトポロジーは保存されている。
SCOPやCATH (構造分類データベース)における
Family, Superfamilyの分類の基準�
Δ=0.40 exp(1.87H)
Δ:common core 主鎖の重ねあわせのRMSD
H:配列の相違度
Hが小さい時:表面のみの変化
Hが大きい時:表面と内部の変化
�内部の変化は表面に比べ大きな構造変化をもたらす�
アミノ酸配列では類似性が検出できないほど
アミノ酸置換が蓄積された遠い進化的関係に
あるタンパク質でも、立体構造を比較することで
類縁関係を検出できる。
(1)homology なのか analogy なのかの区別が
�必要になってくる
(2)アミノ酸配列がそれほど変化していて、何故
�共通のフォールドをとれるのか?�
Homology Modeling
立体構造未知のアミノ酸配列�
配列類似性�
立体構造既知の蛋白質�
(5) 相同タンパク質の機能(生化学的機能)は
基本的に保存される。�
�
Thornton JM et al. (1999) J. Mol. Biol. 293, 333-342.
シングル・ドメインとマルチドメインに分類し、酵素活性の保存を調査
(シングル・ドメインのみの調査+マルチドメインタンパク質を含めた調査) シングル・ドメインの酵素の場合: ○ 配列一致度が40%以上:EC番号の最初の3つはほぼ完全に保存 ○配列一致度が30%レベル:EC番号の最初の3つは95%保存 ○ 配列一致度が30%以下:EC番号の保存はきわめて悪くなる。 シングル・ドメインとマルチドメインの両方のタンパク質を含む場合:
○ 配列一致度40%以上:EC番号の保存はシングル・ドメインのケースと同様 ○ 配列一致度が30%レベル:EC番号の最初の3つは90%保存 どちらの解析においても: 配列一致度30%以下では、酵素/非酵素のペアが多く観察された。 相同タンパク質の分子進化の性質�
1)  多くのアミノ酸置換は保存的
��スコア・テーブル
2)�置換や挿入/欠失は、一次構造中不均一に生じる
��機能的制約と構造的制約 (疎水コア、モチーフ)
3)�分子時計
��置換の数は分岐後の時間に比例
4)�類縁蛋白質の立体構造は保存される
��ホモロジー・モデリングの根拠
5) 機能も基本的には保存的である�
逆転写関連因子の進化的関係とその応用�
レトロウイルス・プロテアーゼのコンセンサス配列�
�
�
�
�
(Hydrophobic)-Asp-Thr-Gly-(Small Hydrophilic)�
������ ��� 予 測
レトロウイルスのプロテアーゼは酸性プロテアーゼである。
H. Toh et al. EMBO J. 4, 1267 (1985) H. Toh et al. Nature 315, 691 (1985)
������������ 実 験
[1] 既知酸性プロテアーゼの立体構造を鋳型としたHIV プロテアーゼのホモロジー・モデリン
グ L.H. Pearl and W.R. Taylor, Nature 329, 351 (1987). [2] 酸性プロテーゼ阻害剤(ペプスタチン)によるHIV プロテアーゼの阻害 R.F. Nutt et al. Proc. Natl. Acad. Sci. USA 85, 7129 (1988). P.L. Darke et al. J. Biol. Chem. 264, 2307 (1989).
検 証
X 線結晶構造解析からHIV プロテアーゼは酸性プロテーゼと類似の構造である。 M. Miller et al. Science 246, 1149 (1989).
2apr
C-terminal domain
N-terminal domain
2apr N-terminal domain
2apr C-terminal domain
1hih
HIV protease
>> 0: 2aprb.pdb
>> 1: 1hih.pdb
>> 2: 2apra.pdb
YDSTKFKGSLTTVPI--DNSRGWWGITVDRATVGTSTVASSFDGILDTGTTLLILPN---
P----------QIT----LW-QRPLVT---IKIGG--Q--LKEALLDTGADDTV--LE--
AG-------VGTVPMTDYGNDIEYYGQ---VTIGTPGK--KFNLDFDTGSSDLWIASTLC
GGG EEE -- EEEEEEEEEE EEEEEE EEE ---
---------- ---- - EE---EEE --E--EEEEEEE E--E --
------- EEE EEE EEEEE---EEE E--EEEEEEE EEEE -------N-I------AASVARAYGASDNG--------DGTYTISCDTSAFK-------P
--------EM-------S---LPGRWKPKMIGGIG-GFIKVRQYDQ--------------
TNCGSGQTKYDPNQSSTY---QADGR-TWSISYGDGSSASGILAKDN----VNLGGLLIK
-------H-H------HHHHHHH -------- EEE ------- -------- ------- --- EEEEEEEEE -EEEEEEEE --------------
--- E-EEEEEE EEEEEEEEEEE----EEE EEE LVFSINGASFQVSPDSLVFEEFQG--QCIAGFGYGN----WGF-AIIG------------
ILIEICGHKA-------------IGTVLV-GPT------PVN---IIG------------
G-----------------------QTIELAKRE-AASFASGPNDGLLGLGFDTITTVRGV
EEEEE EEEEE HHHH EEE --EEE ---- -EEE ------------
EEEEE EEE-------------EEEEEE- ------ ---EE ------------
-----------------------EEEEEEEEE-EHHHH EEEE GGG ---DTFL-KN--N---YVVFN---QGV-PEVQIAPVAE
---RNLLTQIGC------TLNF----------------
KTPMDNLISQGLISRPIFGVYLGKAKNGGGGEYIFGG-
---HHHG-GE--E---EEEEE--- - EEEEE ---HHHH ------ ----------------
HHHHHHH EEEEE EEEEE -
>> 0: 2aprb.pdb
>> 1: 1hih.pdb
>> 2: 2apra.pdb
YDSTKFKGSLTTVPI--DNSRGWWGITVDRATVGTSTVASSFDGILDTGTTLLILPN---
P----------QIT----LW-QRPLVT---IKIGG--Q--LKEALLDTGADDTV--LE--
AG-------VGTVPMTDYGNDIEYYGQ---VTIGTPGK--KFNLDFDTGSSDLWIASTLC
GGG EEE -- EEEEEEEEEE EEEEEE EEE ---
---------- ---- - EE---EEE --E--EEEEEEE E--E --
------- EEE EEE EEEEE---EEE E--EEEEEEE EEEE -------N-I------AASVARAYGASDNG--------DGTYTISCDTSAFK-------P
--------EM-------S---LPGRWKPKMIGGIG-GFIKVRQYDQ--------------
TNCGSGQTKYDPNQSSTY---QADGR-TWSISYGDGSSASGILAKDN----VNLGGLLIK
-------H-H------HHHHHHH -------- EEE ------- -------- ------- --- EEEEEEEEE -EEEEEEEE --------------
--- E-EEEEEE EEEEEEEEEEE----EEE EEE LVFSINGASFQVSPDSLVFEEFQG--QCIAGFGYGN----WGF-AIIG------------
ILIEICGHKA-------------IGTVLV-GPT------PVN---IIG------------
G-----------------------QTIELAKRE-AASFASGPNDGLLGLGFDTITTVRGV
EEEEE EEEEE HHHH EEE --EEE ---- -EEE ------------
EEEEE EEE-------------EEEEEE- ------ ---EE ------------
-----------------------EEEEEEEEE-EHHHH EEEE GGG ---DTFL-KN--N---YVVFN---QGV-PEVQIAPVAE
---RNLLTQIGC------TLNF----------------
KTPMDNLISQGLISRPIFGVYLGKAKNGGGGEYIFGG-
---HHHG-GE--E---EEEEE--- - EEEEE 普通の配列アラインメント
---HHHH ------ ----------------
では困難
HHHHHHH EEEEE EEEEE -
(4-1) 分子系統樹を利用した機能予測
(1)エイコサノイド受容体の分子進化
(2)エンドセリン受容体のアンタゴニスト設計
(3) deorphanization
(4) CRY-DASH subfamilyの発見
Class A GPCR bovine rhodopsinの構造�
GPCRs
Monomer function
Peptides
Amines
Nucleic acids
Coupling with
trimeric G-protein
Conformation
change
β
α
G-protein
activation
γ
Secondary
messenger
GPCRs
•  Membrane proteins
•  Bind neurotransmitters (physiologically
active peptides, amines, nucleic acids,
etc).
•  Ligand binding to GPCRs causes their
conformation changes.
•  It leads to several signal transductions
conjugated with trimeric G-proteins.
GPCRs
•  About 1000 genes in human genome
•  Target for ~45% of clinically marketed drugs
•  Divided into 5 classes based on sequence
similarity (Class A-E, the other)
•  Atomically resolved structure in class A GPCR:
Bovine Rhodopsin
オルファクトリー受容体
プロスタグランジン受容体
カンナビノイド受容体
アデノシン受容体
オプシン
アミン受容体
ペプチド性リガンド受容体
エイコサノイド受容体の分子進化�
(1)PG受容体はクラスタを形成(同一起原)
���
���LT/LX受容体はペプチド性リガンド受容体
���から独立に進化
(2)PGE受容体によるシグナル伝達が
���PGシグナリングの始原的形態�
分子系統解析の利用�
エンドセリン受容体アンタゴニスト
�の設計への分子系統樹の利用�
Th. Fruh et al. Bioorganic & Medical Chemistry Lett. 6, 2323 (1996).
endothelin : ET
・血管内皮細胞により産生され、強力な血管収縮活性を示す ・21a.a. ・3種類のアイソフォーム<ET-1,2,3> 標的 ET receptorを介してホスホリパーゼCの活性化、 カルシウムチャンネルの開口など の細胞内シグナル伝達に関与 endothelin receptor ・7回膜貫通型のG蛋白質共役型受容体(GPCR) ・3種類<ETA,ETB,(ETC)> ETA・・・ET-1,ET-2への親和性高、ET-3への親和性低(Gαq,Gαs) ETB・・・ET-1,ET-2,ET-3への親和性同程度 (Gαq,Gαi) (ETC・・・ET-3への親和性高 ) Gly scanによる受容体結合部位の探索�
IRL1722: Gly scanに基づきTyr-Pheをミミックした分子
�����
H
N
O
N
H
IRL 1722
Ki (ETB) = 16µM
COOH
バソプレッシン受容体
ニューロペプチド Y
受容体
タキキニン受容体
エンドセリン受容体
ヒト
サブスタンスP
受容体�
ゴナドトロピン放出ホルモン
受容体
ヒトエンドセリンA受容体�
ヒトエンドセリンB受容体�
ニューロメジン受容体
ガストリン放出ペプチド受容体
ボンベシン受容体
ガストリン
受容体
ニューロテンシン
受容体
ソマトスタチン
受容体
PAF 受容体
走化性ペプチド受容体
アンジオテンシン
受容体
IL-8受容体
ブラジキニン受容体
スロンビン受容体
Substance P receptor のアンタゴニスト140種類
�
(Chibacompound)
ランダムスクリーニング�
3種類エンドセリン受容体に結合するものを選択
�������Ki = 5 ~ 20 µM
CGP49941: Substance P 受容体アンタゴニスト
������
H
N
O
N
O
N
H
CGP 49941
Ki (ETB) = 5µM
H
N
H
N
O
N
H
O
COOH
N
O
N
H
IRL 1722
Ki (ETB) = 16µM
CGP 49941
Ki (ETB) = 5µM
H
N
O
O
N
N
H
COOH
IRL 1841
Ki (ETB) = 36nM
H
N
O
N
O
N
H
COOH
IRL 2500
Ki (ETB) = 1nM
"
オーファン受容体
内在性リガンドが不明の受容体
deorhanization:
内在性リガンドを同定すること
その受容体が創薬ターゲットとして
有効か否かを調べるのに必要
Deorphanization with Molecular Phylogenetic Tree
(1)  Szekeres et al. (2000) J. Biol. Chem. 275, 20247-20250
オーファン受容体 FM3のligandがペプチドである事を
�分子系統解析により予測
(2) Chambers et al. (2000) J. Biol. Chem. 275, 10767-10771.
� KIAA0011を含むオーファン受容体のリガンドが、
�ヌクレオチドの修飾体であることを、分子系統解析より予測
(3) Zhu et al. (2001) Mol. Pharmacol. 59, 434-441.
オーファン受容体AXOR35が新規のヒスタミン受容体である
�ことを、H3ヒスタミン受容体との類似性がら推測�