6回 5/24 1章 生命科学 1

生命情報科学概論 講義計画
6回 5/24 1章 生命科学 1- 6
7回 5/31 1章 生命科学 1-11
1-10
1-13, 1-19
8回 6/7 2章 計算科学 2- 1
9回 6/14 2章 計算科学 2- 6
10回 6/21 2章 計算科学 2-13
2- 5
2-12
2-20
11回 6/28 4章 構造解析 4- 1
12回 7/5 4章 構造解析 4- 7
4- 6
4-12
1-20
13回 7/12 6章 オーミクス解析 6- 1 6- 4 �
14回 7/19 タカラバイオ特別講義(北川先生)
15回 7/26 6章 オーミクス解析 6- 5 6- 8�
テキストのpdfは毎週以下のページの
http://sird.nagahama-i-bio.ac.jp/sird/download.php
DLTEXT for download からダウンロードすること
4"7$~$4"8
1)  塩基配列やアミノ酸配列の類似性は配列一致度(= {一致した塩基やアミノ酸の数)/{比較した
数} x 100 %) で表す。立体構造の類似性は、対応する原子(N個)の間の距離が最小になるよ
うに構造Aと構造Bを置いた場合(重ね合わせという)に、対応するAの原子AiとBの原子Biの
間の距離dA-B, iの二乗平均のルート(単位は距離単位の二乗、タンパク質などではオングスト
ロームÅの二乗 = Å2)で表す。これをRMSD(根平均二乗偏差 = Root Mead Square
Deviation)という。
2)  構造のわかったタンパク質同士を重ね合わせて
RMSDを求めると右のグラフになる。アミノ酸配
列一致度が20 30%以上なら構造はよく似ている。
これは重ね合わせたタンパク質が相同(進化上の類
縁性がある)であるためと考えられている。つまり
構造は配列よりも保存性が高いので、この程度ま
でアミノ酸配列が一致していれば、高精度で構造
を予測できる。
H19-問73
立体構造の似ている2つのタンパク質間で、対応関係にある原子が分かっている場合には、RMSD(Root Mean
Square Deviation)と呼ばれる数値を計算することにより、立体構造の重なり合いの程度を数値化することがで
きる。RMSDは、全ての対応する原子間の距離を2乗した値の平均値(相加平均)にルートをとったものとして
定義される。
あるタンパク質における6つの原子A、B、C、D、E、Fと別のタンパク質の6つの原子A 、B 、C 、D 、E 、
F について対応関係が分かっており、互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は
以下の表のようになった。この表からB−B 、 C−C 、 E−E は正確に重なったが、他の原子間ではずれが見ら
れることがわかる。ここで、6つの原子に対するRMSD値はいくらになるか。選択肢の中からもっとも適切な値
を一つ選べ。ただし、原子間距離の単位は考慮しないものとする。
1$
2$$
3$$
4$$
0.5
0.66
1.0
1.33
4"7$~$4"8
1)  「タンパク質フォールド1000個説」のよ
うに、アミノ酸配列一致度が低くても構造
が類似している場合は多く観察される。こ
れらは相同タンパク質かどうかはわからな
いが、非常に遠い相同関係にある場合も含
まれている。
2)  非常に遠い相同関係にある場合、保存され
ているアミノ酸はタンパク質の機能にとっ
て重要である(=ほかのアミノ酸に置き換え
ることが難しい)ことが多い。遠い相同タ
ンパク質をアラインメントしたり、多数の
相同タンパク質をマルチプルアラインメン
トして高度に保存されているアミノ酸残基
(触媒機能を持つとか、ほかの分子=リガン
ドを結合する)を絞りこむことで、機能的に
重要な残基を特定できる。配列アラインメ
ントでの絞り込み!立体構造で検証するこ
とをマッピングという。
4"9
1)  タンパク質の立体構造上で、触媒部位やほかの分子(リガンド)の結合にかかわる部位は、
溝(クレフト)やポケットなどの「へこみ」である場合が多い。
2)  クレフトやポケットを特定するためにタンパク質の表面(サーフェス)を計算する。タンパ
ク質の表面とは、水分子などの「ほかの分子がそれ以上入ってこられない限界面」で、
溶媒可接触面(水分子に模した球をタンパク質上で転がしたときに球の中心が通る面。
ASA=Accessible Surface Areaともいう)やコノリーサーフェス(同じ球を転がしたとき
に球の表面が通る面)などで定義される。
問56 以下の記述の ( a ) ∼ ( d ) に入る語句の組み合わせとして、もっとも適切なものを選択肢の中から一つ選べ。
溶媒露出表面は、溶質分子のファンデルワールス球群に接するように、水分子の大きさの球をくまなく転がしたときの ( a ) と
して定義され、下に示した二次元の模式図 ( b ) の太線に相当する。その面積は溶媒露出表面積と呼ばれる。溶媒露出表面積に
水分子の直径を乗じた値は、溶質分子に接触(水和)できる水分子の総体積の近似値になる。タンパク質が伸びた状態からコンパ
クトに折りたたまれるフォールディングの過程や、解離した二つの分子が結合するドッキングの過程においては、溶媒露出表面積
は ( c ) する。これは、これらの過程の前後において、結合する水分子の数より解離する水分子の数のほうが ( d ) ことを示す。
立体構造予測や複合体構造予測では、原子ごとの溶媒露出表面積の変化から水和自由エネルギーを見積もる計算法が広く採用され
ている。
1. 
2. 
3. 
4. 
(a)
(a)
(a)
(a)
球の中心の描く軌跡の面 球の中心の描く軌跡の面
球が侵入できない領域との境界面
球が侵入できない領域との境界面
(b)
(b)
(b)
(b)
A
A
B
B
(c)
(c)
(c)
(c)
減少 増加 減少 増加 (d)
(d)
(d)
(d)
多い 少ない
多い
少ない
4"10
1)  タンパク質の立体構造上は複雑で把握しに
くいので、一枚の図でタンパク質全体の構
造を把握できるように工夫したものに、コ
ンタクトマップやラマチャンドランマップ
がある。
2)  コンタクトマップはアミノ酸配列を縦軸と
横軸にとって、立体構造で近い位置にある
アミノ酸残基を点で示したものである。例
えば点が点がたくさんある「三角」領域は
内部でまとまっているので「ドメイン」と
よばれる。点がほとんど無い領域があれば、
ドメインがお互いに接触せず、独立性が高
い、などの情報がわかる。
逆平行シート
3)  二次構造のパターンも把握できる。逆平行
シートは配列上では遠いアミノ酸ほど立体
構造では近くにくるので、対角線に垂直な
線になる。平行シートは逆の関係になるの
で、対角線に平行な線として認識される。
平行シート
4"10
1)  ペプチドで自由に回転できるのは、Cα原子の前(φ=ファイ)と後(ψ=プサイ)の2箇所だけ(前
回)。この性質を利用すると、φ角(横軸)ψ角(縦軸)で主鎖構造をプロットできる。これがイン
ドのラマチャンドランが考案したラマチャンドランマップである。
2)  二次構造はラマチャンドランマップで特定の領域
を占めるので、二次構造含量を把握しやすい。ま
βシート領域
左巻らせん領域
た普通に占めることのできる領域が限られるので、 180
構造的におかしいアミノ酸を特定できる。
3)  アミノ酸の中で、グリシンは
側鎖の障害がないので占めら
れる領域が広い、プロリンは
φ角が固定されψ角しか自由
ψ角
0
度がないという特徴がある。
ほかのアミノ酸は大体同じ分
布になる。
-180
0
-180
へリックス領域
φ角
180
Most favored region 90%
Favored region 99%
Generously allowed 100%
4"11
1)  未知の立体構造を予測する方法はたくさんあるが、a)ホモロジーモデリング法(比較モデリング
=CM法ともいう), b) フォールド認識法, c) ab initio法(アブイニシオ法と読む。第一原理法とも
いう)の3つに分類される。
2)  ホモロジーモデリング法は相同なタン
a) ホモロジーモデリング法
パク質では構造が保存されることを利
用する方法(4-7
4-8参照)。フォール
ド 認 識 法 は 「 タ ンパ ク 質 フ ォ ール ド
1000個説」に従って、相同ではないが
構造が似ているタンパク質や遠い相同
b) フォールド認識法
タンパク質を探す方法である。
3)  上2つの方法は「経験的な知識」を利
用する方法。これを使わない方法をab
initio法という。もっともよく使われる
方法は、分子動力学法を使って物理化
学計算により安定な(エネルギーの低
い)構造を探す方法だが、フラグメント
アセンブリなど既知のタンパク質を丸
c) ab initio法
ご と 鋳 型 と して 使 わ な い 方 法 も a b
initio法に含まれる。
4"12
原子1
1)  実際の分子中の原子は熱振動などで運動している。
の運動を結合などの制限(結合距離、結合角、ねじれ
結合角
角の3つが主要な制限)とファンデルワールス力など 結合距離
の制限(力場)を守りながら計算機でシミュレーション
する方法が分子動力学法(MD法)。
原子2
2)  分子動力学法にはいろいろなバリエーションがある
エネルギー
が、それらは構造空間をより広く探索できるように
工夫されている。エネルギーの高い構造ほど実現可
能性が低いので、構造空間を探索する際は高エネル
ニーリング法、レプ
リカ交換法などはす
べてこの障壁を効率
エネルギー
構造空間
EM
Δt
MD
トラジェクトリ
的に乗り越える工夫
である。
安定領域1
安定領域2
エネルギー
ミュレーテッドア
エネルギー
エネルギー
モンテカルロ法、シ
原子3
ねじれ角
通常法
構造空間
モンテカルロ法
ギー領域の「山」が障壁になり、局所的な「谷」の
空間しか探索できない。
原子4
構造空間
シミュレーテッドアニーリング法
構造空間
レプリカ交換法
構造空間
H!9-問74
タンパク質の主鎖に添って定義される二面角のうち、φ(窒素原子とα炭素原子の間の二面角)と、ψ(α炭素原子とカルボニル基の
炭素原子の間の二面角)の値を各残基ごとに計算して二次元にプロットしたものを、ラマチャンドラン・プロットと呼ぶ。以下に
示したラマチャンドラン・プロットに対する説明文の中で、もっとも適切なものを一つ選べ。
1
2
3
4
(a)、(b) はともにαへリックスの領域である。
(a)、(b) はともにβストランドの領域である。
(a) はαへリックス、(b) はβストランドの領域である。
(a) はβストランド、(b) はαへリックスの領域である。
H24-問60
タンパク質のアミノ酸配列の一致度、立体構造の違い、および相同性についてもっとも不適切な記述を選択肢の中から一つ選べ。
1 アミノ酸配列の一致度が30%以上なら、多くの場合、立体構造の違いは数Å以下である。
2 アミノ酸配列の一致度が100%であっても、実験条件の違いなどによって、立体構造が多少異なる場合がある。
3 立体構造の違いが数Å以下であっても、アミノ酸配列の一致度が30%未満であれば、相同である可能性はない。
4 相同で機能の保存されたタンパク質を立体構造でアラインメントした場合、アミノ酸配列の一致度が30%以下であっても、
機能部位の位置は対応し、そのアミノ酸種は同一であることが多い。
H20-問65
生体高分子の立体構造解析に用いられる計算手法のうち、分子動力学法と分子力学法に関する以下の記述において、不適切なもの
を選択肢の中から一つ選べ。
1 分子動力学法は、英語ではMolecular Dynamics であり、MDという略称も使われる。
2 分子力学法は、英語ではMolecular Mechanics であり、MMという略称も使われる。
3 分子動力学法では、分子を構成する各原子の運動は、ニュートンの運動方程式で記述される。
4 分子力学法では、分子を構成する各原子の運動は、シュレーディンガーの波動方程式で記述される。