6回 5/24 1章 生命科学 1

生命情報科学概論 講義計画
6回 5/24 1章 生命科学 1- 6
7回 5/31 1章 生命科学 1-11
1-10
1-13, 1-19
8回 6/7 2章 計算科学 2- 1
9回 6/14 2章 計算科学 2- 6
10回 6/21 2章 計算科学 2-13
2- 5
2-12
2-20
11回 6/28 4章 構造解析 4- 1
12回 7/5 4章 構造解析 4- 7
4- 6
4-12
1-20
13回 7/12 6章 オーミクス解析 6- 1 6- 4 �
14回 7/19 タカラバイオ特別講義(北川先生)
15回 7/26 6章 オーミクス解析 6- 5 6- 8�
テキストのpdfは毎週以下のページの
http://sird.nagahama-i-bio.ac.jp/sird/download.php
DLTEXT for download からダウンロードすること
6-5 k-平均法は9∼10回で学習した機械学習のなかでも比較的簡単な方法で、例えば2つ
の遺伝子の発現量から被験者ががんかどうかを予測したい場合、被験者のデータに
近い方からk個の既知データ(2つの遺伝子の発現データが得られていて、がんか否か
の診断がついている)をとって、そのなかでの多数決で被験者の状態を推定する。な
ので、kの大きさ(図では被験者Xを中心にした同心円に入る既知データの数)に依存
して結果がゆれるという欠点がある。多数決を取るので、kは奇数にすることが多い。
2) 
この例では、遺伝子2発現量 > 遺伝子1発現量 (図の緑線より上の領域)である傾向が
明らかなので、サポートベクトルマシン(SVM, 10回参照)などの「がんと正常を分け
る線を推定する」方法が適している可能性が高い。 ただし、この場合の被験者は
境界(緑線)に近い位置に存在する
ので、判断の難しいサンプルにな
る(= 境界の緑線より上にいるか
下にいるか微妙なので)。
遺伝子2発現量
1) 
がん
正常
被験者
遺伝子1発現量
6-6 2) 
生物に含まれる複雑多様な要素を含んだシステム(=系とよぶ)がどの様に働くのかを研究
する方法をシステム(ズ)バイオロジー(またはシステム生物学)という。
図は最も単純なパスウェイで、代謝中間体Aが代謝中間体Bに酵素によって変換される。
このシステムの時間変化を追うには以下の微分方程式を解けばよい。これはよく現れる
例で、d[A]/dt = -k[A]は左辺(Aの代謝速度)がAの濃度[A]に比例することを示す。この
くらい単純な系では微分方程式が「解ける」のでシステムの振る舞いは完全に予測でき
る。最初はAの濃度[A]が高いので反応が急速に進行しBの濃度[B]は急上昇する。[A]の
低下に伴い反応速度は低下し、すべてのAがBに変換されると反応は停止する。
k"
代謝中間体A
微分方程式を解く
微分方程式を立てる
微分方程式!
[A]!=![A]0!e*kt"
代謝中間体B
[A]!+![B]!=![A]0!=!(一定)!!
[B]!=![A] !*![A]!!
酵素
0
d[A]/dt!!=!*k[A]!
3)  この場合はA!Bの単純な変換なので微分方程式は解け
るが、これがBがAの生成自体に影響を与えるなど少し
複雑になると「解析的に解く」ことができない (=計算で
解くことができない)。通常その場合は、計算機で短時間
の変化を再現しながらシステムの挙動を追跡する必要が
ある。これをパスウェイシミュレーションという(「数値
的に解く」という言い方をする)。
[B]!
濃度
1) 
[A]!
時間t"
6-6 1) 
2) 
システム生物学では遺伝子発現制御のシミュレーションも重要な課題の一つ。
図の例は、一定の速度(a)で構成的に発現する遺伝子Xの例で、mRNAの分解などによ
る消失量が時間tにおける発現量X(t)に比例(-bでb>0なので)して、発現量が大きいほ
どより多く分解される)する場合を示す。これも2体問題なので解くことができる。
dX(t)/dt = a ‒ bX(t) なので各項を積分すると(積分定数は0になる)
X(t) = at - X(0)!e*bt"
合成 分解 となり、釣り合いがとれて合成量 = 分解量に達すると増加が止まる(ただし合成が止ま
るわけではなく、釣り合いが取れて見かけ上増減しないだけ)
3) 
これは遺伝子の発現量を一定値(図の緑線)を上限として抑えることのできるフィード
バックシステムを表現している。例えば遺伝子Xの翻訳産物が転写因子に結合して
DNAのの結合を阻害するようなフィードバック系は実際の遺伝子でも知られている。
H23-問80
あるmRNAの時刻t ( 0)での発現量をX(t)とした時、X(t)は正の定数 aと bを含む以下の方程式に従うとする。
このとき、このmRNAの定常状態での発現量に関する以下の文章の(ア)(イ)に入れるもっとも適切な語句の組み合わせ
を、選択肢の中から一つ選べ。
X(0)の値が大きくなった場合、定常状態でのこのmRNAの発現量は(ア)。また、mRNA の定常状態での発現量は、b の
値が一定のときに、a の値が大きくなると(イ)。
1(ア)変わらない(イ)小さくなる。
2(ア)変わらない(イ)大きくなる。
3(ア)大きくなる(イ)小さくなる。
4(ア)大きくなる(イ)大きくなる。
H22-問78
細胞濃度Xの時間変化が比例定数k (>0)を用いて、
と与えられるとき、細胞濃度が2倍になるために要する時間(ダブリングタイム)の記述としてもっとも適切なものを選
択肢の中から一つ選べ。
1 ダブリングタイムは
2 ダブリングタイムは
で与えられる。
で与えられる。
3 細胞濃度Xが高くなるにつれてダブリングタイムは長くなる。
4 細胞濃度Xが高くなるにつれてダブリングタイムは短くなる。
6-7 1) 
2) 
遺伝子発現系も遺伝子Xの産物が、さらに遺伝子Yの発現を制御しているような系になると
解くことができないので、数値的に解く必要がある。
この場合は遺伝子X発現量(x(t))、遺伝子Y発現量(y(t))をシミュレーションするが、この数
値を実際に求めなくても、以下の関係がなりたつ場合には、この系が「平衡」する(特定の
値付近で見掛け上変化が止まる)か「発散」する(値が変化し続けてどこかで停止すること
はない)かを行列Aの固有値から判断することができる。
dx/dt
dy/dt
=
a11
a12
x(t)
a21
a22
y(t)
A
3)  この系は行列Aの固有値が両方とも負の場合は
平衡する。そうでなければ「発散」する。固
有値は固有方程式 ¦λI - A¦=0でもとめるが、
簡単にいうと以下がなりたつ場合、λは行列A
の固有値になる。
(a11"."λ)(a22."λ)!–!a12a21
="0
FB
6-8 FF
1)  システムズバイオロジーでは分子の相互作用を論理回路(8回
参照)で表して解析する場合も多い。たいていは信号が戻され
るフィードバック(FB)回路か、信号が先送りされるフィード
フォアード(FF)回路が現れる。
1)  6-8の例題はFF回路の例になる。
論理回路
*
これを数値的に解くのは難しいが、
a)  AND回路なので、Sxが存在してYが0.5より
多く存在するときだけタンパク質Zは速度1で
徐々に増加する。
b)  Yは0.5を超えないといけないので、Yの増加
からZの増加までにはタイムラグがある。
c)  Sx がなくなるとZは-Zの速度で徐々に分解さ
れる。
ことは解かなくても読み取ることができるので、
Xのついた箇所はおかしいと判断できる。
H20-問80
時間の関数である変数 y1、 y2からなるシステムの連立微分方程式が
のように表される。行列 の固有値を用いて、システムの安定性を論じることができるが、平衡状態(原点)におけるシ
ステムの安定性に関する記述でもっとも適切なものを選択肢の中から一つ選べ。安定とは、システムに摂動が与えられ
た場合、すみやかに元の平衡状態にもどれることをいう。
dy 1
dt
dy 2
dt
= 2y 1 − 3y 2
= 4 y 1 − 5y 2
1 固有値は1、2であるので、システムは安定である。
2 固有値は1、2であるので、システムは不安定である。
3 固有値は −1、−2であるので、システムは安定である。
4 固有値は −1、−2であるので、システムは不安定である。
*
論理回路