Ⅵ息ゆ - CSML

鳥
\J′ ノてj
あなたの研究にシステム生物≠の
∫J、J
lT戦時芝ニル牽
導ノしてみませんか?
r jr.
:.▲軍∴、
−
遥 1寮
妄「右:迂憲≧追
.
巨京大学医科学研究所ヒトゲノム解析セン
世界の動向
40年にわたる分子生物学の展開により、フユノタイプ
を予測するにはその原因となっている遺伝子をつきとめれ
ばよいという研究のパラダイムが王道を形成してきた。そ
の結果多くの個々の遺伝子やタンパク質の機能が解明さ
れ、ノーベル賞受賞者に象徴されるように生命科学の大天
球に生物学のスーパースター達が燦然と輝いている。
しかし一方で、このパラダイムにそって研究を続けるこ
とにより、複雑な生命システムの理解へ近づくことができ
ると考えるには無理がありそうだということも同時に認識
されるようになった。すなわち、これからの生命科学を展
開する上で分子生物学という方法論の限界が見えてきたの
である。特に20代から30代にかけての若い研究者の中に
は、自分の所属する研究室のボスの方法論で自分の研究人
生を措くことは難しいと感じている人も多いと思われる。
N血のロードマップ1にも述べられているように、生命科
学は新たな方法論をもった科学に急激に変わりつつあり、
それを感じているのである。
これまでの生命科学は生命システムを構成する個々の部
品やコンパートメントについての知識を深めてきたが、シ
ステムとしての理解のための方法論にはあまり重点が置
かれていなかった。こうした中システム生物学(Systems
Biology)という方法論は、コンピュータを使って先端的
な生命システムのモデル化・シミュレーションと実験デー
タとを融合させることにその核心を置いている。この方法
論はゲノム研究のようなシステマテイツタな生命科学研究
と連動して次第に主体性を強くしてきた。そこではビッグ
マウスから出てくる創薬などについての声と過大な期待感
とが乱流を起こして混乱したところも見受けられるが、ゲ
ノム研究がそうなったように、科学として決してぶれない
ものになっていくことに疑いの余地はない2。
2セルイラストレータの開発
様々な生物のゲノム情報が出揃い、生命システムの部
なった。そして、トランスクリプトームやプロテオームな
どの解析が大観模にできるようになり、どんな分子が、い
つ、どこで、どれだけ発現しているかを観測することが可
能になった。また、これまでの分子生物学の研究成果が整
理され、遺伝子制御やシグナル伝達の経路、代謝の経路
などのパスウェイに関する知識が、BIOBASE,Ingenuity
PathwayDatabase,KEGG,BioCycなどのいわゆるパスウ
ェイデータベースに蓄積されるようになった。そして、興
味の対象は個々の遺伝子のローカルな機能にとどまらず、
これらの部品がどのように連携して作用し、動的なネット
ワークを構成し、システムとしての多様な機能を作り出し
ているのかというところに広がってきた。そのためにコン
ピュータを利用して、複雑な生命システムの理解を助ける
ための様々なソフトウェアツールやデータベースの利用技
術が必要になったのである。
著者らは1999年ごろから、生命システムに関する情報
を整理・記述して簡単にシステムのモデル化とシミュレー
ションが実現できるようなインシリコ統合ソフトウェア環
境を開発してきた。これが現在、セルイラストレ一夕(Cell
Illustrator)として商用化されているソフトウェアである。
なぜセルイラストレータを開発したのか?当時システム
生物学の方法論が重要になるという認識はあったもののソ
フトウェアのGUIが充実しておらず、微分方程式をゴリ
ゴリに書いていくスタイルが中心で微分方程式系に落とし
にくいところはC++でプログラムを書くといったやり方
だった。この方法では大学などの実験室でデータを取って
いる研究者のマインドとの乗難が大きく、そのようなソフ
トウェアが流布して「これがシステム生物学だ」というメ
ッセージになってしまうと、システム生物学の方法論が生
命科学に変革をもたらすことに悪影響を与えることになる
だろうと考えた。上述のように一部そのようなことはあっ
たが、幸い世界の判断は正しい方向に向かったようである。
科学としてぶれていないのだ。セルイラストレ一夕開発の
原点は、「実験室でデータを取っている人自身の手でモデ
ルが作られ、シミュレーションされ、モデルと知識・デー
◎Ⅵ息ゆ
タの融合がスムーズに行えるソフトウェアを開発しよう」
というものだった。
1995年にAファージの溶原化・洛菌経路の遺伝子制
御のスイッチメカニズムのシミュレーションモデルを
SPICEという電子回路の設計ツールを使ってとてもうま
く作成できたという報告があった3。SPICE.は、電気関係
の会社で回路設計をしている人は普通に使っているソフト
である。その後、このソフトを基に、米国防省の研究費
(DARPA)により、BioSPICEというソフトが開発された。
一方、情報科学の分野にはベトリネット(Petrinet)とよ
ばれる並行システムの制御システムの設計に用いられる磨
きぬかれた技術があり、工場プラントをはじめとして産業
界で広く使われていた。このベトリネットの考え方で、実
際にAファージの遺伝子制御ネットワークや代謝系のシミ
ュレーションモデルを生物系の学生に作ってもらうとこれ
がなかなかで、おもしろいほど簡単にパスウェイの動的モ
デルができた。すなわち、ベトリネットはパスウェイのメ
カニズムととても親和性があることがわかったのだ。そこ
で著者らは、このベトリネットの機能を生命科学研究の現
場にあうように拡張し、セルイラストレ一夕というソフト
ウェアとして実現した。
セルイラストレータでは、パスウェイをエンティティ
(entity)、プロセス(process),コネクタ(connector)と
いう3つのエレメント(element)を用いてモデル化する
(図1)。エンティティは、タンパク質、mRNAなどの「も
の(物質)」を表現するものである。エンティティには離
散(discrete),連続(continuous),汎用(generic)の3
つのタイプがある。この3つのタイプにはそれぞれ特徴が
あり、うまく使い分けることで、より適切なモデルを作成
することができる。プロセスはタンパク質などの物質に起
こる「こと(事象)」を表現する。例えば、「活性化」、「結
合」、「発現」、「移動」、「転写」、「翻訳」など様々な現象を
表すことができる。エンティティとの組み合わせにより、
離散と連続を混合したモデルなど、複雑な現象・反応を表
現することができる。コネクタは「もの(物質)」を表す
エンティティと「こと(事象)」を表すプロセスをつなぐ
矢印である。よってエンティティとエンティティ、プロセ
スとプロセスを直接コネクタで接続することはできない。
そしてセルイラストレータは、生命システムを構成するパ
スウェイ(代謝経路、遺伝子制御ネットワーク、シグナル
伝達経路、細胞間の制御反応など)を措くために必要なア
イコンを350個以上備えており、これらをドラッグアンド
ドロップし、コネクタで繋いでいくことで簡単にパスウェ
イを作成できる。また、これらのアイコンはベクター形式
(SVG)になっているため、大きさを自由に変えてもきれ
いなままである。自分でオリジナルのアイコンを作成して
利用することもできる。そしてセルイラストレータで作成
したパスウェイは、再生ボタンを押せばすぐに簡単なシミ
ュレーションが可能である。さらに数式を入力することで
複雑なシミュレーションもできるようになっている。図2
は、血管内皮細胞における血管形成に関するシグナル伝達
系のモデルだが、セルイラストレータではこの程度のモデ
ルを作ることができる。
P53
●
ml
P53_mdm2
㌢昔/
l
(ml★叩
m3
書 ○
て
図1.タンパク質p53とmdm2というエンティティが結合という
プロセスにより複合体p53−mdm2が作られるというモデル
これにより実験現場の研究者は、自分の知識とデータに
基づいたシミュレーション可能なモデルを得ることがで
き、仮説の生成・検証をする、遺伝子をノックアウトした
影響を予測する、今ある知識のもとでデータとの矛盾が起
こっていないかをチェックする、予備実験をするといった
ことを簡単な操作で実現できるようになる。そして研究室
で研究をしている人たちの問で共有されている知識や知見
をコンピュータ上で再現可能な形で整理・統合・継承する
図2.血管内皮細胞の血管形成に関するシグナル伝達系のモデル
ことができるようになったのである。
クスの用語についてはまだ手がつけられていなかった。そ
こで、著者らは、BioPAXのオントロジーを継承し、新た
にシステムダイナミクスの用語体系を作り、シミュレーシ
ョンを考えたパスウェイの用語体系を作った。それがセ
ルシステム・オントロジー(CellSystemOntology)であ
る。セルイラストレ一夕に用意されている350個以上のア
イコンは、このオントロジーと関連付けられている(図3)。
そのため、パスウェイの図を描くと同時に、このオントロ
ジー情報が自動的に付けられ、その後のパスウェイ情報の
整理・共有・再利用に便利になっている。
データ同化技術と次世代スーパーコンビュータ
図3.分子やプロセスのアイコンとオントロ、ジー
現在、世界中でこうしたパスウェイのモデル化とシミュ
レーションを目指した様々なソフトウェア環境が提案され
てきている。その数は著者らの調べでは数十に及んでいる。
その結果、パスウェイ知識はそれぞれソフトウェア環境に
対応したⅩMLなどの形式で記述されている。それぞれ得
手不得手があり、ユーザがこれらを有効的に活用するため
には、効率的なソフトウェア問のデータのやり取りが必
須である。セルイラストレ一夕は、CSML(CellSystem
MarkupLanguage)(http://www.csml.org)というⅩML
の形式に基づいて開発されているが、こうした発想で提案
されたⅩML形式に基づく言語として、SBMLやCellML
などもあり、パスウェイ知識をシミュレーション可能な形
で記述しようとしている。最新のCSML3.0は、SBML及
びCellMLを完全に包含しており、これらの形式で作成さ
れたパスウェイモデルをそのままインポート可能になって
いるため、セルイラストレ一夕さえあれば、これひとつで
全部をまかなえる。
生命システムについての知識を記述し、高度の知識処理
を実現するためには、体系化された用語(これをオントロ
ジーという)が必要である。現在BioPAXというパスウ
ェイ知識のオントロジーが開発中だが、システムダイナミ
癌などの病気に関わっているEGF受容
体を介したシグナル伝達系のセルイラ
ストレータによるモデルの楕禁
セルイラストレ一夕では、はじめに文献などの知識を整
理・統合する形でパスウェイの構造モデルをつくる。次に、
ダイナミクスについてのパラメータを現象やデータに合う
ようにシミュレーションをしながら調整する。小さな部分
から調整をはじめ、少しずつその規模を大きくしていく。
慣れるまでにちょっと努力が必要だが、文献4の教科書を
使いながら、モデル作りの練習をしてみるのが良いだろう。
通常はこれで十分なのだが、現在研究が進行しているデ
ータを動的モデルに融合させる優れものの技術について
述べる。これは2006年から開始された理化学研究所「次
世代スーパーコンピュータの開発と利用」プロジェクトの
中で行われているもので、「次世代生命体統合シミュレー
ションプログラムの開発」である(http://www.nsc.riken.
jp/project.html)。著者らは、生命体のシミュレーション
モデルにデータの情報を動的かつ適切に取り込むためのデ
ータ同化技術(data assimilation)を開発した。さらにそ
の技術を用いてモデル及びデータがそれぞれ単独では得ら
れない有用な情報を抽出することが可能となる、データ駆
動型の大規模データ解析及びシミュレーション技術を開発
している。その一例として、セルイラストレータで作成し
たEGF受容体パスウェイの動的モデルに質量分析器で解
析したプロテオームの時系列量的データをデータ同化した
ものがある5(図4)。
データ同化は現在のスパコンでは十数個のパラメータが
限界だが、今後の技術開発とベタスケール計算で、生命シ
ステムのモデル化とシミュレーションに今まで想像できな
かった世界が開けてくることを期待している。
SILAC法による量的プロテ
新たな機序仮説の生成
オーム時系列データをモデル
に同化
毒物血き姦d
63パラメータのモデル り
t暮
■
ご二:▲七三:二ご二二三‘=二
図4.データ同化によるEGF受容体シグナル伝達系のモデル精緻化
予測とエラーの発見
するtranspath2csmlというプログラムを開発した。これ
によりセルイラストレータを使いながら、TRANSPATH
のパスウェイにダイナミクスを入れることができる。現
在、BIOBASE社と東京大学の共同研究が進行しており、
BIOBASE社のデータベースをセルイラストレータにイン
ポートしシミュレーションができるようになる。
南北朝の時代、梁に張僧島系(ちょうそうよう)という
画家がいた。武帝は仏寺を崇飾し、彼に命じて多くの絵を
描かせた。しかし、金陵にある安楽寺の壁に描いた4匹の
白い竜には隋(瞳)が措き入れられていなカ子った。彼はい
つも、「もし瞳を入れたら即ち飛んでいってしまうんだよ」
といっていた。人々はこれをでたらめと思い、彼に強く求
めて4匹のうち2匹に瞳を入れさせた。すると、たちまち
雷と稲妻が壁を破り、2匹の竜は雲に乗って天に飛び去っ
てしまった。そして、瞳を入れなかった2匹の竜が現在残
っているそうだ。
このセルイラストレータにとっての画竜点隋ともいう
べき機能が登場しようとしている。BIOBASE社(http://
www.biobase−international.com/)から販売されている
TRANSPATHというパスウェイのデータベースとの連
携である。これは、ヒト・マウス・ラットの10万以上の
生体内反応を収めたデータベースなのだが、残念ながら
このパスウェイにはダイナミクスが入っていない。著者
らは、TRANSPATHのデータをCSML3.0の形式に変換
【参考文献】
1.NIHRoadmapforMedicalResearch:
http://nihroadmap.nih.gov/
2.Cassman,M.,Arkin,A.,Doyle,F.,Katagiri,F.,LaufEenburg
D..Stokes,C.Systems.Biology:InternationalResearch and
Development,Springer.2007.
3.McAdams,H.H.,Shapiro,L.Circuit simulation of genetic
networks.Science269:650−656,1995.
4.土井淳・長崎正朗・斉藤あゆむ・松野浩嗣・宮野悟.「システ
ム生物学がわかる!−セルイラストレータを使ってみよう−、
共立出版、2007.
5.Tasaki,S.,Nagasaki,M.,Oyama,M.,Hata∴臥,U
Yoshida,R,Higuchi,T.,Sugano,S,,Miyano,S.Modeling and
estimation of dynamic EGFR pathway by data assimilation
approach using time series proteomic data.Genome
Informatics.17(2):226−228,2006.
セルイラストレーク
∼生命をシステムとして理解し、活用したい全ての方へ∼
セルイラストレータ・プロフェッショナル(プロフェッショナル・ユーザー向け)
あらゆる規模のパスウェイモデルの構築に必要なすべての横能を搭載し、導入当初から生産的で効率的なワークフローを
実現します。
セルイラストレータ・スタンダード(一般ユーザー向け)
専門的で大きなパスウェイモデルは必要ないという方を対象に、プロフ工ツショナルの機能はそのままにコンパ外にまとめました。
セルイラストレータ・クラスルーム(教育機関向け)
大学・専門学校などで、小規模なバスウェイを対象とした実習でのご利用を想定し、必要十分な機能をもたせながら、リーズ
ナブルな価格でご提供いたします。
コードNo. メーカーコード
品 名
亭 主 希望納入価格(円)*
備 考
Ce””lustratorProfessionalCorporateEdition
プロフェッショナル・ユーザー
306−33381 GS−CIPCOIJ
1セット
600,000
向け
セルイラストレ一夕プロフエツショナルコーポレート版
Ce””lust「atorStandardCorporateEdition
303−33391 GS−CISCOIJ =ニ.■■ニ≡ご‘こて.リーニ’T=∴ニrJU■ごLニ」「ニ’「二’LuE=
lセット 200,000 一般ユーザー向[j.
セルイラストレ一夕スタンダードコーポレート版
306−33401GS−CIPAOIJ呂苫ミック版lセット
■e
150・000 警至㌍窟プロフェッショナル●
3D3−33411GS−C・SAOIJI警
ク版
300−33421GS−C・SSOIJE警空
307−33431GS−C・CAOIJ竺冒
センス
304−33441GS−C・CA10J一Ck
30l−3345− GS−C・CA50J】㌣器
ンス
lセット
50IOOO 教育機関の一般ユーザー向け
lセット
121000 学生向け
lセット
501000 教育闘向けパック製品
lセット 2501000 教育雛向けパック製品
lセットl・250・000 教育削向けパック製品
*年間のライセンス料となります。
価格はすべて希望納入価格であり、消費税等が含まれておりません。
販売元 和光純薬工業株式会社
本社:〒540−8605 大阪市中央区道修町三丁目1番2号 TELO6−6203−1788(学術部)
支店:〒103−0023 東京都中央区日本橋本町四丁目5番13号 TEL03−3270−8243(学術部)
フリーダイヤル:0120−052−099 フリーーーーファックス:0120−052−806
URL:http://www.wakD−Chem.co.jp rJ
開発・製造元 株式会社ジー工ヌアイ
URL:http://VVWW.gene−netWOrks.com
ト本製品は東京大学医科学研究所と共同開発されたものです。
07ZOl学。,K