5 タンパク質間相互作用解析

生体情報学I タンパク質間相互作用解析 関西学院大学理工学部生命医化学科�
藤 博幸 講義内容と目標
講義内容 ► タンパク質間相互作用解析から得られる知見
► 演習
目標
► タンパク質間相互作用情報について理解する
► ウェブサービスを用いてタンパク質間相互作用に関する情報を抽出
できるようになる ► 相互作用情報に基づき、解析対象の機能等について理解を深める
ことができるようになる
2 タンパク質間相互作用解析から得られる知見
→分子の生物学的機能に関する情報
・配列解析の実施により類推される分子の機能は生化学的機能である
X
X�
生化学的機能
タンパク質
自体の属性�
X�
物理的接触
(複合体)
タンパク質ネットワーク
の基本要素�
生物学的機能�
複数のタンパク質より
構成されるネットワーク
によって担われる�
タンパク質間相互作用解析が必要�
タンパク質間相互作用に関する バイオインフォマティクス手法 u 結合タンパク質ペア予測
u インターフェイス予測
u 結合サイトペア予測
u 親和性予測
u ドッキング
演習内容
► Webサービスを用いて Spleen Tyrosine Kinase(SYK)が
相互作用する分子を検索する。 ► また、SYKが関連するタンパク質のネットワークを検索
する。 STRINGのトップページ(h;p://string-­‐db.org/) 相互作用するタンパク質の候補を予測 タンパク質間相互作用ネットワークを視覚的に提供
STRINGのトップページ(h;p://string-­‐db.org/) 相互作用するタンパク質の候補を予測 タンパク質間相互作用ネットワークを視覚的に提供
①�
検索方法4種(タブ)で選択
n 1つのタンパク質名,
n 1つの配列情報
n 複数のタンパク質名
n 複数の配列情報�
②�
生物種の指定�
COG分類を単位
とした検索ボタン�
③�
タンパク質を単位
とした検索ボタン�
①”search by name”タブをクリックして選択
②入力ボックスにタンパク質名を入力(ここではSpleen Tyrosine Kinase)
③”GO”ボタンをクリックして計算を実行
検索結果のページ1 入力したタンパク質をもつ生物種のリストの表示画面
②�
生物種の指定�
①
①生物種リストの中から注目する生物種のSYK項をクリックして選択 (ここではHomo sapiens) ②”Continue ->”ボタンをクリックして選択した生物種のもつSpleen Tyrosine Kinaseの情報を表示させる
検索結果のページ2 ネットワークの表示画面(上部)
一つの球(ノード)が 一つのタンパク質に 相当(右肩に名前). クリックすると モチーフ情報
構造や機能
の情報
n タンパク質の種類
立体構造と
PDBコード
n アミノ酸配列へのリンク
n ホモログへのリンク�
n エビデンスの分類
球(ノード)の色:タンパク質の種類 線(エッジ)の色:エビデンスの分類 画面中央部にある色分類に対応 検索結果のページ3 ネットワークの表示画面(中央部)
エッジの表示方法の選択ボタン ①  confidence:信頼度別に線の太さを変化(太-­‐
信頼度高) ②  evidence:デフォルト.相互作用のエビデンス
①�
②�
③�
別に線の色を変化 ③  acJons:相互作用の種類別に線の色を変化 u 機能的に関連性が高いと考えられるタンパク質同
士が近くなるようにエッジの長さが調整されている
u エッジ長は相互作用の強さを反映しているとは限
らない�
エビデンスの分類
タンパク質
��の種類
●は各エビデンスの有ることを意味する(色が
濃いー信頼度高)。
クリックすると…(ページが移行してしまうので、
新しいウィンドウかタブで開いて下さい)
検索結果のページ4 エビデンスが有ることを示す●をクリックすると →エビデンスについての詳細情報の画面に移行
Experimentを
クリックした場合�
n 情報源:DBや論文情報 n 相互作用の種類 n 注目する生物種以外におけ
る相互作用についての情報 等々
Infoをクリックすると文献情報に
ジャンプ 検索結果のページ5 ネットワークの表示画面(下部)
エビダンス別 相互作用情報の
要約表示選択ボタン 検索結果のページ6 エビダンス別 相互作用情報の詳細表示選択ボタンをクリックすると… 例として”Coexpression”を クリックして選択すると u mRNAが共発現する遺伝子産物間の�
関係を表示�
u 色が濃いー関連性が強い
検索結果のページ7 ネットワークの表示画面(下部) タンパク質ネットワーク図の表示条件の変更<相互作用数表示>
①�
タンパク質ネットワーク図の 表示の設定 次々ページ
で説明 ②�
③�
①”Summary Network”ボタンをクリックして表示をネットワーク図に切り替える
②”Interactions Shown”項のプルダウンメニューをクリックして任意の数字を選択
(ここでは50)
③”Update Parameters”ボタンをクリックしてネットワーク図に設定を反映する
検索結果のページ8 ネットワークの表示画面(“InteracJons shown”項を “no more than 50” にした場合 (=上限設定50)
タンパク質の種類一覧�
ネットワーク図�
検索結果のページ9 タンパク質ネットワーク図の表示条件の変更<ネットワーク推定方法の選択>
ネットワーク推定方法1
n neighborhood:
�真正細菌や古細菌において、複合体を形成する分子同士や、同じ代謝パスウェイ
で機能するタンパク質は、オペロン内において、順序や近接性が比較的保存されて
いることを利用する方法。複数のゲノムにおいて、オーソロガスな遺伝子ペアの近
接性が保存されている場合、その遺伝子産物には何らかの相互作用があると予測
される。
参考)�
市原�寿子、藤�博幸 バイオインフォマティクス入門�要素と相互作用、個別と網羅の観点から BioIT World 2, 49-63 (2003)の図17�
ネットワーク推定方法2
n co-occurrence: �相互作用の関係にある分子の遺伝子は、進化の過程で、ゲノム中に一緒に保存さ
れるか或いは消滅するという仮定に基づいた方法。注目する遺伝子とそのオーソロ
ガス遺伝子のそれぞれについて、各生物種ゲノム上での存在パターンが類似する
ものには、その産物であるタンパク質間に相互作用があると予測される。
参考)�
市原�寿子、藤�博幸 バイオインフォマティクス入門�要素と相互作用、個別と網羅の観点から BioIT World 2, 49-63 (2003)の図18�
ネットワーク推定方法3
n gene fusion:
�ある生物種ゲノムにおいて、独立した別々の遺伝子にコードされている2つのタンパ
ク質が、別の生物種ゲノムでは1つの遺伝子として見いだされる場合、その2つの
遺伝子産物は、相互作用していることが多いという性質を利用した方法。ある生物
種で別々にコードされている2つの遺伝子が、他の生物種で融合遺伝子としてコード
されている場合、ある生物種の2つの遺伝子産物のタンパク質は相互作用があると
予測される。
参考)�
市原�寿子、藤�博幸 バイオインフォマティクス入門�要素と相互作用、個別と網羅の観点から BioIT World 2, 49-63 (2003)の図19�
ネットワーク推定方法4〜7
n co-expression:
�関連遺伝子のmRNAレベルの共発現の証拠により、タンパク質間での相互作用が
予測されたもの
n experiments:
�他のタンパク質間相互作用データベース情報(実験的検証の情報に基づいたもの)
を総合して、タンパク質間での相互作用が予測されたもの
n database:
�詳細な検証を行ったpathwayデータベースの情報を元に相互作用が予測されたもの
n Text mining:
�出版物のタイトルやアブストラクトの中で共起している頻度などに基づいて相互作用
が予測されたもの�
検索結果のページ10 ネットワークの表示画面(“AcJve PredicJon Methods”項と”required confidence”項を変更)
①�
②�
③�
信頼度の高いもの
だけが表示�
グラフ出力の詳細設定
①“Active Prediction Methods”の設定を変更する。
ここでは“Experiments”のみにして、他の方法の
チェックをはずす。
②”required confidence(score)”項の設定を変更し、
ノードの信頼度の閾値を変更する�
ここでは”high confidence (0.700)に設定→これ以上
のスコアを持つノードだけが表示
③”Update Parameters”ボタンをクリックして、ネット
ワーク図に設定を反映する
検索結果のページ11 ネットワークの表示画面(“addiJonal (white) nodes”項を変更)
②�
他のネットワークの接点が追加
(赤の点線で囲んだ白いノード)�
①�
グラフ出力の詳細設定
①“additional (white) nodes”項の設定を変更し、他の
タンパク質ネットワークとの連結部となるノードの数
を入力する。
ここでは2に設定する。
②”Update Parameters”ボタンをクリックして、ネット
ワーク図に設定を反映する
検索結果のページ12 ネットワークの表示画面(追加した新ノードが関連するネットワークを表示させる)
①�
②�
SYK�
①追加されたノードをクリックして上の詳細画面を表
示させる。
ここでは”MDM2”ををクリックして選択。
②”add this node to input nodes” をクリックして、この
タンパク質の関係するネットワークを表示させる。
MDM2�
MDM2を介してSYKが相互作用するかもしれない分子群も表示�
検索結果のページ13
①�advanced ボタン
をクリック�
② ネットワーク画面トップに
メニューバーが現れる�
検索結果のページ14 ネットワークの表示画面(関連性の強いタンパク質同士をまとめて理解しやすく表示する)
②�
④�
③�
①�
①”advanced”ボタンをクリック
②上部に解析メニューが表示されるので�”Clustering” →”MCL”アルゴリズムを選択(推奨)
③クラスタの分割数を指定する(右側:クラスタ数大)。
ここでは、3に設定。→ノードがクラスタ毎に色分けさ
れる。
④解析メニューの”Layout”→”Relax”→”Start Relaxation”
を選択
検索結果のページ15
前ページ③の
処理の結果�
検索結果のページ16
前前ページ④の
処理の結果�
参考文献
►  はじめてのバイオインフォマティクス 藤 博幸編 講談社サイエンティフィク
(2006) ►  タンパク質機能解析のためのバイオインフォマティクス 藤 博幸著 講談社サ
イエンティフィク(2004) ►  W. J. Ewens, G.R. Grant, “StaJsJcal Methods inBioinformaJcs”, Springer (2001) ►  STRING 9.0 Help/Info <h;p://string-­‐db.org/> ►  ライフサイエンス統合データベースセンター 統合TV(togotv):<h;p://togotv.dbcls.jp/>