生命と情報

生命と情報
タンパク質立体構造予測演習
2010年7月6日
阿久津 達也
京都大学 化学研究所
バイオインフォマティクスセンター
PDBの利用

PDB(Protein Data Bank)



タンパク質立体構造のデータベース
http://www.rcsb.org/pdb/
演習





キーワードにタンパク質の名前などを入力して検索(例:
verotoxin)。
一つのタンパク質を選び、その PDBID (例:1qnu)をクリック。こ
のPDBIDを覚えておく。
グラフィックソフト(右側のDisplay Optionsのいずれか)で構造を
目でみて、その特徴をレポートに記載。
左のDisplay FilesのPDB Fileをクリックし、その内容を確認する
(これをレポートに添付する必要はない)。
以上を例にあげたものとは異なるタンパク質について行うこと。
SCOPの利用

SCOP(Structural Classification Of Proteins)

タンパク質立体構造を分類したデータベース



http://scop.mrc-lmb.cam.ac.uk/scop/
http://scop.berkeley.edu/
もしくは
演習


Top of the hierarchy をクリックし、その概要を体験す
る。
PDBの利用でメモしたPDBIDを入力して検索し、その
タンパク質がどのクラスに分類されているか
(Lineage:の部分)をファイルに保存する。
CASPページからの配列データの取得

CASP(Critical Assessment of Techniques for
Protein Structure Prediction)



タンパク質立体構造予測コンテストのホームページ
http://predictioncenter.org/
演習



2008年のTarget List をクリックし、問題がどのような形式で
出されるのかを知る。
T0388, T0391 に対し、PAPIA(後で説明)を適用。
それらのPDB IDをPDBのHPで検索し、Sequence の項をク
リックし二次構造をチェック
PAPIA(二次構造予測)の利用

PAPIA

複数の手法の組み合わせによる二次構造予測


http://mbs.cbrc.jp/papia/
演習



4(二次構造予測)を選択し、さらに Typing directly
を選択した後、配列データをコピー&ペーストし、
submit をクリック
T0388, T0391 の場合の結果の違いを知る
上記以外の配列2種類を入力し、二次構造予測結
果を保存し、真の二次構造データと比較
レポートの提出法

以下の情報をテキストに埋め込むか、添付する




以下を数行程度にまとめる



SCOPで検索して得たLineage:の部分、および、PDBID
PAPIAを適用したCASPのターゲット配列ID
PAPIAによる予測結果
PDBにあるグラフィックソフトで見た立体構造の特徴
二種類の配列に対する予測結果と実際の二次構造の比較
提出先




xxx および yyy へメールを送付
件名は「生命と情報レポート課題」とする
名前、学部学科、学年、学籍番号を明記
締め切り:7月13日午後8時まで