タンパク質モチーフ検索

タンパク質ドメイン検索
タンパク質ドメイン
• タンパク質の特定の機能、構造に対応する短い類似アミノ酸配列
領域(30アミノ酸~)
– ある特殊な機能を果たす部位(例:酵素活性部位)
– 他の物質と相互作用する部位(例:タンパク質相互作用部位)
– 進化的に保存された領域
• モチーフ
– ドメイン同様に活性部位などの重要な特徴を表すような、よく保存さ
れたアミノ酸のパターン
– ドメインより小さい構成単位とされているが(3~10アミノ酸)、ドメインと
特に明確な使い分けがされているわけではない
タンパク質ドメイン解析
• 配列相同性検索(BLAST, FAST)では全長にわたって高い相同
性をもつ遺伝子が得られない
• 得られてもその遺伝子も機能未知である
?
相同性
相同性
機能未知アミノ酸配列
機能未知アミノ酸配列
• タンパク質を一つの固まりとしてではなく、異なる機能をもっ
た保存領域の組み合わせとして捉える
代表的なタンパク質ドメインデータベース
DB
特徴
URL
Pfam
タンパク質立体構造ドメインを元に
自動的・手動的に構築
http://www.expasy.ch/prosite/
ProDom
PfamのデータからPSI-BLAST(ホモロ http://prodom.prabi.fr/prodom/curr
ジー検索)を用いて相同な領域を同 ent/html/form.php
定
PRINTS
モチーフ(数残基~数十残程度の
ギャップなしに保存されている配
列)を対象にしたデータべース
http://bioinf.man.ac.uk/dbbrowser/P
RINTS/index.php
PROSITE
実験的に確かめられた機能モチー
フ配列データベース
http://www.expasy.ch/prosite/
SMART
シグナル伝達、細胞外タンパク質、
クロマチンタンパク質がもつ保存領
域を中心に構築
http://smart.embl-heidelberg.de/
PANTHER
タンパク質の(サブ)ファミリー内で
保存されているドメイン配列
http://www.pantherdb.org
InterPro/InterProScan
代表的なタンパク質ドメインデータベース11個(2013年6月現
在)を統合したデータベース、及びその解析ツール
http://www.ebi.ac.uk/Tools/pfa/iprscan/
• CATH-Gene3D, HAMAP, PANTHER, PIRSF, PRINTS, PROSITE, Pfam, ProDom,
SMART, SUPERFAMILY, TIGRFAMs
• 各データベースのプログラムの解析手法をそれぞれ採用し、結果を返す
• 核酸配列も6個の読み枠でアミノ酸配列に変換し解析
InteProScan:入力配列のフォーマット
MALLAEHLLKPLPADKQIETGPFLEAVSHLPPFFDCLG
SPVFTPIKADISGNITKIKAVYDTNPAKFRTLQNILEVE
KEMYGAEWPKVGATLALMWLKRGLRFIQVFLQSICD
GERDENHPNLIRVNATKAYEMALKKYHGWIVQKIFQ
AALYAAPYKSDFLKALSKGQNVTEEECLEKIRLFLVNYT
ATIDVIYEMYTQMNAELNYKV
※核酸配列も可
InteProScan:データの入力・実行
アミノ酸配列入力
アミノ酸配列ファイルアップロード
実行
InteProScan:解析結果2
解析結果
InteProデータベースへリンク
InteProScan:解析結果2