タンパク質ドメイン検索 タンパク質ドメイン • タンパク質の特定の機能、構造に対応する短い類似アミノ酸配列 領域(30アミノ酸~) – ある特殊な機能を果たす部位(例:酵素活性部位) – 他の物質と相互作用する部位(例:タンパク質相互作用部位) – 進化的に保存された領域 • モチーフ – ドメイン同様に活性部位などの重要な特徴を表すような、よく保存さ れたアミノ酸のパターン – ドメインより小さい構成単位とされているが(3~10アミノ酸)、ドメインと 特に明確な使い分けがされているわけではない タンパク質ドメイン解析 • 配列相同性検索(BLAST, FAST)では全長にわたって高い相同 性をもつ遺伝子が得られない • 得られてもその遺伝子も機能未知である ? 相同性 相同性 機能未知アミノ酸配列 機能未知アミノ酸配列 • タンパク質を一つの固まりとしてではなく、異なる機能をもっ た保存領域の組み合わせとして捉える 代表的なタンパク質ドメインデータベース DB 特徴 URL Pfam タンパク質立体構造ドメインを元に 自動的・手動的に構築 http://www.expasy.ch/prosite/ ProDom PfamのデータからPSI-BLAST(ホモロ http://prodom.prabi.fr/prodom/curr ジー検索)を用いて相同な領域を同 ent/html/form.php 定 PRINTS モチーフ(数残基~数十残程度の ギャップなしに保存されている配 列)を対象にしたデータべース http://bioinf.man.ac.uk/dbbrowser/P RINTS/index.php PROSITE 実験的に確かめられた機能モチー フ配列データベース http://www.expasy.ch/prosite/ SMART シグナル伝達、細胞外タンパク質、 クロマチンタンパク質がもつ保存領 域を中心に構築 http://smart.embl-heidelberg.de/ PANTHER タンパク質の(サブ)ファミリー内で 保存されているドメイン配列 http://www.pantherdb.org InterPro/InterProScan 代表的なタンパク質ドメインデータベース11個(2013年6月現 在)を統合したデータベース、及びその解析ツール http://www.ebi.ac.uk/Tools/pfa/iprscan/ • CATH-Gene3D, HAMAP, PANTHER, PIRSF, PRINTS, PROSITE, Pfam, ProDom, SMART, SUPERFAMILY, TIGRFAMs • 各データベースのプログラムの解析手法をそれぞれ採用し、結果を返す • 核酸配列も6個の読み枠でアミノ酸配列に変換し解析 InteProScan:入力配列のフォーマット MALLAEHLLKPLPADKQIETGPFLEAVSHLPPFFDCLG SPVFTPIKADISGNITKIKAVYDTNPAKFRTLQNILEVE KEMYGAEWPKVGATLALMWLKRGLRFIQVFLQSICD GERDENHPNLIRVNATKAYEMALKKYHGWIVQKIFQ AALYAAPYKSDFLKALSKGQNVTEEECLEKIRLFLVNYT ATIDVIYEMYTQMNAELNYKV ※核酸配列も可 InteProScan:データの入力・実行 アミノ酸配列入力 アミノ酸配列ファイルアップロード 実行 InteProScan:解析結果2 解析結果 InteProデータベースへリンク InteProScan:解析結果2
© Copyright 2024 ExpyDoc