生命情報学入門 タンパク質の分類法演習 2011年6月14日 阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター SVMによる細胞内局在性予測 • 各器官ごとにSVMを学習 – 器官X • 器官Xに輸送されるタンパク質配列を正例 • それ以外のタンパク質を負例 • 最も高いスコアを出力したSVMに対応する器官を予測結果とする タンパク質配列 ゴルジ体 スコア 3.5 LVEKHPLADFCVEDRKLVIH...... 細胞核 -2.0 予測結果 ミトコンドリア 5.8 ミトコンドリア 小胞体 -3.2 膜タンパク質の膜貫通領域予測 • 膜貫通領域: αへリックス • 7~17残基程度の疎水性指標の平均値をプロット • 平均値が高い部分が膜貫通領域と推定 D A G I 膜タンパク 細 胞 膜 V L P V R K Q A 1.8 C: 2.5 D: -3.5 E: -3.5 F: 2.8 ... 疎水性 指標 細胞内局在性予測演習 • Target-Pのページからデータを取得 – http://www.cbs.dtu.dk/services/TargetP/datasets/datasets.php – Plant の各5種類から、それぞれ1個づつ配列を選ぶ • 最初の配列以外を選ぶ – 配列はfasta をクリックし、その中から1個を選んでは コピーする • 配列1個は不等号(>)から次の不等号(>)の前まで • SLPFA – http://sunflower.kuicr.kyoto-u.ac.jp/~tamura/slpfa.html – コピーした配列を枠内に貼り付けて、submit をクリック – 結果が、Target-Pの情報と一致するかを調べる – 配列データ、SLPFAの予測結果、一致したか?を記載 膜貫通領域予測 • SCOPのページからデータを取得 – http://scop.berkeley.edu/ – top of the hierarchy から順にたどり膜タンパクと、 それ以外のタンパクのデータを1個ずつ取得 • 配列データは PDB entry XXXX のところで、local cashed copy をクリックして配列を1個取得 • 配列1個は不等号(>)から次の不等号(>)の前まで • SOSUIおよびPhobius による膜貫通領域予測 – http://bp.nuap.nagoya-u.ac.jp/sosui/sosui_submit.html – http://phobius.sbc.su.se/ – コピーした配列を枠内に貼り付けて、クリック – 結果の画面をセーブしてメールに添付 – 2種類のソフトの結果を比較した結果を数行にまとめる レポートの提出法 • 局在性予測:以下の情報をテキストとしてメール本体、もしくは、 WORDファイルに記載 – 5種類の配列データ – それぞれに対するSLPFAの予測結果 – Target-Pの分類と一致したか? • 膜貫通領域予測 – 2種類の配列データとそのFoldクラス:テキスト – それぞれのデータに対するSOSUIおよびPhobiusの予測結果の画面:添 付ファイル – SOSUIおよびPhobiusの予測結果の比較 • 感想、要望、改善すべき点 – あれば記載、特になければ記載不要 • 提出先 – xxx および yyy へメールを送付 – 件名は「生命と情報レポート課題」とする – 名前、学部学科、学年、学籍番号を明記。締め切り:6月21日午後8時。
© Copyright 2024 ExpyDoc