生命情報学入門 - Kyoto University Bioinformatics

生命情報学入門
タンパク質の分類法演習
2011年6月14日
阿久津 達也
京都大学 化学研究所
バイオインフォマティクスセンター
SVMによる細胞内局在性予測
• 各器官ごとにSVMを学習
– 器官X
• 器官Xに輸送されるタンパク質配列を正例
• それ以外のタンパク質を負例
• 最も高いスコアを出力したSVMに対応する器官を予測結果とする
タンパク質配列
ゴルジ体
スコア
3.5
LVEKHPLADFCVEDRKLVIH......
細胞核
-2.0
予測結果
ミトコンドリア
5.8
ミトコンドリア
小胞体
-3.2
膜タンパク質の膜貫通領域予測
• 膜貫通領域: αへリックス
• 7~17残基程度の疎水性指標の平均値をプロット
• 平均値が高い部分が膜貫通領域と推定
D A G I
膜タンパク
細
胞
膜
V L P V R K Q
A 1.8
C: 2.5
D: -3.5
E: -3.5
F: 2.8
...
疎水性
指標
細胞内局在性予測演習
• Target-Pのページからデータを取得
– http://www.cbs.dtu.dk/services/TargetP/datasets/datasets.php
– Plant の各5種類から、それぞれ1個づつ配列を選ぶ
• 最初の配列以外を選ぶ
– 配列はfasta をクリックし、その中から1個を選んでは
コピーする
• 配列1個は不等号(>)から次の不等号(>)の前まで
• SLPFA
– http://sunflower.kuicr.kyoto-u.ac.jp/~tamura/slpfa.html
– コピーした配列を枠内に貼り付けて、submit をクリック
– 結果が、Target-Pの情報と一致するかを調べる
– 配列データ、SLPFAの予測結果、一致したか?を記載
膜貫通領域予測
• SCOPのページからデータを取得
– http://scop.berkeley.edu/
– top of the hierarchy から順にたどり膜タンパクと、
それ以外のタンパクのデータを1個ずつ取得
• 配列データは PDB entry XXXX のところで、local
cashed copy をクリックして配列を1個取得
• 配列1個は不等号(>)から次の不等号(>)の前まで
• SOSUIおよびPhobius による膜貫通領域予測
– http://bp.nuap.nagoya-u.ac.jp/sosui/sosui_submit.html
– http://phobius.sbc.su.se/
– コピーした配列を枠内に貼り付けて、クリック
– 結果の画面をセーブしてメールに添付
– 2種類のソフトの結果を比較した結果を数行にまとめる
レポートの提出法
• 局在性予測:以下の情報をテキストとしてメール本体、もしくは、
WORDファイルに記載
– 5種類の配列データ
– それぞれに対するSLPFAの予測結果
– Target-Pの分類と一致したか?
• 膜貫通領域予測
– 2種類の配列データとそのFoldクラス:テキスト
– それぞれのデータに対するSOSUIおよびPhobiusの予測結果の画面:添
付ファイル
– SOSUIおよびPhobiusの予測結果の比較
• 感想、要望、改善すべき点
– あれば記載、特になければ記載不要
• 提出先
– xxx および yyy へメールを送付
– 件名は「生命と情報レポート課題」とする
– 名前、学部学科、学年、学籍番号を明記。締め切り:6月21日午後8時。