植物バイオサイエンス情報処理演習

2016年度
植物バイオサイエンス情報処理演
習
第1回 情報収集(1) データを手に入れる
2016年4月15日
機能ゲノム科学 尾形 善之
授業の目標
★植物バイオサイエンス研究領域で必要
な情報処理の能力を培う。
★要は、バイオサイエンスのビッグデータ
を使いこなす、ということ。
応用生命科学類での
情報教育の流れ
★1年次 前期
後期
情報基礎
統計学基礎II
★2年次 前期
後期
★3年次 前期
統計学基礎I
生物物理化学実験
生物統計学
植物バイオサイエン
ス情報処理演習
(植物バイオサイエンス課程)
(生命機能化学課程)
授業の概要
★教室:ずっとここ
★担当教員
♦来週から3回(第2~4回)は深田先生
♦他は全部私です
★講義(実習):15回
★期末レポート
日程
第1回
4月15日
第9回
6月10日
第2回
4月22日
第10回
6月17日
第3回
4月29日
第11回
6月24日
第4回
5月6日
第12回
7月8日
第5回
5月13日
第13回
7月15日
第6回
5月20日
第14回
7月22日
第7回
5月27日
第15回
7月29日
第8回
6月3日
期末レポート
8月9日まで
授業の進め方
★講義:30分程度
♦チェックポイント、自力で書く
★実習と課題:60分程度
♦分からないときは、TAにきく
授業のファイルの置き場所
★読み出すファイル
♦「Teacher/ogata/植物バイオサイエンス情報
処理演習2016/」
★保存するファイル
♦「Share/植物バイオサイエンス情報処理演習
2016 /」
成績評価
★当日レポート、各回5点(5x15=75点)
♦出席を兼ねます!
★期末レポート:25+?点
♦最終回に説明します
★合計:100 +?点
♦成績としては100点満点です
期末レポート
★シロイヌナズナの次世代シーケンシング
のデータを統計的に解析して考察しま
す。
★各回の実習では、そのレポートのための
スキルを学んでいきます。
実習データ
★各回の実習用
♦Arabidopsis kamchaticaの低温ストレス実験
♦全遺伝子を対象としたRNA-Seq解析
♦低温ストレスに応答する遺伝子の探索
★期末レポート用
♦シロイヌナズナのストレス実験
♦全遺伝子を対象としたRNA-Seq解析
♦ストレスに応答する遺伝子の探索
★後の回で詳しく話します
この部屋の使い方
★平日の日中は空いています
★授業の邪魔にならない範囲で、自由に使えま
す
♦プリンターは授業の担当教員の許可が必要です
★期末レポートでは使い倒してもらいます!
まずは自分のフォルダを作りましょ
う
★「Share」フォルダの「植物バイオサイエ
ンス情報処理演習2016」フォルダの中に、
自分の名前(フルネーム)のフォルダを
作りましょう
それでは今日の講義に入りま
す
★今日は「NCBI」の紹介です
♦バイオサイエンスのビッグデータの本家本
元です
遺伝子情報データの蓄積の仕組
み
★遺伝子研究の学術論文では必ず遺伝
子情報を登録する必要がある
★研究された遺伝子の数だけ遺伝子情報
は溜まる
公共DNAデータバンク
Wikipedia
遺伝子を扱う学術論文数の推
移
遺伝子発現解析手法と学術論文数の推移 (Cahvejian et al., Nat Biotechnol, 2008)
遺伝子情報はどこに登録される?
公共DNAデータバンク
登録された塩基配列データ
ペタ
エクサ
ゼタ
ヨタ
テラ
ギガ
メガ
キロ
Sequence Read Archive, NCBI
NCBIとは
★米国国立生物工学情報センター
♦名称はともかく、あらゆる生物の遺伝子に
関連する情報を置いています
♦塩基配列、アミノ酸配列、遺伝子発現、タン
パク質構造、文献情報などなど
NCBIの中身
★実際にどんな情報があるか見てみましょう
♦遺伝子の塩基配列(GenBank)
♦タンパク質のアミノ酸配列(RefSeq)
♦遺伝子の発現(Gene Express Omnibus)
♦遺伝子実験の生データ(Sequence Read Archive)
♦文献(PubMed)
チェックポイント
1. NCBIと連繋している遺伝子バンクは?
2. NCBIに登録されている情報の種類は?
3. データの容量が大きくなったらどうなる?
今日の実習と課題
★シロイヌナズナの遺伝子の情報をいろいろ
と検索します
♦手順書(「作業手順01_16.docx」)を参照。
★本日の実習の感想や疑問点を書いてくださ
い。
♦これからの講義への要望や不安も書いてくださ