Drosophila solexa Tag analysis 2/25 ahsan 論点 • 転写開始点の修正 転写開始点は1つでなく、分布する 分布の定量化とグループ分け • 発現量の定量化 広いダイナミックレンジ • Differential display young vs old, male vs female • 進化的な保存度と発現量の関係 タグの統計 ゲノム上での位置 4500000 loci expressionNumber fly ゲノム上の位置 で非冗長に分類 した場合 冗長を許し たタグ数 YM 530,040 3,526,380 S2 322,442 3,895,955 OF 574,849 3,523,169 OM 488,094 3,661,542 YF 337,835 2,587,129 Em 286,983 3,123,723 Larva 249,438 3,148,532 4000000 3500000 3000000 2500000 2000000 1500000 1000000 500000 0 fly1 fly2 fly3 fly4 fly5 fly6 fly7 前回は N が入っているタグを除いてア ラインメントした。 今回は、3回まで N が含まれている 5endTag も入れて再びアラインメントし た. 転写開始点 正規分布に近い分布 FBtr0078010 gene in Young Male 単一のピークをとる分布 FBtr0077965 gene in Young Male 一様に分布して場合 FBtr0077965 gene in all stage 転写開始点の転写の分布 正規分布 % 一様分布 % YM 4471 32.7 2732 19.9 S2 3776 27.6 1665 12.1 OF 4321 31.6 2150 15.7 OM 4456 32.6 2568 18.7 YF 4689 34.3 1752 12.8 Em 4573 33.4 1801 13.1 La 4080 29.8 1768 12.9 代表的な転写開始点 • 5UTR領域の上流500bp以下から翻訳開始点 (TIS)の間に転写産物の中、最大の転写量を 持つ点を代表的な転写開始点と定義する。 代表転写開始点 一致しないが -500bp ~TIS に存在する 遺伝子の総数に占める カ ラム1+2の割合(%) 1,133 7,784 65 508 6,268 50 761 7,118 58 1,033 7,664 64 804 7,325 60 863 7,112 58 844 6,698 55 従来のTSSと 一致する 遺伝子の総数 13,662 高い再現性 広いダイナミックレンジ 同じYoung Female データを2回取った ときの再現性 Young Female ( solexa Read2) Young Female( solexa Read1) Differential display の考え方 YMvOM YM(1) OM(4) YFvOF YMvYF YF(5) OF(3) YM: young Male YF: young Female OM: old Male OF: old Female OMvOF YoungFemale と Old Female の比較 ゲノム上の各位置で厳密にグループ分け YMvOM YFvOF YMvYF • • • • ゲノム上の各位置にアラインメントされたタグ数を比較 最も厳密なタグの比較方法 遺伝子領域でグルーピングはしていない ちょっと厳しすぎるかもしれないので、次に遺伝子領域 でグルーピングした結果を示す OMvOF 遺伝子領域の定義 代表的な転写開始点 Tag Tag Tag +500bp 5’End Exon1 Tag Tag Tag Tag Exon2 Flybase の遺伝子の転写開始点より500bp以下 の上流領域から終止コドンまでを遺伝子領域とする。 この領域に存在する遺伝子と同じ向きの5endtagを その遺伝子の由来とする。 3’End YoungFemale と Old Female の比較 遺伝子によるグルーピング YMvOM YFvOF YMvYF • • 遺伝子領域でグルーピングした結果 相関は多少上昇している OMvOF タンパク質コード領域(CDS)の定義 TIS Tag Tag Tag +500bp Tag Tag Exon2 Exon1 CDS region 5’End 3’End Flybase の遺伝子の翻訳開始点(TIS)より終止コドンまでの 翻訳領域をCDS領域とする。 この領域に存在する遺伝子と同じ向きの5endtagを その遺伝子の由来とする。 YoungFemale と Old Female の比較 CDSによるグルーピング YMvOM YFvOF YMvYF タンパク質コード領域(CDS)でのグルーピング OMvOF 非翻訳領域(UTR)の定義 TSS TIS Tag Tag Tag +500bp Exon1 Tag Tag Exon2 UTR region 5’End Flybase の遺伝子の転写開始点(TSS)より500bp以下 の上流領域から翻訳開始点(TIS)までをUTR領域とする。 この領域に存在する遺伝子と同じ向きの5endtagを その遺伝子の由来とする。 3’End YoungFemale と Old Female の比較 UTR によるグルーピング YMvOM YFvOF YMvYF OMvOF 異なる組織での遺伝子発現量の 統計的検定(比率検定) 比率検定によって、優位差がある遺伝子を選ぶ Z p1 p2 p 1 p 1 1 n2 n1 p r1 r2 n1 n2 r1: transcription number of gene “A” in Sample 1 n1: total transcripts in sample 1 r2: transcription number of gene “A” in Sample 2 n2: total transcripts in sample2 Young Female と Old Female で 発現に顕著な違いのある遺伝子 FlybaseTrID YFexp OFexp ショウジョウバエの12種に 保存された遺伝子と発現量 FlybaseTrID CDS(bp) 12種に保存 YM OF OM YF Aigaki sensei Sense – anti sense cluster Internal Exon Vs Tag and codon usage Monday: 13:00~15:00
© Copyright 2025 ExpyDoc