スライド 1

Drosophila solexa Tag
analysis 2/25
ahsan
論点
• 転写開始点の修正
転写開始点は1つでなく、分布する
分布の定量化とグループ分け
• 発現量の定量化 広いダイナミックレンジ
• Differential display
young vs old, male vs female
• 進化的な保存度と発現量の関係
タグの統計 ゲノム上での位置
4500000
loci
expressionNumber
fly
ゲノム上の位置
で非冗長に分類
した場合
冗長を許し
たタグ数
YM
530,040
3,526,380
S2
322,442
3,895,955
OF
574,849
3,523,169
OM
488,094
3,661,542
YF
337,835
2,587,129
Em
286,983
3,123,723
Larva
249,438
3,148,532
4000000
3500000
3000000
2500000
2000000
1500000
1000000
500000
0
fly1
fly2
fly3
fly4
fly5
fly6
fly7
前回は N が入っているタグを除いてア
ラインメントした。
今回は、3回まで N が含まれている
5endTag も入れて再びアラインメントし
た.
転写開始点
正規分布に近い分布
FBtr0078010 gene in Young Male
単一のピークをとる分布
FBtr0077965 gene in Young Male
一様に分布して場合
FBtr0077965 gene in all stage
転写開始点の転写の分布
正規分布
%
一様分布
%
YM
4471
32.7
2732
19.9
S2
3776
27.6
1665
12.1
OF
4321
31.6
2150
15.7
OM
4456
32.6
2568
18.7
YF
4689
34.3
1752
12.8
Em
4573
33.4
1801
13.1
La
4080
29.8
1768
12.9
代表的な転写開始点
• 5UTR領域の上流500bp以下から翻訳開始点
(TIS)の間に転写産物の中、最大の転写量を
持つ点を代表的な転写開始点と定義する。
代表転写開始点
一致しないが
-500bp ~TIS に存在する
遺伝子の総数に占める カ
ラム1+2の割合(%)
1,133
7,784
65
508
6,268
50
761
7,118
58
1,033
7,664
64
804
7,325
60
863
7,112
58
844
6,698
55
従来のTSSと
一致する
遺伝子の総数 13,662
高い再現性 広いダイナミックレンジ
同じYoung Female
データを2回取った
ときの再現性
Young Female
( solexa Read2)
Young Female( solexa Read1)
Differential display の考え方
YMvOM
YM(1)
OM(4)
YFvOF
YMvYF
YF(5)
OF(3)
YM: young Male
YF: young Female
OM: old Male
OF: old Female
OMvOF
YoungFemale と Old Female の比較
ゲノム上の各位置で厳密にグループ分け
YMvOM
YFvOF
YMvYF
•
•
•
•
ゲノム上の各位置にアラインメントされたタグ数を比較
最も厳密なタグの比較方法
遺伝子領域でグルーピングはしていない
ちょっと厳しすぎるかもしれないので、次に遺伝子領域
でグルーピングした結果を示す
OMvOF
遺伝子領域の定義
代表的な転写開始点
Tag
Tag
Tag
+500bp
5’End
Exon1
Tag
Tag
Tag
Tag
Exon2
Flybase の遺伝子の転写開始点より500bp以下
の上流領域から終止コドンまでを遺伝子領域とする。
この領域に存在する遺伝子と同じ向きの5endtagを
その遺伝子の由来とする。
3’End
YoungFemale と Old Female の比較
遺伝子によるグルーピング
YMvOM
YFvOF
YMvYF
•
•
遺伝子領域でグルーピングした結果
相関は多少上昇している
OMvOF
タンパク質コード領域(CDS)の定義
TIS
Tag
Tag
Tag
+500bp
Tag
Tag
Exon2
Exon1
CDS region
5’End
3’End
Flybase の遺伝子の翻訳開始点(TIS)より終止コドンまでの
翻訳領域をCDS領域とする。
この領域に存在する遺伝子と同じ向きの5endtagを
その遺伝子の由来とする。
YoungFemale と Old Female の比較
CDSによるグルーピング
YMvOM
YFvOF
YMvYF
タンパク質コード領域(CDS)でのグルーピング
OMvOF
非翻訳領域(UTR)の定義
TSS
TIS
Tag
Tag
Tag
+500bp
Exon1
Tag
Tag
Exon2
UTR region
5’End
Flybase の遺伝子の転写開始点(TSS)より500bp以下
の上流領域から翻訳開始点(TIS)までをUTR領域とする。
この領域に存在する遺伝子と同じ向きの5endtagを
その遺伝子の由来とする。
3’End
YoungFemale と Old Female の比較
UTR によるグルーピング
YMvOM
YFvOF
YMvYF
OMvOF
異なる組織での遺伝子発現量の
統計的検定(比率検定)
比率検定によって、優位差がある遺伝子を選ぶ
Z
p1  p2
p 1 p  1  1 
n2 
 n1
p   r1  r2   n1  n2 
r1: transcription number of gene “A” in
Sample 1
n1: total transcripts in sample 1
r2: transcription number of gene “A” in
Sample 2
n2: total transcripts in sample2
Young Female と Old Female で
発現に顕著な違いのある遺伝子
FlybaseTrID
YFexp OFexp
ショウジョウバエの12種に
保存された遺伝子と発現量
FlybaseTrID CDS(bp)
12種に保存
YM
OF
OM
YF
Aigaki sensei
Sense – anti sense cluster
Internal Exon Vs Tag and codon usage
Monday: 13:00~15:00