DNA - 京都大学

ゲノムワイドアソシエーションスタディ
による
疾患関連遺伝子探索
平成20年9月1日
東京医科大学
東京大学医科学研究所
ヒトゲノム解析センター
山田 亮
GWAS
ゲノムワイドアソシエーションスタディ
• 対象疾患
–NCBI dbGaP 登録疾患リスト
• http://www.ncbi.nlm.nih.gov/entrez/query/Gap/gap_tmpl/abou
t.html
• Disease Studies Variables Documents Participants Type
of Study
– アルツハイマー病、心循環器疾患、高血圧、肥満、ALS、変性性神
経疾患、うっ血性心不全、脳血管障害、気管支喘息、心肥大、多動
症、動脈硬化、躁うつ病、骨粗しょう症、白内障、2型糖尿病、うつ
病、統合失調症、睡眠時無呼吸症候群、乾癬、脂肪肝、加齢黄斑
変性、ホルモン補充療法関連副作用、糖尿病性神経症、SLE、冠
動脈バイパス手術、心弁置換術、関節リウマチ・・・・・・・・・・・
疾患の遺伝因子・環境因子
• 疫学調査は、ひとまず
疫学者に任せておい
て
臨床現場での遺伝性の実感
• 遺伝子解析の基礎
– 疾患には遺伝性がある
– 疾患が血縁関係者に好発する
Commmon diseasesとその遺伝性
偶然性要因
遺伝的要因
環境的要因
単一遺伝子病
生活習慣病
アレルギー性疾患
感染症
悪性腫瘍
リウマチ性疾患
イメージ
外傷
とある外来にて
• ○○病患者 300人を診療している
• そのうちの1割、30人の患者の家族歴が陽
性であった
• さて、この疾患は、「遺伝性」が高いのだろう
か?
あなたの病気は○○病です。
あなたのご家族に、○○病の方
はいらっしゃいますか?
•
•
•
•
風邪の家族歴
MIの家族歴
RAの家族歴
奇病の家族歴
• 遺伝子解析の基礎
– 疾患には遺伝性がある
– 疾患が血縁関係者に好発する疾患が血縁関係
者に
• 好発するとは・・・
– 「普通に」発症している状態より、多く発症してい
ること
「普通に発症」
• 有病率と同じ程度に発症
– ○○病患者 300人を診療している
– そのうちの1割、30人の患者の家族歴が陽性で
あった
– 有病率が1割の疾患だったら、これは「普通に」
発症していて、有病率が5%の疾患だったら「普
通より好発」している?
家族歴の聴取
• 「ご家族に○○病の方はいらっしゃいます
か?」という質問
– 「家族歴陽性」
• 「○○病の診断を受けた家族がいる」
• 「○○病の診断を受けた家族が、少なくとも1人いる」
– 「ご家族」の人数は?→N
• 1-(発病しない率) N =1-(1-発病率)N
少なくとも1人の有病家族
0.7
0.6
有病率
0.5
0.1
0.05
0.01
率
0.4
0.3
0.2
1割の患者で家族歴陽性
0.1
0
1
2
3
4
5
6
家族人数
7
8
9
10
少なくとも一人の有病家族
1
0.9
有病率
0.8
0.7
0.3
0.2
0.1
0.05
0.01
率
0.6
0.5
0.4
0.3
0.2
0.1
0
1
2
3
4
両親
両親+同胞
5
6
7
8
両親+同胞+祖父母
家族人数
9
10
両親+同胞+祖父母+おじおば
比較的高頻度疾患において
• 「家族歴陽性」は、「普通なこと」で遺伝性の
判断には有用ではない
– 「少なくとも1人」だったから
• 「何人中、何人」という情報なら・・・
– 何人の「家族」を思い浮かべて、「あり」「なし」の
情報を取ったか。
– その「あり・なし」の比率が「普通」か「好発」か。
5人家族のうちの何人が有病
1
0.9
確率
0.8
0.7
0.3
0.2
0.1
0.05
0.01
0.6
0.5
0.4
0.3
0.2
0.1
0
0
1
2
3
4
家族が10人なら有
病率x10のところに
ピーク
5
有病者数
家族10人のうち何人が有病
1
0.9
確率
0.8
0.7
0.3
0.2
0.1
0.05
0.01
0.6
0.5
0.4
0.3
0.2
0.1
0
0
1
2
3
4
5
有病者数
6
7
8
9
10
「家族に集積する」環境因子
• 「遺伝」するのは、遺伝因子だけではない
– 精神科領域疾患の例
• 養育・教育環境における父母差 など
• 「家族歴」から感じる遺伝性を、実際の遺伝性
より大きく感じさせる要因
疾患の遺伝因子・環境因子
• 疫学調査・遺伝学
– 双生児研究・家系研究
• 遺伝率 Heritability
– 形質のばらつきを、遺伝因子のばらつきと環境因子のば
らつきに分離することで、「遺伝要因の強さ」を数値化した
もの
– 基本は育種
• 種牛の「能力」
– 育種価 breeding value
ある個体の個々の遺伝子座においてある形質に働く相加的遺伝
子効果の総和を育種価という。実用的 にはある個体の育種価はそ
の個体の子どもの平均値の集団平均からの偏差の2倍としても定
義される。
– 「ウシのブリーダーはウシを売るのでなく育種価を売るのだ」という
言葉がある。
• 「家族歴陽性」の判断だけでなく、遺伝率(学
問的な指標)をも鈍らせる
家族歴収集の段階で、できること
• 有病者・非有病者の両方の情報を取る
• 確実な環境因子を家族員についても聴取する
– 喫煙
– 食習慣
– などなど
• それが面倒くさければ、まったくその情報をとらない
代わりに、「バイアスをもたらす環境因があからさま
な疾患の家族歴」からは情報を引き出さないことと
する・・・
特に集積性の高い家系は・・・
• 集積度の高い家系と集積度の低い家系
• 同じ様相を見てもアプローチが異なる
– 発ガン家系→遺伝因子:発ガン遺伝子
– 肥満家系 →環境因子:生活習慣
• それはなぜ?
– あからさまに論じられていないが・・・
• 集積が「家族」か
• 集積が「血縁」か
• 環境因子は「なだらか」な量的因子・・・ 極端家系がいても、その途中がいそう
• 遺伝因子は「遺伝的な近さ」など、「特徴的な」値がある
– 一卵性双生児:1
– 親子:0.5
– 同胞:0.25 など
– 「MIの配偶者側ヒストリー」
家族歴
• 血縁家族歴
• 非血縁家族歴
Commmon diseasesとその遺伝性
偶然性要因
遺伝的要因
環境的要因
単一遺伝子病
生活習慣病
アレルギー性疾患
感染症
悪性腫瘍
リウマチ性疾患
イメージ
外傷
~遺伝率で遺伝性が判明した後~
• いくつのリスク遺伝子があるか
• それぞれの強さはどのくらいか
• それらを見つけられるか
• スタディ実行!
スタディの結果
「関連遺伝子」の強さ
• p値
• オッズ比・相対危険度
• Genotypic attributable risk
• Genotype-Specific Recurrence Risks
p-value and OR
• 素のp値
– GWASでp=0.0000000000324 !
• 素のOR
– GWASでOR=2
形質(疾患)
1マーカーでの関連解析
マーカー
形質とマーカーとに強い関連がある
多マーカーでの関連解析
形質(疾患)
マーカー2つ
形質と第1マーカーとに強い関連がある
多マーカーでの関連解析
形質(疾患)
マーカー
形質と第1マーカーとに強い関連がある?
多マーカーでの関連解析
形質(疾患)
マーカー
形質と第1マーカーとに強い関連がある
???????
マルチプルテスティング問題
p値の補正
• マルチプルテスティング補正
– GWASでは「割引き」したp値
– GWASでp=0.0000000000324 !
• 「論文になった」~p<0.01
– 「GWASですごいp値」~「GWASのORはすごい値
– 「p値は補正しないと」~「ORも補正しないと」
– 「かろうじて、有意差が出た」
• p=0.0000000000324 !~p=0.01
• 「かろうじてのORは1より少しだけ大きい程度」
ORの補正
本当のリスクは?
発端研究
Korean
メタアナリシス
その他の解釈指標
「本当のリスク」に照らして
• Genotypic attributable risk
– あるリスクアレルがあったときに、そのアレルがなかった
ら、疾患有病者のどれくらいの割合が今より減るだろうか、
という値。
• Genotype-Specific Recurrence Risks
– 同胞に発病者がいるとする。罹患同胞も、本人も一切リス
クアレルに関する情報がないとしたときには、本人(罹患
同胞を持つ)のリスクは によって与えられる。今、あるリス
クローカスについて、本人のジェノタイプがわかったとする
と、そのわかった分だけ、発病リスクが上がる分がある
(当該ローカスのリスクアレルを持っていれば)。それを
Multiplicative modelに照らして数値化したもの。
ポストゲノム時代の疾患遺伝子解析
~現状と課題~
• 民族差
• 多型
– SNPとCNP(コピーナンバー多型)
• 遺伝子
– コーディング遺伝子と非コーディング遺伝子
• 解析規模の拡大
– 統計解析手法
Korean
民族差
ヒトゲノムサイズ
1
10
102
103
104
105
106
107
108
109
Sub-microscopic variants
Microscopic variants
Structural variants
SNP
♂♀
置換型多型
挿入欠失型
CNV
リピート型
向きの多型(逆位)
位置の多型(転座)
1010
Central Dogma & DNA Variations
Variations
DNA
Variations
Transcription initiation point
Transcription
Transcription termination point
Variations
Splicing and mRNA maturation
Variations
mRNA
Translation initiation point
Translation
Codon triplets
Variations
Translation termination point
Peptide
Post-translational peptide
modifications
Molecules
Not one way, but Multiple Bifurcations
Sequence (qualitative) variations, quantitative variations,
Chrono-spatial variations
DNA
mRNA2
Transcript variations
mRNA1
Peptide3
Peptide variations
Molecular
variations
Peptide1
Peptide2
Molecule3
Molecule1
Molecule2
Molecule4
DNA
mRNA2
mRNA1
Peptide3
Peptide1
Peptide2
Molecule3
Molecule1
Phenotype1
Molecule4
Molecule2
Phenotype2
Phenotype3
Phenotype4
DNA
mRNA1
Peptide1
Molecule1 Molecule2
Phenotype2
Phenotype1
mRNA2
Peptide2
Peptide3
Molecule3
Molecule4
Phenotype3
Phenotype4
Association study with DNA-markers
Susceptible
DNA-mRNA-Protein relation is not straight, but
comparison between DNA variations and
phenotype variations bypassing mRNA/proteins
simplifies the analysis structure.
Non-susceptible
Non-coding-gene
World and Variations
DNA
Effects on transcription
Coding DNA
Functional
RNA
Coding mRNA
Effects on translation
?? Effects on phenotypes??
Coding-gene World
and Variations
個人のゲノム
Genotyping technologies and
further developments
•
•
•
•
100,000 marker-panel
250,000 marker-panel
500,000 marker-panel
…1,000,000 marker-panel
…
… Whole genome typing of all
samples
Typing
スタディ規模の大規模化
• ランダムサンプル収集が不可能
– 集団構造化
• 多数のマーカー検定
– マルチプルテスティング
疾患における遺伝因子の位置
~実用に向けて~
• 遺伝子単一では、診断・予測への応用
– その精度と利用法
• 発病前(予防・発病予測)、発病後(治療法選
択・予後予測)
東京大学医科学研究所
ヒトゲノム解析センター
京都大学大学院
医学研究科附属ゲノム医学センター
理化学研究所遺伝子多型研究センター
関節リウマチ関連遺伝子研究チーム