スライド 1 - Affect & Cognition Lab

SEM による行動遺伝学
(behavioral genetics)
解析の理論と実際
前川研 PD
村山 航
目次
基本的な考え方(単変量遺伝分析)
 生物測定学モデルによる遺伝子相関の算出
 発展モデル1:Sex limitation model
 発展モデル2:多変量遺伝分析モデル
 発展モデル3:G X E interaction モデル

目次
基本的な考え方(単変量遺伝分析)
 生物測定学モデルによる遺伝子相関の算出
 発展モデル1:Sex limitation model
 発展モデル2:多変量遺伝分析モデル
 発展モデル3:G X E interaction モデル

ある特性の分散(個人差)を規定する
もの
遺伝子
“A set” of genes
相加型・非相加型(エンドウマメ)
外向性
表現型
(phenotype)
共有環境
家庭の雰囲気
居住環境など
非共有環境
家庭外の交友関係など
環境
+測定
誤差
SEM による表現
* 潜在変数の分
散は1に固定
とりあえず相加型
(additive) 遺伝子に限定
遺伝子
(additive gene: A)
a
共有環境
外向性
c
(common environment: C)
表現型
(phenotype)
e
(random environment: E)
データから代入
2
Vp =
a2
+
非共有環境
c2
+
e2
解けない!
パラメータ3つ (a,c,e) (識別不定)
方程式1つ
兄弟からデータを取ってみる
兄
表現型
a
c
e
A
C
0.5
この値は biometrical
model によって得られ
る(後述)。
E
弟
表現型
1.0
a
c
e
A
C
E
Vp2 = a2 + c2 + e2
Cov = 0.5a2 + c2
まだ解けない!
一卵性双生児 (Monozygotic twins) から
データを取ってみる
兄
表現型
a
c
e
A
C
一卵性双生児だから遺
伝子は同一(後述)
1.0
E
弟
表現型
1.0
a
c
e
A
C
E
Vp2 = a2 + c2 + e2
Cov = a2 + c2
・ e は算出可能
・ a と c が分離不能
あわせてみる
兄
表現型
a
c
e
A
Vp2 = a2 + c2 + e2
Covbros = 0.5a2 + c2
Covmz = a2 + c2
C
方程式3つ → 解けた!
E
弟
表現型
0.5/1.0
1.0
a
c
e
A
C
E
しかし…
兄弟と一卵性双生児だと全員
に共通する「共有環境」の意味
が不明確
一卵性双生児と二卵性双生児 (dizygotic
twins) からデータを取る
兄
表現型
a
c
e
A
C
E
弟
表現型
二卵性双生児は
遺伝的には兄弟と同じ
1.0/0.5
1.0
a
c
e
A
C
E
Vp2 = a2 + c2 + e2
Covdz = 0.5a2 + c2
Covmz = a2 + c2
やはり方程式が解け,か
つ「共有環境」も等質
まとめると



一卵性双生児と二卵性双生児のデータを両方用いる
ことで,ある表現型に対する,遺伝,共有環境,非共
有環境の効果を分離することができる
統計的には共分散構造分析の多母集団解析を用い
て解を推定する
実際的には,3つの効果を同時推定するモデル
(ACE モデル)と,CE モデル,AE モデル,E モデル
の適合度 (e.g., AIC) を比較し,最もよいモデルを選ぶ。
Note1: ACE モデルも飽和モデルではない(すべての
表現型分散が等しいという仮定が入っているため)
Note2: 測定誤差は E に含まれる
行列による共分散構造
ΣMZ =
ΣDZ =
a2 + c2 + e2
a2 + c2
a2 + c2 + e2
a2 + c2 + e2
0.5a2 + c2
MZ間 の相関が DZ 間の
相関より高ければ遺伝の
効果があることを示唆
a2 + c2 + e2
ふたご間の相関を目で見るだけで
も,遺伝の効果は推測できる
単変量遺伝分析の実際

調査対象:首都圏に住む 13-18 歳のふたご 908 組
 MZ男男:221 組
 MZ女女:301 組
分析に使用
 DZ男男:88組
 DZ女女:99組
 DZ男女:199組

調査の詳細:首都圏ふたごプロジェクト (TOTCOP:
http://www.totcop.jp/index.html)
ここで取り上げる項目例

教科ごとの好き嫌いと成績(自己報告)
 数学:「数学ではよい成績を取っている」「数学が好きである」
 英語:上に同じ
 総合学習:上に同じ

授業の予習・復習
 「学校の授業の予習・復習をする」

数学の認知的な学習方略
 「数学の勉強をしていて,教科書,ノート,参考書などを読む
とき『なぜ間違えたのか』『これから間違えないようにするに
はどうしたらいいのか』などということについて考える」など
結果1:最適モデル
ACEのdf ACE
数学・成績
数学・好き
英語・成績
英語・好き
総合・成績
総合・好き
予習・復習
学習方略
CE
AE
E
1335
1230.2 1240.4 1228.2
1353.5
1334
1297.0 1312.6 1295.0
1461.0
1336
1175.0 1199.8 1173.0
1338.1
1335
1241.6 1251.1 1239.6
1355.0
1306
770.1
768.5
844.5
1325
1051.9 1051.6 1050.7
1113.8
1330
1073.4 1071.5 1075.4
1133.1
1332
684.3
778.2
771.5
692.6
682.3
結果2:遺伝率の推定 (a2/[a2+c2+e2])
数学・成績
数学・好き
英語・成績
英語・好き
総合・成績
総合・好き
予習・復習
学習方略
A
C
E
47%
-
53%
52%
-
48%
53%
-
47%
44%
-
56%
38%
-
62%
34%
-
65%
-
42%
58%
41%
-
59%
全体として
遺伝の効果
が強い
注意点

「遺伝の効果」は個人差を説明する効果
 遺伝に既定されていても,個人差がなければ効
果はでない (例:「指を5本にする遺伝子」)

できれば性別ごとに分けて分析するのがよい
 二卵性双生児のopposite

sexペアは除去
モデルの前提を脅かす要因
 遺伝要因と環境要因の相関 (G-E correlation)
人は自分の遺伝にあった環境を選ぶ・作るかも
 いい遺伝の家族はいい環境にいるかも
⇒ 正の相関はAを overestimate させる

目次
基本的な考え方(単変量遺伝分析)
 生物測定学モデルによる遺伝子相関の算出
 発展モデル1:Sex limitation model
 発展モデル2:多変量遺伝分析モデル
 発展モデル3:G X E interaction モデル

なぜDZの遺伝間相関は0.5なのか


なぜMZの遺伝間相関は1なのか。赤の他人は?
⇒ 生物測定学 (biometrical) モデルによる定式化
以下の話の前提
 ある遺伝子座1つの効果を考える
 遺伝子座には2つの対立遺伝子Aとaだけ関与
 遺伝の効果は相加的:A が1つ増えると表現型
(たとえば身長)は d だけ大きくなる。
遺伝子型
AA
Aa
aa
表現型
d
0
-d


A の遺伝子頻度を u, a の遺伝子頻度を v とする
交配がランダムだとすると,次の世代は
A: u
a: v
A: u
AA: u2
Aa: uv
a: v
Aa: uv
aa: v2
1世代後の遺伝子頻度
u+v=1
A: u2 + ½ uv + ½ uv = u2 + uv = u (u+v) = u
a: v2 + ½ uv + ½ uv = v2 + uv = v (u+v) = v
変化しない!

前の表より,遺伝子型の頻度は,どの世代でも
遺伝子型

AA
Aa
aa
頻度
u2
2uv v2
表現型
d
0
-d
従って,表現型の(遺伝による)平均と分散は
μ = u2 d + 2uv x 0 + v2 (-d) = (u+d)(u-v)d = (u-v)d
σ2 = u2[d – (u-v)d]2 +2uv[ 0 – (u-v)d]2 + v2[-d – (u-v)d]2
= … = 2uvd2

表現型の遺伝による2者間の共分散は
(X1i – μ) (X2i – μ) を 頻度で重み付けして足すと,MZ,
DZ, unrelated それぞれの表現型の遺伝による共分散
が分かる

共分散の計算結果
 Cov (MZ) = 2uvd2
 Cov (DZ) = uvd2
 Cov (unrelated) = 0

よって相関は,これを標準偏差(先述)で割って
 MZ: 2uvd2/ 2uvd2 = 1
モデルで仮定し
た値と一致!
 DZ: uvd2/ 2uvd2 = 0.5
 Unrelated = 0/2uvd2 = 0

遺伝子座が複数あったとしても計算結果は同じ(メン
デルの独立の法則より)
非相加遺伝子 (dominance: D)


ある遺伝子の効果が別の遺伝子の効果によって変
わってくること (e.g. エンドウマメの皺)
非相加効果は,下図における h で表現可能
aa
Aa
AA
h
-d

d
h を組み込んで,先ほどのモデルからDZの表現型
の遺伝による相関を計算すると,0.25 となる
 MZ
は 1, unrelated は 0
ADCE モデル

A
a

d
表現型
c
D
1.0/0.5

C

e
E
1.0/0.25
A
a
d
D
c
C
表現型
e
E
1.0
非相加遺伝の効果も組み込
んだモデル
共通環境で養育された双子
データだけだと識別不定
解が不安定になりやすい
以降では,ACE モデルだけを
取り扱う
Vp2 = a2 + c2 + d2 + e2
Covdz = .5a2 + .25d2+ c2
Covmz = a2 + d2 + c2
注意点

DZ における遺伝の効果の相関が 0.5 (or
0.25) である背後には,「ランダム交配」の前提
 エンドウマメはランダムだった
 人間なら,遺伝子が似ている人ほど結婚しやすい
かも: Assortative mating (同類交配)
 Assortative mating が存在:A のDZにおける相関
は実際は 0.5 以上になり,それを 0.5 として分析し
てしまうことで,C の効果がoverestimate される。
目次
基本的な考え方(単変量遺伝分析)
 生物測定学モデルによる遺伝子相関の算出
 発展モデル1:Sex limitation model
 発展モデル2:多変量遺伝分析モデル
 発展モデル3:G X E interaction モデル

General sex-limitation model

行動遺伝学における 2 タイプの性差
 1:遺伝や環境の効果の大きさに性差があるか
 2:どちらの性別にも同じ遺伝子セット(もしくは共
有環境)が影響を与えているのか
この両方を1つのモデルで検討
 ポイント:これまで使わなかった opposite sex
の DZ のデータを用いる

モデル
0.5
A
af
1.0
C
cf
E
ef
A
C
am
表現型(女)
em
表現型(男)
影響力に性差を仮定
DZ opposite sex ペア
cm
E
A
a’m
男性に特殊な遺
伝の効果を仮定
(共有環境の効果でも
いいが,どちらか1つに
しないと識別できない)
MZ male, MZ female, DZ male,
DZ female も同じようにモデル構築 ⇒ 5群の多母集団分析
共分散構造
Vmale = am2 + cm2 + em2 + a’m2
Vfemale = af2 + cf2 + ef2
CovDZm-f = 0.5amaf + cmcf
CovDZmale = 0.5am2 + cm2 + 0.5a’m2
CovDZfemale = 0.5af2 + cf2
CovMZmale = am2 + cm2 + a’m2
CovMZfemale = af2 + cf2
異なる性別間では分散が
違っていてもよい!
Opposite sex DZ の相関
が,Same sex DZ の相
関よりも弱ければ,特殊
遺伝子があることを示唆
サブモデル

Common effects sex-limitation model
a’m の効果を 0 にしたもの
 General sex-limitation model より自由度1減


Scalar effects sex-limitation model
effects sex-limitation model の制約
をさらに強め,効果の性差はあるが,遺伝・環境
の効果の割合は変わらないようにしたもの
 Common effects sex-limitation model より自由
度2減
 Common
* Scalar effects sex-limitation model
0.5
A
a
同一
1.0
C
E
c
e
L(女)
1
表現型(女)
A
a
C
E
c
e
L(男)
k
表現型(男)
効果を
スケーリング
さらなる発展モデル
性別を「環境」と考えると,環境によって遺伝
や環境の効果が変わってくるモデルになる
⇒ 一種の G X E interaction モデル
 ただし,環境が性別のように二値変数の場合
にしか使えない
 連続量の場合の G X E interaction model
に関しては後述

Sex-limitation model の実際

自己概念
 「数学の授業の内容を理解できる自身がある」
 「数学の授業の内容を身につけることができてい
ると感じている」
双子間相関
男ペア
MZ
0.38
DZ
0.19
← 遺伝?
女ペア
0.47
0.41
← 共有環境?
男女ペア
0.17
モデル比較
Am
Cm
Em
Am’
828.3 38%
2%
61%
0%
10% 36% 53%
Common1 1705 826.3 38% 2% 61%
-
10% 36% 53%
Common2 1706 824.9 40%
60%
-
20% 28% 53%
Common3 1706 826.8 33% 7% 61%
-
-
46% 54%
Common4 1707 829.0 40%
-
-
46% 54%
df
General
1704
AIC
-
-
60%
Af
Cf
Ef
男性は遺伝の効果が,女性は共有環境の効果が大きい
目次
基本的な考え方(単変量遺伝分析)
 生物測定学モデルによる遺伝子相関の算出
 発展モデル1:Sex limitation model
 発展モデル2:多変量遺伝分析モデル
 発展モデル3:G X E interaction モデル

2変量の場合
X1 = a1A1 + c1C1 + e1E1
潜在変数の分散を1にし
てあるので,相関になる
X2 = a2A2 + c2C2 + e2E2
V(X1) = a12 + c12 + e12
V(X2) = a22 + c22 + e22
A,C,E間の共
分散は 0
Cov(X1, X2) = a1a2 Cor (A1,A2) + c1c2 Cor (C1,C2)
+ e1e2 Cor (E1,E2) = a12 + c12 + e12
置き換え
データから代入
V(X1)
Cov(X1,X2) V(X2)
共分散も遺伝要因・環境要因に分割可能
=
a12 + c12 + e12
a12 + c12 + e12 a22 + c22 + e22
方程式3つにパラメータ9つ ⇒ 解が求まらない!
パス図で書くと(遺伝相関モデル)
X1
a1
c1
e1
A1
C1
E1
Cor(A1,A2)
Cor(C1,C2)
X2
a2
c2
e2
A2
C2
Cor(E1,E2)
E2
* ふたご間ではなく,「1人」のパス図である点に注意!
ふたごを使ってみる

「ふたご間」の分散と共分散が求まる
CovMZ(X1) = a12 + c12 + e12
CovMZ(X2) = a22 + c22 + e22
CovMZ(X1, X2) = a12 + c12 + e12
CovDZ(X1) = 0.5a12 + c12
CovDZ(X2) = 0.5a22 + c22
CovDZ(X1, X2) = 0.5a12 + c12
方程式はさきほどとあわせて合計9つ,パラ
メータは9つ ⇒ 解が求まる!
分散共分散構造を改めてきちんと書くと
双子1
x1
双子2
x2
2 + c 2 + e 2
a
x
1
1
1
双 1
子
2
2
2
1 x2 a12 + c12 + e12 a2 + c2 + e2
x1
x2
Sym.
MZ
双 x1
子
2 x2
a12 + c12
a12 + c12
a12 + c12 + e12
a12 + c12
a22 + c22
a12 + c12 + e12 a22 + c22 + e22
双 x1
子
1 x
a12 + c12 + e12
双x
子 1
2 x
0.5a12 + c12
0.5a12 + c12
a12 + c12 + e12
0.5a12 + c12
0.5a22 + c22
a12 + c12 + e12 a22 + c22 + e22
2
2
a12 + c12 + e12 a22 + c22 + e22
Sym.
DZ
行列による簡略化
a12 a12
a12 a2
MZ
DZ
2
=A
c12 c12
c12 c2
2
=C
A+C+E
A+C
A+C+E
A+C+E
0.5A + C
A+C+E
e12 e12
e12 e2
2
=E
パス図で書くと
1.0/0.5
ふたご1
X1
a1
c1
e1
A1
C1
E1
1.0
Cor(A1,A2)
ふたご2
A1
C1
a1
c1
e1
X1
E1
Cor(C1,C2)
X2
a2
c2
e2
A2
1.0/0.5
A2
C2
Cor(E1,E2)
C2
E2
1.0
E2
a2
c2
e2
X2
コレスキー分解


A, C, E 行列が正定値でないといけないが(分散共
分散行列なので),往々にしてそれが満たされない
したがって,下記のコレスキー分解で下三角行列の
値を推定してから,A, C, E の値を求める。このよう
にして求めた A, C, E は必ず正定値
A = PP’, C = QQ’, E = RR’
(P, Q, R は下三角行列)
MZ
DZ
PP’ + QQ’ + RR
PP’ + QQ’
PP’ + QQ’ + RR’
PP’ + QQ’ + RR’
0.5PP’ + QQ’
PP’ + QQ’ + RR’


以上の2変量モデルは,容易に多変量に拡張可能
(行列による共分散構造はまったく同じ式になる)
Cor (A1,A2), Cor (C1,C2), Cor (E1, E2) は得られた
パラメータをもとに算出可能
遺伝相関:Cor (A1, A2) = a12/a11a22
共有環境相関:Cor (C1, C2) = c12/c11c22
非共有環境相関:Cor (E1, E2) = e12/e11e12

遺伝相関の意味:同じセットの遺伝子が,複数の表
現型に影響を与えている(多面発現: pleiotropy)
 ただし他の解釈も可能
さらなる発展モデル1

独立経路 (independent pathway) モデル
 より制約の強いモデル
 遺伝相関,環境相関のそれぞれに因子分析を実
施したモデル
 さらに個々の変数の独自因子も遺伝要因と環境
要因に分割可能
モデル図
(双子の片側のみ) A1
C1
E1
A
X1
A2
C2
X2
C
X3
E
E2
A3
C3
E3
X1, X2, X3 を単一
の遺伝・環境因
子で説明
さらなる発展モデル2

共通経路 (common pathway) モデル
 独立経路モデルより制約の強いモデル
 表現型を単一の因子が説明し,それが遺伝要
因・環境要因に分割される
 さらに個々の変数の独自因子も遺伝要因と環境
要因に分割可能
独立経路モデルとの意味
的な違いは難しい?
モデル図
(双子の片側のみ)
A1
C1
E1
X1
A
A2
C2
X2
f
C
E2
A3
C3
E3
E
X3
多変量遺伝分析の実際

努力に対する信念,努力量,そして成績の関係
 努力に対する信念:「勉強をいっしょうけんめい努力すれ
ば,学校でいい点数をとることができると思う」
 学校での勉強時間
 学校での総合的な成績(自己報告)

単変量遺伝解析の結果
 努力に対する信念,学校での総合的な成績
⇒ AE
⇒ ACE
 よって,C をコレスキー分解した下三角行列に制約を入
れ,A や E だけに変数間の相関があるモデルを検討
 学校での勉強時間
表現型相関
結果
信念
努力量 .11 1
成績
分散説明率
信念
A
C
E
33%
-
67%
努力量 47%
成績
62%
遺伝相関
信念
1
22%
31%
-
38%
.15 .20 1
非共有環境相関
1
信念
1
努力量 .30 1
努力量 .01 1
成績
成績
.25 .31 1
.16 .10 1
目次
基本的な考え方(単変量遺伝分析)
 生物測定学モデルによる遺伝子相関の算出
 発展モデル1:Sex limitation model
 発展モデル2:多変量遺伝分析モデル
 発展モデル3:G X E interaction モデル

G x E interaction モデルとは




遺伝と環境の効果は,ある状況下にいる人や,パー
ソナリティを持った人によって違うかもしれない
Sex limitation モデルはその例の1つ
連続量の場合だとどうか?
遺伝と環境の効果に影響を与える変数を調整変数
(moderator variable) と呼ぶ
M1: 1人目の調整変数の値
モデル図
M2: 2人目の調整変数の値
a + t x M1
表現型
c + u x M1
A
C
1.0/0.5
e + v x M1
M1
E
1.0
M2
a + t x M2
表現型
c + u x M2
e + v x M2
A
C
E
※ 基本は単純な(潜在変数を含んだ)交互作用モデル
共分散構造
Vp12 = (a + s M1)2 + (c + t M1)2 + (e + uM1)2
Vp22 = (a + s M2)2 + (c + t M2)2 + (e + uM2)2
Covmz = (a + sM1)(a + sM2) + (c + tM1)(c + tM2)
Covdz = 0.5 (a + sM1)(a + sM2) + (c + tM1)(c + tM2)
Mx だとこれをこのままプログラムに代入すればよい
→ 1人1人について尤度を算出して最大化している?
注意点





モデル比較をしながら,不必要なパラメータは除去
調整変数によって因子負荷が線形的に変化するモデ
ルなので,分散成分は非線形に変化する
結果を視覚化するソフトが
http://statgen.iop.kcl.ac.uk/gxe/ にある
ここでプロットされるのはあくまでも分散成分であり,
「分散説明率」は新たにスケールしなおす必要がある:
結果としてまったく違った見え方になる可能性あり
両端部分は,サンプル数が少ないので,不安定である
ことを意識する必要性
G x E interaction モデルの実際

クラスサイズによって総合学習の成績における遺伝の分散
成分は変わってくるのか?
ACE - TUV
df
1224
AIC
704.72
ACE - TV
ACE - TU
ACE - UV
AE - TV
1225
1225
1225
1226
705.28
704.32
704.48
692.39
AE - T
1227
703.23
AE - V
AE
1227
1228
702.02
706.26
パラメータ値
A - 0.0784
E
1.2688
T
0.0127
V -0.0151
このまま解釈す
るのは難しい
プロットすると一目瞭然
E
A
クラスサイズが大きいと遺伝の寄与が増える!
ただし調整変数の分布には注意
このようなクラス
はほとんどない
E
A
参考文献など

Web上で無料で手に入るテキスト


G x E interaction について


Neale, M. C. & Maes, H. H. M. (2002). Methodology for genetic
studies of twins and families: http://ibgwww.colorado.
edu/workshop2006/cdrom/HTML/book2004a.pdf
Purcell S (2002). Variance components models for geneenvironment interaction in twin analysis. Twin Research, 5, 554-571.
今回紹介しなかった direction of causation analysis の話

Heath, A. C, Kessler, R. C., Neale, M. C., Hewitt, J. K., Eaves, L. J.,
& Kendler, K. S. (1993). Testing hypotheses about direction of
causation using cross-sectional family data. Behavior Genetics, 23,
29-50.