量的形質の場合

量的形質の場合
質的形質の場合は、「病気である」「病気でない」のように 2 つの表現型(3 つ以上のことも有る)
を取ります。病気である場合を 1、病気でない場合を 0 として、変数と考えることもできます。
しかし身長や検査値は、
「大きい」
「小さい」のような質的表現型で表すことができないわけではあ
りませんが、連続的な量として表したほうが適当と言えます。このように量的形質の場合、表現型は
連続的な変数、あるいは変量で表すことができます。量的変量の場合、まずそれが正規分布に従うか
どうかを確認します。もし、そうではない場合、例えば変量の対数が正規分布に従う場合、変量の対
数を対象に解析を進めることもあります。
単一座位の影響
表現型が、ある単一座位の遺伝型 AA, Aa, aa と関連するとします。それぞれの遺伝型ごとに、表
現型は平均が異なり、分散が同じ正規分布に従うと仮定します。つまり
Q|AA
∼ N (µAA , σ 2 )
Q|Aa
∼ N (µAa , σ 2 )
Q|aa ∼ N (µaa , σ 2 )
とします。Q が表現型で、Q|G ∼ N (µ, σ 2 ) は、遺伝型 G の条件のもと、表現型が平均 µ、分散 σ 2
の正規分布に従うことを示します。ただし、µAA , µAa , µaa は、それぞれの遺伝型に対応する表現
型の平均です。
ここで、アレルの相加性を仮定すると、E(Q|Aa) = [E(Q|AA) + E(Q|aa)]/2 より
µAa =
µAA + µaa
2
が得られます。
相加性が仮定できない場合、次のドミナンス偏位 d があるといいいます。
d = µAa −
µAA + µaa
2
a の頻度を p とし、Hardy-Weinberg 平衡を仮定すると、集団全体の平均は
E(Q) = µAA (1 − p)2 + 2µAa p(1 − p) + µaa p2
となりますが、相加性を仮定できる場合は簡単になり、
E(Q) = µAA (1 − p)2 + (µAA + µaa )p(1 − p) + µaa p2 = µAA (1 − p) + pµaa
となります。
1
(1)
複数座位の場合
複数座位の場合、量的表現型は次の多変量線形モデルで計算されます。
Q = β0 + β1 X1 + β2 X2 + · · · + βn Xn + ²
(2)
ここで、βi , (i = 1, 2, · · · , n) は定数、² は n 個の座位以外の、環境を含めた要因の統合による変量で、
β0 を調整することにより平均 0 とすることが可能です。
i 座位について、上記のようにアレルの効果の相加性を認める場合、Xi は単純に片方のアレル a の
数(0,1,2)とし、
βi = µAa − µAA = µaa − µAa =
µaa − µAA
2
とします。
相加性を認めない場合は、βi は同じく (µaa − µAA )/2 とし、



0
(AA の場合)


2(µAa −µAA )
Xi =
(Aa の場合)
µaa −µAA



 2
(aa の場合)
(3)
とします。相加性を認める場合は、µAa = (µAA +µaa )/2 となるので、上記の式の Aa の場合は Xi = 1
となり、この式は相加性を認める場合にも成り立ちます。
特定の個人で、1, 2, · · · , n 座位の遺伝型が決まった場合、その個人の表現型を Qs とすると、
E(Qs ) = β0 + β1 x1 + β2 x2 + · · · + βn xn
(4)
となります。ここで、xi は i 座位で観察された遺伝型から、式(3)により決まる Xi の値です。
集団の表現型の平均 E(Q) については次の式が成り立ちます。
E(Q) = β0 + β1 X̄1 + β2 X̄2 + · · · + βn X¯n
(5)
ここで、X̄i は Xi の期待値です。
i 座位の遺伝型の情報(Xi = xi )のみで、計算した個人の表現型の期待値 E(Qi ) については次の
式が成り立ちます。
E(Qi ) = β0 + β1 X̄1 + β2 X̄2 + · · · + βi xi + · · · + βn X¯n
(6)
ここで、E(Qi ) は i 番目の座位から計算された表現型の期待値で、その座位の個人の遺伝型により、
3 種類の値、E(Qi |AA) = µAA , E(Qi |Aa) = µAa , E(Qi |aa) = µaa のいずれかの値をとります。こ
れらの値は座位により異なります。
2
式(5,6)より
E(Qi ) − E(Q) = βi xi − βi X̄i = βi (xi − X̄i )
(7)
が求められますが、これより、
βi xi = E(Qi ) − E(Q) + βi X̄i
(8)
となり、式(8)に i = 1, 2, · · · , n を入れ、それを式(4)に代入すると
E(Qs ) = β0 +
n
∑
[E(Qi ) − E(Q)] +
i
n
∑
βi X̄i
(9)
i
となります。
式(5)を参考にして、
E(Qs ) =
n
∑
[E(Qi ) − E(Q)] + E(Q)
(10)
i
を、求めます。
E(Qs ) は i から n までの座位の情報を統合した個人の表現型の期待値であり、求める値です。
E(Qi ) は i 座位のみの遺伝型情報で計算した表現型の期待値、E(Q) は集団の表現型の平均です。
具体的な計算
具体的には論文の中で、多くの場合、相加性を仮定し、βi と pi のみが記載されていることがほと
んどです。pi は片方のアレル a の頻度であり、βi の符号とアレルの選択が合致するようにします。a
アレルが増えるごとに表現型が増える場合、βi は正でなければなりません。
ここで、相加性を仮定する場合、Xi は、確率パラメータ pi 、サイズ 2 の二項分布に従うため、平
均と分散は、
X̄i
V (Xi )
= E(Xi ) = 2pi
= 2pi (1 − pi )
(11)
であり、式(7)より、



−2βi pi
(AA の場合)


E(Qi ) − E(Q) =
βi (1 − 2pi ) (Aa の場合)



 2β (1 − p ) (aa の場合)
i
i
となります。ただし、pi は i 座位における a アレルの頻度です。
3
(12)
つまり βi がわかり、a アレルの頻度 pi がわかれば、この座位の遺伝型に応じてこれから E(Qi )−E(Q)
を計算できます。それが各座位について計算できれば、式(10)より E(Qs )、即ち、各座位の遺伝
型を決めた上での表現型の期待値を求めます。
相加性を仮定した場合、V (Q) は式(2)より、式(11)を参考に
V (Q) =
n
∑
V (βi Xi ) + V (²) = 2
i=1
n
∑
βi2 pi (1 − pi ) + V (²)
i=1
となります。
複数の論文の βi を統合する方法
複数の論文の βi の統合は逆分散法によるメタ解析の手法により行います。
4