生命科学研究のための 統計学てほどき(2)

Katsumi Wakabayashi, Ph. D.
Prof. Emer. Gunma University
Technical consultant, Shibayagi Co. Ltd.
Shibayagi Webiner
1
全数検査が困難または不可能である場合
には抽出標本の群について比較等の検討
を行う
このような場合従来の統計学とは区別し
て推測統計学、あるいは推計学という
この分野ではある事柄の起きる可能性を
一定の危険率(間違った判定をする確
率)の範囲で判定する
例えば5%,1%,0.1%を危険率の
標準としてその事柄の有意性を判定する
通常生命科学の領域では危険率5%を用
いることが多い
左は日本における推計学の開祖といわれ
る増山元三郎の著書である(1950年
代)
Shibayagi Webiner
2
推測統計学で行うこと
比較
母集団中での位置(その標本は母集団のどの位置にあるか?)
2群に差があるか(分布の形に差があるか?)
2群の平均値の差の検定(平均値に差があるか?)
対応のあるt検定
対応のないt検定
等分散の場合/不等分散の場合
多群の平均値の比較
分散の均一性の検定 ⇒ Duncan の 多群比較
要因の関連を検討する
2要因の相関(一つの母集団中の二つの要因に関連性があるか?)
その応用として直線回帰による検量線と定量
分散分析法(一元配置と二元配置)
(母集団中の或る要因が異なる集団は平均値も異なるか?)
All or nothing (出現率) の検定
Fisherの直接確率検定法
mxn分割表によるカイ二乗検定
Shibayagi Webiner
3
定性的判定と定量的判定
定性的判定
ある確かさ(危険率)で判定する
A群の平均値はB群より大きい
薬物Dを投与すると血糖値が下がる
A が増加するとBは減少する、など
数値的なデータは示されず判定の危険率のみ示される
定量的判定
具体的数値を以て判定する
生体物質Sの血中濃度はXng/ml である
ある製品A中の有効物質Dは別な製品Bよりも3倍多い
薬物DのXg投与で物質Sの血中濃度はYmg/ml低下する、など
数値的なデータは信頼範囲と共に示される
Shibayagi Webiner
4
二つの群を比べる
正規分布の形を決める要因は二つある
平均値
μ
標準偏差 s
検定の順序
標準偏差 ⇒ 平均値
標準偏差,即ち分散(分布の広がり)が同程度であること(等分散)を
確認してから、平均値の差の検定に掛かる
Shibayagi Webiner
5
正規分布の形と比較の可能性
A
B
C
A
A
と B : 等分散 (σ が同程度の大きさ)
と C : 不等分散(σ が大きく異なる)
分散比の検定:F 検定 σの大きい方を小さい方で割った値をFoとして、
それぞれの群の自由度、n-1 とm-1でp<0.05のF表から
求めた数値と比較して有意差を求める
有意差になったら不等分散
Shibayagi Webiner
6
正規分布から外れる分布
ヒストグラムを作ってみてから基本統計量の歪度、尖度を調べ、疑問が
生じたら正規性の検定を行う
正規性が否定されたら正確な比較は困難
Shibayagi Webiner
7
2群の平均値に有意差があるかどうかの検定
検定の順序
1.二つの群のデータに対応があるか?
2.分散は等分散か?
対応ある?
Yes
対応のあるt検定
(Paired t test)
No
F 検定
等分散?
Yes
Studentの t 検定
No
Shibayagi Webiner
近似的 t検定
Cochran-Cox の検定
Welsh の検定
8
多群の平均値の比較
広い意味でのt-検定は、元来二つの平均値を比較するためのものである
比較したいそれぞれの群のバラツキ(分散)は互いに異なる可能性がある
比較すべきものが2群しかない場合はそれぞれの分散を使用せざるを得な
いが、3群以上の平均値の比較には偶然の分散変動を避ける意味で、いわ
ば「平均的バラツキ」を使用する方がより精密な判定ができる
●各群の分散がほぼ等しいことを確かめる(分散の均一性の検証)
(Bartlett の方法による)
分散が不均一であると判定された時は、他とはずれた異常に大きな分散
を持つ群を見つけ出し、そのグループの取り扱いに問題点(あってはな
らないグロスエラー)があったものとして別に扱う
(不等分散の場合のt検定で近似的に他の群と比較する)
●分散の均一性が保証された群について Duncan’s multiple
comparison の手法により、平均的分散を計算し、平均値の大きさに
よって群を並べ直し、順位によって平均的分散に或る因子を掛けて二群
ずつを比較.有意差を判定する.
Shibayagi Webiner
9
相関係数 (Correlation coefficient)
r=
𝑆𝑆𝑆𝑆𝑆𝑆
𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆
𝑆𝑆𝑆𝑆𝑆𝑆 = ∑(𝑥𝑥 − 𝑥𝑥̅ )2
𝑆𝑆𝑆𝑆𝑆𝑆 = ∑(𝑦𝑦 − 𝑦𝑦�)2
𝑆𝑆𝑆𝑆𝑆𝑆 = ∑(𝑥𝑥 − 𝑥𝑥̅ )(y−𝑦𝑦�)
Sxx, Syy は標準偏差を求める際の計算式
SD =
∑(𝑥𝑥 − 𝑥𝑥̅ )2
𝑛𝑛 − 1
における平方和の部分と同じ数式である.
これに倣って Sxy はxの偏差とyの偏差を掛け合わせた
ものの和と考えれば分かり易い.
Shibayagi Webiner
10
相関
負の相関
正の相関
8
10
6
8
6
4
4
2
0
2
0
1
3
5
7
X が増大するとYも増大する
(0<r≤1)
3
5
7
Xが増大するとYは減小する
(-1≤r<0)
相関無し
10
8
6
Xの増減とYの増減は関係ない
4
2
0
0
5
10
Shibayagi Webiner
11
相関の有意性
相関係数だけでは相関の有意性は分からない
相関の有意性は、標本の個数と相関係数によって一義的に決まる
Shibayagi Webiner
12
相関(定性)から回帰(定量)へ
AとBの相関係数が±1に近い時には、回帰直線が信頼性を持って描ける
ので、AからBまたはBからAが推定できる
得られた回帰式によって、全ての点 Pi (xi,yi)の何パーセントが説明でき
るかを示すのが、回帰係数rの自乗、r^2である
回帰係数自体は相関関係の有無を定性的に示す係数である
従ってrとr^2では使い道が異なることに注意!
以下の2つのスライドに示す相関と回帰の例では、各要因の信頼限界が
示されている
即ち、回帰係数の95%信頼限界の上限と下限、一次回帰式の勾配と切
片、またグラフ上には、各データの座標と一時回帰直線、その両側には
データの95%が含まれる領域、及び回帰直線の95%領域が示されて
いる(いわば平均値の信頼限界と2SDの関係のようなもの)
Shibayagi Webiner
13
相関と回帰の例・・・通常の相関例
よくある例で、相関係数はそれほど大きくないが、有意な相関が判定される
(危険率は0.1%以下である)
回帰式も計算されているが、r^2値は0.75で、回帰式により説明できる部分は
75%に過ぎず、標準曲線には使用できない
Shibayagi Webiner
14
相関と回帰の例・・・ある測定系の標準曲線から
各標準点のバラツキが小さくX-DATAとY-DATAがきれいに直線状に並んで
いるため相関係数が1に近い.このような場合、r^2は1に近く、全ての点の
99.8%が回帰式により説明できるので、検量線として使用できる
Shibayagi Webiner
15
この項
終わり
Shibayagi Webiner
16