フイッシャーとメンデルの対話 統計家 生物学者

数理統計学
医薬研究における統計学の役割
東京理科大学
浜田知久馬
遺伝学の父 G.J.Mendel
R.A.Fisher
20世紀最大の統計学者
英国生まれ
1890-1962
ロザムステッド農事試験場
にて,実験計画法を独力で
考案. 現代統計学の基礎
を独力で構築
メンデルの遺伝の法則
表1
エンドウの2世代にわたる実験(メンデルの得た結果)
形質
両親
F1
F1の自家受精
F2
1 種子の形
丸×しわ
丸
丸×丸
丸
5474
74.8%
しわ
1850
25.2%
黄色
6022
75.1%
緑色
2001
24.9%
有色
705
75.9%
無色
224
24.1%
2 子葉の色
3 種皮の色
4 さやの形
5 さやの色
6 花の付き
黄色×緑色
有色×無色
黄色
有色
黄色×黄色
有色×有色
ふくらんだ×
ふくら
ふくらんだ×
ふくらんだ 882
くびれた
んだ
ふくらんだ
くびれた
299
25.3%
緑色×黄色
緑色
緑色×緑色
緑色
428
73.8%
黄色
152
26.2%
被生
651
75.9%
頂生
207
24.1%
高
787
74.0%
低
277
26.0%
被生×頂生
被生
被生×被生
方
7 茎の高さ
比率
高×低
高
高×高
74.7%
メンデルの3法則
• 優性の法則
AAとaaを掛け合わせると,次の世代
は,片方の親の表現型(A)のみになる.
• 分離の法則
Aa同士を交配すると,次の世代は,
(A+a)2=AA+2Aa+aaで,表
現型がAとaのものが3:1で生じる.
• 独立の法則
異なった形質は独立に遺伝する.
メンデルの苦悩
メンデル:「私は親から子への遺伝の問題について,長年研
究を続けてきた.最近geneという概念を導入することに
より遺伝という現象が,よく説明できることに気づいた.
もし,この仮説が正しければ, F2 において,優性と劣
性のものの比率は3:1になるはずである. データからも,
それに近いような結果が得られている.例えば,種子の形
が丸としわの数は5474と1850で,比率は74.8%と25.2%
で,ほぼ3:1になっている.私のgene仮説を立証するに
は,これが3:1であることを科学的に裏付けないといけな
い.客観的な裏付けがないと,学会からまたホラフキとい
われてしまう.」
メンデルの苦悩
メンデル:「私はこれまで随分努力をしてきました.はじ
めは純系がうまく作れなかったためF2 の優性と劣性の
比率がかなりばらついてしまいましたが,バラツキをな
くすために,何十年もかけて純系を作り出しました.そ
して学会に結果を発表したら,形質の判断が正確にでき
ているのかと文句をいわれました.そこで形質の判定ミ
スがなくなるように,だれにでも判断が容易な7つの形
質を取り上げましたが,今度はNが小さすぎてあてにな
らないと言われました.それで農園のあちこちにエンド
ウをまいて,このデータを得たわけです,3:1に近くなっ
ていますが,完全にはならない.どうしたら3:1であるこ
とが証明できるのでしょうか.もっとNを増やさないと
いけないのでしょうか,フイッシャー先生 」
確率分布とは
・データはバラツキを伴う.
・バラツキをモデル化しない限りは
評価ができない
・確率分布
(probability distribution)
バラツキを確率的に記述するための道具
データがいろいろな値をとる確率を表現
確率分布
N個のエンドウマメ π:しわの比率
しわの数の個数Xの分布:2項分布
Pr(X)=NCX・ πx(1- π)N-X
N=7324 π=0.25
しわの数の期待値:Nπ=7324×0.25=1831
しわの数が1831になる確率
1831(1-0.25)7324-1831
C
・0.25
7324
1831
=0.010765
N=7324,π=0.25の2項分布
p値の計算
1812
1850
2項分布の比率の検定
1)仮説を立てる.
しわのエンドウの数は,N=7324,比率0.25
の2項分布にしたがう.
2)仮説の下で得られたデータ(1850)以上に極端
な事象の起きる確率(p値)を計算する.
1831±19=1812,1850
1850以上になる確率:0.308
1812以下になる確率:0.309
両側p値=0.617
2項分布の正規近似
期待値:Nπ
=7324×0.25=1831
分散 :Nπ(1-π)=7324×0.25×0.75
=1373.25=(37.057)2
2項分布を平均が1831で標準偏差SDが
37.0の正規分布で近似
平均±SDの範囲に約70%
平均±2SDには約95% のデータを含む
平均±SD:1831±37.057=1794~1868
2項分布の正規近似
期待値:Nπ=7324×0.25=1831
分散:Nπ(1-π)
=7324×0.25×0.75
=1373.25=(37.057)2
N=7324,π=0.25の2項分布
N(1831,37.0572)の正規分布で近似
X2=(1850-期待値)2/分散
=(1850-1831)2/1373.25=0.51272
2項分布の正規近似
1812
1850
37
37
1831
近似の精度
正規近似による検定
表2 比率0.25の検定結果
形質
1
2
3
4
5
6
7
劣性の
観測数
種子の形
1850
子葉の色
2001
種皮の色
224
さやの形
299
さやの色
152
花の付き方 207
茎の高さ
277
p値>0.05
期待数
1831.00
2005.75
232.25
295.25
145.00
214.50
266.00
観測数 標準偏差 期待数
-期待数 (SD)
-2SD
19.00
37.06 1756.89
-4.75
38.79 1928.18
-8.25
13.20
205.85
3.75
14.88
265.49
7.00
10.43
124.14
-7.50
12.68
189.13
11.00
14.12
237.75
期待数
+2SD
1905.11
2083.32
258.65
325.01
165.86
239.87
294.25
= 観測数が期待値±2SD以内
p値
0.61
0.90
0.53
0.80
0.50
0.55
0.44
適合度のカイ2乗検定
観測数が期待数±2SDの範囲に入る
=(観測数-期待数)/SDが±2の範囲
(観測数-期待数)2/SD2
=(観測数-期待数)2/分散)
=(観測数-期待数)2/{Nπ(1-π)}
= (観測数-期待数)2 /{Nπ}
+(観測数-期待数)2 /{N(1-π)}
適合度のカイ2乗検定
期待数 観測数 差
劣性: 7324・0.25 =1831 1850
19
優性: 7324・(1-0.25)=5493 5474 -19
(観測数と期待数の差)2/期待数
劣性
優性
計
192 /1831=0.197
(-19)2/5493=0.066
0.262
メンデルの実験への疑問
1)7つの形質全てで3:1に近い(p=0.023)
2)追試ではメンデルほどきれいな結果は出てない
3)7つの形質は7つの染色体上に独立して存在
4)3:1を証明するには数が多すぎる.
メンデルは苦悩したに違いない.
もしメンデルが統計学を知っていたなら,より少な
いデータで,より強い確証が持てたに違いない.
物理化学実験と生物実験
物理化学実験
目的
法則の証明
実験の制御 容易
誤差
除去すべき
生物実験
技術評価
困難
除去不可
ex) PV=nRT
P:圧力 V:体積 T:温度
この関係を調べるときどのような実
験をすべきだろうか.
統計学のアプローチ
1)バラツキを確率分布で表す.
2)仮説の正しさを確率(p値)で評価する.
3)分布を近似する.
生物実験における統計学の役割
実験計画と結果の評価
実験→評価→実験→評価→・・・
1)実験計画:効率的な実験(Nを少なくする)
妥当な実験(目的に応じて)
2)結果の評価:考察のための材料
誤差の大きさの評価
検定:偶然を越えた結果
標準的,客観的評価
H11年都知事選挙
2
3
5
候補者名
鳩山 邦夫
羽柴 誠三秀吉
柿沢 こうじ
6
11
12
桝添要一
三上 満
明石 康
13
14
ドクター・中松
石原 慎太郎
得票数(票)
851,130
2,894
632,054
所属政党名
無所属
無所属
無所属
836,104
661,881
690,308
無所属
無所属
無所属
100,123
1,664,558
無所属
無所属
選挙速報
標本
M氏
70
8(11%)
140
16(11%)
700
80(11%)
7000 800(11%)
I氏
16(23%)
32(23%)
160(23%)
1600(23%)
p値
0.1516
0.0293
0.00001
<10-61
出口調査
0.00%の投票率で当選確実
投票所から出てくる人を数えてて、十人と
か十五人おきにアンケートに答えてもらう。
断られた場合は、調査員が自分で、年齢と
性別を判断して書き込んでおく。
一ヵ所100人~150人くらいサンプル取り,
調査個所は都内だと300程度,それを12時
と5時に調査員が集計して、近くのコンビニ
からファクスで送信。
東京都の投票する
全集団 約700万人
統計的推測
無作為抽出
標本
白い巨塔
財前五郎
40歳。国立浪速大学第
一外科教授。
食道外科を専門とし、と
くに食道癌の手術に関し
ては絶対の技術とそれ
に裏打ちされた自信を
持つ。
財前五郎死す
ステージⅠの肺癌と診断
肺がんの統計
・世界的に増加傾向
・2015年の,肺がんの1年間の新患者数は
男性11万人、女性3万7千人
・50歳以上に多く、男女比は約3:1
・1999年の肺がんによる年間死亡者数:5万2千人
(がん死亡:約29万人、うち胃がん約5万人)
・1993年から肺がんは男性のがん死亡率の第1位、女
性では胃がんに次いで第2位
・肺がんの5年生存率: 25~30%
財前五郎を救え
Ia期 がんが原発巣にとどまっており、大きさは3cm未満
Ib期 がんが原発巣にとどまっており、大きさは3cm以上
IIa期 原発巣のがんの大きさは3cm未満、がんが原発巣と
同じ側リンパ節に転移があるが、他の臓器には転移がない
IIb期 原発巣のがんの大きさは3cm以上であり、がんが原
発巣と同じ側の肺門のリンパ節に転移を認めますが、他の
臓器には転移を認めない
IIIa期 原発巣のがんが直接胸膜・胸壁に拡がっているが、
転移は原発巣と同じ側の肺門リンパ節まで、他の臓器には
転移を認めない
IIIb期 原発巣のがんが直接縦隔に拡がっていたり、胸膜へ
転移をしたり、胸水がたまっていたり、原発巣と反対側の縦
隔、首のつけ根のリンパ節に転移していますが、他の臓器
に転移を認めない。
IV期 原発巣の他に、肺の他の場所、脳、肝臓、骨、副腎な
どの臓器に転移(遠隔転移)がある場合
ステージと5年生存率
ステージ
IA
IB
ⅡA
ⅡB
ⅢA
ⅢB
Ⅳ
5年生存率
80%
70%
50%
40%
30%
15%
5%未満
対象研究
研究
登録期間
症例数
西日本肺癌手術の補助化学療法研究会
(西日本肺癌 2次)
1985.12 – 1989.7
201
西日本肺癌手術の補助化学療法研究会
(西日本肺癌 4次)
1991.3 – 1994.4
332
東北地区肺癌術後化学療法研究会(東北肺癌)
1992.3 – 1994.12
219
Osaka Lung Cancer Study Group (OLCSG)
1992.4 – 1994.3
172
肺癌手術補助化学療法研究会 (ACTLC)
1992.9 – 1995.8
100
日本肺癌術後補助化学療法研究会 (JLCRG)
1994.1 – 1997.3
979
計
2,003
Risk Ratios for 5-year Overall Survival (OS)
West Japan 2nd.
West Japan 4nd.
Northeast Japan
Osaka
ACTLC
JLCRG
Total
Test for Heterogeneity: c 25=2.63, p=0.76
,
: 95% Cl
0.77, 0.63- 0.94
0
1.0
2.0
ステージⅠの肺癌の治療
1)外科的切除
肺葉切除と肺門及び縦隔リンパ節郭清
2)放射線療法(外科手術が適切でない場合)
3)補助化学療法
手術で取り切れない,小さな癌細胞を抗癌
剤で抑える療法
ステージⅠの生存率
100
UFT
80
生
存
率
%
Control
60
40
20
UFT
Control
5生率
死亡数
81.8%
77.2%
176
221
7生率
76.5%
69.5%
p=0.011
0
0
1
2
死亡数
207
271
p=0.001
3
4
Years
5
6
7
開胸→ステージⅣと判明
癌は胸膜全体に広がっ
ており,切除不能
全身転移(脳転移)の
疑いあり.
体力を温存させるため
にすぐに閉胸
ステージⅣの肺癌の治療
1)抗がん剤による化学療法
2)放射線療法
3)痛みや他の苦痛に対する症状緩和を目的とした
緩和療法
通常、IV期では手術を行うことはなく、抗がん剤によ
る化学療法が選択されます。しかしながら、非小
細胞がんは抗がん剤が効きにくく、現状では抗が
ん剤のみでがんを治すことは不可能です。このた
め、治療成績向上を目指して、化学療法に関する
多くの臨床試験が進められています。
ステージⅣの生存率
イレッサ
従来の抗がん剤とは異なる新しいタイプの分子
標的治療剤の1つで、世界で最初に承認された
選択的なEGFR-TKI(上皮成長因子受容体チロ
シンキナーゼ阻害剤)。
イレッサは分子標的治療剤として非小細胞肺が
ん治療の選択肢を広げる薬剤であると期待され
ている. アストラゼネカは世界中で適応拡大の開
発をおこなっており、現在、頭頸部がん、大腸が
ん、乳がんを含むさまざまな固形がんの第2相
臨床試験を実施中。
イレッサ
2001.7.30
2002.1.25
2002.7. 5
2002.10.15
2002.12.25
米国FDAへ承認申請
日本厚生労働省へ承認申請
承認
アストロゼネカ社へ緊急安全性情報発出を指示
第1回ゲフィニチブ安全性問題検討会
間質性肺炎等358例中死亡例114
2003.5.2
同第2回検討会 616例中死亡例246
2004.3.23 症例数 1151例中死亡444
2004.12.17 アストロゼネカが延命効果試験結果を公表
2004.12.20 日本アストロゼネカ社が同結果を公表
2005.1.4
アストロゼネカ社欧州医薬品審査庁に対する
イレッサの承認申請を取り下げ
ISEL=IRESSA Survival
Evaluation in Lung cancer)
i イレッサ(250mg/日)+ベストサポーテイブケアー
vsプラセボ(偽薬)比較第Ⅲ相臨床試験
標準化学療法が効かなくなった非小細胞肺がん患
者への第2次または第3次治療.
ii 試験期間:2003.7.15~2004.8.2
iii 対象患者:1692例(1129例:イレッサ、563例プラセ
ボ)、210施設、28カ国(日本は除く)
iv 主要評価項目:生存
v 副次的評価項目:治療変更までの期間、奏効率、
QOL、EGFR発現、EGFR遺伝子の変異とその他バ
イオマーカー、安全性
ISEL試験結果のまとめ
i 全患者1692名対象の解析で、イレッサ服用患者
はプラセボ服用患者と比較して、腫瘍縮小効果
では統計的に有意な改善が見られたが、主要目
的である生存期間に関しては統計的に有意な延
命効果に至らなかった(5.6ヶ月と5.1ヶ月)。
ii 東洋人患者374名を対象とした解析ではイレッ
サ服用者9.5カ月に対しプラセボ服用者5.5ヶ月と
なり、生存期間の改善が示唆された。
iii 非喫煙者と喫煙者との比較では非喫煙者に有
意の効果が認められた。