その1 - 糖尿病・代謝疾患治療医学分野

知らないと損する
医学統計の初歩
その1 (ver. 1)
徳島大学大学院 医歯薬学研究部
糖尿病・代謝疾患治療医学分野(寄附講座)
粟飯原賢一
なぜディオバン®問題が起きたの
か?
・某バルサルタン研究関係者:きっとディオバン®は心臓に
いいに違いない!!(個人的には私もそう思います)良いデー
タを出すと某メーカーから研究費がもらえる。でも医者のお
勉強はいっぱいやってきたけど、統計ってなんだかよく分か
んない!!
・某バルサルタン研究関係者:おおっ。都合の良いことに統
計のプロがいるらしい。あとはよろしくねっ!!。
→ さほど悪意はなかったが、この丸投げが、悲劇の始まり
(あくまでも個人の予想でフィクションです)。
なぜディオバン®問題が起きたの
か?
・研究責任者のA医科大学のB客員教授は英医学誌ランセット
に発表した論文の撤回を表明。調査委員長のC医学科長は記者
会見で「多くの方々に多大な心配を掛けた」と謝罪するとと
もに、データ解析を担当したD社の元社員が操作に関与した可
能性を指摘した。
・C医学科長は、B氏や多くの医師が「自分たちにはデー
タ解析の知識も能力もない」と話したことなどから、統
計解析とデータ操作をしたのはD社元社員との見方を示した。
・統計学の知識やノウハウが、例えプロ級でなかったとして
も、研究者自身に多少の心得があれば、おそらくこの事件は
起きなかったはずです。
医学統計は必要に迫られて初めて身につく!!
・某地方大学内分泌代謝内科医の場合。
・当時の主任教授に大学院生として、学位のテーマを頂く。
何だかよく分からないがノックアウトマウスというものを
作らんといかんらしい。
・テーマの完遂ためのゴールの所在は、どうやら銀河系の
彼方。(様々な悲劇に見舞われ、結局論文発表まで9年の
歳月を要することに・・・)
・9年間も大学院生やっとる場合ではない!!早く学位取
るために、並行して何か臨床研究をやらねば・・・。一応
ネタはありそう。データ並べてみたら、なんかでそうだ。
でもどうやって解析したらいいんだろう?
・だれか医学統計知ってる?
えっ。誰も知らんの??
統計解析において心がけておくべきこと
・統計はマジックとよく言われます。同じデータでも解析方法を変
えたり、意図的に外れ値の扱いを変えると本来、有意差がなかった
はずのものであっても、有意差が出たりします。
・一方、統計学的に有意であっても、臨床医学的に有意かどうかは、
別問題です。例えば、降圧薬Aを用いた患者群の平均収縮期血圧が
130mmHgで降圧薬Bを用いた患者群の平収縮期均血圧が128mmHg
であった場合、群間比較の結果として、有意差があったとしても、
臨床的意義はあるでしょうか?
・患者群が10人ずつのグループなら、大きな意味はないかも知れま
せんが、100万人ずつのグループなら疫学的には意味がないとは言
い切れません。なぜなら収縮期血圧1mmHgの低下で日本国内では
年間5000人の死者が減ると言われているからです。
一流ジャーナルは統計解析にうるさい
・最近の論文のデータ不正が非常に大きな問題となっている状況で
は、統計解析に関して、厳しい目で見られる傾向があります。特に
“一流”と呼ばれる科学ジャーナルにおいては、非常に細かいところ
まで、要求されます。以下に我々が最近掲載した論文の統計解析の
記述例です。最終的に論文受諾まで5つの解析方法が必要でした。
Values for each parameter within a group are expressed as dot plots with
mean bars. For comparisons of quantitative data among groups, statistical
significance was assessed by the Kruskal-Wallis test. The Bonferronicorrected Mann-Whitney U test or the Dunn test was used for multiple
comparisons. For comparison of time-dependent changes among groups,
statistical significance was assessed by linear mixed-effects regression
analysis. Limb survival rate was assessed by the log-rank test.
統計解析を行う前に
1. 統計解析によって何を知りたいのか?
1. 用いるデータはどの様なものか?
例えば
1. 薬Aと薬Bの投与によって、どちらがHbA1cをより低下さ
せるか調べたい。
2. 抗がん剤Cは、対照薬より生存期間が延長できるかどうか
調べたい。
3. 入学試験順位と卒業試験順位に関係があるかどうか調べた
い。
4. 喫煙量と肺癌発症率の関係を調べたい。
5. 呼気中のアルコール濃度から血中のアルコール濃度を推定
したい。
例えば
1. 薬Aの投与によって、血糖値が変動するかどうか調べたい。
2. 抗がん剤Cは、対照薬より生存期間が延長できるかどうか
調べたい。
データ間の比較
(Comparison)
例えば
データ間の相関性
(Correlation)
3. 入学試験順位と卒業試験順位に関係があるかどうか調べた
い。
4. 喫煙量と肺癌発症率の関係を調べたい。
例えば
回帰(推定式)
(Regression)
5. 呼気中のアルコール濃度から血中のアルコール濃度を推
定したい。
変数について
主に観察で得られるデータ値の事で以下の2種があります。
⚫️ 従属変数 (dependent variables)
観察値や測定値で、何らかの要因により変化するもの。
グラフ上はY軸に相当する。
⚫️️ 独立変数 (independent variables)
性別、身長、体重、喫煙歴、薬物投与の有無などの要因。
グラフ上はX軸に相当する。
例えば
従属変数と独立変数は各々何か?
(1) 甘党と辛党の糖尿病発症率
従属変数:糖尿病発症率、独立変数:甘党or辛党
(2) 身長や体重と心筋梗塞の発症頻度の関係
従属変数:心筋梗塞発症頻度、独立変数:身長、体重
(1) 降圧薬の降圧効果と患者背景
従属変数:降圧度、独立変数:年齢、性別、喫煙歴 etc
変数のタイプ
⚫️ 名義変数 (nominal)
性別、治療の有無、喫煙の有無、生活習慣病の有無など
⚫️ 間隔変数 (interval)
身長、体重、血糖値、コレステロール値、血圧値など、
数値が等間隔なもの
⚫️ 順序変数 (ordinal)
ビジュアルアナログスケール( VAS:1, 2, 3, 4, 5)や成
績の優・良・可など、順序あるカテゴリーからなる。
例えば
(1) 収縮期血圧
(間隔変数)
(2) 痛みのビジュアルアナログスケール
(順序変数)
(3) 1日の喫煙本数(間隔変数)
(4) 1日の喫煙量(0本、半箱未満、半箱から1箱、
1箱以上)(順序変数)
(5) 性別(名義変数)
帰無仮説とp値
帰無仮説は、「ある仮説」が正しいかどうかの判断のた
めに立てられる仮説。ほとんどの場合は否定されること
を期待して立てられます。群間の測定値に差がない、あ
るいは、薬物などの効果がないといった否定的な事象の
仮説をいいます。
p (probability) 値とは、ある事象が、まったく偶然におこ
る確率の事を示します。例えば先ほどの帰無仮説が、
p<0.05と示されたら、95%以上の確率で、帰無仮説は棄
却されることになります。評価した事象の差異や効果は
「偶然ではない」、つまり確からしいという事を意味し
ているわけです。
データの正規性
テストの成績は通常、平均点の近くの人数が一番多く、0点
や100点に近づくほど人数が少なくなり、得点の分布は左右
対称の釣鐘型になることが多くなります。このような分布の
型を「正規分布」と言います。正規分布のグラフは中央が一
番高く、この中央の一番高い位置が、平均値となります。
正規分布に従うか否か
⚫️ 正規分布するデータ
(パラメトリック)
身長、体重、 BMI、腹囲、収縮期血圧、握力、WBC、
総コレステロール値、など
⚫️ 正規分布しないデータ
(ノンパラメトリック)
CRP、トリグリセライド、尿中アルブミン、Lp(a)な
ど
分散と標準偏差
⚫️ 分散(Variance)とは、データのばらつきを表す値
のことです。個々のデータと平均値の差を求め、値をそ
れぞれ2乗し、それらを合計したものをデータの個数で
割ることによって求められます。
⚫️ 分散はそれだけでは特に情報がなく、他の集団と比
較して初めてその数値がどうなのかがわかるものです。
⚫️ この分散で求められた数値の平方根が、いわゆる標
準偏差となります。データや確率変数の散らばり具合
(ばらつき)を表す数値としては、分散そのものより、
標準偏差で判断することの方が、多いです。
分散と標準偏差
標準偏差と標準誤差
⚫️ 標準偏差(Standard Deviation: SD)とは、正規分布
しているサンプルのばらつきの指標です。
⚫️ 標準誤差(Standard Error: SE)は正規分布している
サンプルの平均値の精度を示す指標です。SDをサンプル
数の平方根で除して求めます。サンプル数が多いほど小
さくなるので、SEが小さい結果ほどその平均値の信頼度
が高まることになります。
⚫️例えば、20歳の日本人男性の平均身長と SDを表記し
た場合、理論上は100人だろうが、10000人だろうがSD
はあまり変わりませんが、SEは10000人の方が100人の
10分の1にまで圧縮されます。
SDとSEどちらを表記すべきか?
⚫️ 正規分布したサンプルの平均がXとするとその集団は
X±2SDの範囲にデータが入る確率が95%となります。
データのバラつきを示したい、あるいは比べたい時はSD
を使うべきです。
⚫️ 一方で、SEは平均値の区間推定量とも表現できます。
X±2SEの範囲に平均値がある確率が95%となります。
よって平均値の推定をしたい、あるいは比べたいという
時は SEを示せば良いことになります。多くの場合、実
験によって知りたいのは平均値であるので、多くの論文
でSEが示されています(エラーバーが小さくなり、グラ
フの見栄えが良いという理由も大きいですが・・・)。