統計学を成立させるキーポイント

研究における統計学とは?
-質問票調査を例に-
講師 後藤恭一
(航空環境研究センター)
統計学を成立させるキーポイント
今、ドキドキ(揺らぎ)してる?!
変数(variable)とは、変化する値のこと!
・・・でも、ドキドキ感は“平均”では表せない
揺らぎ
なぜ平均を中心に考えるの!?
平均値とは何か?
人ぞれぞれ感情の起伏は違うよね・・・
でも、人それぞれどこかを中心に感情が揺らいでるよね。
では、2人を比べるために、それぞれの感情の中心を重ね合わせてみよう・・・
人の感情には起伏がある・・・でも、どこかを中心として感情は揺らいでいる。
では、その感情の中心からその時の状態がどれくらい隔てているか(差)を考えよう
一方、感情が穏やかな人もいれば、比較的起伏が大きい人もいる。
では、それぞれの揺らぎの幅の中で、差が大きいのか小さいのかを考えてみよう
ゆらぎ
ドキドキ(揺らぎ)の平均
ー標準偏差(S.D)ー
N
 ( Xi  X
i 1
2
)
N
2
標準偏差 =分散
・・・だから
看護(医療)では
基本知識
s
2
データの種類
0m
-10℃
10m
0℃
20m
10℃
30m
高
20℃
情
報
力
1位
2位3位
4位
低
AB型
A型
B型
O型
統計手法
統計と研究の違い
今、ドキドキしてる?!
現象にシンクロした要因を探し出すのが(量的)研究なんだ!
ー因果の追求ー
dはA君に会った時、eはB君に会った時・・・
A君に会うのとドキドキがよりシンクロしてる!?
ドキドキ(反応)と要因の結び付けが研究
シンクロの例で表すと
EBNとは
統計手法の分類
相関性とは?
相関係数の要
相関とは何か?
2つの変数間の直線的な関連性
直線的な関係の『見える化』が散布図
第三の変数の重要性
解析手法のビジュアル的学び方
加齢と血圧の関係
200
180
SBP
160
r=0.454***
140
120
100
80
10
20
30
40
50
AGE
60
70
80
90
相関から(重)回帰式(モデル)へ
子は親に似る?
親の身長と子の身長に相関があるのであれば、親の身長か
ら子の身長が予測できるのでは?
180
170
160
150
身長
M身長
身長
140
140
F身長
150
160
170
180
190
相関係数 correlation coefficient
共分散 Cov(x,y) を 標準化する
(x
rxy 
i
(x i  x)
 x)(y i  y)
2
n *
n
(x i  x) 2

n
(x
i
 x)(y i  y)
(x i  x) 2 (x i  x) 2
値の範囲は、 −1〜1 となる

Sxy
Sxx Syy
共分散 covariance
共分散 covariance
全員について、偏差の積を平均したものが共分散
Cov(x, y)  Sxy
(x


i
 x)( y i  y)
n
相関と回帰
目的変数y
説明変数 x
目的変数y
説明変数 x
子の身長
父の身長
子の身長
父の身長
誤差e
1) 相関
2) 回帰
回帰分析とは
目的変数y
説明変数 x
目的変数y
説明変数 x
子の身長
父の身長
子の身長
母の身長
誤差e
誤差e
なお、誤差eとは、説明変数以外の要因と考えることもできま
す
相関≠因果関係
これが回帰
の影響を
のが
重回帰分析とは
説明変数 x1
父の身長
目的変数y
説明変数 x
目的変数y
子の身長
父の身長
子の身長
誤差e
誤差e
なお、誤差eとは、説明変数以外の要因と考えることもできま
す
説明変数 x2
母の身長
説明変数 xn
回帰モデルと回帰式
(2つ以上の変数での予測)
回帰と重回帰(疾病の発生要因を例に)
化学的
要因
物理的
要因
文化的
要因
社会環
境要因
生物学
的要因
自然要
因
宿主
時間要
因
回帰:反応に影響する要因の影響力(説明率)を検討
重回帰:反応に影響する要因の相対的影響力を検討
よいデータを集める
標本が集団の代表であるか
抽出(sampling)
推定(estimation)
母集団(population)
標本(sample)
偶然誤差と系統誤差
系統誤差=真の値とのズレ
真の値
バイアス:
1. 真の値からのズレ(情報バイアス)
2. 集団の偏り(選択バイアス)
3. (交絡)
偶然誤差=ばらつき(値のブレ)
観測された結果