研究における統計学とは? -質問票調査を例に- 講師 後藤恭一 (航空環境研究センター) 統計学を成立させるキーポイント 今、ドキドキ(揺らぎ)してる?! 変数(variable)とは、変化する値のこと! ・・・でも、ドキドキ感は“平均”では表せない 揺らぎ なぜ平均を中心に考えるの!? 平均値とは何か? 人ぞれぞれ感情の起伏は違うよね・・・ でも、人それぞれどこかを中心に感情が揺らいでるよね。 では、2人を比べるために、それぞれの感情の中心を重ね合わせてみよう・・・ 人の感情には起伏がある・・・でも、どこかを中心として感情は揺らいでいる。 では、その感情の中心からその時の状態がどれくらい隔てているか(差)を考えよう 一方、感情が穏やかな人もいれば、比較的起伏が大きい人もいる。 では、それぞれの揺らぎの幅の中で、差が大きいのか小さいのかを考えてみよう ゆらぎ ドキドキ(揺らぎ)の平均 ー標準偏差(S.D)ー N ( Xi X i 1 2 ) N 2 標準偏差 =分散 ・・・だから 看護(医療)では 基本知識 s 2 データの種類 0m -10℃ 10m 0℃ 20m 10℃ 30m 高 20℃ 情 報 力 1位 2位3位 4位 低 AB型 A型 B型 O型 統計手法 統計と研究の違い 今、ドキドキしてる?! 現象にシンクロした要因を探し出すのが(量的)研究なんだ! ー因果の追求ー dはA君に会った時、eはB君に会った時・・・ A君に会うのとドキドキがよりシンクロしてる!? ドキドキ(反応)と要因の結び付けが研究 シンクロの例で表すと EBNとは 統計手法の分類 相関性とは? 相関係数の要 相関とは何か? 2つの変数間の直線的な関連性 直線的な関係の『見える化』が散布図 第三の変数の重要性 解析手法のビジュアル的学び方 加齢と血圧の関係 200 180 SBP 160 r=0.454*** 140 120 100 80 10 20 30 40 50 AGE 60 70 80 90 相関から(重)回帰式(モデル)へ 子は親に似る? 親の身長と子の身長に相関があるのであれば、親の身長か ら子の身長が予測できるのでは? 180 170 160 150 身長 M身長 身長 140 140 F身長 150 160 170 180 190 相関係数 correlation coefficient 共分散 Cov(x,y) を 標準化する (x rxy i (x i x) x)(y i y) 2 n * n (x i x) 2 n (x i x)(y i y) (x i x) 2 (x i x) 2 値の範囲は、 −1〜1 となる Sxy Sxx Syy 共分散 covariance 共分散 covariance 全員について、偏差の積を平均したものが共分散 Cov(x, y) Sxy (x i x)( y i y) n 相関と回帰 目的変数y 説明変数 x 目的変数y 説明変数 x 子の身長 父の身長 子の身長 父の身長 誤差e 1) 相関 2) 回帰 回帰分析とは 目的変数y 説明変数 x 目的変数y 説明変数 x 子の身長 父の身長 子の身長 母の身長 誤差e 誤差e なお、誤差eとは、説明変数以外の要因と考えることもできま す 相関≠因果関係 これが回帰 の影響を のが 重回帰分析とは 説明変数 x1 父の身長 目的変数y 説明変数 x 目的変数y 子の身長 父の身長 子の身長 誤差e 誤差e なお、誤差eとは、説明変数以外の要因と考えることもできま す 説明変数 x2 母の身長 説明変数 xn 回帰モデルと回帰式 (2つ以上の変数での予測) 回帰と重回帰(疾病の発生要因を例に) 化学的 要因 物理的 要因 文化的 要因 社会環 境要因 生物学 的要因 自然要 因 宿主 時間要 因 回帰:反応に影響する要因の影響力(説明率)を検討 重回帰:反応に影響する要因の相対的影響力を検討 よいデータを集める 標本が集団の代表であるか 抽出(sampling) 推定(estimation) 母集団(population) 標本(sample) 偶然誤差と系統誤差 系統誤差=真の値とのズレ 真の値 バイアス: 1. 真の値からのズレ(情報バイアス) 2. 集団の偏り(選択バイアス) 3. (交絡) 偶然誤差=ばらつき(値のブレ) 観測された結果
© Copyright 2024 ExpyDoc