回帰直線と回帰係数 xの値を与えたときのyの条件付き平均 中 2 同じxに固定した時のyの値をさらに集 めた場合どうなるか? → 分布ができる。 分布には平均値がある。 22 20 18 16 14 12 10 8 6 4 2 0 ŷ = a + bx bは変数xの1単位の差異に対応するyの予測値の差異の大き さ(つまり、xの値の差異に対応してyの値がどの程度変化する か)を表し、回帰係数(regression coefficient)と呼ぶ 「適合の悪さ」の指標 N 2 4 6 8 Q = ∑ ( yi − yˆ i ) 2 10 12 14 16 18 20 22 小6 図3(b) 男子の2つの時点における逸脱 各xの値で固定した時の、それに対応するyの 行動得点の関係を表す散布図 条件付き平均値を直線で表せると仮定する。 N 2 = ∑ [ yi − ( a + bxi ) ] この式で表される直線を、変数xから変数yを予測 する時の回帰直線(regression line) と呼ぶ i =1 128 18 14 10 8 6 男子 4 女子 2 0 0 5 10 15 20 小6 = y + b( x − x ) データに回帰直線を当てはめ、そこから得られる予測値や残差をもとにデータを解 釈していく手法を、一般に回帰分析 (regression analysis) と呼ぶ。 130 実験研究と調査研究とで異なる名称を用 いることは、変数間の因果関係の推論に おける調査研究の限界を認識する上で有 用との指摘もあるが、一方の変数から他 方の変数を予測・説明するという統計的問 題に関しては、データの由来は直接には 関係してこない。そこで、本講義では、名 称の違いとその有用性について留意しつ つも、独立変数と従属変数という名称で統 一して使用する。 2 (従属変数) なお、y^式は次のように書き換える ことができる yˆ = ( y − bx ) + bx 2 4 6 8 10 12 14 16 18 20 22 12 2 中 a = y − bx 16 中 sx 0 指標 Q は回帰直線の切片 a 及び傾きbによって変化する。 小6 129 回帰係数b及び切片aの値は、回帰直線が実際のデータに最もよく適合するように計算する。Q が最小になるようにaとbの値を決定する方法を最小2乗法 (least squares method) と呼ぶ。 回帰分析において、変数xから変数yを予測するという場合、予測に用いられるほうの 変数xを独立変数(independent variable) と呼び、予測されるほうの変数 y を従属 変数 (dependent variable) と呼ぶ。これらの名称は、もともと実験研究に由来する。 「反社会的行動の発達的変化の性差」 の研究のように、実験的操作を行わない調査 研究では、予測に用いられる変数を予測変数 (または説明変数) と呼び、予測される ほうの変数を目的変数 (または基準変数)と呼ぶことがある。 20 b=r ŷ = a + bx 独立変数と従属変数 最小2乗法による 回帰直線の当てはめ sy 2 i =1 yˆ (ワイハット)はyの予測値(predicted value) ŷ = a + bx 中 0 残差ei 22 20 18 16 14 12 10 8 6 4 2 0 22 20 18 16 14 12 10 8 6 4 2 0 xからyを予測する場合 0 2 4 6 8 10 12 14 16 18 20 22 小6(独立変数) 131
© Copyright 2024 ExpyDoc