null

回帰直線と回帰係数
xの値を与えたときのyの条件付き平均
中
2
同じxに固定した時のyの値をさらに集
めた場合どうなるか?
→ 分布ができる。
分布には平均値がある。
22
20
18
16
14
12
10
8
6
4
2
0
ŷ = a + bx
bは変数xの1単位の差異に対応するyの予測値の差異の大き
さ(つまり、xの値の差異に対応してyの値がどの程度変化する
か)を表し、回帰係数(regression coefficient)と呼ぶ
「適合の悪さ」の指標
N
2
4
6
8
Q = ∑ ( yi − yˆ i ) 2
10 12 14 16 18 20 22
小6
図3(b)
男子の2つの時点における逸脱
各xの値で固定した時の、それに対応するyの
行動得点の関係を表す散布図
条件付き平均値を直線で表せると仮定する。
N
2
= ∑ [ yi − ( a + bxi ) ]
この式で表される直線を、変数xから変数yを予測
する時の回帰直線(regression line) と呼ぶ
i =1
128
18
14
10
8
6
男子
4
女子
2
0
0
5
10
15
20
小6
= y + b( x − x )
データに回帰直線を当てはめ、そこから得られる予測値や残差をもとにデータを解
釈していく手法を、一般に回帰分析 (regression analysis) と呼ぶ。
130
実験研究と調査研究とで異なる名称を用
いることは、変数間の因果関係の推論に
おける調査研究の限界を認識する上で有
用との指摘もあるが、一方の変数から他
方の変数を予測・説明するという統計的問
題に関しては、データの由来は直接には
関係してこない。そこで、本講義では、名
称の違いとその有用性について留意しつ
つも、独立変数と従属変数という名称で統
一して使用する。
2
(従属変数)
なお、y^式は次のように書き換える
ことができる
yˆ = ( y − bx ) + bx
2
4
6
8
10 12 14 16 18 20 22
12
2
中
a = y − bx
16
中
sx
0
指標 Q は回帰直線の切片 a 及び傾きbによって変化する。
小6
129
回帰係数b及び切片aの値は、回帰直線が実際のデータに最もよく適合するように計算する。Q
が最小になるようにaとbの値を決定する方法を最小2乗法 (least squares method) と呼ぶ。
回帰分析において、変数xから変数yを予測するという場合、予測に用いられるほうの
変数xを独立変数(independent variable) と呼び、予測されるほうの変数 y を従属
変数 (dependent variable) と呼ぶ。これらの名称は、もともと実験研究に由来する。
「反社会的行動の発達的変化の性差」 の研究のように、実験的操作を行わない調査
研究では、予測に用いられる変数を予測変数 (または説明変数) と呼び、予測される
ほうの変数を目的変数 (または基準変数)と呼ぶことがある。
20
b=r
ŷ = a + bx
独立変数と従属変数
最小2乗法による
回帰直線の当てはめ
sy
2
i =1
yˆ (ワイハット)はyの予測値(predicted value)
ŷ = a + bx
中
0
残差ei
22
20
18
16
14
12
10
8
6
4
2
0
22
20
18
16
14
12
10
8
6
4
2
0
xからyを予測する場合
0
2
4
6
8
10 12 14 16 18 20 22
小6(独立変数)
131