関係の把握の方法 (2) 散布図 ② 散布図と関係の形

1.最小2乗法と相関係数
13章 回帰分析
(1) 回帰分析の目的と関係の把握
1.最小2乗法と相関係数
(1) 回帰分析の目的と関係の把握
(2) 散布図
(3) 共分散と相関係数
(4) 最小2乗法と回帰直線の計算
(5) 回帰直線の性質,推定値と残差
|
3章~6章:1変量の分析
z
z
‡
x1 , x 2 ,L , x n
データ:
分析:度数分布,平均,分散(標準偏差),歪度,
尖度,基準化統計量
13章: 関係の分析(回帰分析,相関分析)
–例
•景気と株価
•女性の社会進出と出生率の低下
•気温とビールの売上 etc.
2.回帰モデルと決定係数
(1) 回帰モデル
(2) 決定係数
3.重回帰モデル
– データ: x 1 , x 2 , L , x n と y 1 , y 2 , L , y n
または、( x1 , y1 ), ( x 2 , y 2 ), L , ( x n , y n )
x 1 = 45 . 7 , y 1 = 1 . 91 , L
例:少子化の分析
( x 1 , y 1 ) = ( 45 . 7 , 1 . 91 ) L
関係の把握の方法
女性の労 合計特殊
女性の労 合計特殊
年
働力率x i 出生率 y i
働力率 x i 出生率 y i
1975
45.7
1.91
1992
50.7
1.50
1976
45.8
1.85
1993
50.3
1.46
1977
46.6
1.80
1994
50.2
1.50
1978
47.4
1.79
1995
50.0
1.42
1979
47.6
1.77
1996
50.0
1.43
1980
47.6
1.75
1997
50.4
1.39
1981
47.7
1.74
1998
50.1
1.38
1982
48.0
1.77
1999
49.6
1.34
1983
49.0
1.80
2000
49.3
1.36
1984
48.9
1.81
2001
49.2
1.33
1985
48.7
1.76
2002
48.5
1.32
1986
48.6
1.72
2003
48.3
1.29
1987
48.6
1.69
2004
48.3
1.29
1988
48.9
1.66
2005
48.4
1.26
1989
49.5
1.57
2006
48.5
1.32
1990
50.1
1.54
1991
50.7
1.53
出 所 : 総 務 省 統 計 局 「労 働 力 調 査 」,
国 立 社 会 保 障 ・人 口 問 題 研 究 所「人 口 統 計 資 料 集 」
年
|
|
グラフ(散布図)により大まかな関係をつかむ
関係を数量的に把握する
1. 関係の強さ
– 相関係数,決定係数
2. 関係の形
– 回帰直線(回帰式)
3. 関係の有無(第14章,省略)
– 検定
(2) 散布図
② 散布図と関係の形
例
① 散布図の描き方
| 横軸: x (原因)
| 縦軸: y(結果)
i
出席回数と得点の散布図
得点(点)
教科書 208-215ページ
yi 100
出席回数 得点
yi
xi
1
6
35
2
8
55
3
10
65
4
14
75
5
14
95
80
各組のデータを,目
盛にあわせて,点を
打っていく(プロット
する)
60
40
20
正の相関:
xが増えるとyも増える
負の相関:
xが増えるとyは減る
無相関:
xとyに関係がな
い
0
0
2
4
6
8
10
12
14
16
出席回数(回)
xi
1
③ 散布図と関係の強さ
練習:エンゲル係数の例(p.213表13-1)
|
エンゲル係数
|
エンゲルの法則
z
z
z
弱い正の相関
強い正の相関
関係が強い:xが決まると,yもほぼ決まる
関係の強さ
z 点が近くに集まっているかどうか
z 散布上の点が1本の直線の周りに集中しているかどうか
|
|
交通事故件数
(1000人当り,件)
生活費に占める食費の割合
エンゲル関数(%)
散布図
所得が高いほど,エンゲル係数
は低下
所得が低いほど,エンゲル係数
は上昇
Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ
≈
x (可処分所得:万円) 28 38 46 54 71
y (エンゲル係数:%) 28 26 25 23 20
可処分所得(万円)
交通事故件数と自動車保有台数の散布図(表13-6)
90
正の相関?無相関?
弱い正の相関?
80
70
(3) 共分散と相関係数
60
50
40
判断はあいまいになりや
すい(主観的)
30
20
|
10
散布図
z
0
0
100
200
300
400
500
自動車保有台数(1000人当り,台)
合計特殊出生率
女性の労働力率と合計特殊出生率
の散布図(1975-2006)
|
2.20
関係の強さを数量的に表す必要もある
出席と得点の関係の強さが科目で違うか
エンゲルの法則は,年が異なっても成り立って
いるか
・・・
→相関係数によって,関係の強さを数量的に把握
する
z
2.00
z
1.80
1.60
相関のパターンが期間
によって異なっている
関係の形,強さに関する大ざっぱな情報を与え
る(散布図を描くことは非常に重要)
1.40
1.20
1.00
45
46
47
48
49
50
51
女性の労働力率(%)
② 散布図上の点と偏差の符号
① 散布図上の点と相関
y
xi − x
yi − y
( xi − x )( yi − y)
Ⅰ
+
+
+
Ⅱ
-
+
-
Ⅲ
-
-
+
Ⅳ
+
-
-
yi − y > 0 ← yi > y
Ⅱ
↑
Ⅰ
yの平均 y
Ⅲ
Ⅳ
0
x
xの平均
xi − x < 0 ← x → xi − x > 0
相関が強ければ,狭い範
囲(直線の近く)に点が集
中する
↓
yi − y < 0 ← yi < y
•正の相関
|
•負の相関
正の相関が強い
z
–ⅠとⅢに点が集中
|
負の相関が強い
z
–ⅡとⅣに点が集中
|
ⅠとⅢに点が多い
ⅡとⅣに点が多い
無相関に近い
z
Ⅰ~Ⅳに点が散らばる
n
∑ ( x − x )( y
i
i
− y ) が+で大きくなる
i =1
n
∑ ( x − x )( y
i
i =1
n
∑ (x
i =1
i
i
− y ) が − で大きくなる
− x )( yi − y ) が0に近い
2
③ 共分散
④ 共分散の解釈
xの平均からの偏差とyの平均か
らの偏差をかけたものの合計
|
n
∑ ( x − x )( y − y)
|
i
i
共分散の大きさと相関
共分散がプラスで大きい→正の相関が強い
共分散がマイナスで大きい(数としては小さい)
→負の相関が強い
z 共分散が0に近い→無相関
z
が関係の強さを測る尺度になる
z
i =1
|
データ数の影響を除くためにデータ数で除す(分散と同
様)=共分散 s xy
s xy
cf . s x2 =
1
n
1
=
n
n
∑ (x
i =1
i
|
n
∑ ( x − x )( y − y )
i
共分散の問題点
z
ex. 例で得点を10点満点にすると,共分散は1/10になる
i =1
− x )2 =
1
n
データの測定単位に依存する
i
共分散の絶対的な大きさで,相関の強さを判断できない
z 共分散の解釈は困難→何らかの基準化が必要
→相関係数
z
n
∑ (x
i =1
i
− x )( x i − x )
共分散・相関係数の計算例
⑤ 相関係数の定義と計算
出席回数 得点
xi − x
( xi − x )
1
6
35
-4.4
19.36
-30
900
132
2
8
55
-2.4
5.76
-10
100
24
3
10
65
-0.4
0.16
0
0
0
4
14
75
3.6
12.96
10
100
36
5
14
95
3.6
12.96
30
900
108
合計
52
325
0
51.2
0
2000
300
平均
10.4
65
400
60
yi
xi
i
標準偏差
2
yi − y
10.24
3.2 標準偏差
( yi − y )
rxy =
s xy
sx s y
=
( x i − x )( y i − y )
20
相関係数
1 n
300
s xy = ∑ ( xi − x )( yi − y ) =
= 60
n i =1
5
2
0.9375
共分散
|
相関係数rxy=共分散をxとyの標準偏差の積で除す
rxy =
s xy
sx s y
s x2 =
相関係数は-1から+1までの間の値をとる
(p.212)
−1 ≤ rxy ≤ 1
⑥ 相関係数の解釈
相関係数
rxyが
• 1に近い(大きい)
→正の相関が強い ex. rxy=0.95
• -1に近い(負で絶対値が大きい)
→負の相関が強い ex. rxy=-0.95
• 0に近い
→無相関 ex. rxy=0.05
相関係数が(絶対値で)大きいほど,相関が強い
1 n
∑ ( xi − x ) 2 , sx = sx2
n i =1
• そうすることによって,
60
= 0.9375
3.2 × 20
| 相関係数の符号=共分散の符号
→プラスなら正の相関,マイナスなら負の相関
1 n
∑ ( xi − x )( yi − y ) : 共分散
n i =1
s x : xの標準偏差、 s y : yの標準偏差
s xy =
関係の把握方法
1. 関係の強さ
z
z
相関係数の大きさ (ややあいまい)
決定係数
2. 関係の形
z
z
定性的:相関係数の符号(正の相関,負の相関)
定量的:回帰式(回帰直線)
•
xが増えると,yがどれだけ増えるか
3. 関係の有無
z
検定(14章)
3
(4) 最小2乗法と回帰直線の計算
① 回帰直線の定式化
|
xとyの関係を数量的に把握する
→ 散布図のxとy の間に数式を仮定する
|
散布図に直線をあてはめる(xとyの関係を直線
y
で把握する)
(x , y )
最も簡単な式として,直線の式で表す
y
=回帰直線
|
直線の式
|
i
y = a + bx
i
yˆ i (yハットと
yi
読む)
x
xi
• あてはめる直線
→各点のできるだけ近くを通る直線(回帰直線)
yˆ i = a + bxi
x
0
② 残差
すべての点を通る直線は,
一般に引くことはできない
③ 最小2乗法
y
| 各点(データ): ( xi , yi )
ˆi )
| 直線上の点: ( xi , y
yi − yˆ i
回帰直線のひき方
|
z
すべての点のできるだけ近くを通る直線(残差
n
ができるだけ小さくなるように)
z
残差の合計が小さくなるように決める
yˆ i
yi
xi
x
z
n
∑
i =1
いくらでも小さくできる(散布図の上の方に直線をひけば
よい)ので不可
出席回数 得点
xi − x
( xi − x )2
yi − y
( yi − y ) 2
( x i − x )( y i − y )
1
6
n
35
-4.4
19.36
-30
900
− yˆ i ) 2 =
i =1
∑ (y
i
− a − bx i ) 2
132
2
8
55
-2.4
5.76
-10
100
i =1
24
3
10
65
-0.4
0.16
0
0
0
4
14
75
3.6
12.96
10
100
36
→最小にするa,bを求める
最終的には,次のような公式が得られる
(pp.215,234)
n
b=
∑
( xi − x )( yi − y )
a = y − bx
i =1
n
∑ (x − x)
i
i =1
2
a,b:最小2乗推定値
yi
xi
i
i
となるように直線(すな
わちa,b)を決める
=最小2乗法
( y i − yˆ i ) 2 → 最小
回帰直線の計算例:得点と出席例題
④ 最小2乗推定値の公式
∑ (y
− yˆ i )
→残差の2乗の合計ができるだけ小さくなるようにする
–残差>0 → 点が直線の上
–残差<0 → 点が直線の下
–残差=0 → 点が直線上にある
S =
i
i =1
•各点と直線のずれ(距離)=残差 yi − yˆ i
n
∑ (y
5
14
95
3.6
12.96
30
900
108
合計
52
325
0
51.2
0
2000
300
平均
10.4
65
標準偏差
10.24
3.2 標準偏差
400
相関係数
n
b=
∑ ( x − x )( y − y )
i
i =1
i
n
∑ (x − x)
i =1
2
=
300
= 5.859375
51.2
i
回帰式(回帰直線)
60
20
0.9375
a = y − bx
= 65 − 5.859375 ×10.4
= 4.0625
yˆ i = 4.0625 + 5.859375 xi
4
⑤ 回帰係数(a,b)の意味
(3) 回帰直線の性質,推定値と残差
ex. yˆ i = 4.0625 + 5.859375 xi
|
x=0のときのyの値
例)出席が0回に対する得点
z
|
① 回帰直線は,xとyの平均 ( x , y ) を通る
a:切片
a = y − bx より y = a + bx
yˆ i = a + bxi
b:傾き(x係数)
y
xが1単位増えたとき,yが何単位増えるか
例)出席が1回増えると,得点が何点あがるか
注:単位とは,測定単位のこと(円,点,億円・・・)
cf. 限界消費性向
z bはxのyに対する影響の度合いを表す
→bが大きいほど,xの影響が強い
例)他の科目との比較
( x, y)
z
推定値 yˆ ・残差 e の計算例
1
|
推定値 yˆ i の計算
z
回帰式
の x に各値を代入し,計算する
z
これを直線のグラフにすれば,回帰直線が描ける
残差 ei の計算 ei = yi − yˆ i
yi
xi
i
yˆ i = a + bxi
x
x
② 推定値と残差
|
yˆ i = a + bxi
y
6
( xi − x )( y i − y )
yˆ i
132
39.21875
35
2
8
55
3
10
65
4
14
75
・・・
ei = y i − yˆ i
ei2
-4.21875
17.7978515625
24
50.9375
4.0625
16.5039062500
0
62.65625
2.34375
5.4931640625
36
86.09375
-11.09375 123.0712890625
8.90625
79.3212890625
5
14
95
108
86.09375
合計
52
325
300
325
0
242.1875
平均
10.4
65
60
65
0
48.4375
n
例)得点の例題でx1=6に対する推定値
b=
yˆ1 = 4.0625 + 5.859375 x1
= 4.0625 + 5.859375 × 6 = 39.21875
x1=6に対する残差 e1 = y1 − yˆ1
= 35 − 39.21875 = −4.21875
∑ ( x − x )( y − y )
i =1
残差の合計は0
n
=
300
= 5.859375
51.2
e1 = 35 − 39.21875
yˆ1 = 4.0625 + 5.859375 × 6
= 65 − 5.859375 × 10.4
= 4.0625
R2 = 1−
yˆ i = 4.0625 + 5.859375 xi
i
i
i =1
cf.平均からの偏差の合計は0:
∑ ( y − y) = 0
i
i =1
n
∑ ( y − yˆ )
i
i
2
→ 最小
i =1
回帰直線(推定値)
は,あるxに対するyの
平均的な値を表す
n
残差の2乗の合計は最小
2
i
a = y − bx
|
n
i
|
n
242.1875
= 0.87890625
2000
④ 回帰直線の解釈
∑ e = ∑ ( y − yˆ ) = 0
i =1
i
∑ (x − x)
i =1
③ 残差の性質
|
i
|
y
あるxに対してyはいろい
ろな値をとる可能性があ
るが,平均的には yˆ i とい
う値をとることが期待され
る.
yˆ i = a + bxi
yˆ i
n
∑ ( y − y)
cf.平均からの偏差の2乗の合計は最小:
i
2
→ 最小
xi
i =1
yˆ と平均 y は同じような性質をもつ
x
残差の解釈:例題2.1参照
5
教科書 215-222ページ
(2) 決定係数
2.回帰モデルと決定係数
y
(1) 説明変数と被説明変数
|
回帰直線
|
yˆ i = a + bxi
y i = yˆ i + ( y i − yˆ i )
y i − y = ( yˆ i − y ) + ( y i − yˆ i )
回帰(x)で + 回帰で説明
されない部
yの変動 = 説明される
分(残差)
部分
②決定係数の公式と範囲
yの全体の変動の分解
データ全体について:2乗して合計する(単なる
合計は0)
n
R =
2
y i − y = ( yˆ i − y ) + ( y i − yˆ i )
n
n
i
− y)2 =
i =1
∑ ( yˆ
− y)2 +
i =1
yの全変動 =
回帰(x)で
説明される
部分
⇒ yの全変動のうち,回帰で説明される変
動がどのくらいの割合を占めるかが,回帰
がどれくらいうまくいったかの指標になる:
決定係数R2
∑ (y
i
− yˆ i ) 2
i
∑(y
i
i =1
n
n
− y )2
または
R = 1−
2
− y )2
③ 決定係数の解釈
回帰で説明
されない部
分(残差)
n
R2 =
∑( y
− yˆ i )2
i
i =1
n
∑( y
i =1
0 ≤ R2 ≤ 1
i =1
+
∑ ( yˆ
i =1
n
i
x
各点について
z
| xによって,yの変動を説明することが目的
⇒どのくらい説明できるのか
⇒決定係数によって測る
∑ (y
yˆ i
yi
① yの変動の分解
z y:結果→被説明変数(従属変数)
z
関係の強さを数量的
に表す指標
z
z x:原因→説明変数(独立変数,回帰変数)
|
yi − yˆ i
決定係数 R2
i
− y )2
この式の方が計算しやすい
–xがyの変動のどのくらいの割合を説明しているか
–xの説明力の尺度
–回帰直線のあてはまりの尺度
∑ ( yˆ
i
− y )2
ex.R2=0.9 →xによって,yの90%が説明される
∑(y
i
− y )2
–R2が1に近いほど(大きいほど),xの説明力が高い
–R2が0に近いほど(小さいほど),xの説明力が低い
i =1
n
i =1
教科書 222-229ページ
④ 決定係数と相関係数
|
|
|
|
決定係数:あてはまりの尺度,xの説明力の尺度
相関係数:相関の強さ
決定係数の方が,相関係数より,意味が明確(説明力
の割合)
z ex. R2=0.5とrxy=0.5の解釈
ただし,(相関係数)2=決定係数 (p.217)
z ex. R2=0.64のとき,rxy=0.8
練習:得点例題 R 2 = 1 − 242.1875 = 0.87890625
または
2000
R 2 = (rxy ) 2 = 0.93752 = 0.87890625
エンゲル係数の例
R 2 = (−0.9978) 2 = 0.9956
3.重回帰モデル
回帰分析:yをxで説明する
z y:被説明変数,x:説明変数
| yの説明要因は1つとは限らない
|
z
z
ある銘柄の株価:市場の株価変動,金利,GDP・・・
出生率,消費,交通事故・・・
重回帰分析:説明変数が2つ以上
単回帰分析:説明変数が1つの場合
| 重回帰分析でも,単回帰と基本的には同じ
|
z
最小2乗法,推定値,残差,決定係数・・・
6
13章 回帰分析 練習問題
1.ある5か月について,A株とB株の株価変化率(%)を調べたら下の表のようになっ
た.A株の株価変化率を x ,B株の株価変化率を y とする.
(1)
散布図を描け.
(2)
下の表を埋め,A株とB株の株価変化率のそれぞれの平均,分散,標準偏差,お
よび両者の共分散 s xy =
s
1 n
( xi − x )( y i − y ) ,相関係数 rxy = xy を求めよ.
∑
n i =1
sx s y
また,相関係数からA株とB株の株価変化率にどんな関係があるのかを答えよ.
A株の変化率 B株の変化率
(%)
(%)
yi
i
xi
1
-3
-2
2
0
0
3
3
1
4
3
2
5
3
4
xi − x
( xi − x ) 2
v
yi − y
( yi − y ) 2
( x i − x )( y i − y )
合計
平均
-
-
x標準偏差
y標準偏差
相関係数 r xy
2.ある5世帯について,1年間の所得額と消費額を調べたら下の表のようになった.所
得を x ,消費を y とするとき,問1と同様の問に答えよ.
所得(万円)
消費(万円)
i
xi
yi
1
300
300
2
400
250
3
500
350
4
500
350
5
500
350
xi − x
( xi − x ) 2
v
yi − y
( yi − y) 2
( x i − x )( y i − y )
合計
平均
-
-
x標準偏差
y標準偏差
相関係数 r xy
7
3. x と y のデータが次のように与えられているとき,相関係数を求めよ.
xi
1
2
3
5
5
yi
10
10
6
4
2
4.【要 PC】テキストの表 13-2(219 ページ)のデータについて,問1と同様の計算を行
え.
5.テキストの表 13-1 の例について,以下のような表が得られている.
(1) 相関係数を求めよ.
(2) 回帰直線 yˆ i = a + bx i をあてはめたときの最小2乗推定値 a, b を求め,yˆ i = a + bxi の形
で表わせ.
(3) a, b にはどのような意味があるか述べよ.
可処分所得 エンゲル係数
(万円)
(%)
i
xi
yi
xi − x
( xi − x ) 2
yi − y
( yi − y ) 2
( xi − x )( y i − y )
1
28
28
-19.4
376.36
3.6
12.96
-69.84
2
38
26
-9.4
88.36
1.6
2.56
-15.04
3
46
25
-1.4
1.96
0.6
0.36
-0.84
4
54
23
6.6
43.56
-1.4
1.96
-9.24
5
71
20
23.6
556.96
-4.4
19.36
-103.84
合計
237
122
0
1067.2
97.6
37.2
-198.8
平均
47.4
24.4
7.44
2.73
-39.76
標準偏差
213.44
14.61 標準偏差
6.上の問1~3について,回帰直線 yˆ i = a + bxi をあてはめたときの最小2乗推定値 a, b
を求め, yˆ i = a + bx i の形で表わせ.
7.次の表は,チーズバーガーの価格(x,単位:円)と1か月あたりの購入量(y,単位:個)
のデータである.このデータについて,表を埋めた上で,次の問いの答えよ.
(1) x と y の平均,分散,標準偏差,共分散,相関係数を求めよ.
(2) 回帰直線 yˆ i = a + bx i を求めよ.
(3) a, b からどのようなことがわかるか.
(4) 決定係数 R を求めよ.また R はどのようなことを意味するか.
2
2
8
価格(円)
購入量(個)
i
x
y
1
240
2
2
160
3
3
120
7
4
80
10
x−x
(x − x )2
y − y
(y − y)
2
( x − x )( y − y)
yˆ
e = y − yˆ
e2
合計
平均
x標準偏差
y標準偏差
相関係数 r xy
決定係数R
2
8.次の表は,ある5世帯の1年間の所得額(x,単位:万円)とと消費額(y,単位:万円)
のデータである.このデータについて,表を埋めた上で,次の問に答えよ.
(1) x と y の平均,分散,標準偏差,共分散,相関係数を求めよ.
(2) 回帰直線 yˆ i = a + bx i を求めよ.
(3) a, b からどのようなことがわかるか.
(4) 決定係数 R を求めよ.また R はどのようなことを意味するか.
2
所得(万円)
2
消費(万円)
i
x
y
1
300
300
2
400
350
3
500
350
4
500
400
5
500
450
x−x
(x − x )2
y − y
(y − y)
2
( x − x )( y − y)
yˆ
e = y − yˆ
合計
平均
-
-
x標準偏差
y標準偏差
相関係数 r xy
決定係数R
2
9
e2
9.右下の表のデータは,ある5人の1年間の所得(単位:万円)と消費(単位:万円)のデータである.
次ページの表を埋めながら以下の問いに答えよ.
x(所得,万円)
400
500
550
600
700
y(消費,万円)
300
400
500
500
500
(1) x と y の散布図を描け.ただし,縦軸と横軸
に何をとったのかを明示し,適当に目盛りもつけること.
(2) x と y の平均 x =
偏差 s x =
n
n
∑x , y = n∑y
1
n
1
i
i =1
i
,分散 s x2 =
i =1
1
n
n
∑ (x
i
− x ) 2 , s 2y =
i =1
1
n
n
∑ (y
i
− y ) 2 ,標準
i =1
s x2 , s y = s 2y を求めよ.
n
(3) x の平均からの偏差の合計
∑ (x
− x ) を求めよ.
i
i =1
n
(4) y の平均からの偏差平方和
∑(y
i =1
i
− y) 2
を求めよ.
(5) 所得 x がすべて 1.2 倍になった場合の平均・分散・標準偏差を求めよ.
(6) 消費 y がすべて 20 万円減少した場合の平均・分散・標準偏差を求めよ.
(7) y の基準化統計量 z i =
yi − y
を求めよ(合計・平均の欄を含めて,ページ下の計算用の表の右側
sy
に答えよ).
(8) (7)の基準化統計量の平均・分散・標準偏差を求めよ.
(9) y の偏差値 10 z i + 50 を求めよ(合計・平均の欄を含めて,ページ下の計算用の表の右側に答えよ).
(10) (9)の偏差値の平均・分散・標準偏差を求めよ.
(11) x と y の共分散 s xy =
1
n
(12) x と y の相関係数 rxy =
n
∑ (x
i
− x )( y i − y ) を求めよ.
i =1
s xy
sxsy
を求めよ.
(13) (12)の相関係数から,この x と y の関係についてどのようなことがいえるのかを簡単に述べよ.
(14) y を x で回帰したときの回帰直線
n
推定値は, b
=
∑ (x
i =1
i
− x )( y i − y )
n
∑ (x
i =1
yˆ i = a + bxi を最小2乗法によって求めよ.ただし,最小2乗
i
, a = y − bx である( yˆ i = a + bxi の形で答えよ).
− x)2
(15) この b の値からどのようなことがわかるか.簡単に述べよ.
(16)
x 2 = 500 に対する推定値 yˆ 2 と残差 e 2 = y 2 − yˆ 2 を求めよ.
2
(17) 決定係数 R を求めよ.その結果,どのようなことが言えるか,簡単に述べよ.
10
xi
yi
1
400
300
2
500
400
3
550
500
4
600
500
5
700
500
xi − x
yi − y
( xi − x ) 2
( x i − x )( y i − y )
( yi − y) 2
(7)
(9)
y 基準化
y 偏差値
合計
平均
-
-
10.右下の表のデータは,ある商品の価格(単位:円)と購入量(単位:個)のデータである.下の表
を埋めながら以下の問いに答えよ.
xi
yi
1
35
10
2
45
10
3
50
10
4
55
8
5
65
6
xi − x
yi − y
( xi − x ) 2
x(価格,円)
35
45
50
55
65
y(購入量,個)
10
10
10
8
6
( x i − x )( y i − y )
( yi − y) 2
(7)
(9)
y 基準化
y 偏差値
合計
平均
-
-
(1) x と y の散布図を右図に描け.ただし,縦軸と横軸に何をとったのかを明示し,適当に目盛
りもつけること.
(2) x と y の平均 x =
標準偏差 s x =
1
n
n
∑
xi , y =
i =1
n
∑
1
n
y i ,分散 s x2 =
i =1
1
n
n
∑
( x i − x ) 2 , s 2y =
i =1
1
n
n
∑(y
i
− y) 2 ,
i =1
s x2 , s y = s 2y を求めよ.
n
(3) x の平均からの偏差の合計
∑ (x
− x ) を求めよ.
i
i =1
n
(4) y の平均からの偏差平方和
∑(y
i =1
i
− y) 2
を求めよ.
(5) 価格 x がすべて 0.8 倍になった場合の平均・分散・標準偏差を求めよ.
11
(6) 購入量 y がすべて 2 個増加した場合の平均・分散・標準偏差を求めよ.
(7) y の基準化統計量 z i =
yi − y
を求めよ.
sy
(8) (7)の基準化統計量の平均・分散・標準偏差を求めよ.
(9) y の偏差値 10 z i + 50 を求めよ.
(10) (9)の偏差値の平均・分散・標準偏差を求めよ.
1
n
(11) x と y の共分散 s xy =
(12) x と y の相関係数 rxy =
n
∑ (x
i
− x )( y i − y ) を求めよ.
i =1
s xy
sx sy
を求めよ.
(13) (12)の相関係数から,この x と y の関係についてどのようなことがいえるのかを簡単に述べ
よ.
(14) y を x で回帰したときの回帰直線
n
2乗推定値は,b
=
∑ (x
i =1
i
− x )( y i − y )
n
∑ (x
i =1
yˆ i = a + bxi を最小2乗法によって求めよ.ただし,最小
i
− x)
, a = y − bx である( yˆ i = a + bxi の形で答えよ).
2
(15) この b の値からどのようなことがわかるか.簡単に述べよ.
(16)
x 3 = 50 に対する推定値と残差を求めよ.
2
(17) 決定係数 R を求めよ.その結果,どのようなことが言えるか,簡単に述べよ.
11.
n
n
i =1
i =1
∑ ( xi − x )( yi − y ) = ∑ xi yi − nxy となることを証明せよ.
12.
【難】最小 2 乗法による回帰直線は, S =
n
n
i =1
i =1
∑ ( yi − yˆi ) 2 = ∑ ( yi − a − bxi ) 2 を a, b に関
して最小にするように決定される.
(1)
S を a, b で偏微分し,次の式(正規方程式と呼ばれる)を導出せよ.
n
n
∑ yi = na + b∑ xi
i =1
i =1
n
n
n
i =1
i =1
i =1
∑ xi yi = a∑ xi + b∑ xi
2
(2) 上の正規方程式を解いて,次の最小2乗推定値の公式を導出せよ.
n
b=
∑ ( x − x )( y
i
i =1
i
− y)
, a = y − bx
n
∑ (x − x)
i =1
2
i
12