統計学1 導 入 身長と体重の散布図 相関係数 相関係数 身長と体重の

2015/5/29
導
入
あるスポーツチームの選手14人の体型を計
測したところ、次のようであった。身長と体重は
どんな関係になっているであろうか?
統計学1
回帰直線
体重
70.0
78.6
69.9
83.8
83.6
95.4
82.1
79.8
86.6
89.9
84.5
98.0
81.9
93.1
身長
172.1
183.5
168.3
183.5
181.0
189.9
177.2
184.2
188.0
186.7
189.2
193.0
176.5
181.0
身長
172.1
183.5
168.3
183.5
181.0
189.9
177.2
184.2
188.0
186.7
189.2
193.0
176.5
181.0
2554.1
182.4
体重
70.0
78.6
69.9
83.8
83.6
95.4
82.1
79.8
86.6
89.9
84.5
98.0
81.9
93.1
1177.2
84.1
身長と体重の散布図
体脂肪率
12.3
6.1
25.3
10.4
28.7
20.9
19.2
12.4
4.1
11.7
7.1
7.8
20.8
21.2
BMI
23.6
23.3
24.7
24.9
25.5
26.5
26.2
23.5
24.5
25.8
23.6
26.3
26.3
28.4
相関係数
1
2
3
4
5
6
7
8
9
10
11
12
13
14
合計
平均
100.0
95.0
90.0
85.0
80.0
75.0
70.0
身長 2
29618.41
33672.25
28324.89
33672.25
32761.00
36062.01
31399.84
33929.64
35344.00
34856.89
35796.64
37249.00
31152.25
32761.00
466600.07
33328.58
体重 2
4900.00
6177.96
4886.01
7022.44
6988.96
9101.16
6740.41
6368.04
7499.56
8082.01
7140.25
9604.00
6707.61
8667.61
99886.02
7134.72
身長×体重
12047.00
14423.10
11764.17
15377.30
15131.60
18116.46
14548.12
14699.16
16280.80
16784.33
15987.40
18914.00
14455.35
16851.10
215379.89
15384.28
65.0
60.0
165.0
170.0
175.0
180.0
185.0
190.0
195.0
相関係数
身長と体重の散布図
100.0
95.0
90.0
85.0
80.0
75.0
70.0
65.0
相関係数は大きく、身長と体重には関連がありそう!
ではこのスポーツチームのメンバーである人の身長が
179cmであったとすると、体重はどれくらいあると考え
られるでしょうか?
60.0
165.0
170.0
175.0
180.0
185.0
190.0
195.0
1
2015/5/29
散布図に直線を引こう!
回帰直線
散布図に当てはめる直線は回帰直線と呼ばれ
ています。いま、このデータに最適な回帰直線
は分かりませんが、回帰直線の式を
100.0
95.0
90.0
85.0
80.0
(体重)=
75.0
×(身長)+
70.0
としてデータによく当てはまる , を求めましょ
う!
65.0
60.0
165.0
170.0
175.0
180.0
185.0
190.0
195.0
どっちの線がいいの?他にもっと良い線があるかも?
散布図に直線を引こう!
回帰直線
回帰直線
100.0
95.0
90.0
各データに対して外れを求め、外れの2乗の総
和が最小になる直線を最適な直線とします。外
れの総和は
85.0
82.1
回帰直線
から得ら
れる予測
体重
外れ
80.0
75.0
70.0
65.0
60.0
165.0
170.0
175.0
180.0
185.0
190.0
195.0
177.2
適当に回帰直線を引くと…
と具体的にかけるので、この量を最小にす
る , を求めます。
回帰直線
回帰直線
このような方法は最小2乗法と呼ばれており、S
を最小にする , は次のようになります。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
合計
平均
身長
172.1
183.5
168.3
183.5
181.0
189.9
177.2
184.2
188.0
186.7
189.2
193.0
176.5
181.0
2554.1
182.4
体重
70.0
78.6
69.9
83.8
83.6
95.4
82.1
79.8
86.6
89.9
84.5
98.0
81.9
93.1
1177.2
84.1
身長 2
29618.41
33672.25
28324.89
33672.25
32761.00
36062.01
31399.84
33929.64
35344.00
34856.89
35796.64
37249.00
31152.25
32761.00
466600.07
33328.58
体重 2
4900.00
6177.96
4886.01
7022.44
6988.96
9101.16
6740.41
6368.04
7499.56
8082.01
7140.25
9604.00
6707.61
8667.61
99886.02
7134.72
身長×体重
12047.00
14423.10
11764.17
15377.30
15131.60
18116.46
14548.12
14699.16
16280.80
16784.33
15987.40
18914.00
14455.35
16851.10
215379.89
15384.28
(x:身長, y:体重)
2
2015/5/29
身長と体重の散布図
身長179cmの選手体重
このスポーツチームのメンバーである人の身長
が179cmであったとすると、体重はどれくらいあ
ると考えられるでしょうか?
100.0
95.0
90.0
85.0
80.0
0.962×(身長)-91.39
=0.962×(179)-91.39=80.78kg
75.0
70.0
65.0
60.0
165.0
170.0
175.0
180.0
185.0
190.0
195.0
決定係数
外れの2乗の総和を最小にするように回帰直線
を求めました。このようにして得られた回帰直線
を用いた場合の外れの2乗の総和は
と書くことができ、相関係数が1に近いと外れの
2乗の総和が小さくなることが分かります。つま
り、 が直線への当てはまり具合を表現してい
ることになり、この値を決定係数という。
演
習
次のデータは、928組の親子の身長を計測したもの
から、計算した親の平均身長と子の平均身長を9段
階で調べたものである。
親
子
184
181
178
176
173
171
168
166
163
183
178
177
175
173
172
170
169
166
このデータの回帰直線を求めなさい。
Sir Francis Galton(1822‐1911)
回帰直線:(子の身長)=a×(親の身長)+b
また、相関係数も求めよ。
3