直線の当てはめ

直線の当てはめと誤差
誤差の二乗和の導出
1
総和記号の確認
準備
2
シグマの話1
(定義)
n
x
i 1
i
 x1  x2    xn
3
シグマの話2
n
c

i 1
 c  c  c
 cn
4
シグマの話3
n
 cx
i 1
i
 cx1  cx2    cxn
 c x1  x2    xn 
n
 c  xi
i 1
5
シグマの話4
n
 x  y 
i 1
i
i
 x1  y1  x2  y2    xn  yn 
 x1  x2    xn    y1  y2    yn 

 

   xi     yi 
 i 1   i 1 
n
n
6
シグマの話5
n
 ax  by
i 1
i
i
 c
n
n
i 1
i 1
 a  xi  b yi  cn
7
2つの変数の関係を表す直線
•気温と売上
•広告と売上
•研究開発費とシェア
一方が予測可能または操作可能な場合、
もう一方の変数が直接操作できなくても
ある程度コントロールできる。
2つの変数の関係をより分かりやすく表
現する方法を考える。
8
直線を表す式
y    x
直線の意味
xが1増加したらyがβだけ増加する。
xが2増加したらyが2βだけ増加する。
xが操作可能な変数の場合、間接的にyを操
作することが可能。
xが予測可能な変数の場合、yを予測すること
が可能。
9
2点の場合
y
(x1,y1)
x
(x2,y2)
 y1    x1

 y2    x2
10
問題
 3,  3、2, 7 を通る
2点 直線の式を求めよ。
y  2x  3
11
3点の場合
y
(x3,y3)
(x1,y1)
x
(x2,y2)
12
当てはまりの基準
• 3点以上では、すべての点を通る直線は
引けない。
• 何らかの基準を設定して「もっともよく当
てはまる」直線を求めることが必要。
• 当てはまりの基準に誤差を想定
• y軸上における直線上の点と各点の差と
して誤差を定義する。
13
誤差 e
ei  yi  yˆ i  y i   xi 
xi , yi 
xi , yˆi 
14
最小二乗法
誤差を使った当てはめの基準
15
誤差の総和
e1  e2  e3  e4
e3
e1
e4
e2
誤差が符号を持つため、互い
に相殺してしまい判断が困難。
16
誤差の絶対値の総和
e1  e2  e3  e4
同じ程度に当てはまる直線が無限に引ける。
17
誤差の二乗和
e e e e
2
1
2
2
2
3
2
4
e3
e1
e4
e2
18
最小二乗法
• 誤差の二乗和を最小化する基準
• 誤差の二乗を求めることにより符号の問題を
解決。
• 計算で、1本だけの直線を引ける。
• 大きな誤差を強調し、小さな誤差をより小さく
評価。
• 最小二乗法という
19
問題
直線を
yˆ i    xi
とし、誤差を
ei  yi  yˆ i
とする。誤差の二乗和を式で表しなさい。
20
答え
ˆ




e

y

y


n
i 1
n
2
i
2
i
i 1
i

2
    yi    xi  
 i 1

n
21
問題
以下の式を展開しなさい。
n
 y
i 1
   xi 
2
i
22
答え
n  
2
n
2
x
i 1
n
2
i
n
 2  xi
i 1
n
n
 2  yi  2   xi yi   y
i 1
i 1
i 1
2
i
23