資料3:回帰分析1 - 単回帰分析 (2014.11.5)

情報処理基礎B(市場戦略学科・木曜 2 時限・小沢)
資料3:回帰分析1 - 単回帰分析 (2014.11.5)
1. 単回帰分析
・2 つのデータ系列を x = (x1, x2, ..., xn),y = (y1, y2, ..., yn) とする.単回帰とは,これらデータ
系列間の関係を次の 1 次式で表現することを指す.この式を単回帰式という.
y = a x + b
・単回帰式は,x の値がわかれば計算によって対応する y の値が得られる式となっている.
その意味で,y を目的変数,x を説明変数と呼ぶ.
・単回帰式を求めるためには,データから係数 a, b の値を計算しなければならないが,それ
は以下の考え方に基づく.実際の計算は Excel の近似曲線機能または分析ツールを用いる.
- 単回帰式に x の実測値を代入して得られる y の値を推定値といい,推定値と y の実測値
の差を残差という.残差は回帰式による推定の誤差を表している.i 番目のデータ (xi, yi)
の推定値は a xi + b であり,残差 ei は次で与えられる.
ei = yi - (a xi + b) = yi - (yi の推定値)
- 残差の 2 乗の和 e12+ e22 +
+ en2 を残差平方和という.残差平方和は単回帰式の総合
的な誤差の大きさを表しているので,それが最も小さくなるように係数 a, b の値を定め
る (係数 a, b の値を動かすと残差平方和の値も変化するので,それが最も小さくなるよ
うに a, b の値を定める).この方法を最小 2 乗法という.
・求めた単回帰式がデータ系列間の関係をどの程度よく表現しているのかを示す指標として
決定係数がある.決定係数は 0 以上 1 以下の値を取り,1 に近いほどデータ間の関係をうま
く表現した単回帰式となる (決定係数は単回帰式で表現できる変動の割合を表しており,単
回帰式における誤差の程度を表す指標と考えてよい).決定係数の値が小さい場合は推定の
誤差が大きいので利用にあたっては注意が必要である.
・単回帰分析を用いると,需要などの予測や企業活動の効果分析などができる.
2. 近似曲線機能を用いた回帰直線の追加
・単回帰式のグラフを回帰直線という.Excel の近似曲線機能でこの回帰直線をグラフ(散布
図) に追加できる.
・回帰直線 (線形近似) の追加方法:
- 2 つのデータ系列 x = (x1, x2, ..., xn),y = (y1, y2, ..., yn) を散布図に表す.
- グラフ(散布図)を選択し,[グラフツール][レイアウト]タブの[近似曲線]で[その他の近
似曲線オプション]をクリックする.
- [近似曲線の追加]で近似曲線を追加したいデータ系列を選択する.
- [近似曲線の書式設定]で以下を設定する.
[近似または回帰の種類]:線形近似をチェック
[グラフに数式を表示する]と[グラフに R-2 乗値を表示する]をチェック (この操作
により,グラフ上に単回帰式と決定係数(R2 値)が表示される.)
・練習 3 の問題 1 から問題 3
-1-