統計学は面白い(その4) - R Statistics Global

統計学は面白い(その4)
小原 堯
これまでは,2つの異なる変数 x と y の相関を考察した.今回は同じ1つの
変数 x の異なる時点での相関を調べる.次のような予想を立てる.現時点 t で
の x の値 xt は,1期前の x の値,xt−1 によって決まる.これを式で書けば
xt = a + b xt−1 + et
(1)
である.a, b は回帰係数,e は誤差である.1期前のデータだけから今期の値が
決まるなどととても考えられないが,その1期前のデータは2期前のデータで
決まり,以下同様にして,何期も前のデータの影響が今期に及ぶことになる.
A 社株の終値に (1) を適用してみよう.xt → y, xt−1 → x と読み替えて,今
まで適用した R の関数 lm(y˜x) を使う:
result = lm(y˜x)
(2)
xhat = fitted(result).
(3)
源データ xt を点で表し,推定された xhat を赤い線で表してみると,図 1 の様
になる.(1) のモデルを AR(1) (1-st order auto-regressive) モデルという.auto-
regressive は自己回帰と訳している.自分の現在を,自分の過去で説明する(回
帰する)ということである.その次数が1次である.2 次の回帰ならば,
xt = a + b1 xt−1 + b2 xt−2 + et
1
(4)
480
440
x
520
となる.図を見る限り,源データを表す点の大きさに,回帰値が埋没するくら
0
10
20
30
40
t
図 1: AR(1) による当てはめ
い良く当てはまっている.AR モデルは関数の形を決めない回帰分析である.こ
の種の分析を時系列分析と呼んでいる.時系列分析には有用な方法がいくつも
ある.これらを調べるのは,面白い事である.
2