実践:線形回帰分析入門 - 慶應義塾大学 湘南

頻度論とベイジアンの比較
慶應義塾大学 SFC 小暮研究会
梶田幸作
1

ジャパンRE(8952)とTOPIXのデータ( 2006年10
月24日から2007年10月23日)を用いて線形回帰分
析を行う

実習を通して、βについての推定を頻度論(ヒストリカ
ルベータ)とベイジアン(ベイジアンベータ?)の両方の
立場から検証する

頻度論の分析をExcelで、ベイジアンの分析(ベイズ
モデルによる回帰直線を求める)をWinBUGSで行う
2





βとは、直感的にはある銘柄の動きがマーケット
(TOPIXや日経225)の動きに対してどの程度感応的
かを示す指標。
β>1:マーケットより大きな動きをする
β=1:マーケットと同じ動きをする
β<1:マーケットより小さな動きをする
種類としてヒストリカルベータ、インプライドベータがあ
る。また、修正ベータやアンレバードベータなどがある。
3
(2007.7.10を100に基準化)
TOPIXに対してどのような動き
(変動)をしているか?
4





データ(Bayes1)を開く
A-C列にJ-REITとTOPIXの終値が1年分ある
基準化して分析するため、E-F列にその収益率を計
算する
収益率かしたデータを視覚的に把握するため散布図
を描く(Alt+I+Hでグラフウィザードを出し散布図を選
択する。右クリックで数式も出力する)
ツールバーのデータから分析ツールをクリックして回
帰分析を選択。X軸にTOPIX、Y軸に8952のデータを
指定し、さらに必要な項目にチェックをいれてOKを押
す。
5
散布図(収益率)
0.15000
y = 1.1411x + 0.0013
R 2 = 0.2596
8952
0.10000
0.05000
0.00000
-0.080 -0.060 -0.040 -0.020 0.0000 0.0200 0.0400 0.0600
-0.05000
0
0
0
0
00
00
00
00
-0.10000
TOPIX
この結果から何が言えるか?
6
概要
y=α+β*x
回帰統計
重相関 R
0.509519078
重決定 R2
0.259609691
補正 R2
0.256562817
標準誤差
0.021544144
観測数
245
y=0.001294+1.1411*x
アルファ
(切片)
ベータ
(傾き)
分散分析表
自由度
回帰
残差
合計
切片
X値1
1
243
244
変動
0.039548035
0.112788479
0.152336515
係数
標準誤差
t
0.001293862 0.001376565 0.939920697
1.141084297 0.123618795 9.230669973
分散
観測された分散比
0.039548035
85.20526815
0.00046415
有意 F
1.36801E-17
P-値
下限 95% 上限 95% 下限 95.0% 上限 95.0%
0.348191607 -0.001417661 0.004005385 -0.001417661 0.004005385
1.36801E-17 0.897583143 1.38458545 0.897583143 1.38458545
ベータはExcel関数(linest)でも計算可能
7










コード
8952
銘柄名 ジャパンRE
インデックス名称 TOPIX
原ベータ
1.1429
修正ベータ 1.0958
ULベータ 0.6999
アルファ
0.1461
標準誤差 2.1564
決定係数 0.2591
相関係数 0.5090
Excelの結果とほぼ等しい
8
モデル、データセットを用意する
→尤度、事前分布、初期値
⇒ここでは、”8952TOPIX1.txt”を開く


WinBUGSに取り込んで分析を行う。

ここでのモデルは
9
model{
for(i in 1:N){
Y[i] ~ dnorm(mu[i],tau)
mu[i] <- alpha + beta * X[i]
}
alpha ~ dnorm(0,1.0E-3)
beta ~ dnorm(0,1.0E-3)
tau ~ dgamma(1.0E-3,1.0E-3)
}
list(alpha = 0, beta = 0, tau = 1)
尤度
事前分布
初期値
10







Step1.WinBUGSの起動
Step2.FileからNewを開き、さきほど用意し
た”8952TOPIX1.txt”を全選択して貼り付ける
Step3.ツールバーのModelからSpecificationをク
リック
Step4.貼り付けたプログラムのmodelをダブルクリッ
クして反転させcheck modelをクリックする
Step5.データのlistを反転させload dataをクリック
Step6.チェーンの本数を決めCompileをクリックする
Step7.初期値のlistを反転させload initsをクリック
11






Step8.ツールバーのModelからUpdateをクリック
Step9.Update欄の設定をしてupdateをクリック
Step10.ツールバーのInferenceからSamplesをク
リックし、node欄に変数(alpha,beta,tau)を入力し
それぞれsetをクリック
Step11.再びUpdate Toolにもどり、回数を設定し
て(10000回)updateをクリック
Step12.Sample Monitor Toolでnode欄に*と
入力
Step13.出力したいものをクリックする
12
node
alpha
beta
tau
mean
sd
MC error 2.5%
0.001289 0.002281 1.469E-5 -0.003137
1.14
0.2058
0.001509 0.7376
776.7
70.43
0.4402
645.5
median
0.001296
1.141
773.9
97.5%
0.005785
1.543
922.3
start
2001
2001
2001
sample
20000
20000
20000
alpha chains 1:2
alpha chains 1:2 sample: 20000
200.0
150.0
100.0
50.0
0.0
0.01
0.005
0.0
-0.005
-0.01
2001
-0.01 -0.005
0.0
5000
0.005
7500
10000
iteration
beta chains 1:2
beta chains 1:2 sample: 20000
2.0
1.5
1.0
0.5
0.0
2.0
1.5
1.0
0.5
0.0
2001
5000
7500
10000
iteration
0.0
0.5
1.0
1.5
tau chains 1:2
1200.0
1.00E+3
800.0
600.0
400.0
2001
5000
7500
10000
iteration
13



Excelによる頻度論の結論はパラメータ(α、β)が1つ
の値として固定されて算出された。一方、WinBUGSに
よるベイジアンの結論はパラメータそのものが固定さ
れたものではなく、分布の形として算出された。
また、頻度論の結果では決定係数の値が低く、説明
力は極めて弱いと結論づけられる(直観的な常識を
用いるとこの結果をどう思うであろうか?)。一方、ベ
イジアンの分析においてはこのようなことを考慮する
必要がない。
得られるデータが少ない(50個以下)場合、頻度論で
の分析の問題点は何であろうか。
14



MCMC/WinBUGSの研究
AMSUS(実証分析のデータを取得)
木上・風岡(2007):「新しい統計解析手法とその金
融データへの適用」(風岡担当箇所参照:第二部)
15