野球の勝率が、チームの成績により受ける影響

野球シーズン終了時の勝率は、
打撃・防御率・本塁打数に
依存するか
4400026 上野貴寛
2002/12/10
シミュレーション論
1
目的、ねらい
目的、ねらい
• 野球の試合の勝率(Y)が、
チームの打率(X1)
防御率(X2) [通常の防御率の逆数]
本塁打数(X3)
によってどのように影響されるのかを解析
する。
2002/12/10
シミュレーション論
2
• 対象:セリーグ6球団(2002年の成績)
• 従属変数:勝率
• 独立変数:チーム打率、チーム防御率、
チーム本塁打数(以下「チーム」は省略す
る)
(注)通常の防御率は低いほうが良いので
逆数を取る。以後これを防御率と呼ぶ。
• 仮説:勝率は、打率が高く、防御率が低く、
本塁打数が多いほど高くなる。
2002/12/10
シミュレーション論
3
使用データ
チーム名
巨 人
ヤクルト
中 日
阪 神
広 島
横 浜
チーム
チーム
チーム
打率(X1) 防御率(X2) 本塁打数(X3)
0.272
0.329
186
0.263
0.295
142
0.257
0.313
125
0.253
0.293
122
0.259
0.229
154
0.24
0.244
97
勝率(Y)
0.623
0.544
0.511
0.485
0.471
0.363
出展:BIGROBEスポーツ(URL:http://sports.biglobe.ne.jp/baseball/stats/team.htm)
測定期間:2002年3月30日~10月17日(各チーム140試合)
2002/12/10
(注)X2 : 1/通常の防御率
シミュレーション論
4
散布図を描く
散布図を描く
• 規定問題ではデータをグループ化したが、
今回はデータ数が「6」と少ないのでグルー
プ化は行わないで、分析を進めてみること
にする。
(先生のコメント) 自由課題では,グループ
化は不要。不可能。散布図からは相関が
2
あるか,どのような形の変数(x?,x ?)が適
切かを読み取ること。
2002/12/10
シミュレーション論
5
散布図を描く
勝率vs打率の散布図を描いて直感勾配を求める
0.7
巨 人
0.6
中 日
阪 神
広 島
勝率
0.5
0.4
ヤクルト
横 浜
0.3
0.2
0.1
0
0.235
0.24
0.245
0.25
0.255
打率
0.26
0.265
0.27
0.275
図1:勝率vs打率の散布図
2002/12/10
シミュレーション論
6
散布図を描く
勝率vs防御率の散布図を描いて直感勾配を求める
0.65
巨 人
0.6
勝率
0.55
0.5
ヤクルト
中 日
阪 神
広 島
0.45
0.4
横 浜
0.35
0.3
0.25
0.200
2002/12/10
0.220
0.240
0.260 0.280
防御率
0.300
図2:勝率vs防御率の散布図
シミュレーション論
0.320
0.340
7
散布図を描く
勝率
勝率vs本塁打数の散布図を描いて直感勾配を求める
0.65
0.6
0.55
0.5
0.45
0.4
0.35
0.3
0.25
0.2
巨 人
中 日
阪 神
広 島
横 浜
50
2002/12/10
ヤクルト
70
90
110
130
150
本塁打数
170
図3:勝率vs本塁打数の散布図
シミュレーション論
190
210
8
回帰分析
回帰分析
• 重回帰分析を行う。
従属変数:勝率
独立変数:打率・防御率・本塁打数
• 変数の選択:変数減少法を用いて変数を
減少させてみる。
(コメント) t 検定の結果,有意でない変数は
順次削除する。
2002/12/10
シミュレーション論
9
回帰分析
算出統計量
•
•
•
•
•
打率(X1)の平均値:0.257 [提示不要]
防御率(X2)の平均値:0.289 [提示不要]
本塁打数(X3)の平均値:137.667 [不要]
残差平方和Sr:0.00020
回帰係数:b0=-0.813、b1=3.809
b2=0.801、b3=0.001
• 正規方程式の係数行列の逆行列:
2156.690
-10988.494
832.690
3.128
2002/12/10
-10988.494
56255.162
-4407.734
-16.087
832.690
-4407.734
477.428
1.189
シミュレーション論
3.128
-16.087
1.189
0.005
10
回帰分析
• 単相関行列:
1
0.632
0.942
0.967
0.632
1
0.392
0.795
0.942
0.392
1
0.861
0.967
0.795
0.861
1
• 偏相関行列:
-1
-0.502
0.062
0.752
-0.502
-1
-0.784
0.934
0.062
-0.784
-1
0.600
0.752
0.934
0.600
-1
• 重相関係数:0.997
• 寄与率:0.995
2002/12/10
シミュレーション論
11
回帰分析
• t値: t1=1.979
t分布表の値
t(3,0.05)=3.182
t2=4.515
t3=1.299
(コメント)ちゃんとt(3,0.05)を求めている。
自由度が低くて t(3,0.05)が大きいね。
• F値: F1=3.916
F2=20.382
F3=1.687
• 得られた回帰式:
Y=-0.813 + 3.809X1
+ 0.801X2 + 0.001X3
2002/12/10
シミュレーション論
12
回帰分析
計算によって得られた勾配と
直感勾配との比較(1)
• 勝率vs打率
計算:3.809 直感:8.00
0.7
巨 人
0.6
勝率
0.5
0.4
阪 神
中 日
広 島
ヤクルト
横 浜
0.3
0.2
0.1
0
0.235
2002/12/10
0.24
0.245
0.25
0.255
打率
0.26
0.265
0.27
図4:勝率VS防御率における勾配の比較
シミュレーション論
0.275
13
回帰分析
計算によって得られた勾配と
直感勾配との比較(2)
• 勝率vs防御率
計算:0.801 直感:1.667
0.65
巨 人
0.6
勝率
0.55
0.5
ヤクルト
中 日
阪 神
広 島
0.45
0.4
横 浜
0.35
0.3
0.25
0.200
2002/12/10
0.220
0.240
0.260
0.280
防御率
0.300
0.320
図4:勝率VS防御率における勾配の比較
シミュレーション論
0.340
14
回帰分析
計算によって得られた勾配と
直感勾配との比較(3)
勝率
• 勝率vs本塁打数
計算:0.001 直感:0.0021
0.65
0.6
0.55
0.5
0.45
0.4
0.35
0.3
0.25
0.2
巨 人
中 日
阪 神
広 島
横 浜
50
2002/12/10
ヤクルト
70
90
110
130
150
本塁打数
170
190
図4:勝率VS防御率における勾配の比較
シミュレーション論
210
15
回帰分析
変数の選択[減少]結果
• t値が最も小さく、有意でなかった本塁打数(X3)
を削除して、回帰分析を行い、次式を得た。
Y = -1.287 + 6.244X1 + 0.621X2
• 勝率vs打率の勾配:6.244
• 勝率vs防御率の勾配:0.621
• 重相関係数:0.996
• 寄与率:0.992
(コメント) t 値の評価がない。係数の有意性検定
が要る。 t 1=20.8, t 2=8.2 に言及せよ。
2002/12/10
シミュレーション論
16
考察
分析結果の考察(1)
• 変数減少前の t 値を見ると、本塁打数の値
が最も小さい。[回帰係数の値も小さくなって
いる。よって]チームの勝率には本塁打数は
あまり寄与しないものと思われる。 [このこと
は、変数減少前後の寄与率を見比べてみて
も分かる。 ]
(コメント)有意でない変数の係数値は信用で
きない。変数を減らせば寄与率は下がる。
2002/12/10
シミュレーション論
17
考察
分析結果の考察(2)
• 散布図上に直感で引いた直線と、計算で
求めた直線の勾配との間にかなりのズレ
が生じていた。この原因として、データ数が
少ないことが挙げられる。データが6つしか
ないので、直感で引いたものは一見良さそ
うだが実際はかなりアバウトになってしまっ
たと判断できる。
(コメント)t 検定がなかったので,独立変数の独
立性は大丈夫かと最初は心配した。
2002/12/10
シミュレーション論
18
結論
野球の勝率は、
打率と防御率によって
ほぼ決まる。
2002/12/10
シミュレーション論
19
今後の課題
今後の課題(1)
• 仮説の見直し:「勝率は、打率が高く、防御
率が低く、本塁打数が多いほど高い。」と
仮説を立てた。しかし分析を行ってみると
本塁打数はあまり寄与していないことが窺
えた。したがって、仮説の中には本塁打数
は考慮する必要はあまりないと思われる。
2002/12/10
シミュレーション論
20
今後の課題
今後の課題(2)
• データの見直し:今回はデータとしてセリー
グ6球団のデータを扱ったが、これでは
データの数が少なすぎたと思う。
• 変数の見直し:打率と本塁打数にはあまり
相関は無いと思っていたが、実際はかなり
の相関があり、本塁打数は独立変数として
は不適当であったと思われる。
2002/12/10
シミュレーション論
21
付録1:計算結果
チーム名
巨 人
ヤクルト
中 日
阪 神
広 島
横 浜
計
Ave.
チーム
打率
(X1)
0.272
0.263
0.257
0.253
0.259
0.240
1.544
0.257
チーム
防御率(X2)
0.329
0.324
0.313
0.293
0.229
0.244
1.733
0.289
チーム
本塁打数
(X3)
186.000
142.000
125.000
122.000
154.000
97.000
826.000
137.667
6.000
1.544
1.733
826.000
2.997
1.544
0.398
0.447
214.095
0.776
0.257
0.001
0.001
1.538
0.004
0
1
2
3
4
0.623
0.544
0.511
0.485
0.471
0.363
2.997
0.500
X1*X1
0.074
0.069
0.066
0.064
0.067
0.058
0.398
0.066
1.733
0.447
0.510
241.138
0.880
826.000
214.095
241.138
118394.000
423.916
2.997
0.776
0.880
423.916
1.534
0.289
0.001
0.009
2.540
0.014
137.667
1.538
2.540
4681.333
11.329
0.500
0.004
0.014
11.329
0.037
0.167
-0.257
-0.289
-137.667
-0.500
-0.356
2.507
0.005
-1.316
0.003
-557.344
2700.820
-1.316
528.373
-0.665
-1.508
7.800
0.003
-0.665
0.002
116.479
-451.991
0.356
557.344
1.508
-451.991
1756.440
-2.507
-2700.820
-7.800
-644.638
3315.033
-244.976
206.072
0.151
-1.287
6.244
0.621
0.151
0.000
140.122
-618.347
66.351
644.638
1.287
-618.347
2926.954
-466.854
-3315.033
-6.244
66.351
-466.854
186.203
244.976
-0.621
-0.813
3.809
0.801
0.001
0.00020
2156.690
-10988.494
832.690
3.128
0.813
-10988.494
56255.162
-4407.734
-16.087
-3.809
832.690
-4407.734
477.428
1.189
-0.801
3.128
-16.087
1.189
0.005
-0.001
5502.707
-26663.411
-2461.758
0.106
4114.710
-26663.411
129686.659
11025.599
-1.931
-19275.974
-2461.758
11025.599
3721.101
4.164
-4051.293
0.106
-1.931
4.164
0.008
-3.716
4114.710
-19275.974
-4051.293
-3.716
5059.997
-0.502
-1
-0.784
0.934
0.062
-0.784
-1
0.600
0.752
0.934
0.600
-1
0
1
2
3
4
1
0
0
0
0
0
1
2
3
4
1
0
0
0
0
0
1
0
0
0
0
1
2
3
4
1
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
1
2
3
4
1
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
0
1
0
0
1
2
3
4
1
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
0
1
0
0
1
2
3
4
単相関行列
1
0.632
0.942
0.967
0
0
0
0
1
X2*X2
0.108
0.105
0.098
0.086
0.053
0.060
0.510
0.085
X3*X3
34596.000
20164.000
15625.000
14884.000
23716.000
9409.000
118394.000
19732.333
1
0
0
0
0
Y*Y
0.388
0.296
0.261
0.235
0.222
0.132
1.534
0.256
X1*X2
0.089
0.085
0.081
0.074
0.059
0.059
0.447
0.075
X1*X3
50.592
37.346
32.125
30.866
39.886
23.280
214.095
35.683
0
1
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
0
1
0
1
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
0
1
0
0
1
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
1
0
0
0
0
0
1
X1*Y
0.169
0.143
0.131
0.123
0.122
0.087
0.776
0.129
0
0
0
0
1
偏相関行列
0.632
1
0.392
0.795
0.942
0.392
1
0.861
SR
Sr
VR
Vr
回帰不偏平方和
残差平方和
回帰不偏分散
残差不偏分散
0.03682
0.00020
0.01841
0.00007
R
R^2
重相関
寄与率
0.99733
0.99466
t1
t2
t3
F1
F2
F3
2002/12/10
勝率
(Y)
0.967
0.795
0.861
1
-1
-0.502
0.062
0.752
1.979
4.515
1.299
3.916
20.382
1.687
シミュレーション論
22
付録2:変数減少後の計算結果
チーム名
巨 人
ヤクルト
中 日
阪 神
広 島
横 浜
計
Ave.
チーム
打率
(X1)
0.272
0.263
0.257
0.253
0.259
0.240
1.544
0.257
勝率
(Y)
0.623
0.544
0.511
0.485
0.471
0.363
2.997
0.500
X1*X1
0.074
0.069
0.066
0.064
0.067
0.058
0.398
0.066
1.544
0.398
0.447
0.776
1.733
0.447
0.510
0.880
2.997
0.776
0.880
1.534
0
1
2
3
6
1.544
1.733
2.997
0
1
2
3
1
0
0
0
0
1
2
3
1
0
0
0
0
1
0
0
0
1
2
3
1
0
0
0
0
1
0
0
0
1
2
3
1
0
0
0
0
1
0
0
0
1
2
3
0.257333 0.288860549
0.000569 0.001427453
0.001427 0.008949447
0.004441
0.01446833
-0.35633477
2.507235688
0.005370487
0.003333697
単相関行列
1
0.632
0.967
SR
Sr
VR
Vr
回帰不偏平方和
残差平方和
回帰不偏分散
残差不偏分散
R
R^2
重相関
寄与率
t1
t2
F1
F2
2002/12/10
チーム
防御率
(X2)
0.329
0.324
0.313
0.293
0.229
0.244
1.733
0.289
X2*X2
0.108
0.105
0.098
0.086
0.053
0.060
0.510
0.085
Y*Y
0.388
0.296
0.261
0.235
0.222
0.132
1.534
0.256
X1*X2
0.089
0.085
0.081
0.074
0.059
0.059
0.447
0.075
X1*Y
0.169
0.143
0.131
0.123
0.122
0.087
0.776
0.129
1
0
0
0
0
1
0
0
0
0
1
0
0
0
0
1
0.4995 0.166666667
0.004441 -0.25733333
0.014468 -0.28886055
0.03702
-0.4995
0
1
0
0
0
0
1
0
0
0
0
1
-1.50779
7.800351
0.003334
0.002378
116.4789227
-451.990632
0.356334768
1.507790398
-451.991
1756.44
-2.50724
-7.80035
0
0
1
0
0
0
0
1
0
0
1
0
-1.287
6.244
0.621
0.000309
140.122
-618.347
66.351
1.286597772
-618.347
2926.954
-466.854
-6.244
66.351
-466.854
186.203
-0.62074
0
0
0
1
0
0
1
0
0
0
0
1
5501.212491
-26636.3075
-2520.21085
4166.873807
-26636.3
129195
12086.01
-20222.3
-2520.21
12086.01
1434.139
-2010.39
4166.874
-20222.3
-2010.39
3238.676
-0.888
-1
0.933
0.989
0.933
-1
0.632
1
0.795
0.967
0.795
1
偏相関行列
-1
-0.888
0.989
X2*Y
0.205
0.176
0.160
0.142
0.108
0.089
0.880
0.147
0.037
0.00031
0.018
0.00003
0.996
0.992
20.770
8.187
431.3973
67.02026
シミュレーション論
23