ビールに関する要因分析

■「夏→ビールの売り上げが伸びる」というイメージ
・具体的にどのような要因があるのか?
・ビールの売り上げ(消費量)はどのようなことに
影響をもたらすのか?(相関関係があるのか?)
以上の点に関して世界の国々のデータを用いて3つ
の仮説を検証
仮説1 「年間平均気温が高い国は、一人当たりの年間
ビール消費量が多い。」
仮説2 「一人当たりの年間ビール消費量が多い国
は、一人当たりの年間たばこ消費量も多い。」
仮説3 「一人当たりの年間ビール消費量が多い国は、
男女平均寿命が短い。」
変数1 国ごとの年間平均気温(平年値)
(出所:気象庁「気象統計情報」)
変数2 国ごとの一人当たりの年間たばこ消費量(本数)
(出所:Wikipedia 「国別煙草消費概況」)
変数3 国ごとの男女平均寿命
(出所:総務省統計局「男女別平均寿命」)
変数4 国ごとの一人当たりの年間ビール消費量(L)
(出所:ビール酒造組合「国別一人当たりビール消費量)
相関係数
一人当たり年間
年平均気温
年平均気温
Pearson の相関係数
1
有意確率 (両側)
N
一人当たり年間ビール消費
Pearson の相関係数
量
有意確率 (両側)
N
ビール消費量
-.164
.386
30
30
-.164
1
.386
30
30
分散分析b
モデル
平方和 (分散成
分)
1
回帰
自由度
平均平方
343.223
1
343.223
残差 (分散分析)
12385.535
28
442.341
合計 (ピボットテーブル)
12728.759
29
a. 予測値: (定数)、年平均気温。
b. 従属変数 一人当たり年間ビール消費量
F値
.776
有意確率
.386a
・散布図:各データは散在しており、予想していたような
正の相関は見受けられない。
・相関係数:弱いが負の相関があることがわかる。
・決定係数:0.027
・有意確率:有意水準α=0.05とすると、有意確率>α
となり帰無仮説は棄却されない。
相関係数
一人当たり年間 一人当たり年間
ビール消費量
一人当たり年間ビール消費
Pearson の相関係数
量
有意確率 (両側)
N
たばこ消費量
1
.215
30
30
1
一人当たり年間たばこ消費
Pearson の相関係数
.233
量
有意確率 (両側)
.215
N
.233
30
30
分散分析b
モデル
平方和 (分散成
分)
1
回帰
自由度
平均平方
680592.844
1
680592.844
残差 (分散分析)
1.185E7
28
423390.376
合計 (ピボットテーブル)
1.254E7
29
a. 予測値: (定数)、一人当たり年間ビール消費量。
b. 従属変数 一人当たり年間たばこ消費量
F 値
1.607
有意確率
.215a
・散布図:データは散在
(→はっきりとした相関は見受けられない)
・相関係数:弱い正の相関
・決定係数:0.054
・有意確率:有意確率>α(=0.05)
(→帰無仮説は棄却されない)
相関係数
一人当たり年間
ビール消費量
一人当たり年間ビール消費
Pearson の相関係数
量
有意確率 (両側)
N
平均寿命
平均寿命
1
.131
.491
30
30
Pearson の相関係数
.131
1
有意確率 (両側)
.491
N
30
30
分散分析b
モデル
平方和 (分散成
分)
1
回帰
残差 (分散分析)
合計 (ピボットテーブル)
自由度
17.403
1
17.403
998.897
28
35.675
1016.300
29
a. 予測値: (定数)、一人当たり年間ビール消費量。
b. 従属変数 平均寿命
平均平方
F 値
.488
有意確率
.491a
・散布図:データは散在
(→相関は見受けられない)
・相関係数:ごくわずかだが正の相関
・決定係数:0.017
・有意確率:有意確率>α(=0.05)
(→帰無仮説は棄却されない)
予想:気温(高)→消費量(増)
結果:予想とは逆の弱い負の相関
なぜ予想とは逆の結果が出たのか?
→独立変数(気温)の取り方?
年平均ではなく夏場の最も暑い時期の1カ月間のデー
タを使えば違った分析結果が期待できる
予想:ビールの消費量(増)
→たばこの消費量(増)
結果:弱い正の相関
しかし、データは散在している。
データを2つのグループに分
ければ、よりはっきりした相
関や地域による特徴・性質等
がわかるかもしれない。
予想:ビールの消費量(増)→平均寿命(低)
(→負の相関があると予想)
結果:弱い正の相関
この結果をみるとビールの消費量が平均寿命を説明で
きるとはいえない。ただ、別のアルコール飲料やアル
コール飲料全般の消費量を変数に取ったら違った分
析結果が出る可能性もある。
■より大きな標本を用いての分析
■変数の取り方に工夫が必要
ex)気温:年平均→夏場の1カ月間の平均
■信頼できるデータの使用
今回たばこの消費量に関するデータはWikipediaの
データを使用
→統計局や省庁、調査機関のデータの使用