時系列データの分析

時系列データの分析
経営統計の補足資料
2015年7月13日
金沢学院大学経営情報学部
藤本祥二
§3.1(教科書P.132)
時系列データ
時系列データの分析
• 時系列データ
時間に沿って観測されるデータ(等間隔時間が理想)
• 変化に注目する
– 長期的な傾向(トレンド)
右肩上がり(上昇トレンド),右肩下がり(下降トレンド)
– 周期性
年周期,四半期周期,曜日周期,日周期
– ノイズ
不規則な変化
• 様々な加工で上記の変化が分かりやすくなる
移動平均,指数,成長率,等々
図3.1.1 日本の人口の推移
日本の人口推移
140
120
100
80
60
40
20
2000
1990
1980
1970
1960
1950
1940
1930
0
1920
人口
55,963,053
64,450,005
72,500,581
83,199,637
94,301,623
104,665,171
117,060,396
123,611,167
126,925,843
百万
年
1920
1930
1940
1950
1960
1970
1980
1990
2000
図3.1.2 横軸は等間隔にする
食糧生産量の推移
食糧生産量の推移
昭和60年
62年
64年
平成2年
4年
6年
8年
10年
12年
14年
15年
14年
13年
12年
7年
平成2年
40
35
30
25
20
15
10
5
0
昭和60年
40
35
30
25
20
15
10
5
0
ソーセージ
レトルト食品
ソーセージ
レトルト食品
水産缶びん詰
果物缶びん詰
水産缶びん詰
果物缶びん詰
↑間違い例:5年幅と1年幅の横軸が
混ざっている為,折れ線の傾きが比較できない
↑横軸を1年間隔に揃えると
傾きの印象は全然違う
図3.1.3上昇トレンドの例
ようかんの価格の推移
120
平成22年(2010年)基準消費者物価指数
100
80
60
40
上昇トレンド
(右肩上がり)
20
70
72
74
76
78
80
82
84
86
88
90
92
94
96
98
2000
2
4
6
8
10
12
14
0
平成22年基準消費者物価指数>長期時系列データ>品目別価格指数>全国>年平均
http://www.e-stat.go.jp/SG1/estat/List.do?bid=000001033700&cycode=0
品目別価格指数(1970年~最新年) >総合~チューインガム(含類総連番001~197)
図3.1.4下降トレンドの例
えのきだけの価格の推移
平成22年(2010年)基準消費者物価指数
下降トレンド
(右肩下がり)
90
91
92
93
94
95
96
97
98
99
2000
1
2
3
4
5
6
7
8
9
10
11
12
13
14
200
180
160
140
120
100
80
60
40
20
0
平成22年基準消費者物価指数>長期時系列データ>品目別価格指数>全国>年平均
http://www.e-stat.go.jp/SG1/estat/List.do?bid=000001033700&cycode=0
品目別価格指数(1970年~最新年) >総合~チューインガム(含類総連番001~197)
§3.2(教科書P.138)
移動平均
表3.2.1 移動平均
おにぎりの
販売個数
1日
5563
2日
5550
3日
おにぎりの
販売個数
3日移動平均
(中央移動平均)
3日移動平均
(後方移動平均)
1日
5563
5554
2日
5550
5550
5529
3日
5550
5554
4日
5488
5517
4日
5488
5529
5日
5513
5484
5日
5513
5517
6日
5450
5471
6日
5450
5484
7日
5450
5446
7日
5450
5471
8日
5438
5450
8日
5438
5446
9日
5463
5450
9日
5463
5450
10日
5450
10日
5450
5450
前後の3日の平均
手前の3日の平均
移動平均の目的
なめ
へいかつ
• データを滑らかにする(平滑化)
– 平均を取ることで細かな上下動を打ち消して
トレンドを読みやすくする
なら
• 周期性を均す
– 季節周期の平滑化
12ヶ月移動平均を取ることで季節による周期を均す
– 曜日周期の平滑化
7日移動平均を取ることで曜日の周期を均す
– 日周変動の平滑化
24時間移動平均を取ることで1日の周期を均す
例題3と図3.3.2
[℃]
東京都の年平均気温
18
17
16
15
14
13
移動平均を取ることでデータの変動が滑らかになり,長期トレンドが分かりやすくなる
12
1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 1990 2000 2010
1年ごとのデータ
5年移動平均
10年移動平均
データソース:気象庁
http://www.data.jma.go.jp/obd/stats/etrn/view/annually_s.php?prec_no=44&block_no=47662&year=&month=&day=&view=a2
季節周期を均す
日本全国の軽自動車販売台数の推移
[台]
350000
300000
250000
200000
150000
100000
50000
0
月ごとのデータ
7月
2014年 1月
7月
2013年 1月
7月
2012年 1月
7月
2011年 1月
7月
2010年 1月
7月
2009年 1月
7月
2008年 1月
7月
2007年 1月
毎年3月に販売台数が多くなる季節周期がある
12ヶ月移動平均
12ヶ月移動平均を取ることで季節周期を均した比較ができる
(2011年の落ち込みなどが見やすくなる)
データソース:日本自動車販売協会連合会
http://www.jada.or.jp/contents/data/index09.html
§3.3(教科書P.140)
指数・成長率
指数
• 指数(index):「基準量を100とすると,比較量はいくつ
になるか?」
棒の長さでのイメージ
比較量 指数
=
基準量 100
両辺に100を掛けると
比較量
指数 =
× 100
基準量
比較量
基準量
比率を変えないように
両方を拡大(縮小)して
基準量を100に調整する
指数
100
• 指数にすることで通常は比較が難しいものを比較できる
• 基準量は日常よく使う大きさの数値である100にする
ベキ乗を表す23 の肩の3なども指数と言いますがここでの指数とは別物です.
日本語では同じ字を当ててますが英語ではexponentと言います.
増加率と成長率
• 増加量(値がマイナスなら減少量)
「比較量は基準量からどれくらい増えてるのか?」
増加量 = 比較量 − 基準量
• 増加率
「増加量は基準量の何倍(何割)か?」
増加量
増加率 =
基準量
比較量 − 基準量
=
基準量
• 時系列データの増加率を成長率という
基準量の方が大きいときは
増加量はマイナスになる
棒の長さでのイメージ
比較量
増加量
基準量
緑の棒は赤の棒の
何倍(何割)か?
増加率の例1
• 例1)20,000円のバッグがバーゲンセールで
16,000円になりました.値下げ前を基準にす
ると値下げ後の増加率はいくつ?
16000 − 20000 −4000
増加率 =
=
= −0.2
20000
20000
増加率は−0.2 (2割引き,20%引き)
増加率の例2
• 例2)20,000円のバッグに消費税がかかって
21,600円になりました.増加率はいくつ?
21600 − 20000
1600
2
増加率 =
=
=
20000
20000 25
= 0.08
増加率は0.08 (8%増し,消費税は8%)
増加率の例3
• Y野屋では牛皿並盛85g(330円),特盛170g
(580円)である.並盛を基準にして特盛の重
さと値段の増加率を計算する.
– 重さの増加率
170 − 85 85
=
= 1.0
85
85
– 値段の増加率
580 − 330 250
=
= 0. 75 ≒ 0.76
330
330
– 特盛は24%程お得(並盛2つ頼むなら特盛1つ)
表3.3.1 に成長率を加えた表
年
人口
[単位:人]
指数
1920年基準
10年
成長率
100.0
10年前のデータがない
から計算できない
64,450,005
115.2
15.2%
1940
72,500,581
129.6
12.5%
1950
83,199,637
148.7
14.8%
1960
94,301,623
168.5
13.3%
1970
104,665,171
187.0
11.0%
1980
117,060,396
209.0
11.8%
1990
123,611,167
220.9
5.6%
2000
126,925,843
226.8
2.7%
1920
55,963,053
1930
基準年の指数は
必ず100
その年の人口を基準年の人口で割って100掛ける
基準年の人口を100とした時のその年の人口がいくつになるか
10年前を基準にした時の
増加率が10年成長率
1930の人口 − 1920の人口
1920の人口
1960の人口 − 1950の人口
1950の人口
2000の人口 − 1990の人口
1990の人口
83199637
× 100 ≒ 148.7
55963053
表3.3.2 年齢区分別人口の推移
年
1920
1930
1940
1950
1960
1970
1980
1990
2000
15歳未満
20,416,202
23,579,265
26,134,865
29,428,039
28,434,159
25,152,779
27,507,078
22,486,239
18,472,499
15~64歳
32,605,495
37,806,865
42,950,762
49,657,761
60,469,355
72,119,100
78,834,599
85,903,976
86,219,631
65歳以上
2,941,356
3,063,875
3,413,996
4,109,167
5,395,377
7,388,612
10,647,356
14,894,595
22,005,152
図3.3.1 年齢区分別人口の推移
100,000,000
90,000,000
80,000,000
70,000,000
60,000,000
50,000,000
40,000,000
30,000,000
20,000,000
10,000,000
0
1920
1930
1940
15歳未満
1950
1960
15~64歳
1970
1980
1990
2000
65歳以上
各年齢区分のボリューム(全体の大きさ)が違うので比較が難しい
表3.3.3 (表3.3.2を指数化)
年
1920
1930
1940
1950
1960
1970
1980
1990
2000
15歳未満
100.0
115.5
128.0
144.1
139.3
123.2
134.7
110.1
90.5
15~64歳
100.0
116.0
131.7
152.3
185.5
221.2
241.8
263.5
264.4
65歳以上
100.0
104.2
116.1
139.7
183.4
251.2
362.0
506.4
748.1
1920年を
基準に
指数化
図3.3.1 年齢区分別人口の推移
800
700
600
500
400
300
200
100
0
1920
1930
1940
1950
15歳未満
1960
15~64歳
1970
1980
1990
2000
65歳以上
指数にして基準を100に揃えることで,元データでは分かり難かった65歳以上の伸びが見える
表3.3.4 (表3.3.2の成長率)
年
1920
1930
1940
1950
1960
1970
1980
1990
2000
15歳未満
15~64歳
65歳以上
15.5%
10.8%
16.0%
13.6%
4.2%
11.4%
12.6%
-3.4%
-11.5%
9.4%
-18.3%
-17.8%
15.6%
21.8%
19.3%
9.3%
9.0%
0.4%
20.4%
31.3%
36.9%
44.1%
39.9%
47.7%
10年毎に
何%増加
してるか
図3.3.1 年齢区分別人口の
10年成長率
50%
30%
10%
0%
-10%
-30%
-50%
1920
1930
1940
1950
15歳未満
1960
15~64歳
1970
1980
1990
2000
65歳以上
15歳未満はマイナス成長があること,65歳以上は年々成長率が上がってることが分かる