第7章 時系列データの季節調整 ー 経済統計 ー この章の内容 Ⅰ 時系列データとは a) データの種類 b) 時系列データの特性 Ⅱ 古典的時系列分析 a) b) c) d) 時系列データの成分 トレンドの抽出 季節変動の抽出 季節調整法の実際 <おもなポイント> •季節性を含むデータの簡単な分 析法である、前年同期比はどのよう な方法で、どのような問題点がある のか。 •古典的時系列分析において、トレ ンドの抽出、季節変動の抽出はど のような方法があるのか。 など Ⅰ 時系列データとは a) データの種類 時系列データ • データを時間の順序に並べたもの • 過去の変動から現状を把握し、将来を予測するなどの目的に用 いられる (例)年次データ、四半期データ、月次データ、日次データ ※ 四半期データ - 1年を1月~3月、4月~6月、7月~9月、10月~12月の4つ に分けたもので、それぞれを第Ⅰ四半期、第Ⅱ四半期、第Ⅲ四半期、第Ⅳ四半 期という。 クロスセクションデータ • 1時点において何らかの属性に関してならべたデータ • 地域差などの現状把握に用いられる (例)都道府県別データ、収入階級別データ <時系列データとクロスセクションデータ> (例) 交通事故死亡者数の推移(中国地方5県) (データ出典: 警察庁「交通事故死者数について」) (単位:人) 年 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 鳥取県 61 79 61 51 45 39 34 30 37 42 島根県 72 73 74 47 69 46 42 42 33 31 岡山県 190 169 175 159 148 144 115 114 107 109 広島県 251 202 187 189 187 165 132 128 142 127 鳥取県の交通事故死亡者数の年次推移 → 時系列データ 2010年の県別交通事故死亡者数 → クロスセクションデータ 山口県 152 141 129 106 116 108 115 91 108 96 b) 時系列データの特性 時系列データを用いた分析をおこなうとき、分析者はど のような間隔のデータを用いるかを選ぶ必要がある。 (例1) 年次データ 実質GDP (10億円) (例2) 日次データ 実質GDPの推移 東証株価(日経225種平均・終値) (2010年8月-11月) 株価指数(円) 600,000 10500 550,000 10000 500,000 9500 450,000 9000 400,000 暦年 日本経済の長期的な変動をみるとき → 実質GDPの年次データなどの比 較的間隔の長いデータを用いる 11/29 11/22 11/15 11/8 11/1 9/6 10/25 2004 10/18 2001 10/11 1998 10/4 1995 9/27 1992 9/20 1989 9/13 1986 8/30 1983 8/23 1980 8/16 8/2 300,000 8/9 8500 350,000 日付 株価などの変動の激しいデータを分析 するとき → 日次データなどの比較 的間隔の短いデータを用いる ※ 最近では秒次データの分析なども試み られている 分析にどのようなデータを用いるかは、分析の目的だけで なく、調査や集計・公表の間隔に依存する。 たとえば、もし次のようなデータが分析に必要であっても、 存在しないため利用することはできない。 • GDPの月次データ - 四半期ごとのデータしか集計 されていない。 • 毎週の失業率のデータ - 『労働力調査』は毎月末 1週間の就業状態を調査するものであり、毎週の失業 率は調査されていない。 <時系列データ分析のはじめの一歩> 前期のデータと比べ、どの程度の増減があったか(対前 期比)を調べることが、時系列データにおいて最初におこ なうことである。(年次データなら前年、日次データなら前 日と比べる) (例)ある商店の売上が次のようであった。 2009年 2010年 500万円 600万円 この商店の2010年の売上は2009年を100としたとき、 120となる。 「この商店の2010年の売上は対前期比(この場合は対前 年比)20%増」 対前期比は四半期データや月次データに用いるとき、注 意が必要 → データが季節による変動(季節変動、季節性などとい う)をもつ場合には誤った結論をみちびくおそれがある。 売上高(100億円) 百貨店売上高の推移 340 320 300 280 260 240 19 96 Ⅰ 19 96 Ⅲ 19 97 Ⅰ 19 97 Ⅲ 19 98 Ⅰ 19 98 Ⅲ 19 99 Ⅰ 19 99 Ⅲ 20 00 Ⅰ 20 00 Ⅲ 20 01 Ⅰ 20 01 Ⅲ 220 年・ 四半期 データ出典: 経済産業省『商業動態統計』 2001年の第Ⅰ四半期は2000年の第Ⅳ四半期に比べて 売上が落ちている →百貨店は毎年第Ⅳ四半期の売上 が良い(「歳末商戦」といわれる) <季節性を含むデータの簡単な分析> 前年同期比を用いる。前年同期比は、前年の同じ時期を 100としたとき、今期がどれぐらいの大きさとなるかをあら 今期のデータ わしたものである。 四半期データの場合 yt yt 4 100 前年の同じ時期のデータ 売上高(100億円) 百貨店売上高の推移 340 320 300 280 260 240 19 96 Ⅰ 19 96 Ⅲ 19 97 Ⅰ 19 97 Ⅲ 19 98 Ⅰ 19 98 Ⅲ 19 99 Ⅰ 19 99 Ⅲ 20 00 Ⅰ 20 00 Ⅲ 20 01 Ⅰ 20 01 Ⅲ 220 年・ 四半期 (例) 2001年第Ⅰ四半期のデータであれば、2000年第Ⅰ四半期のデータと比較する。 月次データの場合 今月のデータ yt 100 yt 12 前年の同じ月のデータ これは前年同月比ともいわれる。 課税移出数量 (kl) 450000 400000 350000 300000 250000 200000 150000 100000 50000 0 2007年01月 ビール国内課税移出数量 (ビール酒造組合調べ) 2008年01月 2009年01月 データ出典: ビール酒造組合『月別ビール課税移出数量(会員5社)』 (例) 2009年12月のデータであれば、2008年12月のデータと比較する。 <前年同期比の問題点> 1. 不規則変動の影響 ある期のデータが平年と異なった値をとったとき、前年同期比は影響をう ける。 (例)1997年の第Ⅰ四半期(第Ⅱ四半期も同様) 売上高 (100億円) 百貨店売上高の推移 (商業販売年報より作成) 百貨店売上高の推移(前年同期比) 前年同期比 (前年=100) 110 340 109.7 320 105 年・ 四半期 1997年第Ⅰ四半期が平年より高い値をとったので • 1997年第Ⅰ四半期の前年同期比は通常より高めになる。 • 1998年第Ⅰ四半期は、反対に通常より低めになる。 この場合は、1997年第Ⅱ四半期も平年より低い値をとったので • 1997年第Ⅱ四半期の前年同期比は通常より低めになる。 • 1998年第Ⅱ四半期は、反対に通常より高めになる。 2000Ⅳ 97.1 96.3 97.3 2000Ⅲ 91.1 1998Ⅰ 1997Ⅳ 1997Ⅲ 1997Ⅰ 1997Ⅱ 1996Ⅳ 1996Ⅲ 1996Ⅱ 19 95 Ⅰ 19 95 Ⅲ 19 96 Ⅰ 19 96 Ⅲ 19 97 Ⅰ 19 97 Ⅲ 19 98 Ⅰ 19 98 Ⅲ 19 99 Ⅰ 19 99 Ⅲ 20 00 Ⅰ 20 00 Ⅲ 年・ 四半期 1996Ⅰ 90 220 98.4 2000Ⅱ 95.0 97.2 96.897.1 2000Ⅰ 240 96.2 95.3 95.7 1999Ⅲ 1999Ⅳ 95 1999Ⅱ 260 101.6 100.0 98.5 1999Ⅰ 280 104.0 102.0 101.9 100.0 1998Ⅳ 100 1998Ⅱ 1998Ⅲ 300 2. タイミングの問題 経済時系列データは景気変動などにより、循環的な変動をすることがある。 (詳しくは後述) 景気判断をおこなう場合などには、「どこが底か」を知りたいのであるが、 前年同期比にはタイミングのずれがある。 仮想データとその前年同月比 102 原系列 前年同月比 100 98 1月 4月 7月 10月 1月 4月 7月 10月 1月 4月 この仮想の月次データについて前年同月比を取ると、転換点から若 干の遅れが出るのがわかる。 そのため、データから季節性のみをとり除くための方法が必要となる。 ⇒ その方法は季節調整法といわれる方法で、古典的時系列分析の 応用例の1つである。 Ⅱ 古典的時系列分析 a) 時系列データの成分 時系列データは次の4つ成分が組み合わさってできたも のと想定する。 1.トレンド(Trend) 経済成長などの長期的な変動 2.サイクル(Cycle) 景気循環などの周期的な変動 3.季節変動(Seasonal variation) 季節による変動 4.不規則変動(Irregular variation) 上の3つに含まれない変動 ただし、これらの成分は実際に観測できるものではなく、 あくまで仮定の話である。 1996Ⅰ 1997Ⅰ 1998Ⅰ 1999Ⅰ 1997Ⅰ 1998Ⅰ 1999Ⅰ 1991Ⅰ 1990Ⅰ 1989Ⅰ 1988Ⅰ 1995Ⅰ -1.5 1996Ⅰ -1 1994Ⅰ 0 1995Ⅰ -0.5 1993Ⅰ 0.5 1994Ⅰ 1 1992Ⅰ 1.5 1993Ⅰ 不規則変動 1992Ⅰ 1991Ⅰ 1990Ⅰ 1989Ⅰ 1987Ⅰ 1986Ⅰ 1985Ⅰ 1984Ⅰ 1983Ⅰ 1982Ⅰ 1981Ⅰ トレンド 1988Ⅰ 季節変動 1987Ⅰ 1986Ⅰ 1985Ⅰ 1984Ⅰ 1983Ⅰ 1982Ⅰ 1 0.8 0.6 0.4 0.2 0 -0.2 -0.4 -0.6 -0.8 -1 1980Ⅰ 16 14 12 10 8 6 4 2 0 1981Ⅰ 1999Ⅰ 1998Ⅰ 1997Ⅰ 1996Ⅰ 1995Ⅰ 1994Ⅰ 1993Ⅰ 1992Ⅰ 1991Ⅰ 1990Ⅰ 1989Ⅰ 1988Ⅰ 1987Ⅰ 1986Ⅰ 1985Ⅰ 1984Ⅰ 1983Ⅰ 1982Ⅰ 1981Ⅰ 19 80 19 Ⅰ 81 19 Ⅰ 82 19 Ⅰ 83 19 Ⅰ 84 Ⅰ 19 85 19 Ⅰ 86 19 Ⅰ 87 19 Ⅰ 88 Ⅰ 19 89 19 Ⅰ 90 19 Ⅰ 91 19 Ⅰ 92 19 Ⅰ 93 19 Ⅰ 94 19 Ⅰ 95 19 Ⅰ 96 Ⅰ 19 97 19 Ⅰ 98 19 Ⅰ 99 Ⅰ 右のデータは時系列データ についての仮想例である。 この例は下のような4つの成 分を加えたものである。 1980Ⅰ 1999Ⅰ 1998Ⅰ 1997Ⅰ 1996Ⅰ 1995Ⅰ 1994Ⅰ 1993Ⅰ 1992Ⅰ 1991Ⅰ 1990Ⅰ 1989Ⅰ 1988Ⅰ 1987Ⅰ 1986Ⅰ 1985Ⅰ 1984Ⅰ 1983Ⅰ 1982Ⅰ 1981Ⅰ 1980Ⅰ 1980Ⅰ 時系列データの仮想例 18 16 14 12 10 8 6 4 2 0 原系列 トレンド+サイクル トレンド+サイクル+季節変動 年・四半期 サイクル 0.6 0.4 0.2 0 -0.2 -0.4 -0.6 0.4 1998Ⅰ 1999Ⅰ 1999Ⅰ 1999Ⅰ 1998Ⅰ 1997Ⅰ 1996Ⅰ 1995Ⅰ 1994Ⅰ 1993Ⅰ 1992Ⅰ 1991Ⅰ 1990Ⅰ 1989Ⅰ 1988Ⅰ 1987Ⅰ 1986Ⅰ 1985Ⅰ 1984Ⅰ 1983Ⅰ 1982Ⅰ 16 14 12 10 8 6 4 2 0 1981Ⅰ 1997Ⅰ 1993Ⅰ 1992Ⅰ 1991Ⅰ 1990Ⅰ 1989Ⅰ 1988Ⅰ 1987Ⅰ 1986Ⅰ 1985Ⅰ 1984Ⅰ 1983Ⅰ 1982Ⅰ 1981Ⅰ 1980Ⅰ 1998Ⅰ -0.6 1996Ⅰ -0.4 1997Ⅰ 0 1995Ⅰ -0.2 1996Ⅰ 0.2 1995Ⅰ 1980Ⅰ 0.6 1994Ⅰ サイクル 1994Ⅰ 1993Ⅰ 1992Ⅰ 1991Ⅰ 1990Ⅰ 1989Ⅰ 1988Ⅰ 1987Ⅰ 1986Ⅰ 1985Ⅰ 1984Ⅰ 1983Ⅰ 1982Ⅰ 1981Ⅰ 1980Ⅰ トレンド、サイクル 1990年頃までの日本の経済データの多くは、周期的な上昇下降をくり 返しながら、右上がりの傾向を示している。(実質GDPのグラフを参照) これは、トレンドとサイクルが組み合わさったものと考えられる。 トレンド トレンド+サイクル 16 14 12 10 8 6 4 2 0 不規則変動 不規則変動は2種類のものを含んでいる。 1.比較的小さなランダムな変動 2.戦争、天災、制度の変更などによる突発的な変動 (例) 百貨店売上高 1997年4月に消費税が3%から5%に引き上げられ た。 → この年の第Ⅰ四半期に「駆け込み需要」、第Ⅱ四 半期に「買い控え」の傾向がみられる これは不規則変動の2番目の種類である。 時系列データの4つの成分は直接観測することはできな い どのように組み合わさっているかは分からない → モデルを仮定する (1) 加法モデル yt=Tt+Ct+St+It (2) 乗法モデル yt=Tt×Ct×St×It 季節調整法 原系列から季節変動Stをとり除くこと。 加法モデルを仮定した場合は yt-St 、乗法モデルを仮定 した場合には yt/St が季節調整値(季節調整済み系列 ともいう)となる。季節調整値をもとめるには、 1.トレンドTCtをとり除く 2.不規則変動Itをとり除く 3.このようにしてもとめた季節変動Stを原系列ytからとり除く yt SIt TCt St It yt-St または yt/St b) トレンドの抽出 系列の小さな変動を考えない大局的な変動をトレンドと 考える。 TtとCtを分離することは困難なので、この2つをあわせた ものを、トレンドとよび、TCtであらわす。 トレンドを抽出するには • トレンドに特定の形を想定する方法 • トレンドに特定の形を想定しない方法 がある。 <トレンドに特定の形を想定する方法> • トレンドに直線や3次曲線、指数曲線などの特定の関 数形を想定するもの。 (例) yt = α + βt + ut • 回帰分析などの手法を用いてもとめた、 α + βt の 推定値がトレンド <長所>将来のトレンドの予測値をもとめる場合、t+1, t+2… を代入すればよい <短所>どのような関数形を用いるかに、分析者の判 断が必要(1次式と2次式のどちらが良いのか など) <トレンドに特定の形を想定しない方法> • 代表的なものに移動平均法を用いる方法がある。 • 移動平均法はその期と前後k期の値の平均を、1期ず つ移動しながら平均する手法であり、k=1とするなら、 3項移動平均である。 • 移動平均には系列の大幅な上下変動を「ならす」効果 がある。 下の表のようなデータ(仮想データ)について3項移動平 均をとると、変動の幅は小さくなる。 1990 126 1991 106 1992 101 111 105 1993 108 1994 103 1995 111 1996 101 1997 106 104 107.33 105 106 94 原系列と3項移動平均 130 120 110 100 90 80 70 原系列 3項移動平均 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 1998 75 96 1999 107 移動平均をとることによって、変動の激しいデータの大局 的な動きを見ることができる。 たとえば、株価の変動などは移動平均をとることによって、 今後のトレンドの予想をおこなう。 ※ ただし、株価の変動の分析に用いられる移動平均は後方移動平均(その期 以前の移動平均をおこなうこと)であることが多い。 日経平均株価 出典: Yahooサイトより 四半期データの場合、移動平均としては4項移動平均を とる。 ← すべての季節の影響を「ならす」ため 移動平均の項数が偶数の場合、どの期に対応するデー タか判断することが困難である。 → 中心化系列の利用 年・ 四半期 原系列 1996Ⅰ 1996Ⅱ 1996Ⅲ 1996Ⅳ 1997Ⅰ 1997Ⅱ 257 258 263 326 282 245 4項移動平均 中心化系列 276 282.25 279 279.125 280.625 1996年第Ⅲ四半期の中心化系列は前後同数の期の影 響を受けている。 中心化4項移動平均によって、第m期のデータは次のよ うにもとめられる。 y y y y 1 y y y y yˆ m ( m2 m1 m m1 m1 m m1 m2 ) 2 4 4 1 1 ( ym2 ym1 ym ym1 ym2 ) 2 2 4 また、乗法モデルの場合は対数をとって log yt log Tt log Ct log St log It とし、加法モデルと同じように移動平均をおこなえばよい。 (実際には乗法モデルを仮定した場合でも、対数変換せずに移動平 均をおこなっていることが多い。これは、対数変換したものと、しない ものとの差があまり大きくないことによる) c) 季節変動の抽出 原系列ytからトレンドTCtを取り除いたものは、系列SItと なる。このSItからItを取り除けば、季節変動Stが抽出さ れる。 季節変動を抽出する場合、季節変動についての仮定が 必要となる。 季節変動は次の2つに分けられる • 固定型季節変動 • 可変型季節変動 <固定型季節変動> • 季節変動が全期間を通して一定と仮定したもの。 • SIt系列を各期ごとに平均したものは、固定型季節変 動の一例である。 <欠点>トレンドの増大とともに季節変動の幅が大きく なるような系列に固定型季節変動を仮定すると、トレ ンドの水準が低いときに季節変動を余分に取りすぎ、 トレンドの水準が高くなると不足するということになる。 <可変型季節変動> • 季節変動が時間とともに変化すると仮定したもの。 • 移動平均法を用いたものが可変型季節変動の一例で ある。 • たとえば、各期のSIt系列に3項移動平均を2回繰り返 すことなどが考えられる。 <移動平均を繰り返す方法の欠点> ⇒ 末端のデータが欠損してしまうこと 何らかの加重平均を用いて補う必要がある。 あるxtという系列に3項移動平均を取ると xt 1 xt xt 1 xˆt 3 となる。これを2回繰り返すと ˆxˆ xˆt 1 xˆt xˆt 1 t 3 xt 2 xt 1 xt xt 1 xt xt 1 xt xt 1 xt 2 3 3 3 3 xt 2 2xt 1 3xt 2xt 1 xt 2 9 となり、各期のウエイトが異なる加重移動平均をおこ なうことに等しい。 d) 季節調整法の実際 現在日本の官庁統計で多く用いられているものは、セン サス局法Ⅱである。 センサス局法は移動平均法をもとに発展したもの。 現在はX-12-ARIMAというバージョンのプログラムが開 発されて、これが広く用いられている。 移動平均法に確率的時系列モデルを組み合わせたもの X-12-ARIMAの手順 X-12-ARIMAは3つのパートから成り立っている。 regARIMAによる事前調整パート (異常値や曜日変動などをとり除く) X-11による移動平均パート (季節調整法のメイン) 事後診断パート X-11のデフォルトの計算方法の概略は次のよう になる。 <第1段階> (1) 原系列に中心化12か月移動平均をおこない、初期ト レンドTCt(1)とする。 (2) 原系列ytをTCt(1)で割ることによって初期のSIt(1)を求 める。 (3) SIt(1)について各月別に3×3移動平均(3項移動平均 した系列に、さらに3項移動平均をおこなう)をおこない、 暫定のS^t(1)を求める。 (4) 暫定のS^t(1)をS^t(1)の中心化12項移動平均で割った ものを初期季節変動St(1)とする。 (5) 原系列をSt(1)で割ることによって、初期の季節調整済 み系列TCIt(1)を求める。 <第2段階> (1) TCIt(1)にHenderson の移動平均(どのような移動平均 項数をとっても、ほぼ3次曲線を再現できるもの)を適 用して中間のトレンドTCt(2)をもとめる。 (2) 原系列ytをTCt(2)で割ることによってSIt(2)を求める。 (3) SIt(2)について各月別に3×5移動平均(3項移動平均 した系列に、さらに5項移動平均をおこなう)をおこない、 暫定のS^t(2)を求める。 (4) 暫定のS^t(2)をS^t(2)の中心化12項移動平均で割った ものをSt(2)とする。これが最終的な季節変動である。 (5) 原系列をSt(2)で割ることによって、季節調整済み系列 TCIt(2)を求める。 <第3段階> (1) TCIt(2)にHenderson の移動平均を適用して最終的な トレンドTCt(3)をもとめる。 (2) TCIt(2) をTCt(3) で割ったものが最終的な不規則変動 It(3) である。
© Copyright 2024 ExpyDoc