ダウンロード - Researchmap

東大社研パネル調査
研究成果報告会2015
パネルデータで個人の変化を追跡する
中澤 渉
(大阪大学)
2015/2/27
1
パネルデータ分析を行うメリット
• 観察できない異質性(unobserved heterogeneity)の
影響を取り除いた回帰係数の推定。
→より正確な「因果効果」の推定に寄与
• 個人内(within)変動と個人間(between)変動の区
別を可能とする。
• 個人そのものに焦点をあてて、その変動を観察でき
る(本発表の焦点)。
以上、山口(2004)、中澤(2012)、三輪(2013)などを
参照。
2015/2/27
2
個人の追跡の重要性
• パネル調査のメリットは、何より同一個人内の変化を追うこと
ができること。
• 単純な横断調査の分布だけではわからない情報がある
①同じものをカウントしているつもりでも、該当者の構成員
はかなり入れ替わっている可能性がある。
②変動の激しい人とそうでない人がいる。
wave1
ID1
ID2
ID3
ID4
ID5
ID6
ID7
ID8
ID9
ID10
濃灰の率
2015/2/27
wave2
50%
wave3
50%
wave4
60%
wave5
50%
wave6
50%
wave7
40%
wave8
50%
60%
3
潜在混合分布モデル(latent mixture model)
• 個人内変化のパターンを決める何らかの潜在変数を仮定し、
変動のパターンの類型を導き出す。→変動を起こすものが質
的変数であれば、一種の潜在クラス分析
• 変動を起こす変数が量的変数であれば、典型的な変化の軌
跡を導くことになる(基本的に発想は同じで、典型的な軌跡を
抽出するのが目的。混合軌跡モデリングとか潜在軌跡モデ
リングとよばれる)。D’Unger et al (1998)など。
• 導かれたクラス(類型)を従属変数とし、それぞれのクラスの
特徴を(ある種の)独立変数で説明することが可能。また逆
にクラスを独立変数にして、特定の従属変数を説明すること
もできるが、今回は前者のみ扱う(竹田 2014; Collins and
Lanza, 2010 chap.6; Yamaguchi 2008; 2000)。
2015/2/27
4
注目する変数
• 現在のあなたの暮らしむきは、この中のどれ
にあたるでしょうか。
1
豊か
2
やや豊か
3
ふつう
4
やや貧しい
5
貧しい
• 収入に代わる経済的地位の指標として、特に回顧調査で使用。
• 主観的な判断を伴う変数ともいえる(が、回答者の生活実感を反映)。
• 順序尺度のカテゴリー変数。ただし5段階だと、潜在クラスを発見するに
は細かすぎる。
2015/2/27
5
変数の処理
• 5段階を3段階(豊か・ふつう・貧しい)の3カテゴリーに変換。
「やや」がつくかつかないかの判断は恣意的で個人差が大き
いと判断し、より単純なカテゴリー区分にする。
• 自分の(主観的な)暮らしの評価の変動のパターンと、その
違いを生む変数(いずれも質的変数)を検討する。
①性別(男、女)
②出生コーホート(1966-75生まれ、1976-85生まれ)
③学歴(中学・高校、専門・短大、大学・大学院)
④wave1時点での就業上の地位(正規・自営・家族vs非正規・無職)
※wave1時点で学生の場合は正規・自営・家族に含める。
⑤15歳時の暮らしむき(貧しい、それ以外)
• 分析にはM-plus (ver.7.3)を使用。
2015/2/27
6
各年度暮らし向き変数の分布
豊か
0.1668
0.6156
0.2176
2007年
2015/2/27
普通
貧しい
0.1672
0.1893
0.1884
0.1668
0.1672
0.1735
0.1635
0.6593
0.6165
0.5869
0.6248
0.6327
0.651
0.6344
0.1735
0.1943
0.2246
0.2084
0.2001
0.1755
0.2022
2008年
2009年
2010年
2011年
2012年
2013年
2014年
7
モデル選択
2クラス
3クラス
4クラス
5クラス
6クラス
7クラス
8クラス
9クラス
2015/2/27
BIC
AIC
d.f.
29653.888
29462.987
25800.917
25511.673
25519.528
25131.940
25297.288
24811.357
25248.407
24664.133
25231.186
24548.569
25292.140
24511.180
25359.385
24480.082
6497
6476
6462
6448
6432
6419
6402
6392
χ2
G2
G2 の差
224538.729
6363.329 --5015.621
2343.436
4019.893
3996.169
1980.646
362.790
3375.449
1665.135
315.511
3091.050
1512.400
152.735
2924.110
1411.760
100.640
2809.345
1345.216
66.544
2929.445
1365.172
-19.956
8
8クラスの内訳
クラス2 豊か→普通下降型 11.4%
クラス1 普通安定型 39.3%
クラス3 貧しい安定型 10.9%
クラス4 豊か安定型 10.6%
100%
100%
100%
100%
90%
90%
90%
90%
80%
80%
80%
80%
70%
70%
70%
70%
60%
60%
60%
60%
50%
50%
50%
50%
40%
40%
40%
40%
30%
30%
30%
30%
20%
20%
20%
20%
10%
10%
10%
10%
0%
0%
0%
0%
豊か
普通
貧しい
豊か
クラス5 普通→貧しい下降型 10.1%
普通
貧しい
クラス6 普通→豊か上昇型 8.7%
豊か
普通
貧しい
豊か
クラス7 貧しい→普通上昇型 5.8%
100%
100%
100%
90%
90%
90%
90%
80%
80%
80%
80%
70%
70%
70%
70%
60%
60%
60%
60%
50%
50%
50%
50%
40%
40%
40%
40%
30%
30%
30%
30%
20%
20%
20%
20%
10%
10%
10%
10%
0%
0%
0%
0%
普通
2015/2/27
貧しい
豊か
普通
貧しい
豊か
普通
貧しい
貧しい
クラス8 急上昇型 3.2%
100%
豊か
普通
豊か
普通
貧しい
9
8クラスの構成比率
各クラスの分布(N=2401)
貧しい→普通上昇
6%
急上昇
3%
普通→豊か上昇
9%
普通安定
39%
普通→貧しい下降
10%
豊か安定
11%
貧しい安定
11%
豊か→普通下降
11%
Entropy = 0.811
2015/2/27
10
潜在クラス多項ロジット
基準=普通安定型
性別(1=男性、0=女性)
出生年(1=1966~75, 0=76~85)
専門・短大(vs 中学・高校)
大学・大学院(vs 中学・高校)
wave1での従業上の地位
(1=非正規・無職、0=正規・自営家族)
15歳時暮らし向き
(1=貧しい、0=それ以外)
+ <.10 *<.05 **<.01 ()内は標準誤差
2015/2/27
豊か→普通 貧しい安定
豊か安定 普通→貧しい 普通→豊か 貧しい→普通
-.150
.329
(.426)
(.183)
(.174)
-.430
.120
-.288
(.323)
(.183)
-.189
-.393
(.729)
(.200)
.606
-.520
(.544)
(214)
-.149
.649
(.363)
(291)
-.128
1.704
(525)
(254)
+
+
.029
.410
+
*
**
.124
.192
(.207)
(.265)
(.504)
-1.482
-.262
-.199
-.229
-1.254
(.234)
(.914)
(.769)
.336
-.279
-.216
(1.466)
(.832)
(-1.855)
.888
-.367
-.346
(.165)
(255)
.357
-.516
(.331)
*
1.443
*
(.223)
**
急上昇
.375
*
-.835
**
(.295)
(.290)
(1.256)
(1.016)
(1.486)
-.008
.381
-.108
.359
1.006
(.248)
(.298)
(.978)
(1.365)
-.296
.585
1.298
1.957
(.363)
(.334)
(.968)
(.943)
(.326)
+
.754
(.400)
+
*
Log Likelihood=-20142.489
11
解釈
• 学歴の差が大きい。(普通安定に比して)豊かで安定してい
る人は大学以上が多く、貧しい人は非大学が多くなる。
• 貧しい傾向は男性に強く出ている。
• 貧しい安定は、wave1での従業上の地位、15歳時の暮らしむ
きが有意→貧困の定着、負の連鎖?
◆問題点
①「どういうときに、暮らしむき変数の変化が起こるのか」はまた
別の課題。ここで説明変数として入れているのは、不変の所与
の変数。固定効果モデルとの使い分けが必要(Cherlin et al.
1998)。
②脱落の影響(生活不安定層を過小評価している可能性)
←今回はすべてのウェーブの回答の揃ったケースを選択
2015/2/27
12
①の問題点について、参考まで(固定効果モデル)
男性
係数
正規就業(vs 自営・家族)
非正規・無職(vs 自営・家族)
結婚(vs 未婚・離死別)
健康(5段階 大きいほど良好)
.022
-.076
-.073
.062
15歳以下の子あり(vs なし)
世帯収入150~350万(vs 150万未満)
世帯収入350~600万(vs 150万未満)
世帯収入600万以上(vs 150万未満)
世帯収入無回答・わからない(vs 150万未満)
年齢30~34(vs 年齢29以下)
年齢35以上(vs 年齢29以下)
2008年(vs 2007年)
.047
.021
.090
.202
.138
.049
.054
-.067
2009年(vs
2010年(vs
2011年(vs
2012年(vs
2013年(vs
2014年(vs
定数項
-.028
-.025
-.003
-.025
-.041
-.022
1.676
2007年)
2007年)
2007年)
2007年)
2007年)
2007年)
2
R (within)
2
R (between)
2
R (overall)
N (groups)
N (observations)
+
2015/2/27
<.10 *<.05
**
.026
.273
.157
1028
7902
女性
係数
S.E.
+
**
**
*
+
**
**
*
+
**
+
**
S.E.
.036
.041
.027
.008
.097
.003
.091
.037
**
.021
.053
.053
.053
.052
.023
.032
.021
-.041
.075
.185
.267
.189
-.006
.028
-.032
*
.021
.022
.022
.023
.024
.024
.071
-.057
-.012
-.015
-.023
-.064
-.026
1.638
**
**
**
+
**
**
**
+
**
**
.036
.034
.021
.007
.017
.039
.039
.040
.039
.019
.028
.018
.018
.018
.019
.019
.020
.021
.058
.026
.188
.114
1376
10428
<.01
13
②の問題点について、参考まで(N=4,200)
クラス1(非貧困クラス) 55.2%
クラス3(中途脱落クラス) 17.4%
07年
07年
08年
08年
09年
貧困層
10年
非貧困層
11年
脱落・無回答
09年
12年
13年
13年
20%
40%
60%
80%
非貧困層
11年
12年
0%
貧困層
10年
100%
脱落・無回答
0%
20%
40%
60%
80%
100%
クラス4(貧困クラス) 5.5%
クラス2(早期脱落クラス) 22.0%
07年
07年
08年
08年
09年
09年
貧困層
貧困層
10年
非貧困層
11年
脱落・無回答
10年
11年
12年
12年
13年
13年
0%
20%
40%
60%
80%
100%
非貧困層
脱落・無回答
0%
20%
40%
60%
80%
100%
14
まとめ
• パネル調査の利点を生かす。
→何より、個人内の変化を観察できること。
ここに着目するだけでも、いろいろわかることがある。
変化のパターンを抽出することで、分析の幅も広がる。
いくつかの分析方法を組み合わせることも有効かも。
【謝辞】本研究は、科学研究費補助金基盤研究(S)(18103003, 22223005)の助成を受けた
ものである。東京大学社会科学研究所パネル調査の実施にあたっては、社会科学研究所
研究資金、株式会社アウトソーシングからの奨学寄付金を受けた。パネル調査データの
使用にあたっては社会科学研究所パネル調査企画委員会の許可を受けた。
2015/2/27
15
参考文献
•
•
•
•
•
•
•
•
•
Cherlin, Andrew J., P. Lindsay Chase-Lansdale, and Christine McRae, 1998, “Effects of
Parental Divorce on Mental Health Throughout the Life Course,” American Sociological
Review, 63(2): 239-49.
Collins, Linda M. and Stephanie T. Lanza, 2010, Latent Class and Latent Transition
Analysis: With Applications in the Social, Behavioral, and Health Sciences, Hoboken:
John Wiley & Sons.
D’Unger, Amy, Kenneth C. Land, Patricia L. McCall, and Daniel S. Nagin, 1998, “How
Many Latent Classes of Delinquent/Criminal Careers? Results from Mixed Poisson
Regression Analysis,” American Journal of Sociology, 103(6): 1593-1630.
三輪哲,2013,「パネルデータ分析の基礎と応用」『理論と方法』28(2): 355-366.
中澤渉,2012,「なぜパネル・データを分析するのが必要なのか-パネル・データ分析
の特性の紹介」『理論と方法』27(1): 23-40.
竹田由武,2014「潜在混合分布モデル」,小杉考司・清水裕士編『M-plusとRによる構
造方程式モデリング入門』北大路書房,228-44.
Yamaguchi, Kazuo, 2000, “Multinomial Logit Latent-Class Regression Models: An
Analysis of the Predictors of Gender-Role Attitudes among Japanese Women,” American
Journal of Sociology, 105(6): 1702-40.
―――――――, 2008, “Four Useful Finite Mixture Models for Regression Analysis of
Panel Data with a Categorical Dependent Variable,” Sociological Methodology, 38: 283328.
山口一男,2004,「パネルデータの長所とその分析方法-常識の誤りについて」『季刊
家計経済研究』62: 50-58.
2015/2/27
16