東大社研パネル調査 研究成果報告会2015 パネルデータで個人の変化を追跡する 中澤 渉 (大阪大学) 2015/2/27 1 パネルデータ分析を行うメリット • 観察できない異質性(unobserved heterogeneity)の 影響を取り除いた回帰係数の推定。 →より正確な「因果効果」の推定に寄与 • 個人内(within)変動と個人間(between)変動の区 別を可能とする。 • 個人そのものに焦点をあてて、その変動を観察でき る(本発表の焦点)。 以上、山口(2004)、中澤(2012)、三輪(2013)などを 参照。 2015/2/27 2 個人の追跡の重要性 • パネル調査のメリットは、何より同一個人内の変化を追うこと ができること。 • 単純な横断調査の分布だけではわからない情報がある ①同じものをカウントしているつもりでも、該当者の構成員 はかなり入れ替わっている可能性がある。 ②変動の激しい人とそうでない人がいる。 wave1 ID1 ID2 ID3 ID4 ID5 ID6 ID7 ID8 ID9 ID10 濃灰の率 2015/2/27 wave2 50% wave3 50% wave4 60% wave5 50% wave6 50% wave7 40% wave8 50% 60% 3 潜在混合分布モデル(latent mixture model) • 個人内変化のパターンを決める何らかの潜在変数を仮定し、 変動のパターンの類型を導き出す。→変動を起こすものが質 的変数であれば、一種の潜在クラス分析 • 変動を起こす変数が量的変数であれば、典型的な変化の軌 跡を導くことになる(基本的に発想は同じで、典型的な軌跡を 抽出するのが目的。混合軌跡モデリングとか潜在軌跡モデ リングとよばれる)。D’Unger et al (1998)など。 • 導かれたクラス(類型)を従属変数とし、それぞれのクラスの 特徴を(ある種の)独立変数で説明することが可能。また逆 にクラスを独立変数にして、特定の従属変数を説明すること もできるが、今回は前者のみ扱う(竹田 2014; Collins and Lanza, 2010 chap.6; Yamaguchi 2008; 2000)。 2015/2/27 4 注目する変数 • 現在のあなたの暮らしむきは、この中のどれ にあたるでしょうか。 1 豊か 2 やや豊か 3 ふつう 4 やや貧しい 5 貧しい • 収入に代わる経済的地位の指標として、特に回顧調査で使用。 • 主観的な判断を伴う変数ともいえる(が、回答者の生活実感を反映)。 • 順序尺度のカテゴリー変数。ただし5段階だと、潜在クラスを発見するに は細かすぎる。 2015/2/27 5 変数の処理 • 5段階を3段階(豊か・ふつう・貧しい)の3カテゴリーに変換。 「やや」がつくかつかないかの判断は恣意的で個人差が大き いと判断し、より単純なカテゴリー区分にする。 • 自分の(主観的な)暮らしの評価の変動のパターンと、その 違いを生む変数(いずれも質的変数)を検討する。 ①性別(男、女) ②出生コーホート(1966-75生まれ、1976-85生まれ) ③学歴(中学・高校、専門・短大、大学・大学院) ④wave1時点での就業上の地位(正規・自営・家族vs非正規・無職) ※wave1時点で学生の場合は正規・自営・家族に含める。 ⑤15歳時の暮らしむき(貧しい、それ以外) • 分析にはM-plus (ver.7.3)を使用。 2015/2/27 6 各年度暮らし向き変数の分布 豊か 0.1668 0.6156 0.2176 2007年 2015/2/27 普通 貧しい 0.1672 0.1893 0.1884 0.1668 0.1672 0.1735 0.1635 0.6593 0.6165 0.5869 0.6248 0.6327 0.651 0.6344 0.1735 0.1943 0.2246 0.2084 0.2001 0.1755 0.2022 2008年 2009年 2010年 2011年 2012年 2013年 2014年 7 モデル選択 2クラス 3クラス 4クラス 5クラス 6クラス 7クラス 8クラス 9クラス 2015/2/27 BIC AIC d.f. 29653.888 29462.987 25800.917 25511.673 25519.528 25131.940 25297.288 24811.357 25248.407 24664.133 25231.186 24548.569 25292.140 24511.180 25359.385 24480.082 6497 6476 6462 6448 6432 6419 6402 6392 χ2 G2 G2 の差 224538.729 6363.329 --5015.621 2343.436 4019.893 3996.169 1980.646 362.790 3375.449 1665.135 315.511 3091.050 1512.400 152.735 2924.110 1411.760 100.640 2809.345 1345.216 66.544 2929.445 1365.172 -19.956 8 8クラスの内訳 クラス2 豊か→普通下降型 11.4% クラス1 普通安定型 39.3% クラス3 貧しい安定型 10.9% クラス4 豊か安定型 10.6% 100% 100% 100% 100% 90% 90% 90% 90% 80% 80% 80% 80% 70% 70% 70% 70% 60% 60% 60% 60% 50% 50% 50% 50% 40% 40% 40% 40% 30% 30% 30% 30% 20% 20% 20% 20% 10% 10% 10% 10% 0% 0% 0% 0% 豊か 普通 貧しい 豊か クラス5 普通→貧しい下降型 10.1% 普通 貧しい クラス6 普通→豊か上昇型 8.7% 豊か 普通 貧しい 豊か クラス7 貧しい→普通上昇型 5.8% 100% 100% 100% 90% 90% 90% 90% 80% 80% 80% 80% 70% 70% 70% 70% 60% 60% 60% 60% 50% 50% 50% 50% 40% 40% 40% 40% 30% 30% 30% 30% 20% 20% 20% 20% 10% 10% 10% 10% 0% 0% 0% 0% 普通 2015/2/27 貧しい 豊か 普通 貧しい 豊か 普通 貧しい 貧しい クラス8 急上昇型 3.2% 100% 豊か 普通 豊か 普通 貧しい 9 8クラスの構成比率 各クラスの分布(N=2401) 貧しい→普通上昇 6% 急上昇 3% 普通→豊か上昇 9% 普通安定 39% 普通→貧しい下降 10% 豊か安定 11% 貧しい安定 11% 豊か→普通下降 11% Entropy = 0.811 2015/2/27 10 潜在クラス多項ロジット 基準=普通安定型 性別(1=男性、0=女性) 出生年(1=1966~75, 0=76~85) 専門・短大(vs 中学・高校) 大学・大学院(vs 中学・高校) wave1での従業上の地位 (1=非正規・無職、0=正規・自営家族) 15歳時暮らし向き (1=貧しい、0=それ以外) + <.10 *<.05 **<.01 ()内は標準誤差 2015/2/27 豊か→普通 貧しい安定 豊か安定 普通→貧しい 普通→豊か 貧しい→普通 -.150 .329 (.426) (.183) (.174) -.430 .120 -.288 (.323) (.183) -.189 -.393 (.729) (.200) .606 -.520 (.544) (214) -.149 .649 (.363) (291) -.128 1.704 (525) (254) + + .029 .410 + * ** .124 .192 (.207) (.265) (.504) -1.482 -.262 -.199 -.229 -1.254 (.234) (.914) (.769) .336 -.279 -.216 (1.466) (.832) (-1.855) .888 -.367 -.346 (.165) (255) .357 -.516 (.331) * 1.443 * (.223) ** 急上昇 .375 * -.835 ** (.295) (.290) (1.256) (1.016) (1.486) -.008 .381 -.108 .359 1.006 (.248) (.298) (.978) (1.365) -.296 .585 1.298 1.957 (.363) (.334) (.968) (.943) (.326) + .754 (.400) + * Log Likelihood=-20142.489 11 解釈 • 学歴の差が大きい。(普通安定に比して)豊かで安定してい る人は大学以上が多く、貧しい人は非大学が多くなる。 • 貧しい傾向は男性に強く出ている。 • 貧しい安定は、wave1での従業上の地位、15歳時の暮らしむ きが有意→貧困の定着、負の連鎖? ◆問題点 ①「どういうときに、暮らしむき変数の変化が起こるのか」はまた 別の課題。ここで説明変数として入れているのは、不変の所与 の変数。固定効果モデルとの使い分けが必要(Cherlin et al. 1998)。 ②脱落の影響(生活不安定層を過小評価している可能性) ←今回はすべてのウェーブの回答の揃ったケースを選択 2015/2/27 12 ①の問題点について、参考まで(固定効果モデル) 男性 係数 正規就業(vs 自営・家族) 非正規・無職(vs 自営・家族) 結婚(vs 未婚・離死別) 健康(5段階 大きいほど良好) .022 -.076 -.073 .062 15歳以下の子あり(vs なし) 世帯収入150~350万(vs 150万未満) 世帯収入350~600万(vs 150万未満) 世帯収入600万以上(vs 150万未満) 世帯収入無回答・わからない(vs 150万未満) 年齢30~34(vs 年齢29以下) 年齢35以上(vs 年齢29以下) 2008年(vs 2007年) .047 .021 .090 .202 .138 .049 .054 -.067 2009年(vs 2010年(vs 2011年(vs 2012年(vs 2013年(vs 2014年(vs 定数項 -.028 -.025 -.003 -.025 -.041 -.022 1.676 2007年) 2007年) 2007年) 2007年) 2007年) 2007年) 2 R (within) 2 R (between) 2 R (overall) N (groups) N (observations) + 2015/2/27 <.10 *<.05 ** .026 .273 .157 1028 7902 女性 係数 S.E. + ** ** * + ** ** * + ** + ** S.E. .036 .041 .027 .008 .097 .003 .091 .037 ** .021 .053 .053 .053 .052 .023 .032 .021 -.041 .075 .185 .267 .189 -.006 .028 -.032 * .021 .022 .022 .023 .024 .024 .071 -.057 -.012 -.015 -.023 -.064 -.026 1.638 ** ** ** + ** ** ** + ** ** .036 .034 .021 .007 .017 .039 .039 .040 .039 .019 .028 .018 .018 .018 .019 .019 .020 .021 .058 .026 .188 .114 1376 10428 <.01 13 ②の問題点について、参考まで(N=4,200) クラス1(非貧困クラス) 55.2% クラス3(中途脱落クラス) 17.4% 07年 07年 08年 08年 09年 貧困層 10年 非貧困層 11年 脱落・無回答 09年 12年 13年 13年 20% 40% 60% 80% 非貧困層 11年 12年 0% 貧困層 10年 100% 脱落・無回答 0% 20% 40% 60% 80% 100% クラス4(貧困クラス) 5.5% クラス2(早期脱落クラス) 22.0% 07年 07年 08年 08年 09年 09年 貧困層 貧困層 10年 非貧困層 11年 脱落・無回答 10年 11年 12年 12年 13年 13年 0% 20% 40% 60% 80% 100% 非貧困層 脱落・無回答 0% 20% 40% 60% 80% 100% 14 まとめ • パネル調査の利点を生かす。 →何より、個人内の変化を観察できること。 ここに着目するだけでも、いろいろわかることがある。 変化のパターンを抽出することで、分析の幅も広がる。 いくつかの分析方法を組み合わせることも有効かも。 【謝辞】本研究は、科学研究費補助金基盤研究(S)(18103003, 22223005)の助成を受けた ものである。東京大学社会科学研究所パネル調査の実施にあたっては、社会科学研究所 研究資金、株式会社アウトソーシングからの奨学寄付金を受けた。パネル調査データの 使用にあたっては社会科学研究所パネル調査企画委員会の許可を受けた。 2015/2/27 15 参考文献 • • • • • • • • • Cherlin, Andrew J., P. Lindsay Chase-Lansdale, and Christine McRae, 1998, “Effects of Parental Divorce on Mental Health Throughout the Life Course,” American Sociological Review, 63(2): 239-49. Collins, Linda M. and Stephanie T. Lanza, 2010, Latent Class and Latent Transition Analysis: With Applications in the Social, Behavioral, and Health Sciences, Hoboken: John Wiley & Sons. D’Unger, Amy, Kenneth C. Land, Patricia L. McCall, and Daniel S. Nagin, 1998, “How Many Latent Classes of Delinquent/Criminal Careers? Results from Mixed Poisson Regression Analysis,” American Journal of Sociology, 103(6): 1593-1630. 三輪哲,2013,「パネルデータ分析の基礎と応用」『理論と方法』28(2): 355-366. 中澤渉,2012,「なぜパネル・データを分析するのが必要なのか-パネル・データ分析 の特性の紹介」『理論と方法』27(1): 23-40. 竹田由武,2014「潜在混合分布モデル」,小杉考司・清水裕士編『M-plusとRによる構 造方程式モデリング入門』北大路書房,228-44. Yamaguchi, Kazuo, 2000, “Multinomial Logit Latent-Class Regression Models: An Analysis of the Predictors of Gender-Role Attitudes among Japanese Women,” American Journal of Sociology, 105(6): 1702-40. ―――――――, 2008, “Four Useful Finite Mixture Models for Regression Analysis of Panel Data with a Categorical Dependent Variable,” Sociological Methodology, 38: 283328. 山口一男,2004,「パネルデータの長所とその分析方法-常識の誤りについて」『季刊 家計経済研究』62: 50-58. 2015/2/27 16
© Copyright 2024 ExpyDoc