階層線形モデル(Hierarchical Linear Modeling, HLM)の概要と適用例 東京大学大学院教育学研究科 日本学術振興会 村山 航 はじめに:アイリス・データ rセトサ=0.74 rバーシカラー=0.53 r全体= -0.21 Fisherのデータ(豊田・前田・柳井, 1992) ► 一般的な対処策は? ⇒ 層別相関 よくあるデータ例:複数学校のデータ 総合模試 の成績 学校1 学校2 全体 学校3 遂行目標 ► よくある分析 ⇒ 全体をプールした回帰分析 全体どころか,どの単一の学校も反 映していない結果になる可能性 どうすればいいのか ► 素朴なアイディア 各学校ごとに回帰係数を求め,切片と回帰係数の 平均値や分散を求める a の平均と分散 b の平均と分散 が求められる 階層線形モデルの基本的な式 ► 一般化して数式にすると(確率変数導入・notation変更) 学校 j の i 番目の人の値 レベル1のモデル式 各学校ごとの切片と傾き 傾きの各学校特有の値 傾きの(学校間の)平均値 レベル2のモデル式 切片の学校間分散 傾きの学校間分散 上記の効果をすべて除いたときの誤差分散 結果の解釈 ► 独立変数をSES,従属変数を成績とした上で先ほどの モデルを適用した例(Raudenbush & Bryk, 2002より改変) 解釈してみよう! モデルの拡張 ► モデルは柔軟に構成可能 特に有用な拡張:切片や傾きの学校間分散を予測 する変数を投入することができる レベル1は同じ 切片や傾きの学校間の違いを予測しようと する変数(例: 学校の平均クラスサイズ) ここで なら?(仮想例) このとき,予測力のあるWを投入すると学校間分散 は減少する:Wによる分散説明率を算出可能 例) (前頁参照)が たとき,分散説明率は に変化し 留意点1: 学校ごとの回帰分析との違い ► HLMによって推定される学校ごとの切片・回帰係数 (Empirical Bayes)は,次の3つの要素で構造化される 学校ごとに回帰分析をして推定した切片・回帰係数(OLS) 全体(他校)の情報を使って推定した切片・回帰係数( 学校ごとに推定した切片・回帰係数の信頼性 一種の信 頼性係数 HLMによる学校ごとの切 学校ごとに回帰分析を 片・回帰係数の推定値 したときの推定値(OLS) (Empirical Bayes) ) 全体の情報をもとに 算出した切片・回帰 係数の推定値 全体平均に収縮し,分散が 小さくなっている(特に信頼 性の低い“傾き”が) Raudenbush & Bryk(2002)より 留意点2: センタリングについて ► HLMでは独立変数をセンタリングすることが多い 切片に意味を持たせるため:通常の回帰分析にも当該 場合によっては多重共線性の回避にも寄与(Cronbach, 1987) 2種類のセンタリング方法が存在:切片( )に影響 Grand Mean Centering 全学校の平均値を用いて独立変数をセンタリング Group Mean Centering 各学校ごとに,その学校の平均値を用いてセンタリング ► Grand Mean Centering: は独立変数が全学校の平 均値のときの, の期待値.一種の調整平均. ► Group Mean Centering: は独立変数が各学校の平 均値のときの, の期待値.各学校での の期待値. 学校1 学校1の 学校1の 学校2の 学校2 学校2の Grand Mean Centering Group Mean Centering 学校1 全体 平均 平均 学校2 平均 共分散分析のように独立変数を調整した群間の平均値差に 興味があるとき以外は,Group Mean Centeringが無難 HLMを適用した論文を読んでみる ※ 従属変数は援助要請行動 の回避(avoidance of helpseeking) Ryan, Gheen, & Midgley (1998). Journal of Educational Psychology HLMを自分で実行してみる ► HLM(Bryk, Raudenbush & Congton, 1996; 現在はver6まで) 長所:モデルの組み立て・センタリングが簡単で初心 者向け.アドバンスドなモデルも扱える. 短所:データの変換ができない.HLMに特化している ので他の分析への移行ができない. ► SAS(proc mixedプロシジャを用いて分析) 長所:SASによるデータ加工・他分析とあわせて使え る.SASユーザにとってはかなり使いやすい. 短所:もともとHLMに特化したプロシジャではないた め,アドバンスドなモデルは扱えないのも多い.モデ ルの式をプログラムするときも,やや慣れがいる. HLMの使い方(概要) ► データの準備 1レベル1ファイル:どのレベルもカラム指定になる 最初のカラムは必ずID(必ず昇順で入力) HLMの使い方(概要) ► SSMファイル(十分統計量のファイル)の作成 File→SSM→New→ASCII input レベルごとにData Formatや変数の数などを入力 Data Formatの入力が少しややこしい:Fortran形式. IDが3桁 (A3, 4X, 5F6.1)など スペースが4桁 6桁(うち1桁が小数点以下)の変数が5回繰り 返される(スペース・小数点も1桁に数えられる) “Make SSM”でファイルを作成.“Check Stats”で基 本統計量を確認し,読み込みミスがないかを確認. ► あとのモデル作成は比較的簡単にできる ←SSMファイルの作成 モデルの作成→ SASによるHLMプロシジャ(概要) ► 詳しくはSinger(1998)を参照のこと http://gseweb.harvard.edu/~faculty/singer/ に論文あり ► データファイル レベル1のオブザベーションごとに打ち込む.レベル 2の変数もここに組み込まれる. school 232 232 232 … 193 193 193 193 313 … size motive score 16 3 11 16 4 16 16 4 13 38 38 38 38 26 1 5 4 4 3 13 20 18 17 16 sex … 1… 1… 2… 1 1 2 2 1 … … … … … SASによるHLMプロシジャ(概要) ► 事前準備:分析する2レベルのモデルを結合しておく 例 固定効果と変量効果に分けて結合 固定効果 変量効果 SASによるHLMプロシジャ(概要) ► proc mixedプロシジャを用いて表現 以下大文字はデータセットにおける変数名 固定効果 変量効果 固定効果の独立変数を 指定.ただし切片(γ00は 指定しなくてよい) proc mixed noclprint covtest noitprint; class SCHOOL; model SCORE = MOTIVE/solution ddfm=bw notest; random intercept MOTIVE/sub=SCHOOL type=un; 変量効果の独立変数を指定. 切片(u0j)は“intercept”と記 す.rijは指定しなくてよい. レベル2の単位とな る変数を指定 参考文献など ・Raudenbush, S. W. & Bryk, A. S. (2002). Hierarchical linear models: Applications and data analysis methods (2nd ed.). Newbury Park, CA: Sage. ・Singer, J. D. (1998). Using SAS PROC MIXED to fit multivariate models, hierarchical models, and individual growth models. Journal of Educational and Behavioral Statistics, 24, 323-355. ・2003年度夏学期南風原朝和先生の授業 ・2000・2003年度杉澤武俊さんのレジュメ(HLM・SASによる分析の方法について) ・村山航 (2005). 主体的・内発的な意欲は必ず望ましい結果をもたらすのか 東京 大学大学院教育学研究科比較教育社会学コース(編) 「首都圏の私立中学生 の生活・意識・行動に関する調査」研究報告書, pp78-88. ・Ryan, A. M., Gheen, M. H., & Midgley, C. (1998). Why do some students avoid asking for help? An examination of the interplay among students’ academic efficacy, teachers’ social-emotional role, and the classroom goal structure. Journal of Educational Psychology, 90, 528-535. ご清聴ありがとうございました 分かりにくかったと思いますので,何かご質問などありましたら, [email protected] まで連絡をお願いします.
© Copyright 2025 ExpyDoc