マルチレベル共分散構造分析 清水裕士 大阪大学大学院人間科学研究科 日本学術振興会 本発表の概要・目的 個人-集団データの階層性 • 階層的データは従来の方法では十分な分析がで きない • 従来の方法は何が不十分なのか? 階層的データ分析 • 本発表ではマルチレベル共分散構造分析 (MCA)を紹介 • HLMとの比較など 個人-集団データの階層性 データの階層性 • 集団ごとにネストされたデータ • 集団ごとに共通した値が入力されるデータ • 集団内で類似したデータ 学校-生徒、カップルデータ、反復測定データ・・・etc このようなデータを階層的データと呼ぶ 階層的データ 例:会話実験のデータ ID 1 2 3 4 5 6 7 8 9 10 … グループ番号 発言量 1 3.56 1 4.23 1 3.78 1 3.33 2 2.88 2 2.43 集団で類似したデータ 2 4.98 2 6.53 3 3.08 3 4.63 … … 会話満足 6.60 4.72 4.84 4.96 5.08 5.20 5.33 3.44 7.56 5.69 … 集団で一致したデータ 実験条件 0 0 0 0 1 1 1 1 0 0 … ◆従来の分析手法◆ これまでの階層データの扱い • サンプルを独立なものとして扱う • 集団ごとに平均して集団数をサンプル数とする • 集団のうち、一人しか使わない 上記の方法の問題点 • サンプルは独立ではない→集団内で類似している • 平均値は純粋な集団の性質を反映しない • データがもったいない 集団で平均化されたデータ グループ番号 1 発言量 3.725 微笑量 5.28 実験条件 0 2 4.205 4.76 1 3 3.26 6.24 0 4 3.265 5.72 1 5 3.0325 4.20 0 6 … 5.8 … 4.68 … 1 … 従来の方法の問題 「サンプルの独立性仮定」の違反 • 統計学は、サンプルが独立していることを仮定 • 階層的データは、サンプルが独立していない • つまり、情報量を多く見積もっている • →タイプⅠエラーを犯す危険がある 平均値は集団の性質を反映しない • 平均値は集団の性質と個人の性質が混在 • 得られた相関係数が何を表しているか不明 • 人数が少ないときほど、危険 ◆集団内類似性◆ 個人-集団データの集団内類似性 • 発言量や会話満足は、個々の集団内で類似する • →盛り上がっている集団は全員の発話量が多い 類似性こそが階層的データの特徴 • 個人の得点同士に類似性が見られることによっ て、サンプルの独立性が違反される • 類似性を適切に扱えば、問題は回避される 階層的データ分析 階層的データ分析 • 階層的データを適切に分析する手法 • 「集団内類似性」を評価し、それにあわせたモデ リングを行う 階層的線形モデル(HLM) • 重回帰分析の階層的データ分析版 • 近年注目されている方法 • しかし、限界点も多くある(清水, 2006) ◆マルチレベル共分散構造分析◆ Multilevel Covariance structure Analysis(以下、MCA) • 共分散構造分析の階層的データ分析版 • 多変量を扱ったモデリングが可能 • 適合度指標を参照できる • 以降、MCAの簡単な説明と、Muthen法 (Muthen1994)の簡便法を実行するためのプロ グラムを紹介 MCAのイメージ 個々人のデータ(情報) 類似した部分 独自の部分 個人の性質 集団の性質 個人レベル 集団レベル 相互に独立 個人レベルと集団レベル 各レベルごとにモデルを解釈 • 個人レベル・・・個人の心理プロセスを表す おしゃべりな人は、会話によく満足している • 集団レベル・・・集団の現象を現す みんながよくしゃべると、凝集性が高まる 各レベルの比較 • 扱おうとしている現象は、個人内のプロセスなの か、集団全体のプロセスなのか? MCAのイメージ 個人のデータから集団レベルを推定する Betweenモデル 集団レベル 集団レベル 各個人のデータ 個人レベル 個人レベル 発話量 Withinモデル 会話満足 分析の流れ 集団内類似性の評価 • 級内相関係数の算出 • 有意性の確認・・・.10以上ならあると見る場合も 共分散行列をWithinとBetweenに分割 • 個人レベル=Withinモデル • 集団レベル=Betweenモデル 二つの行列をSEMのソフトウェアに投入 • モデリングをして推定値を算出 • Mplusなら、データから直接分析できる 事前分析プログラム HAD4 • 階層的データ分析用マクロ • Microsoft ExcelのVBA 機能 • 級内相関係数の算出と有意性検定 • 集団ごとの平均値と、その平均値から個人がど れほどずれているかを算出(センタリング) • 簡便法のための、WithinとBetweenの共分散 行列、相関行列を出力 HAD4 データ入力 • 集団を識別するためのID変数をB列に入力 • その隣に分析したい変数を入力 MCAの簡便法 豊田(2000)の簡便法 • Kenneyの個人-集団レベル相関と同じ • WithinとBetweenを同じ行列で表示 • 推定値だけを出力する 個人レベル相関 集団レベル相関 Amosでの分析 従来法 個人レベル MCA簡便法 集団レベル MCAとHLM 同じ点 • 階層的なデータを分析できる • 非標準化推定値、有意性検定はほぼ一致 MCAがHLMより優れている点 • 標準化推定値が算出できる • 豊富な適合度指標(CFI、RMSEAなど)を出力 • モデリングが自由(HLMは従属変数が一つ) • 個人のデータから、集団レベルの独立変数を推 定できる(HLMは平均値を算出する必要がある) MCAとHLMのイメージ HLM 集団レベル 従属変数 集団レベル 独立変数 平均化 分解 個人レベル 個人レベル 個人レベル 独立変数 センタリング MCAとHLM MCA 集団レベル 従属変数 分解 個人レベル 集団レベル 分解 独立変数 個人レベル 集団レベルのモデルは、 MCAのほうがより正確に分析できる MCAの利点 従来の方法の問題点を解決 • 集団内類似性を適切に評価 • それにあわせて、データを2つに分割する 個人レベルと集団レベルを比較 • 個人特性による効果なのか、集団の効果なのか を吟味することができる SEMの要領で分析できる • 自由なモデリング、豊富な適合度指標 MCAの限界 比較的、多くのサンプルを必要とする • 20集団以上が望ましい • 合計サンプルは100程度 モデリングが複雑 • 正式な方法を実行するには、習熟が必要 • Mplusならば容易に実行することができる 解釈の困難さ • 個人レベル、集団レベルごとの解釈が必要 • 測定した変数は、理論的にどのレベルか? 結論 個人-集団データとMCA • 集団内類似性が多く見られるデータには、必要と される分析手法 • もし類似性がないなら、使う必要がない • 「従来の方法では正しい分析ができない」から使 うというよりは・・・ 「より多くの知見を得ることができる」という、 積極的な意義を強調したい
© Copyright 2024 ExpyDoc