マルチレベル共分散構造分析

マルチレベル共分散構造分析
清水裕士
大阪大学大学院人間科学研究科
日本学術振興会
本発表の概要・目的

個人-集団データの階層性
• 階層的データは従来の方法では十分な分析がで
きない
• 従来の方法は何が不十分なのか?

階層的データ分析
• 本発表ではマルチレベル共分散構造分析
(MCA)を紹介
• HLMとの比較など
個人-集団データの階層性

データの階層性
• 集団ごとにネストされたデータ
• 集団ごとに共通した値が入力されるデータ
• 集団内で類似したデータ

学校-生徒、カップルデータ、反復測定データ・・・etc
このようなデータを階層的データと呼ぶ
階層的データ
例:会話実験のデータ
ID
1
2
3
4
5
6
7
8
9
10
…
グループ番号
発言量
1
3.56
1
4.23
1
3.78
1
3.33
2
2.88
2
2.43
集団で類似したデータ
2
4.98
2
6.53
3
3.08
3
4.63
…
…
会話満足
6.60
4.72
4.84
4.96
5.08
5.20
5.33
3.44
7.56
5.69
…
集団で一致したデータ
実験条件
0
0
0
0
1
1
1
1
0
0
…
◆従来の分析手法◆

これまでの階層データの扱い
• サンプルを独立なものとして扱う
• 集団ごとに平均して集団数をサンプル数とする
• 集団のうち、一人しか使わない

上記の方法の問題点
• サンプルは独立ではない→集団内で類似している
• 平均値は純粋な集団の性質を反映しない
• データがもったいない
集団で平均化されたデータ
グループ番号
1
発言量
3.725
微笑量
5.28
実験条件
0
2
4.205
4.76
1
3
3.26
6.24
0
4
3.265
5.72
1
5
3.0325
4.20
0
6
…
5.8
…
4.68
…
1
…
従来の方法の問題

「サンプルの独立性仮定」の違反
• 統計学は、サンプルが独立していることを仮定
• 階層的データは、サンプルが独立していない
• つまり、情報量を多く見積もっている
• →タイプⅠエラーを犯す危険がある

平均値は集団の性質を反映しない
• 平均値は集団の性質と個人の性質が混在
• 得られた相関係数が何を表しているか不明
• 人数が少ないときほど、危険
◆集団内類似性◆

個人-集団データの集団内類似性
• 発言量や会話満足は、個々の集団内で類似する
• →盛り上がっている集団は全員の発話量が多い

類似性こそが階層的データの特徴
• 個人の得点同士に類似性が見られることによっ
て、サンプルの独立性が違反される
• 類似性を適切に扱えば、問題は回避される
階層的データ分析

階層的データ分析
• 階層的データを適切に分析する手法
• 「集団内類似性」を評価し、それにあわせたモデ
リングを行う

階層的線形モデル(HLM)
• 重回帰分析の階層的データ分析版
• 近年注目されている方法
• しかし、限界点も多くある(清水, 2006)
◆マルチレベル共分散構造分析◆

Multilevel Covariance structure
Analysis(以下、MCA)
• 共分散構造分析の階層的データ分析版
• 多変量を扱ったモデリングが可能
• 適合度指標を参照できる
• 以降、MCAの簡単な説明と、Muthen法
(Muthen1994)の簡便法を実行するためのプロ
グラムを紹介
MCAのイメージ
個々人のデータ(情報)
類似した部分
独自の部分
個人の性質
集団の性質
個人レベル
集団レベル
相互に独立
個人レベルと集団レベル

各レベルごとにモデルを解釈
• 個人レベル・・・個人の心理プロセスを表す

おしゃべりな人は、会話によく満足している
• 集団レベル・・・集団の現象を現す


みんながよくしゃべると、凝集性が高まる
各レベルの比較
• 扱おうとしている現象は、個人内のプロセスなの
か、集団全体のプロセスなのか?
MCAのイメージ

個人のデータから集団レベルを推定する
Betweenモデル
集団レベル
集団レベル
各個人のデータ
個人レベル
個人レベル
発話量
Withinモデル
会話満足
分析の流れ

集団内類似性の評価
• 級内相関係数の算出
• 有意性の確認・・・.10以上ならあると見る場合も

共分散行列をWithinとBetweenに分割
• 個人レベル=Withinモデル
• 集団レベル=Betweenモデル

二つの行列をSEMのソフトウェアに投入
• モデリングをして推定値を算出
• Mplusなら、データから直接分析できる
事前分析プログラム

HAD4
• 階層的データ分析用マクロ
• Microsoft ExcelのVBA

機能
• 級内相関係数の算出と有意性検定
• 集団ごとの平均値と、その平均値から個人がど
れほどずれているかを算出(センタリング)
• 簡便法のための、WithinとBetweenの共分散
行列、相関行列を出力
HAD4

データ入力
• 集団を識別するためのID変数をB列に入力
• その隣に分析したい変数を入力
MCAの簡便法

豊田(2000)の簡便法
• Kenneyの個人-集団レベル相関と同じ
• WithinとBetweenを同じ行列で表示
• 推定値だけを出力する
個人レベル相関
集団レベル相関
Amosでの分析
従来法
個人レベル
MCA簡便法
集団レベル
MCAとHLM

同じ点
• 階層的なデータを分析できる
• 非標準化推定値、有意性検定はほぼ一致

MCAがHLMより優れている点
• 標準化推定値が算出できる
• 豊富な適合度指標(CFI、RMSEAなど)を出力
• モデリングが自由(HLMは従属変数が一つ)
• 個人のデータから、集団レベルの独立変数を推
定できる(HLMは平均値を算出する必要がある)
MCAとHLMのイメージ
HLM
集団レベル
従属変数
集団レベル
独立変数
平均化
分解
個人レベル
個人レベル
個人レベル
独立変数
センタリング
MCAとHLM
MCA
集団レベル
従属変数
分解
個人レベル
集団レベル
分解
独立変数
個人レベル
集団レベルのモデルは、
MCAのほうがより正確に分析できる
MCAの利点

従来の方法の問題点を解決
• 集団内類似性を適切に評価
• それにあわせて、データを2つに分割する

個人レベルと集団レベルを比較
• 個人特性による効果なのか、集団の効果なのか
を吟味することができる

SEMの要領で分析できる
• 自由なモデリング、豊富な適合度指標
MCAの限界

比較的、多くのサンプルを必要とする
• 20集団以上が望ましい
• 合計サンプルは100程度

モデリングが複雑
• 正式な方法を実行するには、習熟が必要
• Mplusならば容易に実行することができる

解釈の困難さ
• 個人レベル、集団レベルごとの解釈が必要
• 測定した変数は、理論的にどのレベルか?
結論

個人-集団データとMCA
• 集団内類似性が多く見られるデータには、必要と
される分析手法
• もし類似性がないなら、使う必要がない
• 「従来の方法では正しい分析ができない」から使
うというよりは・・・
「より多くの知見を得ることができる」という、
積極的な意義を強調したい