情報とコンピュータ

データ解析
http://coconut.sys.eng.shizuoka.ac.jp/data/
静岡大学工学部
安藤和敏
2006.01.11
第4章 Excelで学ぶ因子分析
4-1 1因子モデルから学ぶ因子分析の考え
方
4-2 1因子モデルから学ぶ主因子法
4-3 SMCモデルで共通性を推定
4-1 1因子モデルから学ぶ因子分析
の考え方
因子分析とは
我々は,複雑な現象を単純な原因(すなわち因子)
で理解することがよくある.
例) 「彼は理系の才能があるので理科が得意であ
るが文型の才能がないので国語が苦手である.」
複雑な人間の能力を「理系的才能」と「文系的才能」
という2つの因子で単純に説明.
例) 「K君はO型だからいいかげんである.Lさんは,
A型だから真面目である.」
複雑な人間の性格を「血液型」という1つの因子で単
純に説明.
因子分析とは
因子分析とは,複雑な現象を単純な因子で説明す
るための,統計学的な手法である.
因子分析のデータ(変数が3個の場合)
No
国語(x)
英語(y)
数学(z)
1
x1
y1
z1
2
x2
y2
z2
…
…
…
…
i
xi
yi
zi
…
…
…
…
n
xn
yn
zn
この多変量データに対して,「学力」という1つの共
通因子を仮定して,因子分析を行う.
この多変量データは標準化されていると仮定する.
標準化(第3回のスライドから)
xi  x
x'i 
i  1,, n 
sx
標準化された変数の平均は0,分散は1になる.(証明せよ.)
x'  0, sx'  1
因子分析の記法
「学力」という共通因子を変数Fで表してみる.
No
因子(F) 国語(x) 英語(y) 数学(z)
1
F1
x1
y1
z1
2
F2
x2
y2
z2
…
…
…
…
…
n
Fn
xn
yn
zn
学籍番号iの学生の学力はFiである.これをi番目の
学生の因子得点と呼ぶ.
共通因子と独自因子
各科目の得点が共通因子Fだけで説明できることは
ありえない.
変数 x は,共通因子で説明できる部分と,共通因子
で説明できない部分に分けることができると考える.
共通因子で説
明できる部分
変数x
共通因子で説
明できない部分
因子分析のモデル
x  ax F  ex (1)
因子負荷量
共通因子
独自因子
因子分析のモデル
(3変数の場合)
x  ax F  ex  (1)
y  a y F  e y  (2)
z  az F  ez  (3)
因子分析法のパス図
ax
共通因子
F
ay
az
国語 x
英語 y
数学 z
ex
ey
ez
因子分析のデータ(変数が3個の場合)
No F
x
y
z
1
F1 x1= ax F1 +ex1 y1= ay F1 +ey1 z1= az F1 +ez1
2
F2 x2= ax F2 +ex2 y2= ay F2 +ey2 z2= az F2 +ez2
…
…
…
…
…
i
Fi
xi= ax Fi +exi
yi= ay Fi +eyi
zi= az Fi +ezi
…
…
…
…
…
n
Fn xn= ax Fn +exn yn= ay Fn +eyn zn= az Fn +ezn
因子分析の基本方程式(⇒WB)
s x2

s 2y

s z2

s xy

s yz

s zx


x


a 2y s F2  2a y s Fe  se2y
y


a z2 s F2  2a z s Fe  se2z
z
 (5)

2
a x a y s F  a x s Fey  a y s Fex  sexe y 

2
a y a z s F  a y s Fez  a z s Fey  se y ez 

2
a z a x s F  a z s Fex  a x s Fez  sez ex 
a x2 s F2  2a x s Fe  se2x
重要な仮定
「共通因子と独自因子は,互いに無相関(⇒p.19)
である」と仮定する.
つまり,以下の式を仮定する.
sFex  sFey  sFez  0,
sexe y  se yez  sez ex  0(6) 因子分析の基本方程式
s x2

s 2y

s z2

s xy

s yz

s zx


x


a 2y s F2  2a y s Fe  se2y
y


a z2 s F2  2a z s Fe  se2z
z
 (5)

2
a x a y s F  a x s Fey  a y s Fex  sexe y 

2
a y a z s F  a y s Fez  a z s Fey  se y ez 

2
a z a x s F  a z s Fex  a x s Fez  sez ex 
a x2 s F2  2a x s Fe  se2x
因子分析の基本方程式
s x2
2
sy
2
sz
s xy
s yz
s zx
 a x2 s F2  se2x 

2 2
2
 a y s F  se y 
2 2
2 
 a z s F  sez 
 (7)

2

a x a y sF 
2 

a y a z sF 
2 

a z a x sF 
最初の仮定
x, y, z は標準化されていると仮定した.
つまり,以下を仮定する.
2
2
2
s x  s y  s z  1 ,
s xy  rxy , s yz  ryz , s zx  rzx
さらに,F も標準化されていると仮定する.
2
sF
 1 因子分析の基本方程式
s x2
2
sy
2
sz
rxy  s xy
ryz  s yz
rzx  s zx
 a x2 s F2  se2x 

2 2
2
 a y s F  se y 
2 2
2 
 a z s F  sez 
 (7)

2

a x a y sF 
2 

a y a z sF 
2 

a z a x sF 
1
因子分析の基本方程式
(3変数の場合)
1

1

1
rxy
ryz
rzx




2
ax
2
ay
2
az
2 
 se x

2
 se y 
2 
 sez  (8), (9)

axa y
a y az
az ax




因子分析の基本方程式
1

rxy
 rzx

rxy
1
ryz
2
2

rzx  a x  sex
 
ryz    a x a y


1  a a
 x z
ax a y
2
ay
2
 se y
a y az
ax az 

a y az 
2
2 
a z  sez 
因子分析の基本方程式を解く
2
2
2
r

r

r

a

a

a
(9)式より, xy yz zx
x
y
z
 a x  a y  a z  rxy  ryz  rzx  (10)
因子分析の基本方程式を解く
(10)式の両辺を(9)の各式で割ると,
ax

ay

az

rxy  ryz  rzx 

ryz


rxy  ryz  rzx 
 (11)
rzx

rxy  ryz  rzx 

rxy


因子分析の基本方程式を解く
(11)の各式を(8)の各式に代入すると,
2
se x
2
 1  ax
 1
2
se y
2
 1 ay
 1
2
se z
2
 1  az
 1
rxy  rzx
ryz
rxy  ryz
rzx
ryz  rzx
rxy
共通性と独自性
x  ax F  ex (1)
因子負荷量
共通因子
独自因子
共通性と独自性
2
sx

2
ax
2
 sex
 1 (12)
変数xの分散 = 1
2
ax
共通因子が説明する情報
(共通性 hx2 )
2
se x
独自因子が説明する情報
(独自性)
総共通性と寄与率
1
変数 x
変数 y
変数 z
2
se x
2
ax
2
ay
2
se y
2
az
2
se z
2
総共通性 = a x
2
 ay
全情報量
=3
2
 a z  (13)
総共通性と寄与率
総共通性
寄与率 
全情報量

2
ax
2
 ay
2
 az
変数の個数
Excelで学ぼう
ファイル:第4章/4_1
本日のまとめ
• 因子分析の考え方を理解した.
• 因子分析で用いられる言葉(因子負荷量,共
通因子,独自因子,因子得点,寄与率など)の
意味を理解した.
• 3変数の場合に,因子負荷量をExcelを用いて,
計算する方法を理解した.