情報とコンピュータ

データ解析
http://coconut.sys.eng.shizuoka.ac.jp/data/
第4章 Excelで学ぶ因子分析
4-1
4-2
4-3
4-4
4-5
4-6
1因子モデルから学ぶ因子分析の考え方
1因子モデルから学ぶ主因子法
SMCモデルで共通性を推定
1因子モデルから学ぶ反復主因子法
2因子モデルから学ぶ主因子法
2因子モデルから学ぶ反復主因子法
4-5 2因子モデルから学ぶ主因子法
因子分析のデータ
(変数が5個の場合)
No
変数 x 変数 y 変数 z 変数 u 変数 v
1
x1
y1
z1
u1
v1
2
x2
y2
z2
u2
v2
…
…
…
…
…
…
i
xi
yi
zi
ui
vi
…
…
…
…
…
…
n
xn
yn
zn
un
vn
因子分析法のパス図(2因子5変数)
共通因子
F
ax
a y az
bx
av
by
au
共通因子
G
bz bu
bv
x
y
z
u
v
ex
ey
ez
eu
ev
因子分析のモデル(5変数2因子)
x

a x F  bx G  e x
y  a y F  byG  e y
z
u


a z F  bz G  e z
au F  bu G  eu
v

av F  bv G  ev
仮定1
1因子ときの同様に,「共通因子と独自因子は,互
いに無相関(⇒p.19)である」と仮定する.
s Fex  sFey  s Fez  s Feu  sFev  s FG  0,
sGex  sGey  sGez  sGeu  sGev  0,
sexe y  sexez  sexeu  sexev  0,
se y ez  se y eu  se y ev  0,
sez eu  sez ev  0
seu ev  0  (2)
仮定2
1因子のときと同様に, x, y, z, u, v, F, G は標準化
されていると仮定する.
2
sF

2
sG

2
sx

2
sy

2
sz

2
su

2
sv
 1 ,
s xy  rxy , s xz  rxz , s xu  rxu , s xv  rxv ,
s yz  ryz , s yu  ryu , s yv  ryv ,
s zu  rzu , s zv  rzv ,
suv  ruv
基本方程式の導出(1)
1
2
sx

2 2
ax sF
2 2
 bx sG
2
 sex
0
 2a x s Fe  2bx sGe  2a xbx sFG
x
2
1  a x
x
2
 bx
2
 sex
基本方程式の導出(2)
rxy
1
=
0
2
s xy  a x a y sF
 a xby sFG  a x sFey
2
 bx a y sFG  bxby sG
 bx sGey
 a y sFex  by sGex  sexe y
rxy  ax a y  bxby
因子分析の基本方程式
(5変数2因子の場合)
1 
1 
1 
1 
1 
2
ax
2
ay
2
az
2
au
2
av
2
 bx
2
 by
2
 bz
2
 bu
2
 bv
2
 sex ,
2
 se y ,
2  (3)
 sez ,
2
 seu ,
2
 sev ,
因子分析の基本方程式(続き)
(5変数2因子の場合)
 a y au  b y bu ,
rxz
 a x a y  bxby , ryu
 a x a z  bxbz , ryv

a y av  b y bv ,
rxu
 a x au  bxbu , rzu

a z au  bz bu ,
rxv


a z av  bz bv ,

au av  bu bv .
rxy
ryz
a x av  bxbv , rzv
 a y a z  b y bz , ruv
因子分析の基本方程式
未知変数の数が15であるのに対して,方程式の数
は15個である.
1因子モデルのときと同様に行列で表現して解く.
因子分析の基本方程式
1
r
 xy
 rxz

rxu
 rxv

rxy
rxz
rxu
1
ryz
ryu
ryz
1
rzu
ryu
rzu
1
ryv
rzv
ruv
a x2  bx2  se2
x

 a x a y  bxby

 a x a z  bxbz
 a a b b
 x u x u
 a x av  bxbv

rxv 
ryv 
rzv  

ruv 
1 
基本方程式(3)は行列
を用いて,以下のよう
に表すことができる.
a x a y  bxby
a x a z  bxbz
a 2y  b y2  se2y
a y a z  b y bz
a y a z  by bz
a z2  bz2  se2z
a y au  by bu
a z au  bz bu
a y av  by bv
a z av  bz bv
a x av  bxbv 

a y au  by bu a y av  b y bv 

a z au  bz bu
a z av  bz bv 
au2  bu2  se2u au av  bu bv 

au av  bu bv av2  bv2  se2v 
 (4)
a x au  bxbu
共通性
2
 sex
2
xの分散 s x = 1
2
ax
2
 bx
2
se x
2
bx
2
ax
hx2
xのもつ情報量のうちで共通因
子が説明する情報の量
xの共通性と呼ばれる.
1
独自因子の分散
hx2


a x2  bx2
2
1  sex
共通性
xの共通性
yの共通性
zの共通性
uの共通性
vの共通性
2
hx
2
hy
2
hz
2
hu
2
hv
2
 ax
2
 ay
2
 az
2
 au
2
 av
2
 bx
2
 by
2
 bz
2
 bu
2
 bv
2
 1  sex
2
 1  se y
2
 1  sez
2
 1  seu
2
 1  sev
共通性の推定
11 se2 r rrxy

x xy
xz
r r 1 1 rs 2
yze y
 xyxy
 rxzrxz ryz ryz
1

zu
rxurxu ryu rryu
rxv ryv rzv
ryv
 rxv
a x2 2 bx2 2 se2
 a x  bx x
aa xaa y bbxbby
 x y x y
 aaxxaazz bbxxbbzz
 a a  b b
 a xxauu  bxxbuu
 aaxxaavv bbxxbbvv

rxurxz rxv  rxu
ryuryz ryv  ryu
r1zu se2rzv  rzu
z

1 rzu ruv 1  se2
u
ruvr 1  r
zv
uv
rxv 

ryv 

rzv  
ruv 

2 
1  sev 
左辺の対角成分
を,適当な数
hx2 , hy2 , hz2 , hu2 , hv2
で推定する.

a xaax ya y bxbbxyby a x aazx azbxbbzxbz a x aau xabu xbubxbua x av ax baxvbv bxbv 
aa2y 2bby2 2 se2y a aa y azb bby bz a aa yabu bby bua a ay bav b by bv 
y
y
y z
y z
y u
y u
y v
y v

22
22
2

a yaayza z bybbyzbz a zz  bzz  seza z aua zabu zbubz bua z av az bazvbv bz bv 
2
2
2

a yaayuau bybbyubu a z aauz aubz bbuz bu aau2ubbu2u  seau u av au bauvbv bu bv 
2 2 2 2 
2
a yaayvav bybbyvbv a z aavz avbz bbvz bv au aav uabvubvbu bv avav bvbv  sev 
共通性の推定
 hx2 rxy rxz rxu rxv 


左辺の対角成分
2
 rxy hy ryz ryu ryv 
を,適当な数
r

2

2 2 2 2 2
r
h
r
r
xz
yz
z
zu
zv


hx , hy , hz , hu , hv
rxu ryu rzu hu2 ruv 
で推定する.


2
r
r
r
r
h
 xv yv zv uv
v 

 a x2  bx2
a x a y  bxb y a x a z  bxbz a x au  bxbu a x av  bxbv 


2
2
a y  by
a y a z  b y bz a y au  b y bu a y av  b y bv 
a x a y  bxby
a a  b b a a  b b

2
2
a

b
a
a

b
b
a
a

b
b
x z
y z
y z
z
z
z u
z u
z v
z v
 x z
 a x au  bxbu a y au  by bu a z au  bz bu
au2  bu2
au av  bu bv 

2
2 
av  bv 
 a x av  bxbv a y av  by bv a z av  bz bv au av  bu bv
 (6)
因子決定行列
 hx2

 rxy

RF  rxz

rxu

 rxv
rxy
rxz
rxu
hy2
ryz
ryu
ryz
2
hz
rzu
ryu
rzu
2
hu
ryv
rzv
ruv
を因子決定行列と呼ぶ.
rxv 

ryv 

rzv 
ruv 
2
hv 
対称行列のスペクトル分解(先週と同じ)
RF の固有値をλ1>λ2 > λ3 > λ4 > λ5 とし, w1, w2,
w3, w4, w5をそれぞれの固有値に属する固有ベクト
ルで長さが1のものとする.すると, は以下のよう
RF
に書ける.(⇒付録Hを見よ.)
RF  1w1 t w1  2 w2 t w2  3w3 t w3  4 w4 t w4  5w5 t w5
(ここで,tw1はw1の転置を表す.)
因子決定行列の近似
RF  1w1 t w1  2 w2 t w2  3w3 t w3  4 w4 t w4  5w5 t w5
仮に,λ1とλ2が他の固有値に比べて十分大きいと
すれば,上式の第3項以降を無視して,
RF ≒1w1 w1  2w2 w2
t
と書ける.
t
因子決定行列の近似
 w1x 
 w2 x 
w 
w 
 1y 
 2y 
w1   w1z , w2   w2 z ,
 


 w1u 
 w2u 
 w1v 
 w2v 
のとき,直前の近似式は
以下の(7)のように書ける.
 w1x 
 w2 x 
w 
w 
 1y 
 2y 
RF ≒ 1  w1z [ w1x w1 y w1z w1u w1v ]  2  w2 z [ w2 x w2 y w2 z w2u w2v ]
 


w
w
 1u 
 2u 
 w1v 
 w2v 
 (7)
(6)式の右辺
(6)式の右辺は,以下のよう書けることに注意しよう.
 a x2  bx2

a x a y  bxb y
a a  b b
x z
 x z
 a x au  bxbu

 a x av  bxbv
ax 
a 
 y
  az  ax a y
 
 au 
 av 

a x a y  bxb y
a x a z  bxbz
a x au  bxbu
a 2y  b y2
a y a z  b y bz
a y au  b y bu
a y a z  b y bz
a z2  bz2
a z au  bz bu
a y au  b y bu
a z au  bz bu
au2  bu2
a y av  b y bv
a z av  bz bv
au av  bu bv
az
au
bx 
b 
 y
av  bz  bx
 
bu 
 bv 


by
bz
bu
a x av  bxbv 

a y av  b y bv 
a z av  bz bv 
au av  bu bv 
2
2 
av  bv 

bv  (8)
主因子法
ax 
 w1x 
a 
w 
 y
 1y 
 a z   1  w1z ,
 
 
a
 u
 w1u 
 av 
 w1v 
bx 
 w2 x 
b 
w 
 y
 2y 
bz   2  w2 z 
 


b
w
 u
 2u 
 bv 
 w2v 
とすれば,
主因子法
ax 
a 
 y
 az  ax
 
 au 
 av 

ay
 w1x 
w 
 1y 
 1  w1z  w1x
 
 w1u 
 w1v 
≒ RF

az
w1 y
au
bx 
b 
 y
av  bz  bx
 
bu 
 bv 

w1z

w1u
w1v
by

bz
bu
 w2 x 
w 
 2y 
 2  w2 z  w2 x


w
 2u 
 w2v 

bv

w2 y
w2 z
w2u
を得る.以上が主因子法と呼ばれる手法である.
w2v

因子負荷行列
ax
a
 y
A  az

 au
 av
bx 

by 
bz  を因子負荷行列と呼ぶ.

bu 
bv 
因子負荷行列を使うと(6)の右辺は以下のように書ける.
(6)の右辺  A A
t
寄与率と総共通性
1
x
y
2
ax
2
ay
2
se x
2
se y
2
bx
2
by
全
情
報
量
=
v
2
av
2
bv
因子 Fの情報量

因子 Gの情報量
 bx2  b y2  bz2  bu2  bv2
2
ax
2
 ay
5
2
sev
2
 az
2
 au
2
 av
寄与率と総共通性
因子 Fの情報量

2
ax
因子 Gの情報量

2
bx
総共通性 h 2
2
 ay
2
 az
2
 au
2
 av
2
 by
2
 bz
2
 bu
2
 bv
 (ax2  a 2y  az2  au2  av2 )
因子Fの寄与率CF
2
 (bx

2
 by
2
 bz
2
 bu
2
 bv )
ax2  a 2y  az2  au2  av2
5
総共通性
因子全体の寄与率 
5
4-6 2因子モデルから学ぶ反復主因
子法
反復主因子法
START
SMC法で推定
主因子法で計算
YES
推定値=計算値?
NO
END
推定値←計算値
Excelで学ぼう
ファイル:第4章/4_5, 4_6
まとめ
• 因子分析のモデル(2因子の場合)を理解した.
• 因子分析の基本方程式の導出(2因子の場合)を
理解した.
• 寄与率と総共通性の意味を理解した.
• 反復主因子法によって,因子負荷量を求める方法
を理解した.
• 反復主因子法による因子負荷量を, Excelを用い
て,計算する方法を理解した.