Asymmetric Triangulation Scaling: A

Two-stage estimation of
ATRISCAL coordinates
SHOJIMA Kojiro
The National Center for University Entrance Examinations
[email protected]
ATRISCAL
• Asymmetric Triangulation Scaling
– 非対称三角尺度法
– 多次元尺度法(MDS)の1手法
• 目的
– テストデータにおけるグローバルな項目間従属関
係の可視化
• 分析対象
– 2値のテストデータから得られる項目間の条件付
き正答率行列
同時正答率行列
Item 1 Item 2
Item 1 P(1,1) P(1,2)
Item 2 P(2,1) P(2,2)
⋯
⋯
⋯
Item n
P(1,n)
P(2,n)
⋮
⋮
⋮
Item n P(n,1) P(n,2)
⋱
⋯
⋮
P(n,n)
• n×n 対称行列
• 第j対角要素 P(j,j)=P(j)
– 項目jの正答率
• 第ij非対角要素 P(i,j)
– 項目iとjの同時正答率
– 対称 P(i,j)=P(j,i)
条件付き正答率行列
Item 1
Item 2
⋯
Item n
Item 1
Item 2
P(1,1)/P(1)
P(1,1)
1
P(2,1)/P(2)
P(1|2)
P(2,1)
P(1,2)/P(1)
P(2|1)
P(1,2)
P(2,2)/P(2)
P(2,2)
1
P(1,n)/P(1)
P(n|1)
P(1,n)
P(2,n)/P(2)
P(n|2)
P(2,n)
⋮
Item n
⋮
P(n,1)/P(n)
P(1|n)
P(n,1)
⋮
P(n,2)/P(n)
P(2|n)
P(n,2)
⋯
⋯
⋱
⋯
• n×n 非対称行列
• 第j対角要素 P(j|j)=P(j)/P(j)=1.0
• 第ij非対角要素 P(j|i)=P(i,j)/P(i)
– 項目iに正答した時の項目jの正答率
– P(i|j)≠P(j|i): 通常は非対称
⋮
P(n,n)/P(n)
P(n,n)
1
多次元尺度法(MDS)
QM
Q2
X15
X11
X7
非対称条件付き正答率行列
X12
Item
Item 2
⋯
X5 1
X13
1
P(2|1)
⋯
X
X12
P(1|2)1
⋯
X3
X9 ⋮
⋮
⋱
P(1|n)
P(2|n)X
⋯
Item 1
Item 2
⋮
Item n
X6
O
14
X4
X10
Item n
P(n|1)
P(n|2)
⋮
1
X8
Q1
項目iとjの関係
Item i
Item j
Item i
1
P(i|j)
|𝑂𝑋𝑖𝑗 | = 𝑃(𝑖, 𝑗)
Xij
Xj
Xi
|𝑂𝑋𝑖 | = 𝑃(𝑖)
|𝑂𝑋𝑗 | = 𝑃(𝑗)
O
𝑂𝑋𝑖𝑗 = 𝑘𝑂𝑋
𝑋𝑖 𝑋𝑗𝑖 ∙+𝑂𝑋1𝑖 − 𝑘 𝑂𝑋𝑗 (0 ≤ 𝑘 ≤ 1)
𝑂𝑋𝑖𝑗 = −
𝑋𝑖 𝑋𝑗 + 𝑂𝑋𝑖
|𝑋𝑖 𝑋𝑗 |
Item j
P(j|i)
1
項目iとjの関係
Item i
Item j
Item i
1
P(i|j)
Item j
P(j|i)
1
|𝑂𝑋𝑖𝑗 | = 𝑃(𝑖, 𝑗)
Xij
Xj
Xi
|𝑂𝑋𝑖 | = 𝑃(𝑖)
|𝑂𝑋𝑗 | = 𝑃(𝑗)
O
𝑃(𝑖,𝑖𝑗 |𝑗)
|𝑂𝑋
𝑃 𝑗 𝑖 =𝑐𝑜𝑠∠𝑋𝑖 𝑂𝑋𝑖𝑗
|𝑂𝑋
𝑃(𝑖)
𝑖|
𝑃(𝑖,𝑖𝑗𝑗)
|𝑂𝑋
|
𝑃 𝑖 𝑗 = 𝑐𝑜𝑠∠𝑋𝑗 𝑂𝑋𝑖𝑗
𝑃(𝑗)
|𝑂𝑋
𝑗|
拡大 非対称条件付き正答率行列
Item 1
Item 2
Item 1
1
P(2|1)
Item 2
P(1|2)
1
⋮
⋮
⋮
Item n
P(1|n)
P(2|n)
Item n+1 P(1|n+1)
P(1)
P(2)
P(2|n+1)
⋯
⋯
⋯
⋱
⋯
⋯
Item n
P(n|1)
P(n|2)
⋮
1
P(n)
P(n|n+1)
Item n+1
1
P(n+1|1)
1
P(n+1|2)
⋮
1
P(n+1|n)
1
• 非対称条件付き正答率行列は、各項目の正答率に
関する情報が欠如している。
• そこで正答率が1.0という仮想的な項目n+1を考える
– P(j|n+1)=P(j,n+1)/P(n+1)=P(j)
– P(n+1|j)=P(j,n+1)/P(j)=1.0
ストレス関数
λ ( pc|r   c|r )
F ( X ) c,r ( r  c ) c|r
F (X ) 
 n1
T(X) 
δc|r λc|r ( c|r  p) 2
n 1
2
*
c , r ( r c )
 c| r
| x r | 2 | x c |2 ( x r ' x c )


2
2
|
x
|
|
x

x
|
| OX r |
r
c
r
| OX rc |

p
1 Well  formed

Not
0
n 1
p
c , r ( r  c ) c| r
 c|r
n(n  1)
 1 if c, r  n
c|r  
n  1 otherwise
δ (delta)
正しい三角形
• 原点Oからの垂線の足が
線分XiXjに落ちる
正しくない三角形
• 原点Oからの垂線の足が
線分XiXjに落ちない
Xi
Xi
Xij
Xj
Xj
Xij
δij=δji=1
O
O
δij=δji=0
λ(lambda)
 1 if c, r  n
c|r  
n  1 otherwise
Item 1
Item 2
Item 1
Item 2
1
P(1|2)
P(2|1)
1
⋯
⋯
⋯
⋮
Item n
⋮
P(1|n)
⋮
P(2|n)
⋱
⋯
⋮
1
Item n+1
P(1)
P(2)
⋯
P(n)
0.5
1
Item n
Item n+1
P(n|1)
P(n|2)
1
1
0.5
1⋮
1
1
次元数と
空間の不定性回避のための固定座標
• 次元数=3
• 項目n+1の座標
– (xn+1=0, yn+1=0, zn+1=1)
• 最も正答率が低い項目kの座標
– (xk=0, yk>0, zk)
• P(・|k)が中程度の項目lの座標
– (xl>0, yl, zl)
ストレス関数の最適化
• ATRISCAL(MDS全般に)の最適化は難しい
– ストレス関数が単調でないため
• 2段階の最適化を行う
– 第1段階:単純遺伝的アルゴリズム(SGA)
– 第2段階:最急降下法(Shojima, 2010)
岡太先生(多摩大学)に有益な
アイデアをいただきました。どうも
ありがとうございました。
@行動計量春のセミナー2010
第1段階:単純GA (1)
• 初期集団の発生(一様分布から)
• 適応度を評価して選択(ストレス値で)
• 交配(ランダム交叉)
X
X
– エリート戦略
Exametrikaでは
世代T=20
人口G=1000
選択率=0.1
エリート数=1
X
XX
X X
X
X
XX XX X X
X
X
X
XX
X X
X XX X
X X
X
X
X
X X X X XX
X
X X XX
X
X X X X XX X XX X X
X
X
X X XX X X X X X
X
X X X
X XX
X X X
X
X
X
XX X
X X X XX X X
XXX XX X
X XX
X
交配(ランダム交叉)
• 父親と母親を生存集団からランダムに選択
• 行ベクトルをランダムに選択して子Xを作成
• そのようなプロセスで次世代個体をG個つくる
父X
子X
母X
x11 x12 x13 x14
x11 x12 x13 x14
x21 x22 x23 x24
x21 x22 x23 x24
x31 x32 x33 x34
x31 x32 x33 x34
x41 x42 x43 x44
x41 x42 x43 x44
x51 x52 x53 x54
x51 x52 x53 x54
第2段階:最急降下法(SDM)
• Shojima (2010)
• 最終世代の生存個体に対してSDMを実施
• 最小のストレス値を与える個体を最終解
第T世代の生存個体
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
SDM
ストレス関数の最適化
• 最急降下法(steepest descent method)を使用
– ストレス関数を項目jの座標で微分
F * ( X )
1 F ( X )
F ( X ) T ( X )


2
x j
T ( X ) x j
T ( X ) x j
n 1

F ( X )
  n 1
2
2

  λ j|r ( p j|r   j|r )   λc| j ( pc| j   c| j ) 
x j
x j r ( j )
c( j )

n 1

T ( X )
  n 1
2
2

  δ j|r λ j|r ( j|r  p )   δc| j λc| j ( c| j  p ) 
x j
x j r ( j )
c( j )

第1次導関数のカーネル
Exametrikaデモ
www.rd.dnc.ac.jp/~shojima/exmk/index.htm
19
分析結果:放射図(Radial Map)
• 赤い点
– 推定された座標
• オレンジの点
– 原点から赤い点を越
えて半球ドームとの
交点
項目jと仮想項目n+1
の関係
• P(j)→1.0
• P(k)→0.0
Item j
Item n+1
Xn+1
Xj
P(j)
1
Xk
O
P(k)
Item j
1
Item n+1
1
P(j)
1
項目iとjの関係
• P(i)<P(j)
• P(i|j)→1.0
• P(i|j)→0.0
Item i
Item j
Item i
1
P(i|j)
Xn+1
Xj
Xi
O
Item j
P(j|i)
1
地勢図(Topographic Map)
• オレンジ点をXY平面に
射影
• ボロノイ分割
• ボロノイ領域をオレンジ
の線分長だけリフト
– 高さによって色分け
習得図(Mastery Maps)
• 各受検者ごとに
Exametrikaデモ
www.rd.dnc.ac.jp/~shojima/exmk/index.htm
25
まとめ
• グローバルな項目間従属関係を可視化
– マーケティングデータやテキストデータに対する適用は難
しい
• 局所的な項目間従属関係も扱える
– データを総点に関してQ分位分割
– それぞれのグループに対してATRISCAL分析
– その意味での局所性で項目間従属関係を記述可能
• 教育現場では、5段階くらいで項目間従属関係構造
が明らかになれば十分
– 潜在ランク理論(ニューラルテスト理論)と合体させたい
ご清聴ありがとうございました
荘島宏二郎
(独)大学入試センター研究開発部
[email protected]