戦略法の提案 - Research Division

LRTモデルに基づくCATの開発と
シミュレーションによる特性解析
○秋山 實
東北大学大学院(院生)
木村 哲夫
新潟青陵大学
荘島 宏二郎 大学入試センター
研究の背景・目的
➲
背景
・潜在ランク理論(以降LRTと呼ぶ)が荘島によって提案
された(荘島,2007a;ニューラルテスト理論)
・しかし,これに基づくアダプティブテスト(以降CATと呼ぶ)
が未だ存在しない
・項目応答理論に基づくCATよりも小規模利用に適して
いるのではないか?(木村,2010)
・プレースメントテストにLRTに基づくCAT
(以降LRT-CATと呼ぶ)を使うニーズが出てきた
➲
目的
・LRT-CATを開発する
・その特性を調べる
LRTモデルとは
➲
テストの解像度は連続値で表示するほど高くな
い(荘島,2007a)
・項目応答理論では,-∞から+∞の連続値で表現
➲
5から20程度のランク数で能力を表わす
・受験者の能力は,Rank と Rank Membership Profile
で表わす(以降RMPと呼ぶ)
・項目の特性は,Item Reference Profileで表わす
(以降IRPと呼ぶ)
RMPの例
IRPの例
LRTモデルの正答確率
・潜在ランクqjを与える場合
p(Uij=1) = IRPi[qj]
・RMPjを与える場合
Q
p(Uij=1) = Σ(IRPi[qj] * RMPj[qj])
q=1
Q :ランク数
Uij :回答(正答=1,誤答=0)
i :アイテム
j :受験者
方法
➲
LRT-CATをMoodle1.9のモジュールとして開発
・Moodleの「問題バンク」のアイテムを利用する
・
➲
LRT-CATモジュールの関数を利用してシミュレータを
開発,シミュレーションを実施
・受験者のRMPとアイテムバンク(IRP)を与える
・LRTモデルの正答確率と一様乱数を用いてモンテカルロ・
シミュレーションを行う
・受験者1人あたり100回繰り返し受験させる
LRT-CATの仕様
➲
初期条件
➲
項目選択
・Maximum Expectation Posterior Waited Information
(van der Linden,1998)のLRT版(木村・永岡,2011)
➲
能力推定
・Muximum LikelihoodのLRT版(荘島,2007b)
➲
終了条件
・RMPの暫定推定値の変化分の平方和平方根
SQRT(Σ(RMPn-RMPn-1)2 )<0.01
(木村・永岡,2011)
・受験項目数>50アイテム
・β値で5アイテムを選択しテストレットとして出題
LRT-CAT:受験開始画面
LRT-CAT:受験画面
LRT-CAT:受験結果画面
CATの評価基準
➲
推定誤差
・測定の性能
・ばらつきも重要
➲
受験アイテム数
・テストの実施可否を決定付ける場合もある
・同じ推定精度なら少ない方がよい
シミュレーション(1)
➲
テスト
➲
受験者
➲
アイテム
➲
シミュレーション条件
・英語(語彙・文法)
・117名
・104アイテム
・実際のテストの回答データ
・1受験者あたり100回繰り返し
受験者のRMP(1)
アイテムバンクの特性(1)
シミュレーション(1)の結果
シミュレーション(2)
➲
シミュレーション条件
➲
受験者
➲
アイテムバンク
・人工的なデータを使用
・受験者のランクを中心に正規分布となるRMPを与える
・項目応答理論の識別力0.5,1.0,1.5,2.0に相当する
項目特性曲線に近いIRPを持つアイテム
・beta毎に10アイテム
・ランク5 X 識別力4 X 10アイテム = 200アイテム
受験者のRMP(2)
アイテムバンクの特性(2)
シミュレーション(2)の結果(測定誤差)
シミュレーション(2)の結果(受験項目数)
RMPを使用した場合
ランクを使用した場合
まとめ
➲
LRT-CATの特性
・受験項目数
・
今後の課題
➲
LRT-CATの特性を網羅的に明らかにする
➲
最適なアルゴリズムはどれか?を明らかにする
➲
IRTに基づくCATと比較する
➲
実地のテストへ適用・評価する
・同じランクであってRMPの形状が異なる受験者に対する
LRT-CATの挙動をあきらかにする
・項目選択:MFI,KL,MEI
・能力推定:Bayes
・構成要素毎に相当するアルゴリズムを用意
・設定機能,テスト結果のエクスポート機能を付加する
参考文献
➲
秋山實(2010)シミュレーションに基づくインハウスCATシステ
ムの設計ツール.日本テスト学会第8回大会発表論文抄録集,
148-149.
➲
木村哲夫・永岡慶三(2011) 潜在ランク理論に基づくコンピュー
タアダプティブテスト.日本テスト学会第9回大会発表論文抄録
集.
➲
Shojima, K. (2007a). Neural test theory. DNC Reasearch Note,
07-02.
➲
Shojima, K. (2007b). Maximum Likelihood Estimation of Latent
Rank under Neural Test Model. DNC Reasearch Note, 07-04.
➲
Van der Linden, W. J. (1998). Baysian item selection criteria
for adaptive testing. Psychometrika, 63, 201-216.