ベイズ・アプローチに よる グラフィカル・テスト理論

ベイズ・アプローチによる
グラフィカル・テスト理論
植野 真臣
日本教育工学会論文誌 / 日本教育工学雑誌 24(1), 35-52, 2000
発表者:佐藤 篤
日時:11月6日
論文の内容
ベイズアプローチによるグラフィカル・テスト
理論の定式化
母数推定と構造推定法
予測分布最大化によるテスト情報量
(EVTIN)の定式化
従来のテスト理論との理論的比較について
の考察
グラフィカル・テスト理論
教材構造を確率ネットワークとして定式化
し、統計的意思決定論の枠組みによりテス
ト構成を行おうとするもの
はじめに
グラフィカル・テスト理論はいままで提案さ
れてきたテスト理論の利点を統合的に有し、
統一的な視点から、さまざまなテスト理論
モデルに漸近収束、または変化していくモ
デルである。
当初、確率ネットワークと呼ばれるAI分野
の比較的新しい技術の応用として定式化
されたために、その統計モデルとしての定
式化は正確に行われていない。
グラフィカル・テスト理論
の統計モデル(基本モデ
ル)
N個の項目の i 番目の項目に対して、その
反応に対する確率変数 xi を導入すると、N
項目に対する反応パターンの同時確率は
p(x1,x2,‥・,xN)=Πp(xi | x1,x2,‥・,xi-1)
=Πp(xi | Πi)
と表される。
グラフィカル・テスト理論
の統計モデル(基本モデ
ル)
この確率モデルは、確率の定義から導か
れる定理であり、なんらテストデータ特有
のデータ発生メカニズムに対する仮定を置
いていない。
例外の存在を許容するモデルが提供され
る。
グラフィカル・テスト理論
の統計モデル(ベイズ・モデル)
ξijkをΠi=jのときの条件付き確率パラメータ
とし、{ξijk},i=1,‥・,N,j=0‥・,qi,k=0,1とす
ると、jはj番目の親ノードを、kは変数の取
り得る値を示す。よってテストデータは
p(x1,・‥,xN|ξ,S)=ΠΠΠξijk
グラフィカル・テスト理論
の統計モデル(ベイズ・モデル)
前ページの式が、n人のランダムに採集さ
れたデータX(N*n)を得たとすると論文中
(3)式のように表すことができる。
構造の推定
グラフィカル・テスト理論では、データから
構造を推定することができる。
p(S|X)=p(S)p(X|S) / ∑g∈G p(S)p(X|S)
で構造Sに対する事後分布を導き出す。
構造の推定
(11)(12)(13)(14)式による証明により、
真のハイパーパラメータが1/2でなくても、
真の構造を得る保証がある。すなわち、一
致性がある。
NP-hard問題の回避には
親探しアルゴリズム
アーク消去型アルゴリズム
遺伝的アルゴリズムによる全数探索
の三つが有力である。
テスト情報量
統計的意思決定論では、期待されるデー
タの価値EVSIを(17)式のように定式化す
る。
テスト情報量EVTINは、未知なる項目への
被験者の反応を如何に少ない項目で予測
するかを効用としたテスト構成を実現でき
る。
テストデータによる
未知項目の予測
EVTINを最大とするテストを実施した後、
未知の項目への反応を各被験者ごとに予
測することができる。
テスト情報量ENTIN最大化によるテスト構
成は、この未知項目への予測を最大化す
るように最適化
適応型テスト
グラフィカル・テスト理論を用いて適応型テ
ストを開発することができる。
項目情報量EVTINが最大となるように項
目を出題していき、それがある近傍ε以下
になった時にテストを打ち切る。
どのノードを理解して、どのノードを理解し
ていないかが推論できる。
テスト得点の予測
(22)式によってテスト得点の予測ができる。
少数の項目出題から、全体中どのくらい出
来ているかを推測。
項目応答理論との関係
グラフィカル・テスト理論における同時確率
は、項目数Nを大きくすると項目応答理論
モデルの同時確率に近づく。すなわちモデ
ルとしては同値になる。(25、26式により証
明)‥・Theorem 1
一般に、項目応答理論のような潜在変数
モデルでは、潜在変数に標準正規分布を
仮定するが、n’ijkが小さくても、z-分布は正
規分布によく近似される。
項目応答理論との関係
項目数Nを増やすとグラフィカル・テスト理
論は項目応答理論に一致し、局所独立性
も成り立つ。
精度高く推定されたグラフィカル・テスト理
論におけるパラメータおよび構造を用い、
項目応答理論における能力推定値θsや項
目パラメータai,biを求めることができる。
(27,28,29式)
フィッシャー情報量との関係
項目応答理論を用いる場合に、項目の持
つ良さの尺度としてフィッシャー情報量が
用いられ、ここでは(30)式で表される。
フィッシャー情報量の逆数は、一般に最尤
推定値の漸近分散で示すが、同様にベイ
ズ推定値にも同じことの証明ができる。
(31,32)式
フィッシャー情報量との関係
グラフィカル・テスト理論における情報量
EVTINは(33)式によって示され、カルバッ
クライブラー情報量のこれから出そうとして
いるテスト項目についての期待値を示して
いる。
N’に対してテスト項目N’が充分に大きくな
るとき、グラフィカル・テスト理論における同
時確率は、項目数Nを大きくすると項目応
答理論モデルの同時確率に近づく。
フィッシャー情報量との関係
カルバックライブラーのパラメータ近傍の漸
近性質により34,35式が求められ、前ページ
同様、項目数を増やしていくと、グラフィカ
ル・テスト理論の情報量EVTINは項目応答
理論におけるフィッシャー情報量のN’^2/2
倍に近づいていき、されに情報量の加法性
が成り立っていく。すなわち大量の項目数を
持つテストを構成する場合、グラフィカル・テ
スト理論におけるテスト構成と項目応答理
論におけるテスト構成は同一となる。
項目関連構造分析との関係
IRS分析の項目間の順序性係数は(36)式
で定義され、独立性の定義は(37)、(38)
式を満たせばよい。ゆえにIRS分析におけ
る順序性の定義は独立性の定義と同義で
ある。
項目関連構造分析との関係
IRS分析によって構成された教材構造につ
いて、グラフィカル・テスト理論において、親
ノードが互いに独立という制約の下では、
ハイパーパラメータ n’ijkを1/2lognとした時
の構造Sの事後分布最大化によって得ら
れた構造を得るのと等しい。
ハイパーパラメータを用いた場合、IRS分
析で得られる構造とグラフィカル・テスト理
論における構造は一致する。
おわりに
本論文(理論)でベイズ統計的アプローチを
導入する利点は
①少数データのサンプリングによって、条件付確
率パラメータが0や1などに推定されることを防ぐ。
②周辺尤度や周辺事後分布が漸近展開などの近
似なく正確にもとめることができる。
③ハイパーパラメータをさまざまに変化させること
によって、さまざまなテスト理論モデルに漸近収
束っさせることができる。
今後の目標
大規模型教育データバンク(テストデータ
を中心にして)の開発とWeb上での共有
グラフィカル・テスト理論のユーザーフレン
ドリーなシステム化
大規模型データのための解析ツールの開
発(教育用データマインド手法の開発)
新しい効用関数の開発とテスト構成の目
的分析
ためになった部分
グラフィカル・テスト理論はこれまでのテス
ト理論の利点を総合的に有し、統一的な視
点からさまざまなテスト理論に漸近収束、
変化するモデルということで、これを自分
のシステムに入れることができたらすごい
かな‥・
論文中にIRSやS-P、IRTなどの話が出てき
たのでいろんな理論の再確認ができた。
ためになった部分
テストの得点予測などについてはおもしろ
いと感じた。
グラフィカル・テスト理論とIRS、IRTとの関
係などが述べられている部分に興味を持
てた。
参考文献
竹谷 誠 「新・テスト理論
法」 、早稲田大学出版部
教育情報の構造分析