第4日目第2時限の学習目標

第4日目第2時限の学習目標
 検査(テスト)の信頼性について学ぶ。
(1)検査得点の構成について知る。
(2)検査の信頼性の定義を知る。
(3)検査得点に対する仮定を知る。
(4)検査の信頼性の別表現を知る。
(5)信頼性係数と信頼性指数の違いを
知る。
(6)その他の信頼性(係数)の求め方
を学ぶ。
(検査)テスト得点の一般的な定義
 最初に、テスト理論では、一般にテス
トの得点 Xiは、その真値 Ti と測定誤
差 Ei を用いてつぎのように表される:
Xi  Ti  Ei
テスト得点の分散の分割
 ここで、もし真値 Ti と誤差項 Ei が互
いに独立ならば、T と E は無相関(共
分散がゼロ)となり、
V ( X )  V (T )  V (E)
検査(テスト)の信頼性の定義とは?
 2つの平行テスト X, Y 間の相関係数 ρXY
を、信頼性係数と呼ぶ。
 これにより信頼性を求める方法は、平行
検査法と呼ばれる。
 平行検査法では、同一被験者に等質なテ
ストを2時点で行わせる。
 平行テストとは、つぎのような性質を
持ったテストとして定義される:
2つの検査(テスト)の定義
 まず、2つの検査を、 Xi(u)
ると、
X i (u )  Ti (u )  Ei (u ) ,
X i (v )  Ti (v )  Ei (v ) .
, Xi(v) とす
平行性の概念-(1)平行測定
 平行測定
2つの検査が平行測定 (parallel
measure- ment) であるとは、
(1) Ti (u )  Ti (v) ,
(2) V (Ei (u ) )  V ( Ei (v) ),
すなわち、
平行測定の意味
 2つの検査が平行(測定)とは、
(1)両検査は、同一の特性を測定
していること、
(2)両検査は、同一の精度を有し
ていること、
を意味する。これに対して、
その他の平行性の概念ー本質的 τ 等価測定
 本質的 τ 等価測定
2つの検査が本質的 τ 等価測定 (essentially
τequivalent measurement) であるとは、
Ti(u)  Ti (v)  cuv, ここで、cuv は定数である。
平行検査(テスト)とは
-平行検査(テスト)の条件
両検査(テスト)が平行検査(テスト)であれ
ば、つぎの条件を満たす:
(1) Ti (u )  Ti (v )  Ti ,
(2) E(Tu )  E(Tv )  T ,
(3) V ( X u )  V ( X v )  V ( X ), E( Eu )  E( Ev )  0,
(4) Cov(Tu , Eu )  Cov(Tv , Ev )  Cov( Eu , Ev )  0.
平行検査とは
ー平行検査間の相関係数-1
この時、Xu と Xv の相関係数 Xu Xv は、
Cov( X u , X v )
X X 
V ( X u ) V ( X v )
E[( X u  T )( X v  T )]

V ( X u )  V ( X v)
u
v
平行検査とは-2
平行検査間の相関係数-2
ここで、先ほどの平行検査の満たすべき条件
を考慮すると、上記両検査間の相関係数 X X
は、つぎのように書ける:
u v
X X
u
v
V (T )

V (X )
検査の信頼性(係数)のまとめ
 元来、2つの平行性検査間の相関係数と
して定義される、検査の信頼性(係数)
は、当該検査得点 X の分散 V(X) と真値の
分散 V(T) を用いて、つぎのように書け
る:
V (T )
X 
V (X )
検査の信頼性のもう1つの表現-1
 上記の検査の信頼性(係数)は、既
に紹介した検査得点の分割、すなわ
ち
v(X)=V(T)+V(E)
を用いると、つぎのようにも書け
る: V (T ) V ( X )  V (E)
V ( E)
X 

1
V (X )
V (X )
V (X )
検査の信頼性のもう1つの表現-2
 すなわち、検査の信頼性は、検査の誤
差分散 V(E) と、測定値(検査得点)の
分散 V(X) の言葉でも表現できることが
わかる:
V ( E)
X  1 
V (X )
検査の信頼性(係数)と
信頼性指数-1
 検査得点 X とその真値 T との共分散 Cov
(X, T) が、
Cov (X, T)= Cov (T+E, T) = V(T)
と書けることに注意すると、X と T の相
関係数 ρXT は、
Cov( X ,T )
V (T )
V (T )
 XT 


V (X )
V ( X )  V (T )
V ( X )  V (T )
検査の信頼性(係数)と
信頼性指数-2
 すなわち、
X  XT
2
ここで、ρXT は、検査の信頼性指数
(index of reliability) と呼ばれる。この指
数と、信頼性(係数)の区別が重要であ
る。
信頼性(係数)と
信頼性指数との関係
 言い換えれば、
(1)検査得点とその真値の相関係数
は、信頼性指数と呼ばれる。
(2)検査の信頼性指数の二乗は、信
頼性(係数)に等しい。
平行検査法の特徴と問題点
 同一被験者に対して、同質な(平行テストの意
味)検査(テスト)を、2時点で行う。
 しかし、平行テストの意味で同質な検査を作成
することは、大変難しい。
 そこで、検査の信頼性(係数)を求めるには、
平行検査法以外の方法を用いることが多い。
その他の信頼性係数の求め方
 (1)平行検査法
これまでに紹介した信頼性係数の定義にかか
わる平行検査法の他に、信頼性を測定したり推定
したりする方法として、つぎの方法がある:
 (2)再検査法
 (3)折半法
 (4)内部的一致性による方法
(4-1) クーダー・リチャードソンの(第20)公式
(4-2) (クロンバックの)アルファ係数
再検査法とは?
 同一被験者に対して、同一検査を2時点で測り、
両時点 s, t での得点間の相関係数をX s Xt
とすると、つぎの関係を導くことができる:
X X
s
t
V (T )

 X
V (X )
再検査法による相関係数
と信頼性の関係
再検査法による(同一被験者の)同一検査の
2時点での得点間の相関係数は、検査の
信頼性に等しい。
再検査法の特徴と問題点
 同一被験者に対して、同一な検査(テス
ト)を、2時点で行う。
 再検査法による信頼性係数は、安定度係
数 (coefficient of stability) とも呼ばれる。
 しかし、再検査法を用いると、被験者が
前の検査結果を記憶していることが多く、
そのために信頼性が大きくなる傾向があ
り、あまり使われない(Kuder &
Richardson, 1937, p.151)。
折半法とは?
 1つの検査を同質な2つの部分に分け、
両得点間の相関係数ρ12 を計算すると、平
行性の条件が成り立つとき、つぎの関係
を導くことができる:
V (T )
212
X 

V ( X ) 1  12
折半法の特徴と問題点
 折半法では、平行検査法や再検査法による信頼性と
は異なり、1つの検査を2つの部分に分けて、両得
点間の相関係数から、うえの関係を使って検査の信
頼性(係数)を求める。
 折半法の計算式は、スピアマン・ブラウンの公式と
呼ばれる。
 折半法で検査の信頼性(係数)を計算できるために
は、折半した2つの検査が平行性の条件を満たして
いないといけない。