PowerPoint プレゼンテーション

統計手法アラカルト
パ
ン
ノ
ラ
メトリック法
行動計量学講座B3
林賢一二十一歳
nonparametrique
1
目次(適当)
• ノンパラメトリック検定とは
• ノンパラメトリック検定の特徴
• いろんな検定
– たくさんあります(18個+α)
nonparametrique
2
ノンパラメトリック検定とは
• Nonparametric tests
– ⇔Parametric tests
• 母集団分布について極めてゆるい仮定しか設け
ない統計学分野
– 分布に拠らない(distribution-free)検定
• 測定値が完全な量でなく、順序や度数として表さ
れるデータを扱う
– パラメトリック検定にはない
– データの順序や順位付けに焦点
nonparametrique
3
長所
• 母集団分布の形がわからなくてもよい
• 計算が比較的簡単
– 高校程度の数学知識しか使わない
• 仮定の壊れによる影響を受けにくい
– 頑健(robust)な検定
• 小標本に対しても適用できる
nonparametrique
4
短所
• データの浪費
– 得られた情報を十分活用できない
– パラメトリック検定に比べ検出力が劣る
• めんどい
– 方法がいろいろありすぎて使いどころに困る
– 各検定のための有意確率表が多い
• 入手するのも大変
• 分散分析モデルでの交互作用を検定できない
(特殊な仮定が必要)
nonparametrique
5
のんぱらは
• すごくたくさんほうほうがあります
• ここでぜんぶせつめいできません
– ぜんぶってなんだろう?
• だから、ここではSPSSでできるやつだけ
しょうかいします
– SASののんぱらはへぼい?
nonparametrique
6
前置き
• 関数は函数と表現します
– 好みの問題です
• 断りが無ければ、α=0.05とします
• データは全て捏造です
– 「ガッツ」は仮想量です
– ガッツに関する質問は授業後にでも・・・
nonparametrique
7
1:1標本のとき
•
•
•
•
二項検定
χ2検定
Kolmogorov-Smirnovの検定
ラン検定
– 無規則性の検定
nonparametrique
8
1-1:二項検定
• Binomial test
• 2つのカテゴリからなるデータの期待度数
と観測度数が等しいか否かを検定
– 二項分布を用いる
 N  x n x
– P( x)    p q
x
• 観測値より極端な値をとる確率を求めれ
ばよい
nonparametrique
9
例
(問)コインを20回投げたら、表が5回、裏
が15回出た。このコインは公平か?
(答)観測値より極端な値をとる確率は
 20 1   1 
p( x)  2     
x 0  x  2   2 
5
x
20  x
 0.042  0.05
よって、このコインは公平であるといえない。
nonparametrique
10
大標本の場合
• N(全事象)>25のとき、正規近似できる
x  NP,  x  NPQ
で近似でき(P≒0.5のとき)
z
x  x
x
で検定できる
nonparametrique
11
1-2:χ2検定
• Chi-square test
• 2つ以上のカテゴリからなるデータの期待
度数と観測度数が等しいか否かを検定
– χ2統計量を用いる
k
(Oi  Ei ) 2
2
–  
(Oは観測値、Eは期待値)
i 1
Ei
• 小さいほど観測値と期待値の一致はよろ
しい
nonparametrique
12
例
(問)大学生100人にガッツ税(地方税)導入に関
する意見を聞いたら、以下のようになった。
意見 大反対 反対
人数
9
中立
賛成
11
17
40
大賛成
23
(答) χ2統計量を計算する
2
2
2
(
O

E
)
(
9

20
)
(
17

20
)
i
2   i

 
 31.0
Ei
20
20
i 1
5
自由度4のχ2分布の臨界値は9.49なので、ガッツ税
に関する意見は一様でない。
nonparametrique
13
注意
• 自由度が1のとき、各期待度数が5以下
• 自由度が1以上のとき、セルの20%が5未
満か期待度数が1以下
χ2検定は適当ではない(Cochran,1954)
• そういうときは隣接するカテゴリを結合して
みるのもよい(2つになったら二項検定)
nonparametrique
14
1-3:Kolmogorov-Smirnovの検定
• 標本分布がある特定の理論分布と一致するか
否かの検定
– 適合度検定
• F0(X)
– 指定された累積度数分布函数
• SN(X)
– N個の観測値による標本の累積度数分布
• D  F0 ( X )  SN ( X ) の最大値を最大偏差と呼ぶ
• 数表からDの臨界値を調べる
nonparametrique
15
確率
• 二項分布に従う

p q
p
q p
P S N ( X )     F0 ( X ) 1  F0 ( X )
q   p

nonparametrique
16
例
(問)学生10名に狩野先生のめがねの色が異な
る写真を見せ、好みを聞いた。好みは偏るか?
色
1(透明)
2(微黒)
3(弱黒)
4(半黒)
5(真っ
黒)
人数
0
0.2
1
0.4
0
0.6
5
0.8
4
1.0
S10 ( X )
0.0
0.1
0.1
0.6
1.0
F0 ( X )
0.2
0.3
0.5
0.2
0.0
D
(答)maxD=0.5であり、数表からN=10のとき臨界値
は0.41なので、好みは偏っているといえる
nonparametrique
17
検出力
• Kolmogorov-Smirnov検定は個々の観測
値を個別に扱う
– カテゴリの結合を通して情報を失わない
– χ2検定より検出力高い
nonparametrique
18
1-4:ラン検定
• 2つの変数(表/裏、男/女など)の観測の順
序がランダムか否かを検定
• ラン(run、連)の数に基づく検定
• コインを20回投げ、表、裏ともに10回ずつ
出た。公平なコインだろうか?
表表表表表表表表表表裏裏裏裏裏裏裏裏裏裏
表裏表裏表裏表裏表裏表裏表裏表裏表裏表裏
nonparametrique
こんなんでも?
こんなんでも?
19
ランとは
• run
• ひとつの変数の、ひとつの継続
蟹鮭鮭鮭蟹蟹蟹鮭蟹鮭
run
run
run
run run run
この場合、ランは6つ
nonparametrique
20
確率
• 二つの変数をn1、n2(N=n1+n2 )としたとき、
ランのが数r(≦N)である確率は

 n1  1 n2  1  n  n 
1
2






 rが偶数のとき
2 r
r
  1   1   n1 

 2  2 
P(r )  
 n1  1 n2  1  n1  1 n2  1  n1  n2 
 k  1  k  2    k  2  k  1   n 

 

  1 

rが奇数のとき(r=2k-1)
nonparametrique
21
ランをもとに
• 二つの変数をの総数(それぞれn1、n2)から
数表を引いてランダム性を検定
• n1、n2のいずれかが20以上のとき
2n1n2
2n1n2 (2n1n2  n1  n2 )
r 
 1,  r 
n1  n2
(n1  n2 ) 2 (n1  n2  1)
で正規近似でき
z
r  r
r
で検定できる
nonparametrique
22
例
(問)コインA、Bをそれぞれ20回投げ、表、
裏10回ずつ出た。公平なコインだろうか?
A:表表表表表表表表表表裏裏裏裏裏裏裏裏裏裏
B:表裏表裏表裏表裏表裏表裏表裏表裏表裏表裏
(答)A系列はラン2個。B系列はラン20個。
n1=n2=10のとき、数表より、コインがランダ
ムならばランは6~16の値をとる。よってど
ちらのコインも公平とはいえない。
nonparametrique
23
SPSSを使おう1の1
• ラン検定を例に
• 左のようにデータを入力
• 分析の前に名義変数を量
的変数に変換すること
– めんどくさいですね
nonparametrique
24
SPSSを使おう1の2
変換した変数
の名前を指定
• 「変換」→「値の再割当て」→「ほかの変
数」
• 「今までの値と新しい値」で、変換の種類を
指定
nonparametrique
25
SPSSを使おう1の3
今までの値を指定
新しい値を指定
既に指定した
変数
名義変数から量的変数に変換する
nonparametrique
26
SPSSを使おう1の4
連 によ る 検 定
検定値a
ケース < 検定値
ケース > = 検定値
全ケース
連の個数
Z
漸近有意確率 (両側)
a. 中央値
A
.5000
10
10
20
2
-3.905
.000
• 「分析」→「ノンパラメ
トリック検定」→ラン
• 分割点は中央値でよ
い
nonparametrique
27
2:2標本(独立)のとき
• Kolmogorov-Smirnovの検定
– 位置母数の検定
• Mann-WhitneyのU検定
• Wald-Wolfowitzのラン検定
• Mosesの外れ値反応検定
分布の位置と形を特定
– 過剰反応に関する検定
nonparametrique
28
2-1:Kolmogorov-Smirnovの検定
• Kolmogorov-Smirnovの2標本検定
• 独立な2標本が同じ分布を持つ母集団から
抽出されているか否かを検定
• 1標本の場合とほぼ同じ
• 一方の累積度数分布を Sn1 ( X ) 、他方を
Sn2 ( X )
とおき、その最大偏差Dをみる
– で、数表を引く
nonparametrique
29
大標本の場合(n 、n が40以上)
1
2
• 両側検定の臨界値は1.36 (n1  n2 ) n1n2
で求められる
• 片側検定の場合は下式が自由度2のχ2分
布に近似できることから求める
n1  n2
  4D
n1n2
2
2
nonparametrique
30
特徴
• 標本が非常に小さいときは、U検定よりも
やや効率がよい
• 大標本に対しては逆に効率が悪い
nonparametrique
31
2-2:Mann-WhitneyのU検定
• 独立な2標本が同じ分布を持つ母集団から
抽出されているか否かを検定
• 順序尺度が適用できるときに利用
• 2標本をひとまとめにし、昇順に順位付け
– U統計量を算出
• ノンパラメトリック検定の中で極めて検出力
が高い
nonparametrique
32
U統計量
一方の標本(n1個)の順位の和をR1、他方の
標本(n2個)の順位の和をR2としたとき
n1 (n1  1)
n2 (n2  1)
U1  R1 
, U 2  R2 
2
2
とし、小さいほうをU統計量として数表から臨
界値を得る。
ちなみに U1  U 2  n1n2
nonparametrique
33
大標本の場合
• 2標本のデータ数がそれぞれ10以上
– 統計解析ハンドブック
• 小さい方の標本のデータ数が20以上
– ノンパラメトリック統計学(S.Siegel)
のとき、Uは正規近似でき
n1n2
n1n2 (n1  n2  1)
U 
, U 
2
12
U  U
z

から、
で近似する
U
nonparametrique
34
例
(問)小学二年生と人科三回生で逆上がり10回
中10回成功するまでの回数を調べた。逆上がり
の上達に差があるだろうか?
小2(S)
9
11
15
人3(J)
6
8
10
13
(答)二つの群をひとまとめにし、順位をつける
順位
1
2
3
4
5
6
7
回数
15
13
11
10
9
8
6
群
S
J
S
J
S
J
J
nonparametrique
35
つづき
U(順位の合計)は、RS=1+3+5=9なので
nS (nS  1)
U S  RS 
3
2
数表より、このデータ数のときにUがこの値
をとる確率は0.2であり、小学2年生と人科3
回生の逆上がりの上達に差は無い
nonparametrique
36
2-3:Wald-Wolfowitzのラン検定
• 独立な2標本が同じ母集団から抽出され
たものか否かを検定
• 1標本ラン検定と同じ
• 2つの標本をひとまとめにして、順番に並
べてランを算出、検定
nonparametrique
37
2-4:Mosesの外れ値反応検定
• 過剰反応に関する検定
• ある状況や条件が、ある人には一方に過
剰な反応を起こさせ、またあるひとには逆
方向に過剰な行動を起こさせることを想定
してデザインされた検定
• わかりづらいので、わかりづらい例で説明
します
nonparametrique
38
例
(問)パーソナリティ・テストから判別して、自分の衝
動を統制できる人のグループ(C群)と、統制が困
難である人のグループ(E群)それぞれ9名ずつに、
達成困難な課題をさせた後、ガッツを測定し、課題
前後でのガッツの差を比較した。2つのグループの
間で変動の仕方に差はあるだろうか?
C
12
16
6
13
13
3
10
10
11
E
25
5
14
19
0
17
15
8
8
2群の課題前後でのガッツの差
nonparametrique
39
仮説
• E群のほうが課題による苛つきを解消できず、
ガッツの変動が大きいだろう
• ガッツが増える人もいるだろうし、減る人もいるだ
ろう
– E群の差の平均は0に近い?
• C群はあまり変わらないだろう
– やっぱり平均は0?
• 今までの検定じゃ対応できない
– Mosesの検定は、こうした状況を想定した検定方法な
のです
nonparametrique
40
新しい概念
• スパン(span)
– 得点をひとまとめにしたときの、ひとつの群の順位の
範囲
– s  で表す
– 要するにレンジ(range)
• レンジの不安定さを考慮して修正
– 端点を取り去ったスパン(truncated span)
– sh で表す
– 取り去る数hは自分で決める
nonparametrique
41
例のつづき
(答)ひとまとめにして、順位をつける
順位
1
2
3
4
5
6
ガッツ
0
3
5
6
8
8 10 10 11 12 13 13 14 15 16 17 19 25
群
E
C
E
C
E
E
7
C
8
C
9 10 11 12 13 14 15 16 17 18
C
C
C
C
E
E
C
E
E
Cのスパンは14。端点を除いた sh は9(h=1)。最小
な shは7だから観測値との差は2であり、これをgと
おく。つまり、
sh  9, h  1, g  2
nonparametrique
42
E
例のつづきのつづき
求めるのは、sh が観測値より極端な値をと
る確率だから
 i  nC  2h  2  nE  2h  1  i 




nE  i
i
i 0 



P( sh  nC  2h  g ) 
 nC  nE 


 nC 
g
であり、これよりp=0.077であり、両群に差が
あるとはいえない
nonparametrique
43
SPSSを使おう2の1
•
•
•
•
•
•
U検定を例に
左のようにデータ入力
名義変数を変換
小2→0
人3→1
「ノンパラ」→「2個の独
立サンプルの検定」
nonparametrique
44
SPSSを使おう2の2
検定したい変数を指定
変数をどう分けるか指定
検定の種類を選択
グループ化させる数値を指定
nonparametrique
45
3:2標本(対応)のとき
• 符号検定
• Wilcoxonの符号順位和検定
• McNemarの検定
– 変化の顕著性に関する検定
• 周辺等質性検定
– Exact testがないと使えない
nonparametrique
46
3-1:符号検定
•
•
•
•
•
Sign test
対応のある2標本に用いる
順序尺度のときに適用
2標本の差の符号に注目
一方をA群、他方をB群としたとき、検定さ
れる帰無仮説は p( X A  X B )  p( X A  X B )  1 2
• 確率は二項分布によって与えられる
– 大標本のときの近似も二項検定と同じ
nonparametrique
47
例
(問)人科17名の1回生のときと4回生のときの体
育の成績を比較した。差はあるだろうか?
学生 a
b
c
d
e
f
g
h
i
j
k
l
m n
o
p
q
1回
4
4
4
2
3
2
4
3
1
3
4
3
2
3
4
4
2
4回
2
3
2
1
3
3
3
3
2
2
2
2
3
2
4
3
1
成績(優=4、良=3、可=2、不可=1)
nonparametrique
48
つづき
(答)タイ(差が0)は検定から落とす。このときN=14。
学生 a
b
c
d
e
2
1
2
1
符号 +
+
+
+
差
f
g
h
i
j
k
l
m n
o
p
q
0 -2 1
0 -1 1
2
1 -2 1
0
1
1
0 - +
0 - +
+
+ - +
0
+
+
表より、符号が負であるのは3個。これより極端な
結果になる確率は、片側検定で
x
14  x
14  1   1 
p       
x  0  x  2   2 
3
 0.029
であり、1回のときのほうが成績がよいといえる
nonparametrique
49
3-2:Wilcoxonの符号順位和検定
•
•
•
•
Wilcoxon’s sign rank test
符号検定の強力版
差の向きだけでなく、大きさも考慮
一方のスコアをxi、他方をyiとして
di  xi  yi
に順位をつける
• 少ないほうの符号を持つ順位の和をTとし
て、数表から臨界値を得る
nonparametrique
50
大標本の場合
• N(全事象)>25のとき、正規近似できる
N ( N  1)
T 
, T 
4
N ( N  1)(2 N  1)
24
で近似でき
z
x  T
 Tx
で検定できる
nonparametrique
51
例
(問)人科生8名について一週間ジムに通った後と、
一週間事務的な事をした後でガッツを測定した。差
はあるだろうか?
学生
ジム
事務
差
順位
a
82
63
19
7
b
69
42
27
8
c
73
74
-1
1
d
43
37
6
4
e
85
51
7
5
f
56
43
13
6
g
76
80
-4
3
h
85
82
3
2
(答)少ない符号の順位の和T=4なので、数表よりジ
ムと事務ではガッツに差があるといえる
nonparametrique
52
3-3:McNemarの検定
• 主に前・後(before-after)計画に適用
– 前後でどれだけ傾向が変わるか
– 変化の顕著性
• 名義尺度、順序尺度に適用
後
• 右のような表を用いる
- +
• AとDに注目
前 + A B
-
nonparametrique
C
D
53
で
• A=Aでの観測数、D=Dでの観測数とすると
2
(
O

E
)
2  
E
A, D
( A  D) 2

A D
は自由度1のχ2分布に近似できる
nonparametrique
54
例
(問)学生25名にガッツ税の賛否を2回調査した。1回
目と2回目の間にあるビデオテープを見せた。これは
意見を賛成に向けさせる効果をもつと期待される。
本当に効果あるか?
2
(
4

14
)
2

 5.56
(答) 
14  4
であり、自由度1 のχ2分布の臨界
値は3.84なので、ビデオテープに
は効果があるといえる
nonparametrique
後
前
否
賛
賛
4
4
否
3
14
55
3-4:周辺等質性検定
• 周辺対称性とも
• 2つの関連のある順位変数に対する検定
• 2値反応(McNemar検定)の、多値反応へ
の一般化
• χ2分布を使って、反応の変化を検定
• 前後計画における反応の変化を調べるの
に適す
nonparametrique
56
方法
•
•
•
•
詳しいことはよくわかりません
2次元分割表
帰無仮説は
H0 : pij  p ji
分解すると
• MH統計量
H01 : pi  pi
H02 : pij p jk pki  p ji pik pkj
– Marginal Homogeneity?
– Mantel Haenszel?
nonparametrique
57
SPSSを使おう3の1
• 符号検定を例に
• 例によって左の如く
• 「ノンパラ」→「2個の対応
サンプルの検定」
nonparametrique
58
SPSSを使おう3の2
検定したい変数の
組を指定
検定の種類を選択
で、実行(出力は省略)
nonparametrique
59
4:k標本(独立)のとき
• χ2検定
– 割愛
• 中央値検定
• Kruskal-Wallisの分散分析
• Jonckheere-Terpstraの検定
– Exact Testsがないと使えない
• SPSSの使い方は2標本と同じ
nonparametrique
60
4-1:中央値検定
• Median test
• k組の独立な標本が、同一母集団から抽出
されているか否かを検定
• データは順序尺度
nonparametrique
61
方法
• k組の中央値を求める
• kこの中央値の中央値を求める
• 中央値の中央値より大きいなら+、小さい
なら-に置換
• で、 χ2値を計算
nonparametrique
62
例
(問)母親の最終学歴と母親の学校訪問回数に
関係があるといえるか?
学歴
小学校
中学校
高校
大学
回数
4
3
7
1
2
0
3
5
1
24
1
6
3
0
2
5
1
2
1
2
0
4
3
8
0
5
2
1
7
6
5
1
9
4
2
3
2
4
5
2
2
6
nonparametrique
63
例つづき
(答)群毎にデータを中央値の中央値以上、
以下に分類 する
学歴
小学校
中学校
高校
大学
以上
5
4
7
6
以下
5
7
6
4
r
k
 2  
i 1 j 1
(Oij  Eij ) 2
Eij
1.295  7.82(  32 )
となり、母親の学歴によって差があるとは
いえない
nonparametrique
64
4-2:Kruskal-Wallisの分散分析
• k組の独立な標本が、同一母集団から抽出
されているか否かを検定
• 連続変量を順序に置き換える
• 1元配置
nonparametrique
65
方法
• ひとまとめにして順序をつける
• njをj組目の標本数、Rjをj組目の順位の和、
Nを全標本数とする
• このとき
k R2
2
12 分布に近似的に従う
は自由度k-1のχ
j
H

N ( N  1)
n
j 1
 3( N  1)
j
nonparametrique
66
例
(問)ある店でバイト君と社員と客のガッツを測定
した。3つの群のガッツは等しいだろうか?
群
ガ
ッ
ツ
社員
バイト
客
96
128
83
61
101
82
124
132
135
109
115
149
166
147
nonparametrique
67
例つづき
(答)順位をつける(降順)
群
ガ
ッ
ツ
社員
バイト
客
4
9
3
1
5
2
8
10
11
6
7
13
14
12

12  222

H
   3(14  1)
14(14  1)  5

 6.4
数表より群の標本数(5,5,4)のときp<0.049
であり、ガッツが等しいとはいえない
nonparametrique
68
検出力
• 95.5%の漸近効率
• 中央値検定よりよい
– データを2分せず、順位とすることでデータの
情報をより多く利用しているから
nonparametrique
69
4-3:Jonckheere-Terpstraの検定
• k 個の母集団の自然な 事前の位付け (昇順
または降順) があるときに有効
• 例えば、k 個の母集団が k 段階の上昇温度
を表す場合
– 帰無仮説:異なる温度で同じ反応
– 対立仮説:温度の上昇につれ反応が上昇(下
降)
• 対立仮説が順序付けられる
nonparametrique
70
方法
• H1 : F1 ( x)  F2 ( x)    Fk ( x) とする
• 母集団i、j(i<j)からの標本で、xij<xjvをみた
す組の数をUijとするとき
k 1
k
J   U ij
i 1 j i 1
を検定に用いる
nonparametrique
71
大標本の場合
• N(全事象)>9のとき、正規近似できる
k
N n
2
J 
j 1
4
k
2
j
N (2 N  3)   n (2n j  3)
2
, J 
j 1
で近似でき
z
2
j
72
x  J
J
で検定できる
nonparametrique
72
5:k標本(対応)のとき
• CochranのQ検定
• Friedmanの分散分析
• KendallのW検定
– 一致度係数
• SPSSの使い方は2標本のときと同じ
nonparametrique
73
5-1:CochranのQ検定
• k組の対応ある標本の、それらの間で有意
差があるかを検定
• McNemar検定の拡張
– 従って、データは2値反応
nonparametrique
74
方法
• データがN×k表になっているとする
• Gjをj列における成功数、Liをi行における
成功数、Nを全標本数とする
• このとき
2


k
k
N
N
2




2
は自由度k-1のχ
Q  (k  1) k G 分布に近似的に従う
 G 
k L L




j 1
j

 j 1
j
nonparametrique
 
 


i 1
i

i 1
i
75
例
• ある意見調査の、主婦の解答
– 調査に応じてくれるか否か
– 調査員の態度が影響するだろうか?
• 3種類の態度
– 1:興味、親切、熱心
– 2:礼儀、遠慮、丁寧
– 3:無関心、無遠慮、無礼
nonparametrique
76
例つづき
yes=1
no=0
組
態度1 態度2 態度3
Li
Li2
1
0
0
0
0
0
2
1
1
0
2
4
中略
中略
中略
中略
中略
中略
18
1
1
1
3
9
計
13
13
3
29
63
G1
G2
G3
nonparametrique
77
例つづきつづき
• Qを計算する
– 16.7
– 自由度が3-1=2
– このとき、p<0.001
• 面接員の態度によって主婦の態度も変わ
るといえる
nonparametrique
78
5-2:Friedmanの分散分析
• k組の対応ある標本の、それらの間で有意
差があるかを検定
• 順序尺度に適用
• 2元配置
nonparametrique
79
方法
• データがN×k表になっているとする
• Rjを第j列の順位の和、とする
• このとき
2分布に近似的に従う
は自由度k-1のχ
k
12
 
2
r
(R )

Nk (k  1)
j 1
nonparametrique
j
2
 3N (k  1)
80
検出力
• パラメトリックな分散分析とは優劣つけが
たい(Friedman,1937)
• CochranのQ検定よりは良い
– Nが小さすぎると使用されるべきではないのに
対して、Friedmanのは小標本でも正確
nonparametrique
81
例
• だんだん適当に・・・
• こんな表があったとしますよ
群A
群B
群C
Ⅰ
9
6
9
要因
Ⅱ
Ⅲ
4
1
5
2
1
2
nonparametrique
Ⅳ
7
8
5
82
例つづき
• で、順序(群内で)に直す
• Rjを基に統計量を算出
– 7.4
– 数表をひく
– 有意
群A
群B
群C
Rj
Ⅰ
4
3
4
11
nonparametrique
要因
Ⅱ
Ⅲ
2
1
2
1
1
2
5
4
Ⅳ
3
4
3
10
83
5-3:KendallのW
• W?
– k組の変量間の連関の度合
• 相互試験間の信頼性の測定に有用
nonparametrique
84
考え方
• ある事象の順位が、群間で何か関連ある
かを確かめるには?
全ての対のrs(スピアマンの順位相関係
N
数)の平均はどう?
6 ( xi  yi )
rs  1 
i 1
N3  N
だめ!めんどい(kが大きくなると)
nonparametrique
85
ここで・・・
• W、登場
• 計算がずっと簡単
• 全ての対で得られたrsに対して線形な関係
がある
kW  1
rs 
k 1
nonparametrique
86
方法
•
•
•
•
データがk×N表になっているとする
Rjを第j列の順位の和、とする
Rjの平均からの偏差の平方和をsとする
このとき
s
W
1 2 3
k (N  N )
12
• Wは0(関連なし)~1(完全な一致)になる
– 分散の大きさの程度の函数
nonparametrique
87
有意性の検定
• N<7(小標本)のときは数表を引く
• それ以上(大標本)のときは
が自由度N-1のχ2分布に近似的
s
2
 
に従うことから検定する
1
kN ( N  1)
12
nonparametrique
88
例
• 3兄弟に6種類の食べ物を食べさせ、好き
な順に順序付けさせた
長男
次男
三男
Rj
食い物
寿司 蟹玉 蕎麦 麩
1
6
3
2
1
5
6
4
6
3
2
5
8
14
11
11
nonparametrique
湯葉 心太
5
4
2
3
4
1
11
8
89
例つづき
• sを計算

Rj 


  25.5
s   Rj 

N


2
• Wを計算
W
25.5
1
(3) 2 (63  6)
12
nonparametrique
 0.16
90
例つづきつづき
• 有意性を検定
• 数表を引く
– k=3、N=6のとき、有意であるためにはs≧103.9
でなければならない
– 非有意
nonparametrique
91
つけたし
• 今日紹介したものがノンパラの全てではあ
りません
– 連関の測度だけでもたくさんあります
• 今回は、タイ順位の処理法については割
愛しました
• ノンパラメトリックな多重比較法もあります
– SPSSではできません
nonparametrique
92
多重比較法
• ちょっとだけ紹介
• サンプルサイズ小→ノンパラ は誤り
– 大標本近似に基づいているから、近似精度に
問題がある
• Still-Dwassの方法
– Tukeyの方法のノンパラメトリック版
• Stillの方法
– Dunnettの方法のノンパラメトリック版
nonparametrique
93
参考文献
•
•
•
•
•
•
•
•
•
SPSS Base 10.0J User’s Guide SPSS Inc.
SPSS Base 10.0 Applications Guide SPSS Inc.
E.L.Lehmann ノンパラメトリックス 森北出版 1981
J.Hajek ノンパラメトリック統計学 日科技連 1974
武藤眞介 統計解析ハンドブック 朝倉書店 1995
永田靖 統計的多重比較法の基礎 サイエンティスト社 1997
S.Siegel ノンパラメトリック統計学 マグロウヒル 1983
S.Siegel Nonparametric Statistics(2nd Ed.) McGraw Hill 1988
柳川尭 ノンパラメトリック統計学 培風館 1982
nonparametrique
94
おしまい
nonparametrique
95