行動計量学実験実習 ~SPSS tablesとExact Testの巻~

行動計量学演習Ⅱ
~SPSS tablesとExact Testの巻~
行動計量学講座 B3
紺谷幸弘
まずはtablesから…
• SPSS tablesとは
– 勝手に表を組んでくれるスグレモノ
例えばこんな具合に↓
最高
女性
男性
中国
北海道
北陸
関東
近畿
九州
沖縄
四国
東北
中部
中国
北海道
北陸
関東
近畿
九州
ロ シア
四国
東北
高
メガネなし
普通
低
最低
1
最高
高
メガネ有
普通
低
最低
1
1
1
1
1
1
1
1
2
1
2
1
1
1
2
1
1
1
1
1
2
1
1
1
1
2
1
1
1
1
1
1
SPSS tablesとExact Test
2
具体的に何ができますか
• マウス一つで大体の表組みが思いのま
ま!!
• マウス一つで平均や分散などのデータの
要約までしてくれる!!
• 多重回答の表までできてしまう!!
SPSS tablesとExact Test
3
実際にSPSS Tablesを動かしてみよう
• 次のスライドから実際(仮)にSPSS Tablesを使ってみま
しょう
• 今回はその例として列パーセントをやりたいと思います
こ
ん
な
の
SPSS tablesとExact Test
4
実際のローデー
タ
入力場面
SPSS tablesとExact Test
5
1.ここを選択
↓
クリック
SPSS tablesとExact Test
6
2.こんな箱が出ます
この箱を
ダイアログボックス
といいます
3.行変数として扱いたいものを
選択して…
4.ここをクリック
SPSS tablesとExact Test
7
5.行変数として
追加されます
6.列変数にしたい変数も
同じ要領で…
SPSS tablesとExact Test
8
7.行変数と
列変数を
指定できたら…
8.ここをクリック!!
SPSS tablesとExact Test
9
10.ここをクリックす
ると…
9.「列%」を選んで…
SPSS tablesとExact Test
10
11.ここに統計量が
追加されます
12.ここをクリック!!
SPSS tablesとExact Test
11
F.ここをクリック!!
すると...
SPSS tablesとExact Test
12
列の%の表が出来てしまうのです!!!
なんて便利なんだ...
SPSS tablesとExact Test
13
別
紙
の
マ
ニ
ュ
ア
ル
と
の
関
連
一つのダイアログボックス
であることを示します
ダイアログボックス名を
示します
ボタンであることを
示しています
上の操作を行うと
下のダイアログボックスが
開くことを表しています
注意書きです
それではいよいよ説明に…
SPSS tablesとExact Test
14
大事な概念(1)
• 入れ子と積み重ね(1)
最高
性別
女性
男性
出身地
出身地
中国
北海道
北陸
関東
近畿
九州
沖縄
四国
東北
中部
中国
北海道
北陸
関東
近畿
九州
ロ シア
四国
東北
ガッツ
普通
高
低
最低
最高
1
性別
1
1
2
1
1
1
2
出身地
1
1
2
1
1
1
2
1
2
1
1
1
1
2
1
1
1
2
1
1
1
1
1
↑性別と出身地
が入れ子
女性
男性
中部
中国
北海道
北陸
関東
近畿
九州
沖縄
ロ シア
四国
東北
ガッツ
普通
高
1
2
3
2
1
2
1
1
低
5
5
1
2
1
2
1
1
2
最低
4
7
3
6
2
1
1
1
3
2
1
2
1
2
1
1
2
1
1
1
↑性別と出身地が
積み重ね
SPSS tablesとExact Test
15
大事な概念(2)
• 入れ子と積み重ね(2)
– 「AがBの入れ子になっている状態」とは
A
B
↑積み重ねの状態
B
A
AがBの入れ子になっている状態
(AがBの中に入っている状態)
SPSS tablesとExact Test
16
大事な概念(3)
• 行・列・層とは
層
層
層
列
行
列
行
行
列
行→表の長さ
列→表の幅
層→表の奥行き
SPSS tablesとExact Test
17
大事な概念(4)
• 次元とは
– 簡単に言えば階層のこと
• 高い階層=上位の次元
• 低い階層=下位の次元
上位の次元
上位の次元
下位 下位 下位
下位の次元
↑入れ子の場合
↑列次元
SPSS tablesとExact Test
上
位
の
次
元
下位
下位
下位
下位
下位
下位
↑行次元
18
変数について(1)
• カテゴリ変数(categorical variable)
– セルの定義に用いられる変数
– 観測値が質的な値をとるような変数
• 集計変数(summary varible)
– 数量を表す基数
– 観測値が量的な値をとるような変数
• 行(列、層)変数(row (column, layer) variable)
– 行(列、層)を定義している変数
• 管理変数(controlling variable)
– 別の変数が入れ子になっている変数
– 入れ子の状態で下位の変数を持つ変数
SPSS tablesとExact Test
19
ちょっと横道
管理変数について
• 下位変数を持てば全て管理変数というわけでは
ない
• 別の変数でなければならない
性別
男
性別
女
男
女
車の所持 車の所持
有り 無し 有り 無し
↑別の変数が入れ子になっていない
= 性別は男(女)の管理変数ではない
↑別の変数が入れ子になっている
= 性別は車の所持の管理変数である
SPSS tablesとExact Test
20
変数について(2)
• 度数変数(frequency variable)
– 度数のこと
• 要約変数(summary statistics)
– 要約統計(平均とか分散など)によって算出さ
れた値
• ダミー変数(dummy variable)
– 値が有効かそうでないか(欠損値かどうか)を
1と0を用いて区別している変数
SPSS tablesとExact Test
21
変数について(3)
• 目標変数(target variable)
– ダミー変数に名前を付けた変数
• 多重カテゴリ変数(multi-category variables)
– 多重回答をカテゴリとしてコード化した変数
– 詳しくは後述
• 2分変数(dichotomies)
– 多重回答を2種類の変数(1と0、yとnなど)とし
てコード化した変数
SPSS tablesとExact Test
22
そろそろ本題に…
• SPSS tablesの機能を三つに大分すると…
– 基本的なテーブル表手続き
• テーブル表の中の全変数に機能を均等に適用するテーブル表
– 総合的なテーブル表手続き
• 設定(入れ子、積み重ね、統計量など)を変数ごとに個別にできる
テーブル表
• 多重回答変数をテーブル表にするときもこれを使う
– 度数表手続き
• 複数のカテゴリ変数が存在し、いずれも同じカテゴリを共有している
ようなデータのときに使う
SPSS tablesとExact Test
23
基本的なテーブル表手続き(1)
• ほとんどの表作成はこれで事足りる
• 基本的な使い方はどの手続きもほとんど
同じ
これができれば全部の手続きができるようになる!!
SPSS tablesとExact Test
24
基本的なテーブル表手続き(2)
• 積み重ねと入れ子について
– 行や列に別の変数を追加すると、同次元の別の変数
(積み重ね)になる
– 入れ子にしたほうが表自体は簡潔になる
• 次元を減らせることも(主に層次元)
• 変数の位置について
– 従属変数は行、独立変数は列におく
→強調したい変数を列に置く(横に並べる)
– 入れ子の場合は従属変数を独立変数の入れ子にする
→従属変数についての詳しいデータが得られる
SPSS tablesとExact Test
25
基本的なテーブル表手続き(3)
• パーセントについて
– 列パーセント:列の合計が100%
– 行パーセント:行の合計が100%
– 層パーセント:層の合計が100%
※但し、積み重ねのデータの場合にはカテゴリごとの
合計が100%になるようになる(列%の場合)↓
女性
男性
高
低
普通
高
低
普通
メガネなし
度数
列%
1
5%
2
10%
1
5%
3
15%
9
45%
4
20%
メガネ有
度数
列%
3
17%
5
28%
4
22%
1
6%
4
22%
1
6%
↑入れ子は全部を通しての合計値
めがね
性別
ガッツ
女性
男性
高
低
普通
メガネなし
度数
列%
4
20%
16
80%
4
20%
11
55%
5
25%
メガネ有
度数
列%
12
67%
6
33%
4
22%
9
50%
5
28%
↑積み重ねはカテゴリ毎の合計値
SPSS tablesとExact Test
26
基本的なテーブル表手続き(4)
• 合計について
– グループ合計:欠損値を無視した合計
– 表合計:欠損値も含めた合計値
※欠損値がない時は表合計の必要はない
めがね
性別
グループ合計
ガッツ
グループ合計
表合計
女性
男性
高
低
普通
メガネなし
度数
列%
4
20%
16
80%
20
100%
4
21%
11
58%
4
21%
19
100%
20
100%
グループ合計
表合計
メガネ有
度数
12
6
18
4
9
5
18
18
列%
67%
33%
100%
22%
50%
28%
100%
100%
度数
↑あっ!!SPSS tablesとExact Test
16
22
38
8
20
9
37
38
列%
42%
58%
100%
22%
54%
24%
100%
100%
度数
16
22
38
8
20
9
37
38
列%
42%
58%
100%
22%
54%
24%
100%
100%
27
基本的なテーブル表手続き(5)
• 並べ替えについて
– どの統計量を指定しても、度数によって並べ替えられる
– 合計列、合計行の両方が昇順(降順)になるようになる
めがね
性別
グループ合計
ガッツ
グループ合計
女性
男性
すてき度
高
普通
低
すてき度
すてき度
メガネ有
度数
標準偏差
12
17425
6
869066
18
501770
4
27237
5
335
9
708977
18
501770
グループ合計
メガネなし
度数
標準偏差
4
145
16
81614
20
73571
4
163005
5
23626
11
20672
20
73571
度数
16
22
38
8
10
20
38
標準偏差
15297
455357
347970
114178
16965
475792
347970
↑縦も横も度数で昇順になっている(標準偏差は無視)
SPSS tablesとExact Test
28
基本的なテーブル表手続き(6)
• 要約統計量について
– 別の変数ごとの集計変数の要約統計量を求めること
ができる(サブグループ化)↓
• 例えば虫歯の本数の要約統計量を男女別に見たりとか…
度数
女性
男性
高
低
普通
高
低
普通
すてき度
すてき度
すてき度
すてき度
すてき度
すてき度
1
2
1
3
9
4
メガネなし
標準偏差
中央値
.
65
210
203
.
64
188118
852
22608
321
26124
3195
平均値
65
203
64
109212
10820
15282
度数
3
5
4
1
4
1
メガネ有
標準偏差
中央値
31452
54
14258
654
341
359
.
54
1062179
16508
.
2
平均値
18203
7193
359
54
542043
2
↑こんな具合に…
SPSS tablesとExact Test
29
基本的なテーブル表手続き(7)
• 表の提示ルールについて(1)
-四捨五入した数字を用いる
・有効数字は2桁くらいで
暗算が簡単になり、
表が見やすくなる
-比較する数字は近くに配置
-統計量は列に配置(統計量ラベルは列上部
に配置)
-表の中の規則的・例外的なデータは脚注で要約
SPSS tablesとExact Test
30
基本的なテーブル表手続き(8)
• 表の提示ルールについて(2)
-表全体に関する表記には、見出しを使う
-異なる種類の区分けには格子線かスペースを
使う
・ 区分けする項目が多いときにはスペース、少ない
ときには格子線
-記号やラベルには意味のわかりやすく、覚え
やすいものを使う
・略語なんてもってのほか
-ラベルは統一する
-主な層は同ページで比較できるようにする
SPSS tablesとExact Test
31
度数表手続き(1)
• どんな時に使うんだ
– 一連の質問の選択肢が全て同じ場合に使う
• Ex )質問紙の5件法
• 基本的なテーブル手続きではできんのか
– できます
• じゃあ何で使うんだ
– 便利なんです
SPSS tablesとExact Test
32
度数表手続き(2)
• どこが便利なんだ
– サブグループの定義が簡単
• サブグループとは(復習):ある度数変数において
別のカテゴリで入れ子にすること
• それだけです
SPSS tablesとExact Test
33
総合的なテーブル表手続き(1)
• どんな時に使うんだ
– 変数ごとに積み重ねと入れ子を使い分けたい
とき
– 変数ごとに異なる統計量を使い分けたいとき
– 複雑な合計を使いたいとき
SPSS tablesとExact Test
34
総合的なテーブル表手続き(2)
• 統計次元と要約次元について
– 総合的なテーブル表手続きに独特の概念
• 次元について
– 行次元とか列次元とか
– 統計次元とは
• 変数の統計量を指定できる次元のこと
– 要約次元とは
• 変数の要約統計量を指定できる次元のこと
こんな説明で分かるかいや…
SPSS tablesとExact Test
35
要するに…
計算して出した値は行か列に揃え
なければならないということです
SPSS tablesとExact Test
36
総合的なテーブル表手続き(3)
• 総計も出せるぞ!!
– テーブル表が積み重ねになっているとき有用
– ダミー変数を使う(ちょっと面倒)
• 次はいよいよ多重回答だ!!!
SPSS tablesとExact Test
37
総合的なテーブル表手続き(4)
• 多重回答とは
– 一人の回答者に一つの質問に対して複数の
回答権を持たせるような質問形式
– アメリカの国勢調査では自由回答形式の質問
に回答後、同じ話題の具体的質問にはい・い
いえで答える形式質問(以下Y/N形式)に回答
という形式が取られている
→この二つの形式それぞれについて説明
SPSS tablesとExact Test
38
総合的なテーブル表手続き(5)
• 自由回答をどのように変数化するか(1)
– 答える順について変数を作る↓
1.大ケガをした
2.子どもが入院した
Q.過去一年間で
あなたや家族が抱えた、
最も深刻な問題は何ですか?
1.クルマが盗まれた
1.微分ができない
2.酒が飲めなくなった
3.ガッツが足りない
4.小遣いが足りない
5.トマトが食べられない
質問者
回答者ら
SPSS tablesとExact Test
変数1
変数2
変数3
変数4
切り捨て
39
総合的なテーブル表手続き(6)
• 自由回答をどのように変数化するか(2)
– 前スライドのようにして集められた4つの変数
内のカテゴリを7つの一般的なカテゴリに再割
り当てする(1991 U.S. General social
Survey.savに従う)
このようにして定義された変数を
多重回答カテゴリ変数
という
※いくつもある多重カテゴリ変数をまとめて多重回答グループという
SPSS tablesとExact Test
40
総合的なテーブル表手続き(7)
• Y/N形式をどのように変数化するか
はい→1
いいえ/無回答/該当なし→0
として一つの変数に定義
このように定義された変数を
という
SPSS tablesとExact Test
2分変数
41
総合的なテーブル表手続き(8)
• 多重回答グループのパーセントについて
– 応答数とデータ数の二種類
• 応答数:分母が回答者の数→合計が100%を超え
る
• ケース数:分母が回答の数→合計は100%になる
SPSS tablesとExact Test
42
SPSS tables のまとめ(再掲)
• 基本的なテーブル表手続き
– テーブル表の中の全変数に機能を均等に適用するテーブル表
• 総合的なテーブル表手続き
– 設定(入れ子、積み重ね、統計量など)を変数ごとに個別にでき
るテーブル表
– 多重回答変数をテーブル表にするときもこれを使う
• 度数表手続き
– 複数のカテゴリ変数が存在し、いずれも同じカテゴリを共有して
いるようなデータのときに使う
次はいよいよ Exact test だ!!
SPSS tablesとExact Test
43
Exact testの説明の前に…
Exact test の利点をより深く理解できるように…
• 現在よく用いられている近似法(asymptotic
method)について考えてみましょう
SPSS tablesとExact Test
44
近似法について(1)
• 近似法(漸近法とも言う)とは
– 大標本理論を踏まえた方法
• 大標本理論(large sample theory)とは
– サンプル数が無限に大きくなった状態では望
ましい推測方式が得られるという観点から、サ
ンプル数が十分に大きいときの推測方式を論
ずる理論
– 漸近理論(asymptotic theory)と同じ
要するに…
サンプル数が多くないとお話になりません
SPSS tablesとExact Test
45
近似法について(2)
• 近似法にはその他にも色んな制約が…
– サンプルは無作為抽出じゃないといかん
– サンプルに偏りがあったらいかん
– サンプルが正規分布に従っていないといかん
などなど…
SPSS tablesとExact Test
46
近似法について(3)
• 前提条件を満たしたデータはあるのか?
– 前提を満たすこと自体が非常に困難
• 前提を無視して得た結果は本当に信用で
きるのか?
SPSS tablesとExact Test
47
近似法について(4)
• 過去の先人たちはどうしてたんだ
→経験的に規則を作っていました
– Chocran(1954)によると
• 自由度1のとき期待値が5未満であればカイ2乗検
定は適さない
• 2×2以上のクロス表においては5未満の期待値が
全体の20%以上、もしくは1未満の期待値が一つ
でもあるときはカイ2乗検定は適さない
↑こんな感じでね…
SPSS tablesとExact Test
48
近似法について(5)
でも!!
どれだけ気をつけても規則を破ってしまうデータもある!!!
どうする!?
この問題を打破するために考案されたのが
なのです
SPSS tablesとExact Test
49
Exact Testとは何なんだ
• Crosstabsとnonparametricを使った,
分布に頼らない検定方法
– データ数が少なくても検定できる
– データが偏っていても検定できる
– データが正規分布に従わないときにも検定で
きる
– とにかく色々使える
すごいぞ!!
SPSS tablesとExact Test
50
じゃあ何で無名なんだ
• 科学的推定では好まれる
でも!!
• 計算が煩雑(というか処理が膨大)
→変数が増えると手計算ではとても手におえな
くなる
→パソコンでも投げ出してしまうことがあるほど
だめじゃないすか…
SPSS tablesとExact Test
51
モンテカルロ法の出番です
• Exact Testがしんどいといったら…
→モンテカルロ法に分析を丸投げしましょう
• モンテカルロ法(Monte Carlo Method)とは
– Exact Testによって算出される値(exact p value)
を推定する方法
– 推定される信頼区間の信頼率は99%
→exact p valueとほぼ同じ
SPSS tablesとExact Test
52
Exact Testの概念(1)
• Exact Testは漸近分布をつかわず、組合せ
論的に直接確率を算出する
→reference setというものを用いる
SPSS tablesとExact Test
53
Reference set って?
• クロス表でその周辺度数だけが決まってい
る表のこと
→例えば2×2のクロス表で…
B1
B2
計
A1
4
3
7
A1
7
A2
1
2
3
A2
3
計
5
5
10
計
B1
5
B2
5
計
10
↑これがreference set
こんな結果が得られたとしたら…
SPSS tablesとExact Test
54
Exact Testの概念(3)
• Reference setにおいて帰無仮説の下では
観測値より起こりにくいと考えられるような
度数の組み合わせが起こる確率を足して
exact p valueを算出
– 観測値より起こりにくい??
– どゆこと??
– 次スライドで説明
SPSS tablesとExact Test
55
Exact Testの概念(4)
B1
B2
計
A1
1
12
13
A2
4
6
10
計
5
18
23
このとき、ABの二つの要因には関連がある
といえるか??
左の表で、行・列が独立であるとすると、
それぞれのセルの値は↓のような値に
なるはずである(期待値)
↓のような実際のデータ(観測値)より
独立から離れていると考えられる表を
考える
(詳しくは本講義1回目の狩野先生のスライド10~12
枚目を参照)
B1
B2
計
A1
2.83
10.17
13
0
13
13
5
5
10
A2
2.17
7.83
10
5
18
23
計
5
18
23
A1B1・A2B2 ‐ A1B2・A2B1
の絶対値の値が実際のデータよりも
大きくなるような表
A1B1・A2B2 ‐ A1B2・A2B1 = 0
SPSS tablesとExact Test
56
Exact Testの概念(5)
• 前のスライドで実際の表と左下に挙げた表
の起こる確率を足してexact p valueを算出
する
もっと複雑な表になったらどうなるのか?
(例えば5×6のクロス表と
か)
→場合によるとSPSSが音をあげます
そんなときはモンテカルロ法の出番です
SPSS tablesとExact Test
57
モンテカルロ法の原理
• モンテカルロ法はどのようにexact p value
を推定するのか
→reference setを元にした数ある表の中から
行った無作為抽出(もどき)を基に推定する
初期設定では10000個
• Seedを固定することによって同じ結果を得
ることが可能
Seed:乱数の初期値を決める値
SPSS tablesとExact Test
58
まとめ
• 近似法が役に立つようなデータはほとんど
無い
• Exact Testの方がかなり優れている
– 変数が多すぎると出来ない
• モンテカルロ法はデータの変数が多いとき
に用いる
– 結果はほとんどExact Testと同じ
SPSS tablesとExact Test
59
Exact Test の使い方(1)
ここをクリック
ここをクリック
SPSS tablesとExact Test
60
Exact Test の使い方(2)
OKをクリック!!
やったね!!
SPSS tablesとExact Test
61
参考文献
• SPSS Exact Tests 7.0 for Windows SPSS Inc.
• SPSS Tables 7.5J SPSS Inc.
• 心理学のためのデータ解析テクニカルブック
森敏昭 吉田寿夫 編著 2001 北大路書房
SPSS tablesとExact Test
62
おわり
ご聴講お疲れ様でした