行動計量学演習Ⅱ ~SPSS tablesとExact Testの巻~ 行動計量学講座 B3 紺谷幸弘 まずはtablesから… • SPSS tablesとは – 勝手に表を組んでくれるスグレモノ 例えばこんな具合に↓ 最高 女性 男性 中国 北海道 北陸 関東 近畿 九州 沖縄 四国 東北 中部 中国 北海道 北陸 関東 近畿 九州 ロ シア 四国 東北 高 メガネなし 普通 低 最低 1 最高 高 メガネ有 普通 低 最低 1 1 1 1 1 1 1 1 2 1 2 1 1 1 2 1 1 1 1 1 2 1 1 1 1 2 1 1 1 1 1 1 SPSS tablesとExact Test 2 具体的に何ができますか • マウス一つで大体の表組みが思いのま ま!! • マウス一つで平均や分散などのデータの 要約までしてくれる!! • 多重回答の表までできてしまう!! SPSS tablesとExact Test 3 実際にSPSS Tablesを動かしてみよう • 次のスライドから実際(仮)にSPSS Tablesを使ってみま しょう • 今回はその例として列パーセントをやりたいと思います こ ん な の SPSS tablesとExact Test 4 実際のローデー タ 入力場面 SPSS tablesとExact Test 5 1.ここを選択 ↓ クリック SPSS tablesとExact Test 6 2.こんな箱が出ます この箱を ダイアログボックス といいます 3.行変数として扱いたいものを 選択して… 4.ここをクリック SPSS tablesとExact Test 7 5.行変数として 追加されます 6.列変数にしたい変数も 同じ要領で… SPSS tablesとExact Test 8 7.行変数と 列変数を 指定できたら… 8.ここをクリック!! SPSS tablesとExact Test 9 10.ここをクリックす ると… 9.「列%」を選んで… SPSS tablesとExact Test 10 11.ここに統計量が 追加されます 12.ここをクリック!! SPSS tablesとExact Test 11 F.ここをクリック!! すると... SPSS tablesとExact Test 12 列の%の表が出来てしまうのです!!! なんて便利なんだ... SPSS tablesとExact Test 13 別 紙 の マ ニ ュ ア ル と の 関 連 一つのダイアログボックス であることを示します ダイアログボックス名を 示します ボタンであることを 示しています 上の操作を行うと 下のダイアログボックスが 開くことを表しています 注意書きです それではいよいよ説明に… SPSS tablesとExact Test 14 大事な概念(1) • 入れ子と積み重ね(1) 最高 性別 女性 男性 出身地 出身地 中国 北海道 北陸 関東 近畿 九州 沖縄 四国 東北 中部 中国 北海道 北陸 関東 近畿 九州 ロ シア 四国 東北 ガッツ 普通 高 低 最低 最高 1 性別 1 1 2 1 1 1 2 出身地 1 1 2 1 1 1 2 1 2 1 1 1 1 2 1 1 1 2 1 1 1 1 1 ↑性別と出身地 が入れ子 女性 男性 中部 中国 北海道 北陸 関東 近畿 九州 沖縄 ロ シア 四国 東北 ガッツ 普通 高 1 2 3 2 1 2 1 1 低 5 5 1 2 1 2 1 1 2 最低 4 7 3 6 2 1 1 1 3 2 1 2 1 2 1 1 2 1 1 1 ↑性別と出身地が 積み重ね SPSS tablesとExact Test 15 大事な概念(2) • 入れ子と積み重ね(2) – 「AがBの入れ子になっている状態」とは A B ↑積み重ねの状態 B A AがBの入れ子になっている状態 (AがBの中に入っている状態) SPSS tablesとExact Test 16 大事な概念(3) • 行・列・層とは 層 層 層 列 行 列 行 行 列 行→表の長さ 列→表の幅 層→表の奥行き SPSS tablesとExact Test 17 大事な概念(4) • 次元とは – 簡単に言えば階層のこと • 高い階層=上位の次元 • 低い階層=下位の次元 上位の次元 上位の次元 下位 下位 下位 下位の次元 ↑入れ子の場合 ↑列次元 SPSS tablesとExact Test 上 位 の 次 元 下位 下位 下位 下位 下位 下位 ↑行次元 18 変数について(1) • カテゴリ変数(categorical variable) – セルの定義に用いられる変数 – 観測値が質的な値をとるような変数 • 集計変数(summary varible) – 数量を表す基数 – 観測値が量的な値をとるような変数 • 行(列、層)変数(row (column, layer) variable) – 行(列、層)を定義している変数 • 管理変数(controlling variable) – 別の変数が入れ子になっている変数 – 入れ子の状態で下位の変数を持つ変数 SPSS tablesとExact Test 19 ちょっと横道 管理変数について • 下位変数を持てば全て管理変数というわけでは ない • 別の変数でなければならない 性別 男 性別 女 男 女 車の所持 車の所持 有り 無し 有り 無し ↑別の変数が入れ子になっていない = 性別は男(女)の管理変数ではない ↑別の変数が入れ子になっている = 性別は車の所持の管理変数である SPSS tablesとExact Test 20 変数について(2) • 度数変数(frequency variable) – 度数のこと • 要約変数(summary statistics) – 要約統計(平均とか分散など)によって算出さ れた値 • ダミー変数(dummy variable) – 値が有効かそうでないか(欠損値かどうか)を 1と0を用いて区別している変数 SPSS tablesとExact Test 21 変数について(3) • 目標変数(target variable) – ダミー変数に名前を付けた変数 • 多重カテゴリ変数(multi-category variables) – 多重回答をカテゴリとしてコード化した変数 – 詳しくは後述 • 2分変数(dichotomies) – 多重回答を2種類の変数(1と0、yとnなど)とし てコード化した変数 SPSS tablesとExact Test 22 そろそろ本題に… • SPSS tablesの機能を三つに大分すると… – 基本的なテーブル表手続き • テーブル表の中の全変数に機能を均等に適用するテーブル表 – 総合的なテーブル表手続き • 設定(入れ子、積み重ね、統計量など)を変数ごとに個別にできる テーブル表 • 多重回答変数をテーブル表にするときもこれを使う – 度数表手続き • 複数のカテゴリ変数が存在し、いずれも同じカテゴリを共有している ようなデータのときに使う SPSS tablesとExact Test 23 基本的なテーブル表手続き(1) • ほとんどの表作成はこれで事足りる • 基本的な使い方はどの手続きもほとんど 同じ これができれば全部の手続きができるようになる!! SPSS tablesとExact Test 24 基本的なテーブル表手続き(2) • 積み重ねと入れ子について – 行や列に別の変数を追加すると、同次元の別の変数 (積み重ね)になる – 入れ子にしたほうが表自体は簡潔になる • 次元を減らせることも(主に層次元) • 変数の位置について – 従属変数は行、独立変数は列におく →強調したい変数を列に置く(横に並べる) – 入れ子の場合は従属変数を独立変数の入れ子にする →従属変数についての詳しいデータが得られる SPSS tablesとExact Test 25 基本的なテーブル表手続き(3) • パーセントについて – 列パーセント:列の合計が100% – 行パーセント:行の合計が100% – 層パーセント:層の合計が100% ※但し、積み重ねのデータの場合にはカテゴリごとの 合計が100%になるようになる(列%の場合)↓ 女性 男性 高 低 普通 高 低 普通 メガネなし 度数 列% 1 5% 2 10% 1 5% 3 15% 9 45% 4 20% メガネ有 度数 列% 3 17% 5 28% 4 22% 1 6% 4 22% 1 6% ↑入れ子は全部を通しての合計値 めがね 性別 ガッツ 女性 男性 高 低 普通 メガネなし 度数 列% 4 20% 16 80% 4 20% 11 55% 5 25% メガネ有 度数 列% 12 67% 6 33% 4 22% 9 50% 5 28% ↑積み重ねはカテゴリ毎の合計値 SPSS tablesとExact Test 26 基本的なテーブル表手続き(4) • 合計について – グループ合計:欠損値を無視した合計 – 表合計:欠損値も含めた合計値 ※欠損値がない時は表合計の必要はない めがね 性別 グループ合計 ガッツ グループ合計 表合計 女性 男性 高 低 普通 メガネなし 度数 列% 4 20% 16 80% 20 100% 4 21% 11 58% 4 21% 19 100% 20 100% グループ合計 表合計 メガネ有 度数 12 6 18 4 9 5 18 18 列% 67% 33% 100% 22% 50% 28% 100% 100% 度数 ↑あっ!!SPSS tablesとExact Test 16 22 38 8 20 9 37 38 列% 42% 58% 100% 22% 54% 24% 100% 100% 度数 16 22 38 8 20 9 37 38 列% 42% 58% 100% 22% 54% 24% 100% 100% 27 基本的なテーブル表手続き(5) • 並べ替えについて – どの統計量を指定しても、度数によって並べ替えられる – 合計列、合計行の両方が昇順(降順)になるようになる めがね 性別 グループ合計 ガッツ グループ合計 女性 男性 すてき度 高 普通 低 すてき度 すてき度 メガネ有 度数 標準偏差 12 17425 6 869066 18 501770 4 27237 5 335 9 708977 18 501770 グループ合計 メガネなし 度数 標準偏差 4 145 16 81614 20 73571 4 163005 5 23626 11 20672 20 73571 度数 16 22 38 8 10 20 38 標準偏差 15297 455357 347970 114178 16965 475792 347970 ↑縦も横も度数で昇順になっている(標準偏差は無視) SPSS tablesとExact Test 28 基本的なテーブル表手続き(6) • 要約統計量について – 別の変数ごとの集計変数の要約統計量を求めること ができる(サブグループ化)↓ • 例えば虫歯の本数の要約統計量を男女別に見たりとか… 度数 女性 男性 高 低 普通 高 低 普通 すてき度 すてき度 すてき度 すてき度 すてき度 すてき度 1 2 1 3 9 4 メガネなし 標準偏差 中央値 . 65 210 203 . 64 188118 852 22608 321 26124 3195 平均値 65 203 64 109212 10820 15282 度数 3 5 4 1 4 1 メガネ有 標準偏差 中央値 31452 54 14258 654 341 359 . 54 1062179 16508 . 2 平均値 18203 7193 359 54 542043 2 ↑こんな具合に… SPSS tablesとExact Test 29 基本的なテーブル表手続き(7) • 表の提示ルールについて(1) -四捨五入した数字を用いる ・有効数字は2桁くらいで 暗算が簡単になり、 表が見やすくなる -比較する数字は近くに配置 -統計量は列に配置(統計量ラベルは列上部 に配置) -表の中の規則的・例外的なデータは脚注で要約 SPSS tablesとExact Test 30 基本的なテーブル表手続き(8) • 表の提示ルールについて(2) -表全体に関する表記には、見出しを使う -異なる種類の区分けには格子線かスペースを 使う ・ 区分けする項目が多いときにはスペース、少ない ときには格子線 -記号やラベルには意味のわかりやすく、覚え やすいものを使う ・略語なんてもってのほか -ラベルは統一する -主な層は同ページで比較できるようにする SPSS tablesとExact Test 31 度数表手続き(1) • どんな時に使うんだ – 一連の質問の選択肢が全て同じ場合に使う • Ex )質問紙の5件法 • 基本的なテーブル手続きではできんのか – できます • じゃあ何で使うんだ – 便利なんです SPSS tablesとExact Test 32 度数表手続き(2) • どこが便利なんだ – サブグループの定義が簡単 • サブグループとは(復習):ある度数変数において 別のカテゴリで入れ子にすること • それだけです SPSS tablesとExact Test 33 総合的なテーブル表手続き(1) • どんな時に使うんだ – 変数ごとに積み重ねと入れ子を使い分けたい とき – 変数ごとに異なる統計量を使い分けたいとき – 複雑な合計を使いたいとき SPSS tablesとExact Test 34 総合的なテーブル表手続き(2) • 統計次元と要約次元について – 総合的なテーブル表手続きに独特の概念 • 次元について – 行次元とか列次元とか – 統計次元とは • 変数の統計量を指定できる次元のこと – 要約次元とは • 変数の要約統計量を指定できる次元のこと こんな説明で分かるかいや… SPSS tablesとExact Test 35 要するに… 計算して出した値は行か列に揃え なければならないということです SPSS tablesとExact Test 36 総合的なテーブル表手続き(3) • 総計も出せるぞ!! – テーブル表が積み重ねになっているとき有用 – ダミー変数を使う(ちょっと面倒) • 次はいよいよ多重回答だ!!! SPSS tablesとExact Test 37 総合的なテーブル表手続き(4) • 多重回答とは – 一人の回答者に一つの質問に対して複数の 回答権を持たせるような質問形式 – アメリカの国勢調査では自由回答形式の質問 に回答後、同じ話題の具体的質問にはい・い いえで答える形式質問(以下Y/N形式)に回答 という形式が取られている →この二つの形式それぞれについて説明 SPSS tablesとExact Test 38 総合的なテーブル表手続き(5) • 自由回答をどのように変数化するか(1) – 答える順について変数を作る↓ 1.大ケガをした 2.子どもが入院した Q.過去一年間で あなたや家族が抱えた、 最も深刻な問題は何ですか? 1.クルマが盗まれた 1.微分ができない 2.酒が飲めなくなった 3.ガッツが足りない 4.小遣いが足りない 5.トマトが食べられない 質問者 回答者ら SPSS tablesとExact Test 変数1 変数2 変数3 変数4 切り捨て 39 総合的なテーブル表手続き(6) • 自由回答をどのように変数化するか(2) – 前スライドのようにして集められた4つの変数 内のカテゴリを7つの一般的なカテゴリに再割 り当てする(1991 U.S. General social Survey.savに従う) このようにして定義された変数を 多重回答カテゴリ変数 という ※いくつもある多重カテゴリ変数をまとめて多重回答グループという SPSS tablesとExact Test 40 総合的なテーブル表手続き(7) • Y/N形式をどのように変数化するか はい→1 いいえ/無回答/該当なし→0 として一つの変数に定義 このように定義された変数を という SPSS tablesとExact Test 2分変数 41 総合的なテーブル表手続き(8) • 多重回答グループのパーセントについて – 応答数とデータ数の二種類 • 応答数:分母が回答者の数→合計が100%を超え る • ケース数:分母が回答の数→合計は100%になる SPSS tablesとExact Test 42 SPSS tables のまとめ(再掲) • 基本的なテーブル表手続き – テーブル表の中の全変数に機能を均等に適用するテーブル表 • 総合的なテーブル表手続き – 設定(入れ子、積み重ね、統計量など)を変数ごとに個別にでき るテーブル表 – 多重回答変数をテーブル表にするときもこれを使う • 度数表手続き – 複数のカテゴリ変数が存在し、いずれも同じカテゴリを共有して いるようなデータのときに使う 次はいよいよ Exact test だ!! SPSS tablesとExact Test 43 Exact testの説明の前に… Exact test の利点をより深く理解できるように… • 現在よく用いられている近似法(asymptotic method)について考えてみましょう SPSS tablesとExact Test 44 近似法について(1) • 近似法(漸近法とも言う)とは – 大標本理論を踏まえた方法 • 大標本理論(large sample theory)とは – サンプル数が無限に大きくなった状態では望 ましい推測方式が得られるという観点から、サ ンプル数が十分に大きいときの推測方式を論 ずる理論 – 漸近理論(asymptotic theory)と同じ 要するに… サンプル数が多くないとお話になりません SPSS tablesとExact Test 45 近似法について(2) • 近似法にはその他にも色んな制約が… – サンプルは無作為抽出じゃないといかん – サンプルに偏りがあったらいかん – サンプルが正規分布に従っていないといかん などなど… SPSS tablesとExact Test 46 近似法について(3) • 前提条件を満たしたデータはあるのか? – 前提を満たすこと自体が非常に困難 • 前提を無視して得た結果は本当に信用で きるのか? SPSS tablesとExact Test 47 近似法について(4) • 過去の先人たちはどうしてたんだ →経験的に規則を作っていました – Chocran(1954)によると • 自由度1のとき期待値が5未満であればカイ2乗検 定は適さない • 2×2以上のクロス表においては5未満の期待値が 全体の20%以上、もしくは1未満の期待値が一つ でもあるときはカイ2乗検定は適さない ↑こんな感じでね… SPSS tablesとExact Test 48 近似法について(5) でも!! どれだけ気をつけても規則を破ってしまうデータもある!!! どうする!? この問題を打破するために考案されたのが なのです SPSS tablesとExact Test 49 Exact Testとは何なんだ • Crosstabsとnonparametricを使った, 分布に頼らない検定方法 – データ数が少なくても検定できる – データが偏っていても検定できる – データが正規分布に従わないときにも検定で きる – とにかく色々使える すごいぞ!! SPSS tablesとExact Test 50 じゃあ何で無名なんだ • 科学的推定では好まれる でも!! • 計算が煩雑(というか処理が膨大) →変数が増えると手計算ではとても手におえな くなる →パソコンでも投げ出してしまうことがあるほど だめじゃないすか… SPSS tablesとExact Test 51 モンテカルロ法の出番です • Exact Testがしんどいといったら… →モンテカルロ法に分析を丸投げしましょう • モンテカルロ法(Monte Carlo Method)とは – Exact Testによって算出される値(exact p value) を推定する方法 – 推定される信頼区間の信頼率は99% →exact p valueとほぼ同じ SPSS tablesとExact Test 52 Exact Testの概念(1) • Exact Testは漸近分布をつかわず、組合せ 論的に直接確率を算出する →reference setというものを用いる SPSS tablesとExact Test 53 Reference set って? • クロス表でその周辺度数だけが決まってい る表のこと →例えば2×2のクロス表で… B1 B2 計 A1 4 3 7 A1 7 A2 1 2 3 A2 3 計 5 5 10 計 B1 5 B2 5 計 10 ↑これがreference set こんな結果が得られたとしたら… SPSS tablesとExact Test 54 Exact Testの概念(3) • Reference setにおいて帰無仮説の下では 観測値より起こりにくいと考えられるような 度数の組み合わせが起こる確率を足して exact p valueを算出 – 観測値より起こりにくい?? – どゆこと?? – 次スライドで説明 SPSS tablesとExact Test 55 Exact Testの概念(4) B1 B2 計 A1 1 12 13 A2 4 6 10 計 5 18 23 このとき、ABの二つの要因には関連がある といえるか?? 左の表で、行・列が独立であるとすると、 それぞれのセルの値は↓のような値に なるはずである(期待値) ↓のような実際のデータ(観測値)より 独立から離れていると考えられる表を 考える (詳しくは本講義1回目の狩野先生のスライド10~12 枚目を参照) B1 B2 計 A1 2.83 10.17 13 0 13 13 5 5 10 A2 2.17 7.83 10 5 18 23 計 5 18 23 A1B1・A2B2 ‐ A1B2・A2B1 の絶対値の値が実際のデータよりも 大きくなるような表 A1B1・A2B2 ‐ A1B2・A2B1 = 0 SPSS tablesとExact Test 56 Exact Testの概念(5) • 前のスライドで実際の表と左下に挙げた表 の起こる確率を足してexact p valueを算出 する もっと複雑な表になったらどうなるのか? (例えば5×6のクロス表と か) →場合によるとSPSSが音をあげます そんなときはモンテカルロ法の出番です SPSS tablesとExact Test 57 モンテカルロ法の原理 • モンテカルロ法はどのようにexact p value を推定するのか →reference setを元にした数ある表の中から 行った無作為抽出(もどき)を基に推定する 初期設定では10000個 • Seedを固定することによって同じ結果を得 ることが可能 Seed:乱数の初期値を決める値 SPSS tablesとExact Test 58 まとめ • 近似法が役に立つようなデータはほとんど 無い • Exact Testの方がかなり優れている – 変数が多すぎると出来ない • モンテカルロ法はデータの変数が多いとき に用いる – 結果はほとんどExact Testと同じ SPSS tablesとExact Test 59 Exact Test の使い方(1) ここをクリック ここをクリック SPSS tablesとExact Test 60 Exact Test の使い方(2) OKをクリック!! やったね!! SPSS tablesとExact Test 61 参考文献 • SPSS Exact Tests 7.0 for Windows SPSS Inc. • SPSS Tables 7.5J SPSS Inc. • 心理学のためのデータ解析テクニカルブック 森敏昭 吉田寿夫 編著 2001 北大路書房 SPSS tablesとExact Test 62 おわり ご聴講お疲れ様でした
© Copyright 2024 ExpyDoc