R での連関測度の計算方法 寺尾 敦 青山学院大学社会情報学部 [email protected] • 講義で使用しているテキスト(ボーンシュテッ ト & ノーキ)で学習した分割表の連関測度を, R で計算するには? 名義尺度での連関係数 • 最適予測係数(Guttman’s lambda) – rapportパッケージをインストールし,lambda.test 関数を使う. 表9.1 信仰する宗教と校内礼拝の否認判決に対する意見のクロス表 宗教 合計 判決に プロテスタント カトリック その他 賛成 338 (36.1%) 178 (42.1%) 114 (63.3%) 630 (41.1%) 反対 598 (63.9%) 245 (57.9%) 58 (33.7%) 901 (58.9%) 合計 936 (100.0%) 423 (100.0%) 172 (100.0%) 1531 (100.0%) ボーンシュテット & ノーキ『社会統計学』第9章 コード table9_1 <- matrix(c(338,598,178,245,114,58), nrow=2, ncol=3, dimnames=list(判決 = c("賛成", "反対"), 宗教 = c("プロテスタント","カトリック", "その他"))) table9_1 # クロス集計表を出力 lambda.test(table9_1,0) # Guttman's lambda (Goodman & Kruskal's lambda) # 第2引数 # 0: 行変数と列変数の両方に対してラムダを計算 # 1: 行変数から列変数を予測する(行ごとに最頻値に注目) # 2: 列変数から行変数を予測する(列ごとに最頻値に注目) 出力 > table9_1 # クロス集計表を出力 宗教 判決 プロテスタント カトリック その他 賛成 338 178 114 反対 598 245 58 > > lambda.test(table9_1,0) $row [1] 0 $col [1] 0.08888889 順序尺度での連関測度 • グッドマン=クラスカルの γ – 分割表に対して,青木繁伸先生のウェブにある, グッドマン・クラスカルのガンマを計算する関数を 利用する. • ケンドールの順位相関係数 τb – 分割表に対して,青木繁伸先生のウェブにある, ケンドールのτb を計算する関数を利用する. – 個票データ(講義テキスト9.3参照)の場合には, cor 関数を使って method = “kendall” オプションを つける(テキストp.127). 実習 • ボーンシュテット & ノーキの表9.2を行列とし て入力し,グッドマン=クラスカルの γ とケン ドールの順位相関係数 をそれぞれ計算する. 青木先生が用意した関数 gamma2, tau.b を 使う. – round 関数を使って適当なところでまるめてよい – テキストではそれぞれ 0.349 と 0.233 である.実 習で得られた数値は符号が異なる.なぜか? 表9.2と操作仮説 性差別禁 止の支持 強く支持 やや支持 やや反対 強く反対 性役割態度:「女性は家を守るべき」という 意見に 強く賛成 賛成 反対 強く反対 34 91 104 39 89 281 200 27 33 116 41 9 49 55 11 2 H1:女性は家にいて家事をすべきだという意見に反対 する人ほど,性差別禁止の法可決をより強く支持する. 順序尺度での連関測度 • スチュアートの順位相関係数 τc • ソマーズの係数 dyx – 分割表に対して電卓を使うように計算を実行する か,自分で関数を定義する(それほどむずかしく ない). 順位データの連関測度 • スピアマンの順位相関係数 ρs – 個票データに対して,cor 関数を使って method = “spearman” オプションをつける(テキストp.127). – もともと順位が記録されている個票データならば, そのままピアソンの相関係数を計算すればよい. オプションをつける必要はない. 実習 • テキスト第5章練習問題 (3) に取り組む. 2 * 2 表での連関測度 • ユールの連関係数 Q – 分割表から対角要素の積を計算して(テキストp.216217),その和(分母)と差(分子)を使う. – 青木繁伸先生のウェブにある,グッドマン・クラスカル のガンマを計算する関数を利用する. • ファイ係数 – 方法1:個票データで2値のコード化(テキストp.67, p.233)をして,cor 関数を使う. – 方法2:分割表に対して,パッケージ vcd のassocstats 関数を用いる.ピアソンの一致性係数 C とクラメルの V も出力される. 2 * 2 表での連関指数計算方法 • オッズ・条件つきオッズ – 分割表から必要な要素を抜き出して計算する(テ キストp.216-217) • オッズ比 – 分割表に対して,パッケージ vcd のoddsratio 関 数を用いる.log=FALSE オプションをつける. 参考:藤井良宜『カテゴリカルデータ解析』(共立出版)第 4章 – Fisher の直接確率法(関数は fisher.test)では,オッズ比 が出力される. 実習 • ボーンシュテット & ノーキ『社会統計学』第9 章問題の15に取り組む.Q,ファイ,オッズ比を 計算.人口動態と地域のクロス表(1960-70年 の63都市データ). 人口動態 減少・不変 増加 地域 西部 西部以外 計 4 30 34 計 10 19 29 14 49 63
© Copyright 2024 ExpyDoc