第3章 二つの変数の記述統計 二つの変数を対象として変数同士の 関係を捉える 量的変数どうしの関係 質的変数どうしの関係 3.1 二つの変数の関係 相関:2つの量的変数の間の関係 (例)数学テストの点数が高い人ほど物理テストの点 数も高い 連関: 2つの質的変数の間の関係 (例)洋食が好きな人には甘党が多く、和食が好きな 人には辛党が多い 3.2 散布図 • 散布図:散布図とは,独立変数を横軸に,従 属変数を縦軸にとって,二次元平面にデータ 点をプロットしたもの 相関の考え方 • 相関関係:2個以上の変数が「かなりの程度 増減をともにする関係」 正の相関:変数Xが大きいほど変数Yも大きくなる傾向 片方が増えると他方も増える 負の相関:変数Xが大きいほど変数Yは小さくなる傾向 片方が増えると他方が減る 無相関:変数Xの大小の変化と変数Yの大小の変化との間 には関係がない 正の相関の散布図の例 「統計テスト1」と「統計テスト2」の散布図 10 5 統計テスト2 統計テスト2= c(10,13,8,15,8,6,9,10,7,3,1 8,14,18,11,12,5,7,12,7,7) plot(統計テスト1,統計テスト 2) 15 例:(p.57) 統計テスト1= c(6,10,6,10,5,3,5,9,3,3,11,6 ,11,9,7,5,8,7,7,9) 4 6 8 統計テスト1 10 4 6 統計テスト1 8 前の図と比較して より円に近いちらばり 10 弱い相関の散布図の例 4 6 8 10 心理学テスト 12 14 無相関の散布図の例 10 5 統計テスト2 15 全体的に円に近い 4 6 8 10 心理学テスト 12 14 散布図では・・・ 散布図は、2変数の相関の様子を視覚的把握するという意味 では有効である。しかし、変数がたくさんある場合は有効で はない。 そこで、相関の様子を散布図として表現するのではなく、 相関の「強さはこのくらいです」と一つの数値にして示す ことが一般的 この場合の指標として相関係数がある。 3.3 共分散 (x1 x)(y1 y) (x 2 x)(y2 y) (x n x)(yn y) sxy n Rの練習(p60,61) > 共分散1と2=sum((統計テスト1-mean(統計テスト1))*(統計テスト2mean(統計テスト2)))/length(統計テスト1) > 共分散1と2 [1] 7.55 > 共分散1と2=mean((統計テスト1-mean(統計テスト1))*(統計テスト2mean(統計テスト2))) > 共分散1と2 [1] 7.5 > cov(統計テスト1,統計テスト2) [1] 7.947368 > cov(統計テスト1,統計テスト2)*(length(統計テスト1)-1)/length(統計テ スト1) [1] 7.55 単位を変えると... > 身長m=c(1.5,1.6,1.7,1.8,1.9) > 身長m [1] 1.5 1.6 1.7 1.8 1.9 身長mと身長cmは単位をmとcmに変えただけ それなのに共分散が大きく変化している > 身長cm=身長m*100 これはマズイ > 身長cm [1] 150 160 170 180 190 > 体重=c(50,70,60,80,90) > 体重 [1] 50 70 60 80 90 > cov(身長m,体重) [1] 2.25 > cov(身長cm,体重) [1] 225 標準偏差を利用して測定単位 の影響をうけない相関の指標、 相関係数を求める 3.4 相関係数 • 相関係数:二つの確率変数の間の相関(類似 性の度合い)を示す統計学的指標 原則、単位は無く、-1 から 1 の間の実数値をとる • 相関係数の式 sxy rxy sx s y Rの練習(p62,63) > cov(統計テスト1,統計テスト2)/(sd(統計テスト1)*sd(統計テスト2)) [1] 0.749659 > cor(統計テスト1,統計テスト2) [1] 0.749659 > cor(心理学テスト,統計テスト1) [1] 0.3826645 > cor(心理学テスト,統計テスト2) [1] -0.09350516 相関係数 まとめ 無相関の場合、相関係数は0、 正の相関が強くなるにしたがって1に近づく。 相関係数の最大値は1である。 1 に近いときは二つの変数には正の相関があるとい い、-1 に近ければ負の相関があるという。 例:先進諸国の失業率と実質経済成長率は強い負の相関関係 にあり、相関係数を求めれば比較的に -1 に近い数字になる。 表3.1 相関係数の大きさの評価 相関係数 大きさの評価 -0.2 ≤ r ≤ 0.2 ほとんど相関なし -0.4 ≤ r < -0.2 0.2 < r ≤ 0.4 弱い相関あり -0.7 ≤ r < -0.4 0.4 < r ≤ 0.7 中程度の相関あり -1.0 ≤ r< -0.7 0.7 < r ≤ 1.0 強い相関あり 3.5 クロス集計表 クロス集計表:質的変数同士の関係を見る 例: 数学の好き・嫌い(変数「数学」)と、 統計の好き・嫌い(変数「統計」) の間に連関があるかどうか Rによるクロス集計表 > 数学=c("嫌い","嫌い","好き","好き","嫌い","嫌い","嫌い","嫌い","嫌い","好き","好き","嫌い","好き","嫌い ","嫌い","好き","嫌い","嫌い","嫌い","嫌い") > 数学 [1] "嫌い" "嫌い" "好き" "好き" "嫌い" "嫌い" "嫌い" "嫌い" "嫌い" "好き" "好き" "嫌い" "好き" "嫌い" [15] "嫌い" "好き" "嫌い" "嫌い" "嫌い" "嫌い" > table(数学) 数学 嫌い 好き 14 6 > 統計=c("好き","好き","好き","好き","嫌い","嫌い","嫌い","嫌い","嫌い","嫌い","好き","好き","好き","嫌い"," 好き","嫌い","嫌い","嫌い","嫌い","嫌い") > 統計 [1] "好き" "好き" "好き" "好き" "嫌い" "嫌い" "嫌い" "嫌い" "嫌い" "嫌い" "好き" "好き" "好き" "嫌い" [15] "好き" "嫌い" "嫌い" "嫌い" "嫌い" "嫌い" > table(統計) 統計 統計 嫌い 好き 嫌い 好き 数学と統計の 12 8 > table(数学,統計) 嫌い 数学 好き 10 2 4 4 クロス集計表 3.6 ファイ係数 ファイ係数:相関係数の特別な場合 1と0からなる変数(二値変数)に対して計算さ れる相関係数 Rによるファイ係数 > 数学イチゼロ=ifelse(数学=="好き",1,0) > 数学イチゼロ [1] 0 0 1 1 0 0 0 0 0 1 1 0 1 0 0 1 0 0 0 0 > 統計イチゼロ=ifelse(統計=="好き",1,0) > 統計イチゼロ [1] 1 1 1 1 0 0 0 0 0 0 1 1 1 0 1 0 0 0 0 0 > cor(数学イチゼロ,統計イチゼロ) [1] 0.3563483 本章で出てきた関数 目的 関数名と書式 使い方 散布図を描く plot(x,y) plot(統計テスト1,統計テスト2) 共分散を求める cov(x,y) cov(統計テスト1,統計テスト2) 相関係数を求める cor(x,y) cor(統計テスト1,統計テスト2) クロス集計表を描 く table(x,y) table(数学,統計) 場合分けをする ifelse(条件、真の場合、偽 の場合) ifelse(統計==“好き”,1,0) 100 練習問題 (1) 60 40 20 定期試験 80 > 勉強時間=c(1,3,10,12,6,3,8,4,1,5) > 勉強時間 [1] 1 3 10 12 6 3 8 4 1 5 > 定期試験=c(20,40,100,80,50,50,70,50,10,60) > 定期試験 [1] 20 40 100 80 50 50 70 50 10 60 plot(勉強時間,定期試験) 2 4 6 勉強時間 8 10 12 練習問題 (2) cor(勉強時間,定期試験) [1] 0.9092974 散布図と(2)の結果より勉強時間と定期試験の相関係数は・・・ 強い相関関係にあるといえる!! 練習問題 (3)クロス集計 洋食派か和食派か=c("洋食","和食","和食","洋食","和食","洋食","洋食","和食","洋食","洋 食","和食","洋食","和食","洋食","和食","和食","洋食","洋食","和食","和食") > 洋食派か和食派か [1] "洋食" "和食" "和食" "洋食" "和食" "洋食" "洋食" "和食" "洋食" "洋食" "和食" "洋食" "和 食" "洋食" "和食" "和食" "洋食" "洋食" "和食" "和食" > 甘党か辛党か=c("甘党","辛党","甘党","甘党","辛党","辛党","辛党","辛党","甘党","甘党","甘 党","甘党","辛党","辛党","甘党","辛党","辛党","甘党","辛党","辛党") > 甘党か辛党か [1] "甘党" "辛党" "甘党" "甘党" "辛党" "辛党" "辛党" "辛党" "甘党" "甘党" "甘党" "甘党" "辛 党" "辛党" "甘党" "辛党" "辛党" "甘党" "辛党" "辛党" > table(洋食派か和食派か,甘党か辛党か) 甘党か辛党か 洋食派か和食派か 甘党 辛党 洋食 6 4 和食 3 7 練習問題 (4)ファイ係数 > 洋か和=ifelse(洋食派か和食派か=="洋食",1,0) > 洋か和 [1] 1 0 0 1 0 1 1 0 1 1 0 1 0 1 0 0 1 1 0 0 > 甘か辛=ifelse(甘党か辛党か=="甘党",1,0) > 甘か辛 [1] 1 0 1 1 0 0 0 0 1 1 1 1 0 0 1 0 0 1 0 0 > cor(洋か和,甘か辛) [1] 0.3015113
© Copyright 2024 ExpyDoc