第2章 一つの変数の記述統計

第3章 二つの変数の記述統計
二つの変数を対象として変数同士の
関係を捉える
量的変数どうしの関係
質的変数どうしの関係
3.1 二つの変数の関係
相関:2つの量的変数の間の関係
(例)数学テストの点数が高い人ほど物理テストの点
数も高い
連関: 2つの質的変数の間の関係
(例)洋食が好きな人には甘党が多く、和食が好きな
人には辛党が多い
3.2 散布図
• 散布図:散布図とは,独立変数を横軸に,従
属変数を縦軸にとって,二次元平面にデータ
点をプロットしたもの
相関の考え方
• 相関関係:2個以上の変数が「かなりの程度
増減をともにする関係」
正の相関:変数Xが大きいほど変数Yも大きくなる傾向
片方が増えると他方も増える
負の相関:変数Xが大きいほど変数Yは小さくなる傾向
片方が増えると他方が減る
無相関:変数Xの大小の変化と変数Yの大小の変化との間
には関係がない
正の相関の散布図の例
「統計テスト1」と「統計テスト2」の散布図
10
5
統計テスト2
統計テスト2=
c(10,13,8,15,8,6,9,10,7,3,1
8,14,18,11,12,5,7,12,7,7)
plot(統計テスト1,統計テスト
2)
15
例:(p.57)
統計テスト1=
c(6,10,6,10,5,3,5,9,3,3,11,6
,11,9,7,5,8,7,7,9)
4
6
8
統計テスト1
10
4
6
統計テスト1
8
前の図と比較して
より円に近いちらばり
10
弱い相関の散布図の例
4
6
8
10
心理学テスト
12
14
無相関の散布図の例
10
5
統計テスト2
15
全体的に円に近い
4
6
8
10
心理学テスト
12
14
散布図では・・・
散布図は、2変数の相関の様子を視覚的把握するという意味
では有効である。しかし、変数がたくさんある場合は有効で
はない。
そこで、相関の様子を散布図として表現するのではなく、
相関の「強さはこのくらいです」と一つの数値にして示す
ことが一般的
この場合の指標として相関係数がある。
3.3 共分散
(x1  x)(y1  y)  (x 2  x)(y2  y)   (x n  x)(yn  y)
sxy 
n
Rの練習(p60,61)
> 共分散1と2=sum((統計テスト1-mean(統計テスト1))*(統計テスト2mean(統計テスト2)))/length(統計テスト1)
> 共分散1と2
[1] 7.55
> 共分散1と2=mean((統計テスト1-mean(統計テスト1))*(統計テスト2mean(統計テスト2)))
> 共分散1と2
[1] 7.5
> cov(統計テスト1,統計テスト2)
[1] 7.947368
> cov(統計テスト1,統計テスト2)*(length(統計テスト1)-1)/length(統計テ
スト1)
[1] 7.55
単位を変えると...
> 身長m=c(1.5,1.6,1.7,1.8,1.9)
> 身長m
[1] 1.5 1.6 1.7 1.8 1.9
身長mと身長cmは単位をmとcmに変えただけ
それなのに共分散が大きく変化している
> 身長cm=身長m*100
これはマズイ
> 身長cm
[1] 150 160 170 180 190
> 体重=c(50,70,60,80,90)
> 体重
[1] 50 70 60 80 90
> cov(身長m,体重)
[1] 2.25
> cov(身長cm,体重)
[1] 225
標準偏差を利用して測定単位
の影響をうけない相関の指標、
相関係数を求める
3.4 相関係数
• 相関係数:二つの確率変数の間の相関(類似
性の度合い)を示す統計学的指標
原則、単位は無く、-1 から 1 の間の実数値をとる
• 相関係数の式
sxy
rxy 
sx s y
Rの練習(p62,63)
> cov(統計テスト1,統計テスト2)/(sd(統計テスト1)*sd(統計テスト2))
[1] 0.749659
> cor(統計テスト1,統計テスト2)
[1] 0.749659
> cor(心理学テスト,統計テスト1)
[1] 0.3826645
> cor(心理学テスト,統計テスト2)
[1] -0.09350516
相関係数 まとめ
無相関の場合、相関係数は0、
正の相関が強くなるにしたがって1に近づく。
相関係数の最大値は1である。
1 に近いときは二つの変数には正の相関があるとい
い、-1 に近ければ負の相関があるという。
例:先進諸国の失業率と実質経済成長率は強い負の相関関係
にあり、相関係数を求めれば比較的に -1 に近い数字になる。
表3.1 相関係数の大きさの評価
相関係数
大きさの評価
-0.2 ≤ r ≤ 0.2
ほとんど相関なし
-0.4 ≤ r < -0.2
0.2 < r ≤ 0.4
弱い相関あり
-0.7 ≤ r < -0.4
0.4 < r ≤ 0.7 中程度の相関あり
-1.0 ≤ r< -0.7
0.7 < r ≤ 1.0 強い相関あり
3.5 クロス集計表
クロス集計表:質的変数同士の関係を見る
例: 数学の好き・嫌い(変数「数学」)と、
統計の好き・嫌い(変数「統計」)
の間に連関があるかどうか
Rによるクロス集計表
> 数学=c("嫌い","嫌い","好き","好き","嫌い","嫌い","嫌い","嫌い","嫌い","好き","好き","嫌い","好き","嫌い
","嫌い","好き","嫌い","嫌い","嫌い","嫌い")
> 数学
[1] "嫌い" "嫌い" "好き" "好き" "嫌い" "嫌い" "嫌い" "嫌い" "嫌い" "好き" "好き" "嫌い" "好き" "嫌い"
[15] "嫌い" "好き" "嫌い" "嫌い" "嫌い" "嫌い"
> table(数学)
数学
嫌い 好き
14 6
> 統計=c("好き","好き","好き","好き","嫌い","嫌い","嫌い","嫌い","嫌い","嫌い","好き","好き","好き","嫌い","
好き","嫌い","嫌い","嫌い","嫌い","嫌い")
> 統計
[1] "好き" "好き" "好き" "好き" "嫌い" "嫌い" "嫌い" "嫌い" "嫌い" "嫌い" "好き" "好き" "好き" "嫌い"
[15] "好き" "嫌い" "嫌い" "嫌い" "嫌い" "嫌い"
> table(統計)
統計
統計
嫌い 好き
嫌い 好き
数学と統計の
12 8
>
table(数学,統計)
嫌い
数学 好き
10
2
4
4
クロス集計表
3.6 ファイ係数
ファイ係数:相関係数の特別な場合
1と0からなる変数(二値変数)に対して計算さ
れる相関係数
Rによるファイ係数
> 数学イチゼロ=ifelse(数学=="好き",1,0)
> 数学イチゼロ
[1] 0 0 1 1 0 0 0 0 0 1 1 0 1 0 0 1 0 0 0 0
> 統計イチゼロ=ifelse(統計=="好き",1,0)
> 統計イチゼロ
[1] 1 1 1 1 0 0 0 0 0 0 1 1 1 0 1 0 0 0 0 0
> cor(数学イチゼロ,統計イチゼロ)
[1] 0.3563483
本章で出てきた関数
目的
関数名と書式
使い方
散布図を描く
plot(x,y)
plot(統計テスト1,統計テスト2)
共分散を求める
cov(x,y)
cov(統計テスト1,統計テスト2)
相関係数を求める cor(x,y)
cor(統計テスト1,統計テスト2)
クロス集計表を描
く
table(x,y)
table(数学,統計)
場合分けをする
ifelse(条件、真の場合、偽
の場合)
ifelse(統計==“好き”,1,0)
100
練習問題
(1)
60
40
20
定期試験
80
> 勉強時間=c(1,3,10,12,6,3,8,4,1,5)
> 勉強時間
[1] 1 3 10 12 6 3 8 4 1 5
> 定期試験=c(20,40,100,80,50,50,70,50,10,60)
> 定期試験
[1] 20 40 100 80 50 50 70 50 10 60
plot(勉強時間,定期試験)
2
4
6
勉強時間
8
10
12
練習問題
(2) cor(勉強時間,定期試験)
[1] 0.9092974
散布図と(2)の結果より勉強時間と定期試験の相関係数は・・・
強い相関関係にあるといえる!!
練習問題
(3)クロス集計
洋食派か和食派か=c("洋食","和食","和食","洋食","和食","洋食","洋食","和食","洋食","洋
食","和食","洋食","和食","洋食","和食","和食","洋食","洋食","和食","和食")
> 洋食派か和食派か
[1] "洋食" "和食" "和食" "洋食" "和食" "洋食" "洋食" "和食" "洋食" "洋食" "和食" "洋食" "和
食" "洋食" "和食" "和食" "洋食" "洋食" "和食" "和食"
> 甘党か辛党か=c("甘党","辛党","甘党","甘党","辛党","辛党","辛党","辛党","甘党","甘党","甘
党","甘党","辛党","辛党","甘党","辛党","辛党","甘党","辛党","辛党")
> 甘党か辛党か
[1] "甘党" "辛党" "甘党" "甘党" "辛党" "辛党" "辛党" "辛党" "甘党" "甘党" "甘党" "甘党" "辛
党" "辛党" "甘党" "辛党" "辛党" "甘党" "辛党" "辛党"
> table(洋食派か和食派か,甘党か辛党か)
甘党か辛党か
洋食派か和食派か 甘党 辛党
洋食 6 4
和食 3 7
練習問題
(4)ファイ係数
> 洋か和=ifelse(洋食派か和食派か=="洋食",1,0)
> 洋か和
[1] 1 0 0 1 0 1 1 0 1 1 0 1 0 1 0 0 1 1 0 0
> 甘か辛=ifelse(甘党か辛党か=="甘党",1,0)
> 甘か辛
[1] 1 0 1 1 0 0 0 0 1 1 1 1 0 0 1 0 0 1 0 0
> cor(洋か和,甘か辛)
[1] 0.3015113