08.pps

初歩的情報リテラシー
と
アンケート集計のため
のExcel・SPSS講座
2002年5月28日
政策科学部助手 山田 一隆
練習問題(相関)
(1)-1
筆記具の「書きやすさ」と「デザイン」のよしあしと再購入の有無の関係.
再購入
再購入
あり
書き
やすさ
あり
なし
よい
10
4
わるい
5
21
デザ
イン
なし
よい
8
10
わるい
7
15
「カテゴリデータ」と「カテゴリデータ」の相関係数=「クラメールの独立係数」.
公式:
rc 
χ2
n(k  1)
練習問題(相関)
サンプル数(n)と小さいほうの
カテゴリー数(k)がわかっている.
再購入
あり
よい
χ2(カイ2乗)を求める.
なし
10
実測度数(xij),期待度数
(xp(ij))とすると,xp,χ2は,
計
4
14
書きやすさ
わるい
5
21
26
x p (ij)
2 
計
15
25
40
x x


i
n

( xij  x p )2
xp
j
練習問題(相関)
再購入
期待度数(xp)を求め
ましょう.
あり
なし
計
よい
xp(11)=15×14÷40
xp(12)=25×14÷40
14
=5.25
=8.75
わるい
xp(21)=15×26÷40
xp(22)=25×26÷40
26
=9.75
=16.25
計
15
書きやすさ
25
40
練習問題(相関)
再購入
期待度数(xp)を求め
ましょう.
あり
  

計
よい
xp(11)=15×14÷40
xp(12)=25×14÷40
14
=5.25
=8.75
わるい
xp(21)=15×26÷40
xp(22)=25×26÷40
26
=9.75
=16.25
計
15
書きやすさ
2
なし
( xij  x p (ij) )2
x p (ij)
25
40
(10  5.25)2 (4  8.75)2 (5  9.75)2 (21  16.25)2




5.25
8.75
9.75
16.25
 4.298  2.579  2.314  1.388  10.579
練習問題(相関)
 ようやく,「書きやすさ」と「再購入」の相関の度合い「クラメールの独立係数」が
求められます.
rc 
χ2

n(k  1)
10.579
 0.5143
40  (2  1)
やや弱い相関がある
 同様にして,「デザイン」と「再購入」の相関の度合い「クラメールの独立係数」は,
以下のようになります.
練習問題(相関)
 ようやく,「書きやすさ」と「再購入」の相関の度合い「クラメールの独立係数」が
求められます.
rc 
χ2

n(k  1)
10.579
 0.5143
40  (2  1)
やや弱い相関がある
 同様にして,「デザイン」と「再購入」の相関の度合い「クラメールの独立係数」は,
以下のようになります.
x p(11)  6.75, x p(12)  11.25, x p(21)  8.25, x p( 22)  13.75
 2  0.673
練習問題(相関)
 ようやく,「書きやすさ」と「再購入」の相関の度合い「クラメールの独立係数」が
求められます.
rc 
χ2

n(k  1)
10.579
 0.5143
40  (2  1)
やや弱い相関がある
 同様にして,「デザイン」と「再購入」の相関の度合い「クラメールの独立係数」は,
以下のようになります.
x p(11)  6.75, x p(12)  11.25, x p(21)  8.25, x p( 22)  13.75
 2  0.673
rc 
χ2

n(k  1)
0.673
 0.1298
40  (2  1)
相関がない
練習問題(検定)
(2)-1
各年の母集団の認知率とその差の検定.
母比率の推定とその差の検定.
99年
00年
01年
n
96
120
105
%
18%
21%
23%
_
 公式: p  1.96
_
_
p ( 1- p )
n
に,上表の各年次の値を代入します.
練習問題(検定)
_
 99年: p  1.96
_
 00年: p  1.96
_
 01年: p  1.96
_
_
p ( 1- p )
0.18(1  0.18)
 0.18  1.96
 0.18  0.076
n
98
_
_
p ( 1- p )
0.21(1  0.21)
 0.21  1.96
 0.21  0.073
n
120
_
10.4-25.6%
13.7-28.3%
_
p ( 1- p )
0.23(1  0.23)
 0.23  1.96
 0.23  0.080
n
105
15.0-31.0%
練習問題(検定)
各年次の母比率の推定結果を数直線上に表現してみます.
 99年:
 00年:
 01年:
10.4%
25.6%
13.7%
28.3%
15.0%
上図のように,母比率に差がない.
つまり,経年的に認知率が高まっているとはいえない.
31.0%
練習問題(検定)
各年次の母比率の推定結果を数直線上に表現してみます.
 99年:
 00年:
 01年:
実際の母比率は,
こんな増加傾向かも
25.6%
しれないし......
10.4%
13.7%
28.3%
15.0%
上図のように,母比率に差がない.
つまり,経年的に認知率が高まっているとはいえない.
31.0%
練習問題(検定)
各年次の母比率の推定結果を数直線上に表現してみます.
 99年:
 00年:
 01年:
実際の母比率は,
こんな減少傾向かも
10.4%
しれないし......
25.6%
13.7%
28.3%
15.0%
上図のように,母比率に差がない.
つまり,経年的に認知率が高まっているとはいえない.
31.0%
練習問題(検定)
(2)-3
以下のようなアンケート調査を行いました.
問1:商品Aはおいしかったですか.
1.かなりおいしい
4.少しまずい
2.少しおいしい
5.かなりまずい
3.どちらともいえない
問2:商品Bはおいしかったですか.
1.かなりおいしい
4.少しまずい
2.少しおいしい
5.かなりまずい
3.どちらともいえない
問3:あなたの性別は?
1.男性
2.女性
a.このとき,AとBの商品に対する評価には差がありますか.
b.このとき,Aに対する評価に,男女間では差がありますか.
練習問題(検定)
(2)-3
以下のようなアンケート調査を行いました.
問1:商品Aはおいしかったですか.
1.かなりおいしい
4.少しまずい
2.少しおいしい
5.かなりまずい
3.どちらともいえない
問2:商品Bはおいしかったですか.
1.かなりおいしい
4.少しまずい
2.少しおいしい
5.かなりまずい
3.どちらともいえない
問3:あなたの性別は?
1.男性
2.女性
a.このとき,AとBの商品に対する評価には差がありますか.
対応のある場合の母平均の差の検定
b.このとき,Aに対する評価に,男女間では差がありますか.
対応のない場合の母平均の差の検定
回帰分析
• 独立変数
• 従属変数
• 多重共線性
回帰分析
• 単回帰分析
– 独立変数が1つの場合.
– y=ax+b
• 重回帰分析
– 独立変数が2つ以上の場合.
– y=a1x1+a2x2+a3x3+…+b
多変量解析と数量化理論
• 多変量解析
– 2変数(あるいは3変数)以上のデータの関係性
をみる.
– わが国では,数量化理論も多変量解析のうちと
みなされている.
• 数量化理論
– カテゴリーデータ間の関係をみることができる.
– 林知己夫(統計数理研究所)が開発した,わが国
独特の手法で,国際的には認められていない.
多変量解析と数量化理論
予測
従属変数
(外的基準)
がある
(従属変数が数量)
(予測と判別)
(従属変数がカテゴリ)
判別
数量データ
カテゴリデータ
重回帰分析
数量化理論Ⅰ類
重判別分析
数量化理論Ⅱ類
数量化理論Ⅲ類
従属変数
(外的基準)
がない
(内的構造分
析)
分類を
目的
間接的
多次元尺度構成法
(カテゴリを空間に配置)
数量化理論Ⅳ類
(アイテムを空間に配置)
直接的
クラスター分析
変数の合成
主成分分析
潜在因子の発見
因子分析
多変量解析と数量化理論
• 数量化理論Ⅲ類とⅣ類の違い
– Ⅲ類:変数の値(カテゴリ)を最少次元数の空間
に布置する.
– 問:あなたの「生きがい」は何ですか.
1.仕事
5.孫
2.趣味
6.カネ
3.配偶者
– 空間にプロットされるのは,「仕事」,「趣味」......
4.子
多変量解析と数量化理論
• 数量化理論Ⅲ類とⅣ類の違い
– Ⅳ類:変数(アイテム)を最少次元数の空間に布
置する.
– 問:商品Aはおいしかったと思いますか.
1.とても思う
4.あまり思わない
2.まあまあ思う
3.どちらともいえない
5.まったく思わない
– 空間にプロットされるのは,「商品Aはおいしい」.