データ分析1 - initial html file

夏休み課題:データ分析
1.尺度の種類
2.単純集計
3.クロス集計とχ2検定
4.平均値の比較(t検定と分散分析)
5.課題
6.参考文献
1
1.尺度の種類
①名義尺度(nominal scale)
e.g.性別(男性・女性)、職業
裁判員制度に関する知識(e.g. 問1)
裁判員制度に関する知識・情報を入手す
るメディア(問16)
②順序尺度・序数尺度(ordinal scale)
e.g.成績(1位・2位・3位・・・・・)
背の順(1番目・2番目・3番目・・・・)
好きな順位(1位・2位・3位・・・・・)
2
③間隔尺度・距離尺度(interval scale, distance
e.g.新聞閲覧時間(問14)
裁判員制度に対する考え(問8)
scale)
(全くそう思わない、あまりそう思わない、どち
らともいえない、ややそう思う、非常にそう思う)
④比例尺度(ratio scale)=ゼロがある
e.g.成績(0点・・・・100点)
鉛筆の長さ(0cm・・・・・15cm)
メディア別信用(問17)
3
表1 各尺度の特徴
定 義
カテゴリー
名義
やグループ
順序
大小関係
間隔 程度の違い
ゼロから始
比例
まる測定値
順序関係 加減算
なし
あり
あり
あり
変数例
×
性別、
学科・コース
×
テレビ視聴時間
(低・(中)・高に分け
た場合)
△
「全くそう思わない」
~「そう思う」
〇
テレビ視聴時間(実
数できいた場合)
4
2.単純集計
高度な分析を行う前に、回答の全体的特性を度数や
平均値を求めて、把握しよう(=単純集計)。
度数=〇人(△%)など。グラフに描くとより分かりやすく
なることが多い。
←名義、順序、間隔
平均値(中央値)=標準偏差、分散といったデータの散
らばり具合にも目を通すようにする。
←間隔、比例
5
3.クロス集計とχ2検定
どのグループ(カテゴリー)にどんな回答が多いかをみると
きに使用。合わせてχ2検定を行ってしまうことが多い。
<例題2>問26(性別)×問8-2(裁判員裁判への参加意欲)
①「分析」→「記述統計」→「クロス集計表」
②“行”と“列”に関係をみる変数を入れる。
③「統計量」→「カイ2乗」にチェック。
④「セル」→“度数”「観測」「期待」、“パーセンテージ”
「行」「列」、“残差”「調整済みの標準化」にそれぞれ
チェック。
⑤「続行」→「OK」
※アウトプットの見方(次ページ)と資料1を参照。
6
3-1.SPSSアウトプットの見方(Χ2検定の場合)
①有意確率を確認。
p=.000
⇒p<.001
②自由度
③χ2値
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
Value
Asymp. Sig.
(2-sided)
df
21.881a
4
.000
23.224
4
.000
ちなみに、有意確率はそのまま値を
12.415
1
.000
p=.000やp=.043のように記すことも可能。
693
<(小なり)で記述する場合は、
・p<.05(p=.010~.049)
・p<.01(p=.009~.001)
・p<.001(p=.000)
裁判員裁判への参加意欲が回答者の性別で異なるかを検討するために、χ2検定を行った
ところ、男女の回答は有意に異なることが明らかとなった(χ2(4)=21.881, p<.001)。裁判
員として裁判に参加したいという考えに「非常にそう思う」と回答した男性(35名、9.9%)は女
性(8名、2.4%)よりも多かった。以上より、裁判員裁判への参加意欲が非常に積極的なの
は、女性よりも男性であるといえる。
4.平均値の比較(t検定と分散分析)
同じ
なし
分散(SD)
違う
対応
対応なしのt検定
ウェルチの検定
(繰り返し)
あり
対応ありのt検定
2つの平均値の差を調べる→t検定
2つの平均値・3つ以上の平均値の差を調べる→分散分析
8
4-1.対応のあるt検定
<例題3>テレビと新聞の情報に対する信用度は
異なるか。
問17のテレビと新聞の平均値の差を検定する。
①「分析」→「平均の比較」→「対応のあるサンプルのt検
定」
②“変数1”=テレビと“変数2”=新聞を選択
③「OK」
※アウトプットの見方(次ページ)と文章表現は資料2参照。
9
4-2.SPSSアウトプットの見方
(対応のあるt検定の場合)
Mean
メディア別
信用(テレ
Pai
r 1 ビ) - メ
ディア別信
用(新聞)
-8.433
Paired Differences
95% Confidence
Std.
Std. Interval of③t値
the
Deviati Error
Difference
on
Mean
Lower
Upper
17.687
.722
-9.851
-7.015 -11.680
①有意確率を確認。
p=.000
⇒p<.001
Sig.
Df
(2tailed)
599
.000
②自由度
テレビと新聞に対する信用度が異なるかを調べるために、対応のあるT検定を行った。す
ると、表△(図でもよい)に示されているように、「テレビ」(M=58.65%, SD=20.95)よりも
「新聞」(M=67.08%, SD=21.39)の方が有意に信用度が高い(t(599)=11.68, p<.001)。
4-3.対応のないt検定
<例題4>問8-1(日本で裁判員制度が必要)対す考え
が問26(性別)で異なるか調べる。
①「分析」→「平均の比較」→「独立したサンプルのt検定」
②「検定変数」に「問8-1」を、「グループ化変数」に問26を
入れる。
③「グループの定義」で、グループ1(=1)と2(=2)に当てはま
る数字を入力→「続行」→「OK」。
※アウトプットの見方(分散が“同じ”か“異なるか”で検定
結果の見方が異なる)は次ページと資料3と文章表現は資
料3を参照。
11
4-4.SPSSアウトプットの見方
(対応のないt検定の場合)
Levene's Test for
Equality of
①等分散を仮定できるか確認。
Variances
P<.05の場合「等分散を仮定でき
t-test for Equality of Means
ない」ので、下段の値をチェック
する。
F
Equal
制度への variances
考え1
assumed
Equal
(必要
variances
性)
not assumed
Sig.
11.551
③t値
.001
t
Std.
①有意確率を確認。
Mean
Error
Sig. (2- p=.520(p>.05)
Differenc
tailed)
Differenc
⇒ns(n.s.)
e
e
df
95% Confidence
Interval of the
Difference
Lower
Upper
-.641
690
.522
-.049
.077
-.200
.102
-.643
678.106
.520
-.049
.076
-.199
.101
②自由度
回答者の性別により、「裁判員制度は必要である」と考える程度が異なるかを明らか
にするためにT検定を行った。すると、女性(M=3.15, SD=0.91)と男性(M=3.10,
SD=1.09)で考え方に差がないことがわかった(t(678.106)=0.643, ns、表■参照)。
4-5.3つ以上のグループの差を調べる分散分析
<例題5>問9-1(有罪・無罪を的確に判断する自信)が問8-2(裁
判員裁判への参加意欲)によって異なるか?
⇒一元配置の分散分析
「分析」→「平均の比較」→「一元配置分散分析」
「因子」に「問8-2」、「従属変数リスト」に「問9-1」を
「オプション」→「記述統計量」「等分散性の検定」
「その後の検定」→「Tukey」「Dunnett T3」
※次ページと資料4参照。
「分析」→「一般線型モデル」→「1変量」でもできる。
「分散分析」はt検定の2つの平均値の差を調べる場合も使え
る。
13
4-6.SPSSアウトプットの見方
(一元配置の分散分析の場合)
②自由度
Sum of
※分散分析の時は2つ!!
Between
Groups
Within
Groups
Total
Squares
78.644
①有意確率を確認。
p=.000
⇒p<.001
③F値
df
Mean Square
4
19.661
663.255
688
.964
741.899
692
F
20.395
Sig.
.000
裁判員裁判への参加意欲により裁判員として有罪・無罪を的確に判断する自信の程度が
異なるかを調べるために分散分析を行った。その結果、裁判員裁判への参加意欲の主効
果が認められた(F(4, 688)=20.395, p<.001、表★参照)。多重比較を行ったところ、裁判
員裁判への参加意欲が低い者はそれが高い者よりも裁判員を務めることを大変だと感じ
ていることが明らかになった。具体的には、裁判員裁判に裁判員として参加したいに「非常
にそう思う」(M=3.21, SD=1.25)と回答した者は、他の回答者たちよりも判断に自信を持っ
ていた。一方、「全くそう思わない」(M=2.00, SD=1.03)と回答した者は、他の回答者たち
よりも判断に自信がなかった。また、「ややそう思う」(M=2.76, SD=1.00)と回答した者は
「あまりそう思わない」(M=2.31, SD=0.90)と回答した者たちよりも自信を持っていた。つま
り、概して裁判員裁判に対する参加意欲が高い方が有罪・無罪を的確に判断する自信を
持っていることが明らかとなった。
<例題6>問26(回答者の性別)と問8-2(裁判員裁判への
参加意欲) によって、問9-7(裁判員として冷
静に判断する自信がある)の程度が異なる
か?
⇒二元配置の分散分析
「分析」→「一般線型モデル」→「1変量」
「固定因子」→「問26」「問8-2」、
「従属変数」→「問9-7」
「オプション」→「記述統計」「等分散性の検定」
「その後の検定」、「因子」から「問8-2」を選択。「Tukey」も選
択。
※資料5参照
15
5.課題
χ2検定とt検定かχ2検定と分散分析による分析(結果の文章と
表か図を分析ごとにA4版1枚に作成。それぞれプリントアウト
して提出。表紙不要。ホチキスどめ不要。)
以下、 χ2検定についての課題を作成する手順です(参考まで)。
①パワーポイントの手順に従って、自分でχ2検定を使用した
分析を行う。使用項目はパワポと違うものでも同じもの
でも構わない。
②パワポの「SPSSのアウトプットの見方」と「資料1」を参考に、
「結果の文章」を書く。
③SPSSのアウトプットから、自分で表を作成する。
④1枚の用紙に②と③をまとめる。グループ名、学籍番号、氏
名を忘れずに。
16
t検定もしくは分散分析についても、手順は、 χ2検定と同様
ですが、一応手順を参考までに書いておきます。
①パワーポイントの手順に従って、自分でt検定か分散分
析を使用した分析をしてみる。使用項目はパワポと
違うものでも同じものでも構わない。
②パワポの「SPSSのアウトプットの見方」と「資料2~5」のい
ずれかを参考に、「結果の文章」を書く。
③SPSSのアウトプットから、自分で表か図を作成。
④1枚の用紙②と③にまとめる。グループ名、学籍番号、氏
名を忘れずに記載する。
17
6.参考文献
広田すみれ (2005). 読む統計学使う統計学 慶應義塾大学
出版会
★岸 学 (2005). SPSSによるやさし統計学 オーム社
村井潤一郎・柏木恵子 (2008). ウォームアップ心理統計 東
京大学出版会
18