社会調査法 第5回

社会調査法
第5回
き ほ ん とうけいりょう
1.基本 統 計 量
つぎ
ひょう
か
次の 表 に、このクラスの学生のデータを書いてみましょう。
へいきん
身長は平均どのくらいだと思いますか?男性と女性でどのくらい変わるでしょう?
学
①性別
生
②身長
③今アルバイ ④ ア ル バ イ ⑤アルバイトをしている場合、アルバイ
(cm)
トをやってい ト を し て い トの種類(MA
ば あ い
しゅう
るか(SA)
る 場合 、 週
しゅるい
ふくすうかいとう
複数回答)
にっすう
の日数
1
2
3
4
5
6
1 女性
cm 1.いつもやる
ときどき
2 男性
2.時々やる
3 その他
3.やらない
1 女性
3 その他
3.やらない
2.時々やる
3 その他
3.やらない
1 女性
2.時々やる
3 その他
3.やらない
1 女性
2.時々やる
3 その他
3.やらない
1 女性
2.時々やる
3 その他
3.やらない
ぎょう
はんばい
べんとうせいぞう
く
た
製 造 業 (弁当製造、組み立てなど)
ふくし
か て い きょうし
ろうじん
4
その他
た
ぎょう
いんしょく
はんばい
サービス 業 ( 飲 食 、販売など)
べんとうせいぞう
く
た
製 造 業 (弁当製造、組み立てなど)
ふくし
か て い きょうし
ろうじん
3
教 育 ・福祉(家庭教師や老人ホーム)
4
その他
日 1
た
ぎょう
いんしょく
はんばい
サービス 業 ( 飲 食 、販売など)
せいぞうぎょう
2
べんとうせいぞう
く
み
た
製 造 業 (弁当製造、組み立てなど)
きょういく
ふくし
か て い きょうし
ろうじん ほ
ー
む
3
教 育 ・福祉(家庭教師や老人ホーム)
4
その他
日 1
た
ぎょう
いんしょく
はんばい
サービス 業 ( 飲 食 、販売など)
せいぞうぎょう
2
べんとうせいぞう
く
た
製 造 業 (弁当製造、組み立てなど)
きょういく
ふくし
か て い きょうし
ろうじん
3
教 育 ・福祉(家庭教師や老人ホーム)
4
その他
日 1
た
ぎょう
いんしょく
はんばい
サービス 業 ( 飲 食 、販売など)
せいぞうぎょう
2
べんとうせいぞう
く
た
製 造 業 (弁当製造、組み立てなど)
きょういく
1
いんしょく
サービス 業 ( 飲 食 、販売など)
きょういく
ときどき
2 男性
ろうじん
た
せいぞうぎょう
cm 1.いつもやる
か て い きょうし
教 育 ・福祉(家庭教師や老人ホーム)
2
ときどき
2 男性
ふくし
3
日 1
cm 1.いつもやる
た
その他
きょういく
ときどき
2 男性
く
4
せいぞうぎょう
cm 1.いつもやる
べんとうせいぞう
教 育 ・福祉(家庭教師や老人ホーム)
2
ときどき
2 男性
はんばい
3
日 1
cm 1.いつもやる
いんしょく
製 造 業 (弁当製造、組み立てなど)
きょういく
ときどき
2.時々やる
ぎょう
サービス 業 ( 飲 食 、販売など)
せいぞうぎょう
2
cm 1.いつもやる
2 男性
1 女性
日 1
ふくし
か て い きょうし
ろうじん
3
教 育 ・福祉(家庭教師や老人ホーム)
4
その他
た
2.重要な用語
ひょうほん ご さ
(1) 標 本 誤差
N − n P (100 − P )
×
N −1
n
標本誤差 = 1.96
ぼしゅうだん
みぎ
※母集団 が大きいときは右でもいい(あまり変わらないから)→ 標本誤差 = 2
P (100 − P )
n
ぼしゅうだん
ちょうさ
たいしょうしゃすう
母集団
ひょうほんすう
n=調査の対 象 者 数 ( 標 本数)
かいとうりつ
にほん
P=回答率
ぼしゅうだん
だいがくせいぜんたい
日本の大学生全体
にんずう
280 万人
N=母集団の人数
ちょうさ
調査の
たいしょうしゃ
※ σ(シグマ
対象者
母集団がはっきりしている場合)を
ひょうじゅん へ ん さ
ひょうじゅん ご
ひょうほん
標本
さ
標 準 偏差と、SE または S( 標 準 誤差)という場合もある。
れい
む さ く い
えら
だいがくせい
たいしょうしゃ
「アルバイトをしているか」聞いて、ア
例:もし無作為に選んだ 80 人の大学生を対 象 者 に、
ばあい
とき
ひょうほん ご
さ
シグマ
ルバイトをしている人が 60 人だった場合(75%の時) 標 本 誤差( σ )は
σ =2
P (100 − P )
n
つまり
σ =2
75(100 − 75)
=つまり 5 です。
80
わりあい
ぼしゅうだん
にほん
だいがくせいぜんたい
まんにん
これはアルバイトをしている人の割合が、母集団(日本の大学生全体280万人)70%から 80%
あいだ
の 間 (75%±5%)ということです。
ひょうほん ご
さ
じっさい
ちょうさたいしょうしゃ
±5%では、 標 本 誤差が大きすぎるので、実際にはもっとたくさんの人を調査 対 象 者 にし
た方がいいでしょう。
え
たいしょうしゃ
ぜんいん
かいとう
また、正確な結果を得るには、対 象 者 の全員に回答してもらうことが必要です。しかし現
ぜんいんかいとう
ひじょう
むずか
ぎょうせい
おこな
ちょうさ
かいとうりつ
実の調査では、全員回答してもらうのは、非常に 難 しく、 行 政 が 行 う調査でも回答率は
ぐらい
げんじょう
50% 位 にしかならないのが 現 状 です。
へいきん
(2)平均
しんちょう
きんがく
すうち
とき
しゅうけい
身 長 や金額などの数値データの時のみ、 集 計 できます。
れい
がくせい
しんちょう
例:もしこのクラスの学生の 身 長 が
156cm
182cm
161cm
172cm
161cm
159cm
173cm
169cm
のとき、
へいきん
(156cm+182cm+161cm+172cm+161cm+159cm+173cm+169cm)÷8人で 平均は 166.6cm
2
ぶんさん
(3)分散
こ
こ
へいきん
にじょう
そうわ
ぜんぶ た
かず
データのばらつきを表します。
(個々のデータ−平均)の2 乗 の総和(全部足した数)
ぶんさん
おお
おお
ぜったいち
おお
分散が大きければ、ばらつきが大きい。(元のデータの絶対値が大きければ大きくなる)
n
σ2 =
∑ ( Xi − X )
そうわ
2
Σは「総和」と読む
i =1
n
へいきん
Xは「エックスバー」または「平均」と読む
例
身長
A身長−平均(166cm)
B A×A 二乗
Bの総和
B÷8(人数)
1
2
3
156cm
182cm
161cm
-10cm
16cm
-5cm
100cm
256cm
25cm
549cm
69 ←これが分散
4
172cm
6cm
36cm
5
161cm
-5cm
25cm
6
159cm
-7cm
49cm
7
173cm
7cm
49cm
8
169cm
3cm
9cm
ひょうじゅん へ ん さ
(4) 標 準 偏差(SD
へんさ
standard deviation)
へいきんち
にじょう
わ
た
ざん
かず
わ
へいほうこん
偏差(個々のデータ−平均値)の2乗 の和(足し算したもの)を、データの数で割り、平方根
(ルートのこと)をとる。
ぐ あい
ぶんさん
ちが
もと
たん い
データのばらつき具 合 がわかる。(分散と違って、元のデータの単位となっている
しんちょう
たとえ
じょうげ
ば 身 長 のばらつきが上下8.3cm となる。分散では 69)
n
じじょう
∑ ( Xi − X )2
SD =
なぜ、わざわざ二乗して、ルートをとるのか?
へいきん
i =1
へいきん
ちい
→平均より大きい+のデータ、平均より小さいマ
n
ふごう
む
し
イナスのデータの、符号を無視するため
れい
69 = 8.3
例
だいたい 8.3cm のばらつきがあるということ
1
しんちょう
3
4
5
6
7
けい
8
計
156cm
182cm
161cm
172cm
161cm
159cm
173cm
169cm
へいきん
-10cm
16cm
-5cm
6cm
-5cm
-7cm
7cm
3cm
じじょう
100cm
256cm
25cm
36cm
25cm
49cm
49cm
9cm
身長
しんちょう
2
A 身長−平均(166cm)
B A×A(二乗)
そうわ
549cm
C Bの総和
ぶんさん
にん
69cm
D 分散 C÷8人
ひょうじゅん
へんさ
8.3cm
E 標準偏差 √D
3
さいだいち
さいしょうち
(5)最大値 最小値
1
156cm
ちゅうおうち
さいひんち
中央値 最頻値
2
159cm
3
161cm
さいしょうち
4
161cm
ちゅうおうち
6
172cm
7
173cm
ちゅうおうち
中央値
最小値
5
169cm
さいだいち
中央値
さいひんち
さいひんち
最頻値
最頻値
8
182cm
最大値
ど す う ぶんぷひょう
(6)度数分布表(ヒストグラム)
身長
155∼
159cm
160∼
164cm
165∼
169cm
170∼
174cm
175∼
179cm
人数
5
2
4
4
3
5
2
1
3
0
155∼ 160∼ 165∼ 170∼ 175∼
159cm 164cm 169cm 174cm 179cm
1
せいきぶんぷ
(5)正規分布
Wikipedia より
しゃくど
(7)尺度
ひ り つ しゃくど
ねんれい
①比率 尺度
しゅうにゅう
年齢、 収 入 など
かんかくしゃくど
ちがい
ぜったいてききじゅん
も
*間隔尺度との違いは、絶対的規準「0」を持つこと
かんかくしゃくど
しすう
②間隔 尺度
おんど
けいさん
指数、温度など
*計算できる
れい
ふかいしすう
例
不快指数(=0.81×気温+0.01×湿度×(0.99×気温−14.3)+46.3)
∼55
55∼60
きおん
0 がない
60∼65
なに
さむ
寒い
はださむ
肌寒い
しつど
きおん
65∼70
70∼75
75∼80
かん
何も感じ
ない
80∼85
あ つ く て あせ
ここちよ
あつ
快 い
暑くない
4
あつ
やや暑い
暑くて汗
で
が出る
85∼
あつ
暑くてた
まらない
じゅんじょしゃくど
③ 順 序 尺度
とてもよい−よい−ふつう−わるい−とてもわるい アルバイトをしているか
ときどき
けいさん
など
1 いつもやる
*計算できない
ひかく
てんすうか
2 時々やる
けいさん
3 やらない
ばあい
※ただし、わかりやすさや比較のために、次のように点数化して計算する場合もある
とてもよい−よい−ふつう−わるい−とてもわるい
てん
てん
てん
てん
てん
10点
5点
3点
2点
0点
せいべつ
めいぎ
①性別
④名義尺度
せいべつ
だんせい
けいさん
性別など
1
*計算できない
じょせい
男性
め い ぎ しゃくど
2
ばんごう
女性
ふ
けいさん
ばあい
も
ぎ
へんすう
名義尺度で、男性を1、女性を2などと番号を振って計算する場合「ダミー(模擬)変数」
と呼ぶことがある。
へんすう
しゅるい
(8)変数の種類
り さ ん へんすう
れんぞくへんすう
①離散 変数 と連続 変数
例:
せいべつ
り さ ん へんすう
だんせい
性別が離散変数
しんちょう
じょせい
た
男性、女性、その他
しかない
れんぞくへんすう
しょうすうてん い
身 長 が連続変数
どくりつへんすう
151、151.1
じゅうぞくへんすう
②独立 変数 と 従 属 変数
例:
がくねん
しんちょう
たか
ちがうばあい
学年によって、 身 長 の高さが違う場合
しんちょう
き
どくりつへんすう
学年が( 身 長 などを決める)独立変数
がくねん
けってい
じゅうぞくへんすう
身長が(学年によって決定する) 従 属 変数
せつめいへんすう
ひ せつめいへんすう
③説明 変数 と被 説明 変数
例:
しんちょう
へいきん
ちが
性別で 身 長 の平均が違うとき
しんちょう
せつめい
せつめいへんすう
性別が( 身 長 を説明する)説明変数
せいべつ
せつめい
か
れんぞく
151.2 など 小 数点以下があり連続している
ひ せつめいへんすう
身長が(性別によって説明される)被説明変数
しんちょう
じょせい
女性
へいきん
身長の平均
161cm
だんせい
172cm
男性
5
そうかん かんけい
3.相関関係とは
そうかん
(1)相関 とは
へんすう
へんすう
あいだ
そうかんかんけい
ある変数とある変数の 間 に、相関関係があること。
しんちょう
たいじゅう
身 長と体 重
例
1
156cm
52kg
身長
体重
相関係数
2
159cm
43kg
3
161cm
60kg
4
161cm
50kg
5
169cm
58kg
6
172cm
63kg
7
173cm
70kg
0.89 ←+の相関(高ければ重い) 0.6以上は相関がある
身長と体重の関係
80kg
y = 1.1 x - 126.3
R2 = 0.8
70kg
60kg
体重
50kg
線形 (体重)
40kg
150cm
160cm
170cm
180cm
190cm
ぎ じ そうかん
(2)疑似 相関
そうかん
み
じつ
た
よういん
かんけい
相関があるように見えるが、実は他の要因と関係していること。
例:
う
誤り
みず
ひと
ふ
ジュースがたくさん売れると、水におぼれる人が増える?
ただ
きおん
正しくは
気温が上がると、ジュースが売れる、
あ
う
みずあそ
ふ
水遊びをする人も増え、おぼれる人が増えるる
あさ
誤り?
はん
た
せいせき
朝ご飯を食べると、成績がよくなる?
ほんとう
か て い かんきょう
本当は?
家庭 環 境 で規則正しい生活をできる人は、朝ご飯を食べる人が多く、
き そくただ
せいかつ
あさ
せいせき
成績もいいのかもしれない。
6
はん
た
ひと
おお
8
182cm
77kg