社会調査法 第5回 き ほ ん とうけいりょう 1.基本 統 計 量 つぎ ひょう か 次の 表 に、このクラスの学生のデータを書いてみましょう。 へいきん 身長は平均どのくらいだと思いますか?男性と女性でどのくらい変わるでしょう? 学 ①性別 生 ②身長 ③今アルバイ ④ ア ル バ イ ⑤アルバイトをしている場合、アルバイ (cm) トをやってい ト を し て い トの種類(MA ば あ い しゅう るか(SA) る 場合 、 週 しゅるい ふくすうかいとう 複数回答) にっすう の日数 1 2 3 4 5 6 1 女性 cm 1.いつもやる ときどき 2 男性 2.時々やる 3 その他 3.やらない 1 女性 3 その他 3.やらない 2.時々やる 3 その他 3.やらない 1 女性 2.時々やる 3 その他 3.やらない 1 女性 2.時々やる 3 その他 3.やらない 1 女性 2.時々やる 3 その他 3.やらない ぎょう はんばい べんとうせいぞう く た 製 造 業 (弁当製造、組み立てなど) ふくし か て い きょうし ろうじん 4 その他 た ぎょう いんしょく はんばい サービス 業 ( 飲 食 、販売など) べんとうせいぞう く た 製 造 業 (弁当製造、組み立てなど) ふくし か て い きょうし ろうじん 3 教 育 ・福祉(家庭教師や老人ホーム) 4 その他 日 1 た ぎょう いんしょく はんばい サービス 業 ( 飲 食 、販売など) せいぞうぎょう 2 べんとうせいぞう く み た 製 造 業 (弁当製造、組み立てなど) きょういく ふくし か て い きょうし ろうじん ほ ー む 3 教 育 ・福祉(家庭教師や老人ホーム) 4 その他 日 1 た ぎょう いんしょく はんばい サービス 業 ( 飲 食 、販売など) せいぞうぎょう 2 べんとうせいぞう く た 製 造 業 (弁当製造、組み立てなど) きょういく ふくし か て い きょうし ろうじん 3 教 育 ・福祉(家庭教師や老人ホーム) 4 その他 日 1 た ぎょう いんしょく はんばい サービス 業 ( 飲 食 、販売など) せいぞうぎょう 2 べんとうせいぞう く た 製 造 業 (弁当製造、組み立てなど) きょういく 1 いんしょく サービス 業 ( 飲 食 、販売など) きょういく ときどき 2 男性 ろうじん た せいぞうぎょう cm 1.いつもやる か て い きょうし 教 育 ・福祉(家庭教師や老人ホーム) 2 ときどき 2 男性 ふくし 3 日 1 cm 1.いつもやる た その他 きょういく ときどき 2 男性 く 4 せいぞうぎょう cm 1.いつもやる べんとうせいぞう 教 育 ・福祉(家庭教師や老人ホーム) 2 ときどき 2 男性 はんばい 3 日 1 cm 1.いつもやる いんしょく 製 造 業 (弁当製造、組み立てなど) きょういく ときどき 2.時々やる ぎょう サービス 業 ( 飲 食 、販売など) せいぞうぎょう 2 cm 1.いつもやる 2 男性 1 女性 日 1 ふくし か て い きょうし ろうじん 3 教 育 ・福祉(家庭教師や老人ホーム) 4 その他 た 2.重要な用語 ひょうほん ご さ (1) 標 本 誤差 N − n P (100 − P ) × N −1 n 標本誤差 = 1.96 ぼしゅうだん みぎ ※母集団 が大きいときは右でもいい(あまり変わらないから)→ 標本誤差 = 2 P (100 − P ) n ぼしゅうだん ちょうさ たいしょうしゃすう 母集団 ひょうほんすう n=調査の対 象 者 数 ( 標 本数) かいとうりつ にほん P=回答率 ぼしゅうだん だいがくせいぜんたい 日本の大学生全体 にんずう 280 万人 N=母集団の人数 ちょうさ 調査の たいしょうしゃ ※ σ(シグマ 対象者 母集団がはっきりしている場合)を ひょうじゅん へ ん さ ひょうじゅん ご ひょうほん 標本 さ 標 準 偏差と、SE または S( 標 準 誤差)という場合もある。 れい む さ く い えら だいがくせい たいしょうしゃ 「アルバイトをしているか」聞いて、ア 例:もし無作為に選んだ 80 人の大学生を対 象 者 に、 ばあい とき ひょうほん ご さ シグマ ルバイトをしている人が 60 人だった場合(75%の時) 標 本 誤差( σ )は σ =2 P (100 − P ) n つまり σ =2 75(100 − 75) =つまり 5 です。 80 わりあい ぼしゅうだん にほん だいがくせいぜんたい まんにん これはアルバイトをしている人の割合が、母集団(日本の大学生全体280万人)70%から 80% あいだ の 間 (75%±5%)ということです。 ひょうほん ご さ じっさい ちょうさたいしょうしゃ ±5%では、 標 本 誤差が大きすぎるので、実際にはもっとたくさんの人を調査 対 象 者 にし た方がいいでしょう。 え たいしょうしゃ ぜんいん かいとう また、正確な結果を得るには、対 象 者 の全員に回答してもらうことが必要です。しかし現 ぜんいんかいとう ひじょう むずか ぎょうせい おこな ちょうさ かいとうりつ 実の調査では、全員回答してもらうのは、非常に 難 しく、 行 政 が 行 う調査でも回答率は ぐらい げんじょう 50% 位 にしかならないのが 現 状 です。 へいきん (2)平均 しんちょう きんがく すうち とき しゅうけい 身 長 や金額などの数値データの時のみ、 集 計 できます。 れい がくせい しんちょう 例:もしこのクラスの学生の 身 長 が 156cm 182cm 161cm 172cm 161cm 159cm 173cm 169cm のとき、 へいきん (156cm+182cm+161cm+172cm+161cm+159cm+173cm+169cm)÷8人で 平均は 166.6cm 2 ぶんさん (3)分散 こ こ へいきん にじょう そうわ ぜんぶ た かず データのばらつきを表します。 (個々のデータ−平均)の2 乗 の総和(全部足した数) ぶんさん おお おお ぜったいち おお 分散が大きければ、ばらつきが大きい。(元のデータの絶対値が大きければ大きくなる) n σ2 = ∑ ( Xi − X ) そうわ 2 Σは「総和」と読む i =1 n へいきん Xは「エックスバー」または「平均」と読む 例 身長 A身長−平均(166cm) B A×A 二乗 Bの総和 B÷8(人数) 1 2 3 156cm 182cm 161cm -10cm 16cm -5cm 100cm 256cm 25cm 549cm 69 ←これが分散 4 172cm 6cm 36cm 5 161cm -5cm 25cm 6 159cm -7cm 49cm 7 173cm 7cm 49cm 8 169cm 3cm 9cm ひょうじゅん へ ん さ (4) 標 準 偏差(SD へんさ standard deviation) へいきんち にじょう わ た ざん かず わ へいほうこん 偏差(個々のデータ−平均値)の2乗 の和(足し算したもの)を、データの数で割り、平方根 (ルートのこと)をとる。 ぐ あい ぶんさん ちが もと たん い データのばらつき具 合 がわかる。(分散と違って、元のデータの単位となっている しんちょう たとえ じょうげ ば 身 長 のばらつきが上下8.3cm となる。分散では 69) n じじょう ∑ ( Xi − X )2 SD = なぜ、わざわざ二乗して、ルートをとるのか? へいきん i =1 へいきん ちい →平均より大きい+のデータ、平均より小さいマ n ふごう む し イナスのデータの、符号を無視するため れい 69 = 8.3 例 だいたい 8.3cm のばらつきがあるということ 1 しんちょう 3 4 5 6 7 けい 8 計 156cm 182cm 161cm 172cm 161cm 159cm 173cm 169cm へいきん -10cm 16cm -5cm 6cm -5cm -7cm 7cm 3cm じじょう 100cm 256cm 25cm 36cm 25cm 49cm 49cm 9cm 身長 しんちょう 2 A 身長−平均(166cm) B A×A(二乗) そうわ 549cm C Bの総和 ぶんさん にん 69cm D 分散 C÷8人 ひょうじゅん へんさ 8.3cm E 標準偏差 √D 3 さいだいち さいしょうち (5)最大値 最小値 1 156cm ちゅうおうち さいひんち 中央値 最頻値 2 159cm 3 161cm さいしょうち 4 161cm ちゅうおうち 6 172cm 7 173cm ちゅうおうち 中央値 最小値 5 169cm さいだいち 中央値 さいひんち さいひんち 最頻値 最頻値 8 182cm 最大値 ど す う ぶんぷひょう (6)度数分布表(ヒストグラム) 身長 155∼ 159cm 160∼ 164cm 165∼ 169cm 170∼ 174cm 175∼ 179cm 人数 5 2 4 4 3 5 2 1 3 0 155∼ 160∼ 165∼ 170∼ 175∼ 159cm 164cm 169cm 174cm 179cm 1 せいきぶんぷ (5)正規分布 Wikipedia より しゃくど (7)尺度 ひ り つ しゃくど ねんれい ①比率 尺度 しゅうにゅう 年齢、 収 入 など かんかくしゃくど ちがい ぜったいてききじゅん も *間隔尺度との違いは、絶対的規準「0」を持つこと かんかくしゃくど しすう ②間隔 尺度 おんど けいさん 指数、温度など *計算できる れい ふかいしすう 例 不快指数(=0.81×気温+0.01×湿度×(0.99×気温−14.3)+46.3) ∼55 55∼60 きおん 0 がない 60∼65 なに さむ 寒い はださむ 肌寒い しつど きおん 65∼70 70∼75 75∼80 かん 何も感じ ない 80∼85 あ つ く て あせ ここちよ あつ 快 い 暑くない 4 あつ やや暑い 暑くて汗 で が出る 85∼ あつ 暑くてた まらない じゅんじょしゃくど ③ 順 序 尺度 とてもよい−よい−ふつう−わるい−とてもわるい アルバイトをしているか ときどき けいさん など 1 いつもやる *計算できない ひかく てんすうか 2 時々やる けいさん 3 やらない ばあい ※ただし、わかりやすさや比較のために、次のように点数化して計算する場合もある とてもよい−よい−ふつう−わるい−とてもわるい てん てん てん てん てん 10点 5点 3点 2点 0点 せいべつ めいぎ ①性別 ④名義尺度 せいべつ だんせい けいさん 性別など 1 *計算できない じょせい 男性 め い ぎ しゃくど 2 ばんごう 女性 ふ けいさん ばあい も ぎ へんすう 名義尺度で、男性を1、女性を2などと番号を振って計算する場合「ダミー(模擬)変数」 と呼ぶことがある。 へんすう しゅるい (8)変数の種類 り さ ん へんすう れんぞくへんすう ①離散 変数 と連続 変数 例: せいべつ り さ ん へんすう だんせい 性別が離散変数 しんちょう じょせい た 男性、女性、その他 しかない れんぞくへんすう しょうすうてん い 身 長 が連続変数 どくりつへんすう 151、151.1 じゅうぞくへんすう ②独立 変数 と 従 属 変数 例: がくねん しんちょう たか ちがうばあい 学年によって、 身 長 の高さが違う場合 しんちょう き どくりつへんすう 学年が( 身 長 などを決める)独立変数 がくねん けってい じゅうぞくへんすう 身長が(学年によって決定する) 従 属 変数 せつめいへんすう ひ せつめいへんすう ③説明 変数 と被 説明 変数 例: しんちょう へいきん ちが 性別で 身 長 の平均が違うとき しんちょう せつめい せつめいへんすう 性別が( 身 長 を説明する)説明変数 せいべつ せつめい か れんぞく 151.2 など 小 数点以下があり連続している ひ せつめいへんすう 身長が(性別によって説明される)被説明変数 しんちょう じょせい 女性 へいきん 身長の平均 161cm だんせい 172cm 男性 5 そうかん かんけい 3.相関関係とは そうかん (1)相関 とは へんすう へんすう あいだ そうかんかんけい ある変数とある変数の 間 に、相関関係があること。 しんちょう たいじゅう 身 長と体 重 例 1 156cm 52kg 身長 体重 相関係数 2 159cm 43kg 3 161cm 60kg 4 161cm 50kg 5 169cm 58kg 6 172cm 63kg 7 173cm 70kg 0.89 ←+の相関(高ければ重い) 0.6以上は相関がある 身長と体重の関係 80kg y = 1.1 x - 126.3 R2 = 0.8 70kg 60kg 体重 50kg 線形 (体重) 40kg 150cm 160cm 170cm 180cm 190cm ぎ じ そうかん (2)疑似 相関 そうかん み じつ た よういん かんけい 相関があるように見えるが、実は他の要因と関係していること。 例: う 誤り みず ひと ふ ジュースがたくさん売れると、水におぼれる人が増える? ただ きおん 正しくは 気温が上がると、ジュースが売れる、 あ う みずあそ ふ 水遊びをする人も増え、おぼれる人が増えるる あさ 誤り? はん た せいせき 朝ご飯を食べると、成績がよくなる? ほんとう か て い かんきょう 本当は? 家庭 環 境 で規則正しい生活をできる人は、朝ご飯を食べる人が多く、 き そくただ せいかつ あさ せいせき 成績もいいのかもしれない。 6 はん た ひと おお 8 182cm 77kg
© Copyright 2024 ExpyDoc