■︱ デ ー タの整理 と表現 1-1 デ ー タ の整 理 身長や交通事故 の件数 な どの よ うに,あ る集 団 にお 連続変量 と離散変量 い て観測 の対象 とな る特性 を数量 で表 した もの を変量 とい う。変量 には,身 長 や体重 の ように連 続 的 な値 を とる連続変量 と,交 通事故 の件数 や家族 の人 数 の ように とび とびの値 しか とらな い離散変量 とが ある。 度数分布表 連続変量 のデー タを整理 す る ときには,デ ー タ をで きるだ け 同 じ幅 の 区間 に 区切 って分類 す る.こ の とき,各 区間 を階級 とい い,そ の 中央 の値 を階級値 とい う。また ,各 階級 に分類 され た デー タの個 数 を度 数 とい う。 階級 の幅 はデー タ全 体 の傾 向 が 読 み とれ るよ うに,適 当な大 きさに選 ぶ .階 級 または階級値 に度数 を対応 させた もの を度数分布 といい,分 類 の結果 で き上 っ た表 を度数分布表 とい う。 離散変量 のデ ー タの分類 は,そ の変量 が とる値 の個数 を数 えるだ けで よいか ら簡単 で あるが ,変 量 の とる値 が 多 い ときは,連 続変量 の場合 の ように い くつ かの階級 を作 って分類 す る。 累積度数分布表 各階級 の度数 の累計 を累積度数 といい,そ れ らを表 に ま とめた もの を累積度 数分布表 とい う。 相対度数分布表 各階級 の度数 をデ ー タの総数 で割 った値 を相対度数 とい い,こ れ を表 に した もの を相対度数分布表 とい う . 1 デー タの整理 と表現 度数分布表 ,相 対度数分布表 ,累 積度数分布表 階級値 階級 α2 αた_1 αぇ ス ん ⋮ ん αl ∬ ∬ ... ″ αO∼ αl 累積度数 相対度数 度数 /1/π Fl=/1 /2/η F2=/1+/2 三 ん/π 鳥 =/1+・ …+ん =η 計 1-2 グ ラフ に よる表現 ヒス トグラム 度数分布表 を柱状グラフに表 した もので ,各 階級 の上 に立 てる長方形 の面積は階級の度数 に比例 させ る。 ヒス トグラムの各長方形 の上辺の 度数多角形 中点 を結んで得 られる折れ 線 グラフ . 累積度数多角形 累積度数分布表 をグラフに表 した もので,階 級 の上方限界値 と累積度数 を座標 に もつ点 を結んで得 られる . ヒス トグラム 窒葉図 度数 多角形 た と え ば,10個 の デー タ (1.67,1.82,1。 75,1.63,1.72,1。 79, 茎 "に 当た る 1.84,1.60,1.73,1。 75)が 与 え られた とき,各 デ ータ を次 の ように“ (1。 6,1.7,1。 8)と “ 葉 "に 当た る 3桁 目の数 に分解 し,茎 を縦 に葉 を横 に記録 す る ことでデータを表現 した もの を茎葉図 (ま た は幹葉図)と い う . 茎葉図 1-3 代表値 と散布度 1… 3 代 表 値 と散 布 度 (a)生 のデ ー タか らの場合 。 π個 のデー タを ″1,χ 2,・ …,″ ηとす る。 (b)度 数分布表 か らの場合 。 η個 のデ ー タが 力個 の階級 に分類 され て い る として,階 級値 を ″1, ° ″た 数 を /1,/2,… ° ,ん ,累 積度数 を Fl,F2,… ,凡 とす る。 ∬2, °… ,度 1-3-1 代 表 値 デー タ全体 の 中心的傾 向 を表 す値 で,平 均値 ,メ ジア ン,モ ー ドな どが ある。 平均 (ま た は平均値 ) ∬ =場 を∬ ∬ =場 羞∬ (a) J (b) J勇 平均 の簡便計算法 =∬ J ″ o(′ =1,2,… 階級 の幅 を ε,仮 平均 を ″。とす る。ここで,変 換 π J 0,力 )に よって,χ を πに換 えれば Σ %Jん ∬ =χ 。+σ 笏=″ 。+ε メジ ア ン (a)π ら 個 の デ ー タ を大 きさの順 に並 べ た とき,π が 奇 数 な らば小 さ い 方 か 午 番 目 の 値 を,多 が 偶 数 か らば ,中 央 に くる 2つ の 値 の平 均 を メ ジアンまたは中央値 とい う . (b)こ の場合,メ ジアン″。は次式 より求 められる。 いH托午 ここで ,α J_1は メジア ンを含 む階級 の下方限界値 ん はメジア ンを含 む階級 の度数 , , 几 はメジア ンを含 む階級 よ り前 のすべ ての 階級 の度数 の和 すなわち 几 cは 階級 の幅 , =/1+/2+… ・十ん_1, . モー ド (a)デ ータの 中 で最 も多 く現 れて い る値 をモー ドまた は最頻値 とい う。 (b)最 大 の度数 を もつ階級 の 階級値 . 1 1-3-2 データの整理 と表現 散 布 度 デ ー タの散 らば りを表 す特性値 で,標 準偏差 ,分 散 ,範 囲な どが ある。 簡 > > の a b 散 < < 分 η η ΣH たΣH たΣH ΣH 法 ︲し ︲巧 ︲一 講 .し し ・ ・ ・ ・ . 2 2 便 S S 分散 (∬ J_∬ )2 2_∬ 2 ∬′ (∬ J_∬ )2勇 χJ2勇 _∬ 2 l 一π た ﹁ ろH ε 〓 笏_→ 2ん ただ し , πJ=″ 標 準偏 差 J χ° ε 笏=券 Σ %J勇 分散 の正 の平方根 を標 準偏差 とい う . (a) s=7年 2= (b) s=7毎 2= (χ J_∬ )2勇 標準偏差 の簡便計算法 ,Σ を四分位偏差という。 (注 :レ ]は 実数″の整数部分 ) 例 題 例 pり B 日 ヽ醒 臥 万 題 ン夕υ の ノ反 度数分布 製ガ 仰 ノ ) 次 の 数 は あ る 町 で の 30日 間 の 救 急 車 の 出 動 回 数 の 記 録 で あ る。この デー タ か ら 度 数 分 布 表 と 累 積 度 数 分 布 表 を 作 れ 。ま た ,(a)平 均 値 (b)メ ジア ン,(c)モ ー ドを求 め よ , . 2611203023 3042110340 5145105020 解 デ ー タの分類 の結果 , ∬ 検数マーク 正丁 8 正 14 正 19 T 23 丁 26 29 丁 30 計 したが つて,度 数分布表 と累積度数分布表 は ∬/ 計 0 8 6 14 10 19 12 23 12 26 15 29 6 30 30 (a)平 均 2(回 ). 値は ,∬ =器 ≒ (b)累 積度数分布表 よ り小 さい方 か ら 15番 目 と 16番 目の値 は ともに 2で 1 6 デー タの整理 と表現 あるか ら,メ ジア ンは 2(回 )。 (C)最 大度数 は 8だ か ら,モ ー ドは 0. 2 (ヒ ス トグラム・度数多角形 ・累積度数多角形 次 の度数分布 において,階 級 の真の限界 ,階 級値 および相対度数 を与 え 例題 ) よ。また,ヒ ス トグラム,度 数多角形,お よび累積度数多角形 を図示せ よ。 階級 度数 120-129 1 130-139 5 140-149 18 150-159 21 160-169 13 170-179 2 60 解 階級 の真の限界 階級値 120-129 119.5-129.5 124.5 1 1 130-139 129.5-139.5 134.5 5 6 140-149 139.5-149.5 144.5 18 24 150-159 149.5-159.5 154.5 21 45 160-169 159.5-169.5 164.5 13 58 170-179 169.5-179.5 174.5 2 60 度数多角形 ヒス トグ ラ ム 120 累積度数 度数 階級 130 140 身 150 160 長 (cm) 170 180 120 130 140 身 150 160 長 (cm) 170 180 例 題 累積度数多角形 人︶ 累 積度 数 ︵ 130 120 140 身 例題 3 150 160 170 180 長 (cm) (茎 葉 図 と度 数分 布 ) (cm)を 測 って,次 の結果 を得 た。 男子学生 70人 の 身長 169 176 169 169 167 170 172 163 182 173 175 163 168 173 171 164 168 162 167 163 177 159 161 167 164 176 164 159 172 169 164 174 165 177 175 157 175 154 169 155 176 183 167 168 159 168 171 162 173 172 170 173 171 166 168 168 171 164 161 165 168 164 156 174 175 168 161 180 181 166 この デ ー タか ら,身 長 の (a)茎 (b)度 (C)平 (d)メ 葉図 , 数 分布 , 均 と標 準偏 差 , ジア ン とモ ー ド を求 め よ。 解 (a)茎 葉図 葉 15 16 17 18 4567 99 9 1112 23 33 4444 0011 11 22 2333 0123 4455 6677 3445 5556 778888888899999 6677 1 8 (b)最 大値 は 183で 級 の幅 を 5cmに データの整理 と表現 最小値 は 154で あるか ら 範 囲 は 183-154=29。 階 とれ ば 7個 の階級 となる , , . , 度数分布 階級 検数 マー ク 階級 の真の限界 階級値 度数 150-154 155-159 1E 154.5-159.5 152 157 160-164 1EIETF 159.5-164.5 162 14 165-169 11EIEIE 164.5-169.5 167 21 170-174 1EIEIE 169。 5-174.5 172 15 175-179 1ETF 174.5-179.5 177 9 TF 179.5-184.5 182 4 180-184 149.5-154。 5 (C)簡 便計算法 によって 1 6 平 均 と標 準偏 差 を求 め る.階 級 の幅 は ε=5,仮 , 平均 を ″。 =167に とり π= χ-167 5 によって,χ を πに変換 す る。 階級値 ″ / 1 π2/ グ 一 一 一 152 度数 πjん π -3 9 -12 24 -14 14 ∬ =χ 。+ε 笏 =167+5× 167 21 0 0 172 15 15 15 177 9 18 36 182 4 12 36 計 70 134 0.229≒ 一 14 ≒0.229 168.1(cm) 一 π 162 =器 π 6 ” 157 (d)メ 笏=Σ 2 十 疑 ぅ _← ≒6。 8(cm) ジアンは公式 より直接求 める π=70,c=5,α J_1=164。 5,几 =1+6 +14=21,ん =21で あるから 笙 ″。 =164.5+5× 亜 テ ≒167.8(cm) モー ドは度数分布表 より,167(cm). 題 例 4 例り題 題 脅 lγ い ときの ぴ等 (階 こス ト し ヽな い こ さ の ヒス 檄 νノl順 が ヽPL 級の幅 寺 しくな グラム フム ノ トク ) ある日,図 書館 で本 を借 りた人の年齢 の分布 は次のようで あった . 年歯 令 8-12 13-20 21-60 61-64 人数 9 22 35 14 (a)こ のデータを ヒス トグ ラムで表 せ。 (b)80人 の年齢 の平均 と標準偏差 を求 め よ . 解 (a)こ こでの変量 は年 齢 で あるか ら階級 の真 の 限界 を定 める ときに注 意が必要 で あ る。た とえば,階 級 8-12は 8歳 ち ょうどか ら 13歳 未満 の人 を含 む (下 表参照 )こ の 問題 は階級 の幅 が 等間隔 で な い か ら,ヒ ス トグ ラム をか くと き,柱 の面積 が各度数 に比例 す るように しな けれ ばな らな い.こ れ は , 柱 の高 さ × 階級 の幅 =柱 の面積 ∝ 階級 の度数 の関係 より , 柱 の高 さ ∝ よって,ま ず与 えられた度数分布 より れを度数密度 とい う) 薪壽議編!E(こ を求め,柱 の高 さをこの値 に比例するようにとればよい。 階級 よって , 階級 の真の限界 階級の幅 度数 度数密度 8-12 8-13 5 9 13-20 13-21 8 22 1.8 2.75 21-60 21-61 40 35 0.875 61-64 61-65 4 14 3.5 1 デー タの整理 と表現 (b)前 の表 よ り , 階級 の真の限界 度数 階級値 ∬ / 5 9 94.5 992.25 13-21 17.0 22 374.0 6358.00 21-61 41.0 35 1435.0 58835。 00 61-65 63.0 14 882.0 55566.00 2785.5 121751.25 8-13 10。 計 よって , 動 ∬=等 標準偏差 ―ソ 諷 Э 例U洒題 ″2/ ガ ≒囲 御 一MF≒ s= 1隔 差 差 ,メ ン 標準 均 ,標 準偏 (平 羽 叶 r<御 //,t Pノ 次 の表 は 1988年 全 国高校 野球選手権大会 で の全 試合 の勝 敗 の 結果 を示 した ものである.こ の表 よ り (a)得 点差 の度数分布 と累積度数分布 を作 れ。 (b)得 点差 の平均 と標準偏差 を求 め よ (C)得 点差 の メジア ン とモー ドを求 め よ。 . 解 3-0 10-1 6-2 2-1 7-4 4-1 5-1 4-1 8-0 9-0 3-2 4-3 6-0 4-3 3-2 7-4 10-1 3-2 6-3 3-2 9-3 4-3 9-3 5-0 4-0 5-4 8-1 7-3 2-1 4-1 4-0 2-1 19-1 2-1 4-3 9-3 5-2 6-4 12-1 4-2 4-2 5-3 1-0 5-1 8-4 7-5 4-2 1-0 得点差 ″ を求 め る と 例 題 3 3 8 6 1 6 4 1 18 3 2 4 7 4 1 11 1 2 939131131222 4 4 1 9 1 6 131315416241 度数 を /,累 積度数 を Fで 表 し,次 のようにデータを分類 して,度 数分布 と累 積度数分布 を作 る。 (a)度 数分布 累積度数分布 検数 マー ク 1 正正正 2 正 3 正丁 4 正T 5 6 T 7 8 15 15 6 21 8 29 7 36 1 37 4 41 1 42 1 43 3 46 ll 1 47 18 1 48 9 F 計 (b)度 数分布表 より ガ 1 15 15 2 6 12 24 3 8 24 72 4 7 28 112 5 1 5 25 6 4 24 144 , 15 7 1 7 49 8 1 8 27 64 243 9 3 11 1 11 121 18 1 18 324 計 よ って ″2/ 1193 =寺 =&7鰊 平 均″ 宇 ) 1 標準偏差 s=/平 ― 曙 データの整理 と表現 )2=&猟 劇 (C)累 積度数分布表 よ り,小 さい方 か ら 24番 目 と 25番 目の値 は ともに 3 だか ら,メ ジア ンは 3(点 ). モー ドは,度 数分布表 か ら 1(点 ). -49Utt1 0 tメ ン /ン ノ 次 の数 の平 均 値 は つか 7で ,モ ー ドは く . 8,10,″ 解 6で あ る。 これ ら数 の メ ジ ア ン は い ,6,y,z,8,21 モー ドが 6で あ る ことか ら,″ ,y,zの うち少 な くとも 2つ は 6で な け れ ばな らな い。3つ とも 6と す る と,平 均値 が 7に な らな いか ら 2つ が 6で あ る。い ま,″ ,ク を 6と す る と平均値 は 7だ か ら 7= =重 ≒1生 ⇒ Z=-9 よって ,こ れ らの数 を大 きさの順 に並 べ る と -9,6,6,6,8,8,10,21 ↑↑ 豊 立 =■ ア冽ま ゆえ にメジ 苦 … ソ頒邑 ′ と四分 差 )ノ ,,17隔 位偏 差 tメ ン /ン こ四 高速道路 の ある地点 で ,走 行 中 の車 400台 の時速 (km/h)を 測 って,次 の度数分布 を得 た。 彗 L 隣 剖叉f● 30 35 40 45 50 55 60 65 3 12 37 61 89 130 58 10 度数 この結果 を (a)ヒ ス トグラム (b)累 積度数多角形 , で表せ .求 めた累積度数多角形 か らメジア ンと四分位偏差 を求 め よ . 題 例 解 13 (a) 度数 ︵ 台︶ 100 40 45 50 55 60 時 速 (km/h) (b) 累積度数分布表 は , 階級値 度数 階級 の真の限界 30 35 40 45 50 55 60 65 3 12 37 61 89 130 58 10 27.5-32.5 3 32.5-37.5 15 37.5-42.5 52 累積度数 42.5-47.5 113 47.5-52.5 202 52.5-57.5 332 57.5-62.5 390 62.5-67.5 400 計 累積度数多角形 400 この図か らメジアンは 52. 01は 46,o3は 56。 よって,四 分位偏差 は o3 01=56-46=10. 1 … 17叩 巳 0 ヽ1ヨ 17r7・ デー タの整理 と表現 フ l Jtt Cと標 T示 の ノ平均 l欄 万フ) 夕υ 準偏差 午 公式 Σ (∬ J一 2 ∬)2=Σ ″J2_π ∬ を証明 せ よ . ある中学校 の 3年 生 は女子生徒 263人 と男子生徒 282人 か らな り,女 子 5cm,標 準 偏 差 4。 Ocmで ,男 子 の 身 長 は 平 均 163.0 cm,標 準偏差 4.4cmで あ る。この学校 の 3年 生全員 の身長 の平均 と標準 の 身長 は平 均 155。 偏差 を求 め よ . 解 公式 の証明 Σ : (∬ J一 ″)2=Σ (χ J2_2″ j∬ +∬ 2) =Σ ∬j2_2∬ Σ ″J+π ″2 =Σ ″j2_22∬ 2+π ″2 =Σ χJ_π (Σ ″J=η∬ よ り) 2 3年 生全員の身長 の平均 は _ 263× ∬= 5+282× 545 155。 163.0=159。 4(cm) 標準偏差 の計算 には上 記 の公式 を使 う。標準偏差 を sと す る と,こ の公式 よ り Σ ″J2=バ F2+s2) 女子生徒 の場合 ,こ の値 は Σ χJ2=263(155。 52+4。 02)=6363613.75 男子生徒 の場合 ,こ の値 は Σ ∬J2=282(163。 02+4.42)=7497917。 52 よって,3年 生全員の身長 の標準偏差 は 一 ∬ 一 ∬ Σ 1 一η Σ χJ_χ 2 =押鴫 響 壁‐m″ =痴 巧m 1章 の問題 1章 の 問題 1.1 次 の各階級 に対 して,階 級 の真 の限界 ,階 級値 ,階 級 の幅 を示せ。 (a) 20-29 (b) 150-, 180- (C) 1.6-3.5 (d) (-8)― (-5) 1.2(a)数 {3,5,4,1,7}の 平均 と標準偏差 を求めよ。この結果 を用 い て,計 算 によらずに次の数の平均 と標準偏差を求めよ . (i)13,15,14,11,17 (ii)-2,0,-1,-4,2 (iii)α +3,α +5,α +4,α +1,α (市 )0◆ 3,0.5,014,0。 (v)3α 1,0。 +7 7 +ら ,5α +b,4α +b,α +b,7α +b (b)次 のデータから,平 均,メ ジアン,モ ードを求めよ.た だ し,α <b<ε <グ <θ 。 α,α ,α ,α ,α ,b,b,b,ι ,b,b,c,c,c,ε ,グ ,グ ,グ ,θ ,θ l.3 次 の 数 は あ る電 話 交 換 局 が 30秒 間 隔 で 延 べ 25分 間 に 受 けた電 話 呼 び 出 し数 の 記録 で あ る . 2352201324 3223113346 2413545236 3525302054 4212436420 この デ ー タか ら呼 び 出 し数 の 度 数 分布 を作 り,度 数 多 角 形 をか け。また ,呼 び 出 し数 の平 均値 ,メ ジア ン,モ ー ドを求 め よ◆ 1.4 以 下 の 数 値 は 100人 の生 徒 の IQの デ ー タで あ る.55-64,65-74,… ・ を階級 に選 び ,こ れ らデ ー タ を分類 して (a)度 数 分布 表 を作 れ 。 (b)IQの 平均 と標 準偏 差 を求 め よ。 (C)IQの メジアンを求めよ . 1 16 デー タの整理 と表現 81 106 81 116 105 107 110 84 78 91 109 98 106 133 108 109 105 102 100 101 120 73 90 99 90 143 97 100 77 102 82 109 90 97 101 116 103 84 104 119 107 102 96 101 88 80 85 124 117 100 86 81 91 91 124 111 108 82 97 99 108 101 58 95 106 106 91 118 107 121 108 79 94 82 93 104 107 128 66 100 101 100 102 94 89 90 108 114 92 111 81 94 72 118 93 103 104 103 100 92 1.5 観浪l値 ∬,5,y,13は 大 きさの順 に並んでいる。これ らの平均値 は 7 で,メ ジアンは 6で ある。分散 を求めよ。 1.6 3つ のか ごに,そ れ ぞれ 6個 ,5個 ,4個 の りん ごが 入 って い る.第 1 のか ごの りん ごの重 さの平均値 は 220gで ,第 2の か ごの りん ごの重 さの平均 値 は 280gで ,第 3の か ごの りん ごの重 さは 247g, 250g, 239g, 264g で ある.第 3の か ごの りん ごは どれ もが第 1の か ごの りん ごよ り重 く,第 2の か ごの りん ごよ り軽 い.そ の とき,こ れ ら 15個 の りん ごの重 さの 平均値 とメ ジア ン とを求 め よ。次 に,こ れ ら 3つ のか ごの重 さを 夕,c,γ とす る 2+α 2+γ 2=20000 夕+α +γ =240, 夕 . の とき,か ごの重 さの標準偏差 を求 め よ . 1.7 2個 のサイ コロ を同時 に 100回 投 げ,出 た 目の和 χ を観測 して次 の度 数分布 を得 た。χ の平均 と標準偏差 を求 め よ . 1.8 あ った 9 10 16 17 8 9 10 11 12 15 11 8 6 2 0 計 0 ″ / 4567 あ る中学校 の遅刻者 100人 の遅刻 時 間 (分 )の 度 数 分布 は次 の よ うで . 遅刻時間 (分 )0-2 度数 40 3-7 8-12 13-17 18-27 37 13 5 5 計 100 1章 の問題 17 (a)こ の分布 の ヒス トグラム をか け。 (b)遅 刻時間の平均 と標準偏差 を求 め よ。 1.9 あ る試験 を受 けた 200人 の生 徒 の 得 点 の 度数 分布 が ,次 の よ う に 与 え られた とき , (a)こ の分布 の平均 と標準偏差 を求 め よ。 (b)累 積度数分布表 を求 め,累 積度数多角形 をか け . 階級 度数 1-20 21-30 4 15 31-40 41-50 51-60 61-70 71-80 43 55 39 31 10 1.10 4個 の観測値 の平均 は 3.13,標 準偏差 は 0。 81-100 3 15で あ る.こ れ に,さ ら に 6個 の観測値 3。 19 2.86 2.93 3。 15 3.14 3。 21 が追加 された。これ ら 10個 の観測値 の平均 と標準偏差 を求 め よ . 1.11 4個 の数 の平均 は 5,分 散 は 2で ,別 な 6個 の数 の平均 は 7,分 散 は 3で ある。これ ら 10個 の数 の平均 と分散 を求 めよ。
© Copyright 2024 ExpyDoc