1章 データの整理と表現

■︱
デ ー タの整理 と表現
1-1
デ ー タ の整 理
身長や交通事故 の件数 な どの よ うに,あ る集 団 にお
連続変量 と離散変量
い て観測 の対象 とな る特性 を数量 で表 した もの を変量 とい う。変量 には,身 長
や体重 の ように連 続 的 な値 を とる連続変量 と,交 通事故 の件数 や家族 の人 数 の
ように とび とびの値 しか とらな い離散変量 とが ある。
度数分布表
連続変量 のデー タを整理 す る ときには,デ ー タ をで きるだ け
同 じ幅 の 区間 に 区切 って分類 す る.こ の とき,各 区間 を階級 とい い,そ の 中央
の値 を階級値 とい う。また ,各 階級 に分類 され た デー タの個 数 を度 数 とい う。
階級 の幅 はデー タ全 体 の傾 向 が 読 み とれ るよ うに,適 当な大 きさに選 ぶ .階 級
または階級値 に度数 を対応 させた もの を度数分布 といい,分 類 の結果 で き上 っ
た表 を度数分布表 とい う。
離散変量 のデ ー タの分類 は,そ の変量 が とる値 の個数 を数 えるだ けで よいか
ら簡単 で あるが ,変 量 の とる値 が 多 い ときは,連 続変量 の場合 の ように い くつ
かの階級 を作 って分類 す る。
累積度数分布表
各階級 の度数 の累計 を累積度数 といい,そ れ らを表 に ま
とめた もの を累積度 数分布表 とい う。
相対度数分布表
各階級 の度数 をデ ー タの総数 で割 った値 を相対度数 とい
い,こ れ を表 に した もの を相対度数分布表 とい う
.
1
デー タの整理 と表現
度数分布表 ,相 対度数分布表 ,累 積度数分布表
階級値
階級
α2
αた_1
αぇ
ス ん ⋮ ん
αl
∬ ∬ ... ″
αO∼ αl
累積度数
相対度数
度数
/1/π
Fl=/1
/2/η
F2=/1+/2
三
ん/π
鳥 =/1+・ …+ん =η
計
1-2
グ ラフ に よる表現
ヒス トグラム
度数分布表 を柱状グラフに表 した もので ,各 階級 の上 に立
てる長方形 の面積は階級の度数 に比例 させ る。
ヒス トグラムの各長方形 の上辺の
度数多角形
中点 を結んで得 られる折れ 線 グラフ
.
累積度数多角形
累積度数分布表 をグラフに表
した もので,階 級 の上方限界値 と累積度数 を座標 に
もつ点 を結んで得 られる
.
ヒス トグラム
窒葉図
度数 多角形
た と え ば,10個 の デー タ (1.67,1.82,1。 75,1.63,1.72,1。 79,
茎 "に 当た る
1.84,1.60,1.73,1。 75)が 与 え られた とき,各 デ ータ を次 の ように“
(1。
6,1.7,1。 8)と “
葉 "に 当た る 3桁 目の数 に分解 し,茎 を縦 に葉 を横 に記録 す
る ことでデータを表現 した もの を茎葉図 (ま た は幹葉図)と い う
.
茎葉図
1-3 代表値 と散布度
1…
3
代 表 値 と散 布 度
(a)生 のデ ー タか らの場合 。
π個 のデー タを ″1,χ 2,・ …,″ ηとす る。
(b)度 数分布表 か らの場合 。
η個 のデ ー タが 力個 の階級 に分類 され て い る として,階 級値 を ″1,
°
″た 数 を /1,/2,… °
,ん ,累 積度数 を Fl,F2,… ,凡 とす る。
∬2, °…
,度
1-3-1
代 表 値
デー タ全体 の 中心的傾 向 を表 す値 で,平 均値 ,メ ジア ン,モ ー ドな どが ある。
平均
(ま
た は平均値 )
∬
=場 を∬
∬
=場 羞∬
(a)
J
(b)
J勇
平均 の簡便計算法
=∬
J ″ o(′
=1,2,…
階級 の幅 を ε,仮 平均 を ″。とす る。ここで,変 換 π
J
0,力
)に よって,χ を πに換 えれば
Σ %Jん
∬ =χ 。+σ 笏=″ 。+ε
メジ ア ン
(a)π
ら
個 の デ ー タ を大 きさの順 に並 べ た とき,π が 奇 数 な らば小 さ い 方 か
午
番 目 の 値 を,多 が 偶 数 か らば ,中 央 に くる 2つ の 値 の平 均 を メ
ジアンまたは中央値 とい う
.
(b)こ の場合,メ
ジアン″。は次式 より求 められる。
いH托午
ここで ,α J_1は メジア ンを含 む階級 の下方限界値
ん はメジア ンを含 む階級 の度数
,
,
几 はメジア ンを含 む階級 よ り前 のすべ ての 階級 の度数 の和
すなわち 几
cは 階級 の幅
,
=/1+/2+… ・十ん_1,
.
モー ド
(a)デ ータの 中 で最 も多 く現 れて い る値 をモー ドまた は最頻値 とい う。
(b)最 大 の度数 を もつ階級 の 階級値
.
1
1-3-2
データの整理 と表現
散 布 度
デ ー タの散 らば りを表 す特性値 で,標 準偏差 ,分 散 ,範 囲な どが ある。
簡
> > の
a b 散
< < 分
η
η
ΣH
たΣH
たΣH
ΣH
法
︲し ︲巧 ︲一 講
.し
し
・
・
・
・
.
2
2
便
S
S
分散
(∬
J_∬ )2
2_∬ 2
∬′
(∬
J_∬ )2勇
χJ2勇 _∬ 2
l 一π
た
﹁
ろH
ε
〓
笏_→
2ん
ただ し
,
πJ=″
標 準偏 差
J χ°
ε
笏=券 Σ %J勇
分散 の正 の平方根 を標 準偏差 とい う
.
(a) s=7年 2=
(b) s=7毎 2=
(χ
J_∬ )2勇
標準偏差 の簡便計算法
,Σ
を四分位偏差という。
(注 :レ ]は 実数″の整数部分
)
例
題
例
pり B
日
ヽ醒 臥 万
題
ン夕υ
の
ノ反
度数分布
製ガ 仰 ノ
)
次 の 数 は あ る 町 で の 30日 間 の 救 急 車 の 出 動 回 数 の 記 録 で あ る。この
デー タ か ら 度 数 分 布 表 と 累 積 度 数 分 布 表 を 作 れ 。ま た ,(a)平 均 値
(b)メ ジア ン,(c)モ ー ドを求 め よ
,
.
2611203023
3042110340
5145105020
解
デ ー タの分類 の結果
,
∬ 検数マーク
正丁
8
正
14
正
19
T
23
丁
26
29
丁
30
計
したが つて,度 数分布表 と累積度数分布表 は
∬/
計
0
8
6
14
10
19
12
23
12
26
15
29
6
30
30
(a)平 均
2(回 ).
値は
,∬ =器 ≒
(b)累 積度数分布表 よ り小 さい方 か ら 15番 目 と 16番 目の値 は ともに 2で
1
6
デー タの整理 と表現
あるか ら,メ ジア ンは 2(回 )。
(C)最 大度数 は 8だ か ら,モ ー ドは 0.
2 (ヒ ス トグラム・度数多角形 ・累積度数多角形
次 の度数分布 において,階 級 の真の限界 ,階 級値 および相対度数 を与 え
例題
)
よ。また,ヒ ス トグラム,度 数多角形,お よび累積度数多角形 を図示せ よ。
階級
度数
120-129
1
130-139
5
140-149
18
150-159
21
160-169
13
170-179
2
60
解
階級 の真の限界
階級値
120-129
119.5-129.5
124.5
1
1
130-139
129.5-139.5
134.5
5
6
140-149
139.5-149.5
144.5
18
24
150-159
149.5-159.5
154.5
21
45
160-169
159.5-169.5
164.5
13
58
170-179
169.5-179.5
174.5
2
60
度数多角形
ヒス トグ ラ ム
120
累積度数
度数
階級
130
140
身
150
160
長 (cm)
170
180
120
130
140
身
150
160
長 (cm)
170
180
例
題
累積度数多角形
人︶
累 積度 数 ︵
130
120
140
身
例題
3
150
160
170
180
長 (cm)
(茎 葉 図 と度 数分 布 )
(cm)を 測 って,次 の結果 を得 た。
男子学生 70人 の 身長
169
176
169
169
167
170
172
163
182
173
175
163
168
173
171
164
168
162
167
163
177
159
161
167
164
176
164
159
172
169
164
174
165
177
175
157
175
154
169
155
176
183
167
168
159
168
171
162
173
172
170
173
171
166
168
168
171
164
161
165
168
164
156
174
175
168
161
180
181
166
この デ ー タか ら,身 長 の
(a)茎
(b)度
(C)平
(d)メ
葉図
,
数 分布
,
均 と標 準偏 差
,
ジア ン とモ ー ド
を求 め よ。
解
(a)茎
葉図
葉
15
16
17
18
4567 99 9
1112 23 33 4444
0011 11 22 2333
0123
4455 6677
3445 5556
778888888899999
6677
1
8
(b)最 大値 は 183で
級 の幅 を 5cmに
データの整理 と表現
最小値 は 154で あるか ら 範 囲 は 183-154=29。 階
とれ ば 7個 の階級 となる
,
,
.
,
度数分布
階級
検数 マー ク 階級 の真の限界
階級値 度数
150-154
155-159
1E
154.5-159.5
152
157
160-164
1EIETF
159.5-164.5
162
14
165-169
11EIEIE
164.5-169.5
167
21
170-174
1EIEIE
169。
5-174.5
172
15
175-179
1ETF
174.5-179.5
177
9
TF
179.5-184.5
182
4
180-184
149.5-154。 5
(C)簡 便計算法 によって
1
6
平 均 と標 準偏 差 を求 め る.階 級 の幅 は ε=5,仮
,
平均 を ″。
=167に とり
π=
χ-167
5
によって,χ を πに変換 す る。
階級値
″
/
1
π2/
グ
一 一 一
152
度数
πjん
π
-3
9
-12
24
-14
14
∬ =χ 。+ε 笏
=167+5×
167
21
0
0
172
15
15
15
177
9
18
36
182
4
12
36
計
70
134
0.229≒
一
14
≒0.229
168.1(cm)
一
π
162
=器
π
6
”
157
(d)メ
笏=Σ
2
十 疑
ぅ
_←
≒6。 8(cm)
ジアンは公式 より直接求 める π=70,c=5,α J_1=164。 5,几 =1+6
+14=21,ん =21で あるから
笙
″。
=164.5+5× 亜
テ ≒167.8(cm)
モー ドは度数分布表 より,167(cm).
題
例
4
例り題
題 脅
lγ
い ときの
ぴ等
(階
こス ト
し ヽな い
こ さ の ヒス
檄 νノl順 が
ヽPL 級の幅
寺 しくな
グラム
フム ノ
トク
)
ある日,図 書館 で本 を借 りた人の年齢 の分布 は次のようで あった
.
年歯
令 8-12 13-20 21-60 61-64
人数
9
22
35
14
(a)こ のデータを ヒス トグ ラムで表 せ。
(b)80人 の年齢 の平均 と標準偏差 を求 め よ
.
解
(a)こ
こでの変量 は年 齢 で あるか ら階級 の真 の 限界 を定 める ときに注
意が必要 で あ る。た とえば,階 級 8-12は 8歳 ち ょうどか ら 13歳 未満 の人 を含
む (下 表参照 )こ の 問題 は階級 の幅 が 等間隔 で な い か ら,ヒ ス トグ ラム をか くと
き,柱 の面積 が各度数 に比例 す るように しな けれ ばな らな い.こ れ は
,
柱 の高 さ × 階級 の幅
=柱 の面積 ∝ 階級 の度数
の関係 より
,
柱 の高 さ ∝
よって,ま ず与 えられた度数分布 より
れを度数密度 とい う)
薪壽議編!E(こ
を求め,柱 の高 さをこの値 に比例するようにとればよい。
階級
よって
,
階級 の真の限界
階級の幅
度数
度数密度
8-12
8-13
5
9
13-20
13-21
8
22
1.8
2.75
21-60
21-61
40
35
0.875
61-64
61-65
4
14
3.5
1
デー タの整理 と表現
(b)前 の表 よ り
,
階級 の真の限界
度数
階級値
∬
/
5
9
94.5
992.25
13-21
17.0
22
374.0
6358.00
21-61
41.0
35
1435.0
58835。 00
61-65
63.0
14
882.0
55566.00
2785.5
121751.25
8-13
10。
計
よって
,
動
∬=等
標準偏差
―ソ
諷 Э
例U洒題
″2/
ガ
≒囲
御
一MF≒
s=
1隔 差
差 ,メ ン
標準
均 ,標
準偏
(平 羽
叶
r<御
//,t Pノ
次 の表 は 1988年 全 国高校 野球選手権大会 で の全 試合 の勝 敗 の 結果 を示
した ものである.こ の表 よ り
(a)得 点差 の度数分布 と累積度数分布 を作 れ。
(b)得 点差 の平均 と標準偏差 を求 め よ
(C)得 点差 の メジア ン とモー ドを求 め よ。
.
解
3-0
10-1
6-2
2-1
7-4
4-1
5-1
4-1
8-0
9-0
3-2
4-3
6-0
4-3
3-2
7-4
10-1
3-2
6-3
3-2
9-3
4-3
9-3
5-0
4-0
5-4
8-1
7-3
2-1
4-1
4-0
2-1
19-1
2-1
4-3
9-3
5-2
6-4
12-1
4-2
4-2
5-3
1-0
5-1
8-4
7-5
4-2
1-0
得点差 ″ を求 め る と
例
題
3
3
8
6
1
6
4
1 18
3
2
4
7
4
1 11
1
2
939131131222
4
4
1
9
1
6
131315416241
度数 を /,累 積度数 を Fで 表 し,次 のようにデータを分類 して,度 数分布 と累
積度数分布 を作 る。
(a)度
数分布
累積度数分布
検数 マー ク
1 正正正
2 正
3 正丁
4 正T
5
6 T
7
8
15
15
6
21
8
29
7
36
1
37
4
41
1
42
1
43
3
46
ll
1
47
18
1
48
9
F
計
(b)度 数分布表 より
ガ
1
15
15
2
6
12
24
3
8
24
72
4
7
28
112
5
1
5
25
6
4
24
144
,
15
7
1
7
49
8
1
8
27
64
243
9
3
11
1
11
121
18
1
18
324
計
よ って
″2/
1193
=寺 =&7鰊
平
均″
宇
)
1
標準偏差
s=/平
―
曙
データの整理 と表現
)2=&猟 劇
(C)累 積度数分布表 よ り,小 さい方 か ら 24番 目 と 25番 目の値 は ともに 3
だか ら,メ ジア ンは 3(点 ).
モー ドは,度 数分布表 か ら 1(点 ).
-49Utt1 0 tメ ン /ン ノ
次 の数 の平 均 値 は
つか
7で ,モ ー
ドは
く
.
8,10,″
解
6で あ る。 これ ら数 の メ ジ ア ン は い
,6,y,z,8,21
モー ドが 6で あ る ことか ら,″ ,y,zの うち少 な くとも 2つ は 6で な け
れ ばな らな い。3つ とも 6と す る と,平 均値 が 7に な らな いか ら 2つ が 6で あ
る。い ま,″ ,ク を 6と す る と平均値 は 7だ か ら
7=
=重
≒1生
⇒
Z=-9
よって ,こ れ らの数 を大 きさの順 に並 べ る と
-9,6,6,6,8,8,10,21
↑↑
豊
立
=■
ア冽ま
ゆえ
にメジ
苦
… ソ頒邑 ′
と四分
差 )ノ
,,17隔
位偏 差
tメ ン /ン こ四
高速道路 の ある地点 で ,走 行 中 の車 400台 の時速 (km/h)を 測 って,次
の度数分布 を得 た。
彗
L
隣
剖叉f●
30
35
40
45
50
55
60
65
3 12 37 61 89 130 58 10
度数
この結果 を
(a)ヒ ス トグラム
(b)累 積度数多角形
,
で表せ .求 めた累積度数多角形 か らメジア ンと四分位偏差 を求 め よ
.
題
例
解
13
(a)
度数 ︵
台︶
100
40
45
50
55
60
時 速 (km/h)
(b)
累積度数分布表 は
,
階級値
度数
階級 の真の限界
30
35
40
45
50
55
60
65
3
12
37
61
89
130
58
10
27.5-32.5
3
32.5-37.5
15
37.5-42.5
52
累積度数
42.5-47.5
113
47.5-52.5
202
52.5-57.5
332
57.5-62.5
390
62.5-67.5
400
計
累積度数多角形
400
この図か らメジアンは 52.
01は 46,o3は
56。
よって,四 分位偏差 は o3
01=56-46=10.
1
… 17叩 巳
0
ヽ1ヨ 17r7・
デー タの整理 と表現
フ
l Jtt Cと標
T示
の
ノ平均
l欄 万フ)
夕υ
準偏差
午
公式
Σ
(∬
J一
2
∬)2=Σ ″J2_π ∬
を証明 せ よ
.
ある中学校 の 3年 生 は女子生徒 263人 と男子生徒 282人 か らな り,女 子
5cm,標 準 偏 差 4。 Ocmで ,男 子 の 身 長 は 平 均 163.0
cm,標 準偏差 4.4cmで あ る。この学校 の 3年 生全員 の身長 の平均 と標準
の 身長 は平 均
155。
偏差 を求 め よ
.
解
公式 の証明
Σ
:
(∬ J一
″)2=Σ
(χ J2_2″ j∬
+∬ 2)
=Σ ∬j2_2∬ Σ ″J+π ″2
=Σ ″j2_22∬ 2+π ″2
=Σ χJ_π
(Σ
″J=η∬ よ り)
2
3年 生全員の身長 の平均 は
_ 263×
∬=
5+282×
545
155。
163.0=159。
4(cm)
標準偏差 の計算 には上 記 の公式 を使 う。標準偏差 を sと す る と,こ の公式 よ り
Σ ″J2=バ F2+s2)
女子生徒 の場合 ,こ の値 は
Σ χJ2=263(155。 52+4。 02)=6363613.75
男子生徒 の場合 ,こ の値 は
Σ ∬J2=282(163。 02+4.42)=7497917。 52
よって,3年 生全員の身長 の標準偏差 は
一
∬
一
∬
Σ
1 一η
Σ χJ_χ 2
=押鴫 響 壁‐m″ =痴 巧m
1章 の問題
1章 の 問題
1.1
次 の各階級 に対 して,階 級 の真 の限界 ,階 級値 ,階 級 の幅 を示せ。
(a) 20-29
(b) 150-, 180-
(C) 1.6-3.5
(d) (-8)― (-5)
1.2(a)数
{3,5,4,1,7}の 平均 と標準偏差 を求めよ。この結果 を用 い
て,計 算 によらずに次の数の平均 と標準偏差を求めよ
.
(i)13,15,14,11,17
(ii)-2,0,-1,-4,2
(iii)α +3,α +5,α +4,α +1,α
(市 )0◆ 3,0.5,014,0。
(v)3α
1,0。
+7
7
+ら ,5α +b,4α +b,α +b,7α +b
(b)次 のデータから,平 均,メ ジアン,モ ードを求めよ.た だ し,α <b<ε
<グ <θ 。
α,α ,α ,α ,α ,b,b,b,ι ,b,b,c,c,c,ε ,グ ,グ ,グ ,θ ,θ
l.3
次 の 数 は あ る電 話 交 換 局 が 30秒 間 隔 で 延 べ 25分 間 に 受 けた電 話 呼
び 出 し数 の 記録 で あ る
.
2352201324
3223113346
2413545236
3525302054
4212436420
この デ ー タか ら呼 び 出 し数 の 度 数 分布 を作 り,度 数 多 角 形 をか け。また ,呼 び
出 し数 の平 均値 ,メ ジア ン,モ ー ドを求 め よ◆
1.4
以 下 の 数 値 は 100人 の生 徒 の
IQの デ ー タで あ る.55-64,65-74,… ・
を階級 に選 び ,こ れ らデ ー タ を分類 して
(a)度 数 分布 表 を作 れ 。
(b)IQの 平均 と標 準偏 差 を求 め よ。
(C)IQの メジアンを求めよ
.
1
16
デー タの整理 と表現
81
106
81
116
105
107
110
84
78
91
109
98
106
133
108
109
105
102
100
101
120
73
90
99
90
143
97
100
77
102
82
109
90
97
101
116
103
84
104
119
107
102
96
101
88
80
85
124
117
100
86
81
91
91
124
111
108
82
97
99
108
101
58
95
106
106
91
118
107
121
108
79
94
82
93
104
107
128
66
100
101
100
102
94
89
90
108
114
92
111
81
94
72
118
93
103
104
103
100
92
1.5
観浪l値 ∬,5,y,13は 大 きさの順 に並んでいる。これ らの平均値 は 7
で,メ ジアンは 6で ある。分散 を求めよ。
1.6 3つ のか ごに,そ れ ぞれ 6個 ,5個 ,4個 の りん ごが 入 って い る.第
1
のか ごの りん ごの重 さの平均値 は 220gで ,第 2の か ごの りん ごの重 さの平均
値 は 280gで ,第 3の か ごの りん ごの重 さは
247g,
250g,
239g,
264g
で ある.第 3の か ごの りん ごは どれ もが第 1の か ごの りん ごよ り重 く,第 2の
か ごの りん ごよ り軽 い.そ の とき,こ れ ら 15個 の りん ごの重 さの 平均値 とメ
ジア ン とを求 め よ。次 に,こ れ ら 3つ のか ごの重 さを 夕,c,γ とす る
2+α 2+γ 2=20000
夕+α +γ =240, 夕
.
の とき,か ごの重 さの標準偏差 を求 め よ
.
1.7 2個 のサイ コロ を同時 に 100回 投 げ,出 た 目の和 χ を観測 して次 の度
数分布 を得 た。χ の平均 と標準偏差 を求 め よ
.
1.8
あ った
9
10
16
17
8
9
10
11
12
15
11
8
6
2
0
計 0
″ /
4567
あ る中学校 の遅刻者 100人 の遅刻 時 間 (分 )の 度 数 分布 は次 の よ うで
.
遅刻時間 (分 )0-2
度数
40
3-7 8-12 13-17 18-27
37
13
5
5
計
100
1章 の問題
17
(a)こ の分布 の ヒス トグラム をか け。
(b)遅 刻時間の平均 と標準偏差 を求 め よ。
1.9
あ る試験 を受 けた 200人 の生 徒 の 得 点 の 度数 分布 が ,次 の よ う に 与
え られた とき
,
(a)こ の分布 の平均 と標準偏差 を求 め よ。
(b)累 積度数分布表 を求 め,累 積度数多角形 をか け
.
階級
度数
1-20 21-30
4
15
31-40
41-50
51-60
61-70
71-80
43
55
39
31
10
1.10 4個 の観測値 の平均 は 3.13,標 準偏差 は
0。
81-100
3
15で あ る.こ れ に,さ ら
に 6個 の観測値
3。
19
2.86
2.93
3。 15
3.14
3。 21
が追加 された。これ ら 10個 の観測値 の平均 と標準偏差 を求 め よ
.
1.11 4個 の数 の平均 は 5,分 散 は 2で ,別 な 6個 の数 の平均 は 7,分 散 は
3で ある。これ ら 10個 の数 の平均 と分散 を求 めよ。