中間試験:解答例

統計学 - 2016 年度前期
中間試験:解答例
2016 年 6 月 10 日
解答例
※正答は赤字、解説は(もしあれば)青字で印字してあります。
問1 ~ 問8
ある大学の男子学生85人の身長に関するデータを基に次の度数分布表を作成した。
階級の読み方は、階級“160-164”を例にとると「160cm以上164cm未満」を意味する。
また、階級値は各階級の中央値である。この度数分布表の空欄に該当する数値を選
べ。もし正答が見つからない場合は、正答に最も近い数値を選択せよ。なお、空欄
以外の数値の一部も意図的に空白にしてあるので注意せよ。
空白部分を埋めた度数分布表は次のようになる。
階 級
階級値
度 数
相対度数
累積度数
160-164
162
3
0.035
3
164-168
166
14
0.165
17
168-172
170
27
0.318
44
172-176
174
17
0.200
61
176-180
178
9
0.106
70
180-184
182
13
0.153
83
184-188
186
2
0.024
85
問1:a. 169.5 b. 170 c. 170.5 d. 171
階級値は階級の中央値であるから、(168 + 172) ÷2 = 170 である。
問2:a. 181
b. 181.5
c. 182
d. 182.5
問1と同様に考え、(180 + 184) ÷2 = 182 である。
問3:a. 1
b. 2
c. 3
d. 4
階級“164-168”の相対度数が14、一方、階級“164-168”までの累積相対度数が17
であるから、階級“160-164”の相対度数は 17 - 14 = 3 である。
問4:a. 26
b. 27 c. 28
d. 29
問3の結果より、この階級を除く全ての度数の合計が58とわかる。従って、こ
1
の階級の度数は 85 – 58 = 27 である。
問5:a. 0.140 b. 0.170
c. 0.200 d. 0.230
17 ÷85 = 0.2000 である。
問6:a. 0.020 b. 0.024
c. 0.028 d. 0.032
2 ÷85 ≒ 0.0024 である。
問7:a. 60
b. 65
c. 70
d. 75
問3 ~ 問4の結果より、この階級までの累積度数は 3 + 14 + 27 + 17 + 9 = 70 と求
められる。
問8:a. 85
b. 90
c. 95
d. 100
最後の階級までの累積度数はデータ数に等しい。
問 9 ~ 問 12
以下の空欄に該当する数値を選べ。もし正答が見つからない場合は、正答に最も近
い数値を選択せよ。
問1~問8で使用した度数分布表を用いて統計量を計算する。必要に応じて次の表
(先程と同様、数値の一部は意図的に空白にしてある)を利用することにより、身
長の平均およびメディアンはそれぞれ( 問9 )および( 問10 )と求められる。また、
身長の分散は( 問11 )、標準偏差は( 問12 )である。
空白部分を埋めた途中計算は次のようになる。
階級値(A)
相対度数(B)
162
0.035
5.718
-10.918
119.195
4.207
166
0.165
27.341
-6.918
47.854
7.882
170
0.318
54.000
-2.918
8.513
2.704
174
0.200
34.800
1.082
1.171
0.234
178
0.106
18.847
5.082
25.830
2.735
182
0.153
27.835
9.082
82.489
12.616
186
0.024
4.376
13.082
171.148
4.027
平均
172.918
分散
34.405
標準偏差
5.866
問9:a. 170
問10:a. 170
b. 171
b. 171
c. 172
c. 172
偏差(C)
(A×B)
(D = C^2)
(D×B)
d. 173
d. 173
累積度数から、メディアンを計算するために必要となる43番目のデータは階
2
級値170の階級の26番目のデータに対応することがわかる。この階級には27の
データが属することから、
メディアン  168  172  168  26  171.85
27
と求められる。
問11:a. 34 b. 48 c. 62 d. 76
問12:a. 5.9 b. 6.9 c. 7.9 d. 8.9
問13 ~ 問15
以下の空欄に該当する数値を選べ。
ある大学の図書館が2年次学生を対象に一年間に読んだ書籍の冊数を調べた。当初平
均1.5冊、標準偏差0.6冊という結果が報告されたが、その後入力ミスが見つかり、各
学生が実際に読んだ書籍の冊数は機械入力された値の10倍であることが判明した
(即ち、入力値が「1冊」の場合、実際には「10冊」読んでいたことを意味する)。
この場合、正しい冊数に基づく平均、分散および標準偏差はそれぞれ( 問13 )、
( 問14 )および( 問15 )である。
問13:a. 1.5 b. 10 c. 15
問14:a. 0.36 b. 0.6 c. 36
問15:a. 0.6 b. 1.5 c. 6
d. 150
d. 144
d. 12
元(=入力ミスを修正する前)のデータを 10 倍して新しい(=正しい)デー
タを作ると、平均値および標準偏差はそれぞれ元の数値の 10 倍になる。分散
は正しい標準偏差を2乗して得られる。
問16 ~ 問18
ある大学の統計学の講義では中間試験と期末試験を実施している。履修登録してい
る学生全員がそれぞれの試験を受験し、各学生の期末試験の得点は中間試験の得点
にちょうど20点を加えたものであった。中間試験および期末試験の得点をそれぞれX
およびYと表記するとき、それぞれの説明が正しければ a 、誤っていれば b を選べ。
問16:XとYの平均は等しい。b
問17:Xの標準偏差はYの標準偏差よりちょうど20点少ない。b
問18:与えられている情報だけではXとYの相関係数を計算することはできない。b
Y = X + 20 の関係が成り立つため、Y の平均は X の平均に 20 を加えた値とな
る。しかし、X と Y のデータの散らばり具合は変わらないため、これらの分
散および標準偏差は同一である。さらに、全データが正の傾きを持つ直線(Y
= X + 20)上にあるため、相関係数は 1 である。
3
問19 ~ 問21
問16~問18で対象とした学生全員に対し、期末試験対策で学習した時間を追跡調査
した。学習時間は当初分単位で報告されていた(以後「換算前」という)が、デー
タ処理の際これを時間単位に換算した(以後「換算後」という)とする。このとき、
それぞれの説明が正しければ a 、誤っていれば b を選べ。
問4:換算後の学習時間の分散は換算前のものの1/60倍になる。b
問5:換算後の学習時間と期末試験の得点との共分散は換算前のものの1/60倍になる。
a
問6:換算後の学習時間と期末試験の得点との相関係数は換算前のものの1/60倍にな
る。b
分単位の学習時間を時間単位に換算するには1/60倍すればよい。この場合、換
算後の学習時間の標準偏差は換算前の1/60倍となるが、分散は換算前の1/360
倍である。また、換算後の学習時間に関する偏差が換算前の1/60倍となること
に着目すると、換算後の共分散は換算前の1/60倍となることがわかる。さらに、
換算後の相関係数については、換算後の分子と分母がそれぞれ換算前の1/60倍
となるため、結果として換算前の相関係数と同一となる。
問22 ~ 問25
データ数が14の2つのデータA, Bについて、それぞれの説明が正しければ a 、誤って
いれば b を選べ。
A: 12, 14, 17, 23, 25, 34, 38, 39, 42, 52, 56, 58, 59, 64
B: 27, 29, 32, 38, 40, 49, 53, 54, 57, 67, 71, 73, 74, 79
問22:AとBの平均は等しい。b
問23:AとBのメディアンは等しい。b
問24:AとBの標準偏差は等しい。a
問25: AとBの相関係数は1より小さい。b
A の数値に 15 を加えると B の数値が得られることがわかる。従って、B の平
均値およびメディアンはそれぞれ A から計算される数値に 15 を加えたものと
なる。しかし、データの散らばり具合に変化はないため、A と B の分散およ
び標準偏差は同一である。また、B = A + 15 の関係が成り立つため、問 18 と
同様に A と B の相関係数は 1 である。
問26 ~ 問30
ロックバンドNumber Crunchingのライブは一回当たり所要時間の平均が200分、標準
偏差が20分の正規分布に従うことが知られている。このとき、以下の空欄に該当す
る数値を選べ。もし正答が見つからない場合は、正答に最も近い数値を選択せよ。
また、必要に応じて正規分布表を利用せよ。
4
(1) Number Crunchingの一回のライブに要する時間が180分から200分の間になる確率
は( 問26 )である。また、一回のライブに要する時間が( 問27 )分を超える
確率は0.1である。
(2) Number Crunchingのライブの観客の中に、こっそりテープ1本を持ち込んでライ
ブを録音しようと計画している不届き者が含まれているとする。このテープが最
大235分まで録音可能である場合、ライブ全体の録音ができない確率は( 問
28 )である。なお、録音はライブ冒頭から開始し、テープの交換・録音機器の
故障等は発生しないものとする。
(3) あなたは今学期の始まる前にNumber Crunchingのライブ入場券の抽選に当たった
が、ライブの翌日に運悪く統計学の中間試験が予定されてしまったとする。ライ
ブは午後7時に始まり、ライブ会場からあなたの自宅まで徒歩でちょうど30分を
要するものと仮定すると、あなたが試験勉強を開始できる時刻の95%予言的中区
間は( 問29 )から( 問30 )の間になる。
ライブの所要時間を X 、また標準化後の所要時間を Z と表記する。
問26:a. 15.9% b. 34.1% c. 50.0%
d. 65.9%
180  X  200 となる確率は、不等式の各辺を標準化した結果得られる
180  200
X  200
200  200


 1  Z  0
20
20
20
である確率に等しい。 Z は標準正規分布に従うことから、正規分布表を用い
てこの確率を求めると、以下のようになる。
Pr  1  Z  0   Pr 0  Z  1
 Pr Z  0   Pr Z  1
 0.5  0.15866
 0.34134  34.1%.
問27:a. 167.1分 b. 174.4分 c. 225.6分
d. 232.9分
X  x となる確率が10%となるように未知数 x を定めればよい。不等式の両
辺を標準化すると
X  200
x  200
x  200

 Z 
20
20
20
であり、従って
x  200 

Pr  Z 
  0 . 10
20 

を満たすxを求めればよい。Zは標準正規分布に従い、正規分布表から、
Pr Z  1 . 28   0 . 10
であるから、
5
x  200
 1 . 28
20
6
を得る。
をxについて解き、 x  225 .(分)
問28:a. 1%
b. 2% c. 3% d. 4%
1本のテープでライブ全体を録音できないのは X  235 となる場合である。
この確率は、不等式の両辺を標準化した結果得られる
X  200
235  200

 Z  1 . 75
20
20
である確率に等しい。 Z は標準正規分布に従うことから、正規分布表を用い
てこの確率を求めると、0.040059、即ち約4%であることがわかる。
問29:a. 午後9時41分 b. 午後9時56分 c. 午後10時11分
問30:a. 午後10時59分 b. 午後11時29分
d. 午後10時26分
c. 午後11時59分
d. 翌日の午前0時29分
まずライブの所要時間に関する「95%予言的中区間」は
200  1 . 96  20 ~ 200  1 . 96  20  160 . 8 ~ 239 . 2
である(細かく計算すると、160.8分 = 2時間40分48秒、また、239.2分 = 3時間
59分12秒となる)。ライブは午後7時開始であり、徒歩30分を考慮すると、開
始時刻に関する「95%予言的中区間」は
7 : 00 : 00  2 : 40 : 48  0 : 30 : 00  10 : 10 : 48
から
7 : 00 : 00  3 : 59 : 12  0 : 30 : 00  11 : 29 : 12
の間である。従って、余程のことがない限り、午後10時11分少し前から午後
11時29分過ぎの間に試験勉強を開始できると考えてよい。
得点の分布
受験者数:253
平均:20.81
標準偏差:3.53
メディアン:21.00
6