15 区間推定と仮説検定の問題演習 解答例

統計学 第 15 回
Revised at 11:22, February 15, 2015
15
http://my.reset.jp/˜gok/math/statistics/
1
区間推定と仮説検定の問題演習 解答例
基本演習 15.5 ある動物用の新しい飼料を試作し、任意抽出された100匹にこの
基本演習 15.1 3.0426.
飼料を毎日与えて1週間後に体重の変化を調べました。増加量の平均は 2.57kg、標
基本演習 15.2 [168.4, 172.7].
準偏差は 0.35kg でした。この増加量について母平均を信頼度98%で区間推定し
基本演習 15.3 [14.72, 15.88].
て下さい。
基本演習 15.4 全国一斉にある教科のテストが行われました。受験生から100名
母平均を m とします。大きさ 100 の大きなサンプルを取っているので母分散は標本
を抽出し、その得点の平均と標準偏差を求めたところそれぞれ 58.3 点、12.4 点で
分散で代用出来、従って中心極限定理によればこの母集団からとった大きさ
100 の標本
≥
¥
0.352
平均 X̄ は正規分布 N m, 100 で近似されます。
した。全受験生の平均得点の95%信頼区間を求めて下さい。
そこでまず
母分布: unknown
母平均: unknown
母分散: unknown
サンプルサイズ: 100(large)
サンプル平均: 58.3
本分散で代用出来ます。また母平均を m とすれ
ば中心極限定理により、この母集団からとった大
≥
¥
2
きさ 100 の標本平均 X̄ は正規分布 N m, 12.4
100
で近似されます。
サンプル分散: 12.42
P [|X̄ − m| ≤ d] = 0.98
大きなサンプルを取っているので母分散は標
となる様な d > 0 を求めます。少し変形すれば
Ø
Ø



Ø
Ø
Ø X̄ − m Ø
d
d
Ø≤ q
 ∼ P |N (0, 1)| ≤ q

0.98 = P ØØ q
Ø
0.352
0.352
Ø 0.352 Ø
100
100
100
となりますが、標準正規分布表に依れば、
そこでまず
P [|X̄ − m| ≤ d] = 0.95
となる様な d > 0 を求めます。少し変形すれば
Ø
Ø





Ø
Ø
Ø X̄ − m Ø
d
d
d
Ø≤ q
 ∼ P |N (0, 1)| ≤ q
 = 2P 0 ≤ N (0, 1) ≤ q

0.95 = P ØØ q
Ø
12.42
12.42
12.42
Ø 12.42 Ø
100
100
100
100


d 
0.475 = P 0 ≤ N (0, 1) ≤ q
P [|N (0, 1)| ≤ 2.33] ∼ 0.98
ですから、
q
12.42
∼ 1.96,
d=
1.96 × 12.4
∼ 2.43
10
100
= 2.33,
d=
2.33 × 0.35
= 0.08155
10
100
P [|X̄ − m| ≤ 0.08155] ∼ 0.98
となりますが、標準正規分布表に依れば、
d
0.352
であれば良い事が分かります。従って
12.42
100
q
d
が分かりました。
従って今回の標本平均の具体値は信頼度 98 パーセントで不等式
であれば良い事が分かります。従って
P [|X̄ − m| ≤ 2.43] ∼ 0.95
が分かりました。従って今回の標本平均の具体値は信頼度 95 パーセントで不等式
|58.3 − m| ≤ 2.43
すなわち
58.3 − 2.43 ≤ m ≤ 58.3 + 2.43
を満たしていますので、求める信頼区間は [55.87, 60.73] になります。
|2.57 − m| ≤ 0.08155 すなわち
2.57 − 0.08155 ≤ m ≤ 2.57 + 0.08155
を満たしています。
従って元データの平均値 m の、信頼度98%の信頼区間は [2.49, 2.65] になります。
統計学 第 15 回
Revised at 11:22, February 15, 2015
http://my.reset.jp/˜gok/math/statistics/
基本演習 15.6 ある母集団から2万個のサンプルを取って調査したところ、サンプ
基本演習 15.7 ある工場で生産しているケース入洗剤の内容量は、従来の測定に
ルの平均は 157.9、サンプルの不偏分散は 5.352 でした。母平均の 95 %信頼区間を
よって母分散が (3.5g)2 の正規分布に従う事が知られています。
2
求めて下さい。
ある単位生産時間の製品の中から25個を無作為に抽出して測定したところ、平
均値が 202.8g でした。内容量の母平均 m に対して信頼度95%の信頼区間を求め
まず状況を整理すると以下の通りです:
て下さい。
分布: 不明
【母集団】
サイズ: 20000
【サンプル】
平均: 不明
平均: 157.9
不偏分散: 5.352
分散: 不明
母平均は不明ですが、計算の都合上仮に m としておきます。また、大きさ 20000 の
≥
¥
2
この母集団からとった大きさ25の標本平均 X̄ は正規分布 N m, 3.5
に従います。
25
まず
0.95 = P [|X̄ − m| ≤ d]
となる正数 d を求めます。
大きなサンプルを取っているので母分散はサンプル不偏分散で代用出来ます。
Ø
∑Ø µ
∂
∏
Ø
Ø
3.52
Ø
Ø
0.95 = P ØN m,
− mØ ≤ d
25
∑
∏
d
= P |N (0, 1)| ≤ 3.5
従って中心極限定理によれば、この母集団から取った大きさ
20000 の標本平均 X̄ は
≥
¥
5.352
正規分布 N m, 20000 で近似されます。そこでまず
P [|X̄ − m| ≤ d] = 0.95
5
∑
∏
d
= 2P 0 ≤ N (0, 1) ≤
0.7
∑
∏
d
0.475 = P 0 ≤ N (0, 1) ≤
0.7
となるような正数 d を求めますが、正規分布で近似して更に標準化すれば
0.95 = P [|X̄ − m| ≤ d]
Ø
∑Ø µ
∂
∏
Ø
Ø
5.352
∼ P ØØN m,
− mØØ ≤ d
20000
"
#
d
= P |N (0, 1)| ≤ 5.35
√
100 2
"
0.475 = P 0 ≤ N (0, 1) ≤
ですから、正規分布表により
d
5.35
√
100 2
d
5.35
√
100 2
#
∼ 1.96 すなわち d ∼ 0.0744 ですから結局
P [|X̄ − m| ≤ 0.0744] = 0.95
が得られた事になり、今回のサンプル調査の平均値が X̄ の1つの実現値である事に注
意すれば、信頼度 95 %で
|157.9 − m| ≤ 0.0744,
すなわち
157.83 ≤ m ≤ 157.97
が成り立つと言えます。従って求める信頼区間は [157.8, 158.0] です。
ですから、標準正規分布表によれば
d
∼ 1.96,
0.7
従って
d ∼ 1.372
が得られます。従って
P [|X̄ − m| ≤ 1.372] ∼ 0.95
ですから、今回のサンプル平均値が 202.8 だった事から、信頼度 95 %で
|202.8 − m| ≤ 1.372,
従って
201.428 ≤ m ≤ 204.172
が成立しており、これが求める信頼区間になります。
統計学 第 15 回
Revised at 11:22, February 15, 2015
http://my.reset.jp/˜gok/math/statistics/
3
基本演習 15.8 ある正規母集団から大きさ 5 のサンプルを抽出したところ分散の実
基本演習 15.9 (高専教科書 例題 16.4) ある工場では生産しているスチールボール
現値が 2.531 でした。母分散の信頼度95%の信頼区間を求めて下さい。
の規格を直径 12mm±0.5mm としています。いま一つの製品ロットから次の個数を
無作為に取り出して直径を測定したところ、どの場合も直径の平均値が 12.04mm、
分散が 0.122 mm でした。それぞれの条件のもとでこのロットのスチールボールの
母集団は正規分布 N (m, v) に従うものとします。するとここから取った大きさ5の
標本分散を V̄ とすると v5 V̄ は自由度4のカイ自乗分布に従います。
直径の平均値は規格の中央値の 12mm であると言えるでしょうか。有意水準5%で
検定して下さい。
このときカイ自乗分布表によれば
P [0.4844 ≤
5
V̄ ] ∼ 0.975,
v
P [11.14 ≤
5
V̄ ] ∼ 0.025,
v
P [0.4844 ≤
5
V̄ ≤ 11.14] ∼ 0.95
v
が分かりますから、今回の分散のサンプル値 2.531 については信頼度 95 %で
5
0.4844 ≤ 2.531 ≤ 11.14
v
5 · 2.531
5 · 2.531
≤v≤
11.14
0.4844
1.1360 ≤ v ≤ 26.1251
である事が分かり、これが求める信頼区間になります。
(1)20個、全てのスチールボールの直径の分布は正規分布に従い、母標準偏
差が 0.1mm であることが分かっている。
(2)80個、母標準偏差が 0.1mm であることが分かっている。
(3)80個、母標準偏差は不明。
(4)
(1)と同じ条件のもとで、このロットの直径の平均値は 12mm より大き
いと言えるかどうか。
帰無仮説 H0 : 『全てのスチールボールの直径の平均値は 12mm である』
対立仮説 H1 : 『全てのスチールボールの直径の平均値は 12mm でない』
(1)帰無仮説 H0 が正しいと仮定し、母集団
N (12, 0.12 ) から取った大きさ20の
≥
¥
2
標本平均を X̄ とすると X̄ は正規分布 N 12, 0.1
に従います。
20
問題は直径の平均値が 12mm であるかどうかですから、有意水準5%の両側棄却域
を求めます。0.05 = P [|X̄ − 12| ≥ d] となる様な d > 0 を求めると、標準化して
"
#
"
#
d
d
0.05 = P |N (0, 1)| ≥ 0.1 = 2P N (0, 1) ≥ 0.1
"
√
20
0.025 = 0.5 − P 0 ≤ N (0, 1) ≤
"
0.475 = P 0 ≤ N (0, 1) ≤
ですから、正規分布表から
d
0.1
√
20
d
0.1
√
20
#
d
0.1
√
20
#
√
20
∼ 1.96、つまり、d ∼ 0.0438 が分かります。これは
0.05 ∼ P [|X̄ − 12| ≥ 0.0438]
を意味し、求める棄却域は (−1, 11.9562] ∪ [12.0438, 1) です。今回の具体値 12.04 は
この棄却域に入っておらず、仮説を棄却するだけの根拠はないことになり、直径の平均
値は 12mm であると考えて良いことになります。
統計学 第 15 回
Revised at 11:22, February 15, 2015
(2)帰無仮説 H0 が正しいと仮定します。この場合はサンプル数が大きいので標本
≥
¥
平均 X̄ は正規分布 N 12,
0.12
80
http://my.reset.jp/˜gok/math/statistics/
る様な d > 0 を求めると、
Ø
∑Ø µ
∂
∏
Ø
Ø
0.122
0.05 ∼ P ØØN 12,
− 12ØØ ≥ d
80
"
#
d
= P |N (0, 1)| ≥ 0.12
で近似されます。
問題は直径の平均値が 12mm であるかどうかですから、両側棄却域を求めます。
"
0.05 = P [|X̄ − 12| ≥ d]
となる様な d > 0 を求めると、近似し、さらに標準化して
"
√
= 2P N (0, 1) ≥
"
80
d
0.1
√
80
#
0.475 = P 0 ≤ N (0, 1) ≤
d
0.1
√
80
"
80
d
0.12
√
80
#
0.025 = 0.5 − P 0 ≤ N (0, 1) ≤
"
0.475 = P 0 ≤ N (0, 1) ≤
によれば正規分布表を参照して
d
0.12
√
80
d
0.12
√
80
#
d
0.12
√
80
#
∼ 1.96、つまり、d ∼ 0.026 が分かります。これは
0.05 ∼ P [|X̄ − 12| ≥ 0.026]
を意味し、求める棄却域は (−1, 11.974] ∪ [12.026, 1) です。今回の具体値 12.04 はこ
0.025 = 0.5 − P 0 ≤ N (0, 1) ≤
"
√
= 2P N (0, 1) ≥
Ø
∑Ø µ
∂
∏
Ø
Ø
0.12
Ø
Ø
= P ØN 12,
− 12Ø ≥ d
80
"
#
d
= P |N (0, 1)| ≥ 0.1
4
#
d
0.1
√
80
#
の棄却域に入っており、仮説は棄却され平均値は 12mm ではないと判断されます。
(4)
帰無仮説 H0 : 『全てのスチールボールの直径の平均値は 12mm である』
対立仮説 H1 : 『全てのスチールボールの直径の平均値は 12mm より大きい』
帰無仮説 H0 が正しいと仮定します。
(1)と同様の事情によってこの母集団からとっ
≥
¥
2
た大きさ20の標本平均を X̄ は正規分布 N 12, 0.1
に従います。
20
この場合は片側の棄却域で判定すれば良く、0.05 = P [X̄ − 12 ≥ d] となる様な d > 0
によれば正規分布表を参照して
d
0.1
√
80
∼ 1.96、つまり、d ∼ 0.022 が分かります。これは
を求めると、標準化して
"
0.05 = P N (0, 1) ≥
0.05 ∼ P [|X̄ − 12| ≥ 0.022]
を意味し、求める棄却域は (−1, 11.978] ∪ [12.022, 1) です。今回の具体値 12.04 はこ
の棄却域に入っていますから、仮説は棄却され直径の平均値は 12mm ではないと判断
されます。
(3)帰無仮説 H0 が正しいと仮定します。この場合サンプル数が大きいので母分散
は 0.122 で代用し、中心極限定理により標本平均は正規分布で近似します。
≥
¥
2
つまり標本平均 X̄ は N 120, 0.12
に従いますから、0.05 = P [|X̄ − 12| ≥ d] とな
80
"
d
0.1
√
20
#
0.05 = 0.5 − P 0 ≤ N (0, 1) ≤
"
0.45 = P 0 ≤ N (0, 1) ≤
ですから、正規分布表から
d
0.1
√
20
d
0.1
√
20
#
d
0.1
√
20
#
∼ 1.645、つまり、d ∼ 0.037 が分かります。これは
0.05 ∼ P [|X̄ − 12| ≥ 0.037]
を意味し、今回の具体値 12.04 はこの棄却域に入っているので仮説は棄却され、直径の
平均値は 12mm より大きいと判断されます。
Revised at 11:22, February 15, 2015
統計学 第 15 回
http://my.reset.jp/˜gok/math/statistics/
基本演習 15.10 (高専教科書 問題 16.11) ある工場で製品の寿命時間は正規分布
基本演習 15.11 (高専教科書 練習問題 16-1) ある工場で生産しているスチール
に従い、その標準偏差は 120 時間であることが分かっています。この会社では『当
パイプから100個取り出して直径を測定したところ、平均値が 20.1mm、分散が
工場の製品の寿命の平均値は 1800 時間である』と公表しています。この工場の製
0.232 mm でした。
5
品 10 個を無作為に抽出して寿命を測定したところ平均値が 1760 時間でした。こ
の会社の公表は正しいと認められるでしょうか、有意水準5%で検定して下さい。
(1)直径の母平均 m の信頼度99%の信頼区間を求めて下さい。
(2)直径の平均値 m は 20.0mm であると工場は言っています。その主張は正
しいと言えるでしょうか、有意水準1%で検定して下さい。
帰無仮説 H0 : 『寿命の平均値は 1800 時間である』
対立仮説 H1 : 『寿命の平均値は 1800 時間でない』
帰無仮説 H0 が正しいと仮定します。するとこの母集団から取った大きさ10の標本
≥
¥
平均 X̄ は正規分布 N 1800, 120
10
2
に従います。
平均値が 1800 に等しいかどうかが問題になっているので両側検定として棄却域を求
(1)スチールパイプ全体の中からとった大きさ100の標本平均を
X̄ とします。母
≥
¥
2
平均を m とすれば、X̄ は正規分布 N m, 0.23
に従いますから、
100
0.99 = P [|X̄ − m| ≤ d]
めます。
となるような d を求めます。実際標準化してゆけば
0.05 = P [|X̄ − 1800| ≥ d]
∑Ø µ
∂Ø
∏
Ø
1202 ØØ
= P ØØN 0,
≥
d
10 Ø
∑ µ
∂
∏
1202
= 2P N 0,
≥d
10
∑
µ
∂
∏
1202
0.025 = 0.5 − P 0 ≤ N 0,
≤d
10
∑
µ
∂
∏
2
120
0.475 = P 0 ≤ N 0,
≤d
10
"
#
√
10d
= P 0 ≤ N (0, 1) ≤
120
ですから、正規分布表から
√
10d
120
∼ 1.96、つまり、d ∼ 74.38 が分かります。これは
0.05 ∼ P [|X̄ − 1800| ≥ 74.38]
を意味し、求める棄却域は (−1, 1725.62] ∪ [1874.38, 1) です。今回の具体値 1760 は
この棄却域に入りません。従って仮説を棄却するだけの根拠はなく、会社の公表は正し
いと判断されます。
0.99 = P [|X̄ − m| ≤ d]
∑Ø µ
∂Ø
∏
Ø
0.232 ØØ
Ø
= P ØN 0,
≤d
100 Ø
∑
µ
∂
∏
0.232
= 2P 0 ≤ N 0,
≤d
100
∑
∏
d
0.495 = P 0 ≤ N (0, 1) ≤
0.023
がわかり、正規分布表から
d
0.023
∼ 2.575、すなわち、d ∼ 0.059 が得られます。これは
99%の確率で |X̄ − m| ≤ 0.059 となることを意味し、従って今回の具体値 20.1 に対
しては、信頼度99%で |20.1 − m| ≤ 0.059、つまり、
20.1 − 0.059 ∼ 20.04 ≤ m ≤ 20.16 ∼ 20.1 + 0.059
です.従って求める信頼区間は [20.04, 20.16] です。
統計学 第 15 回
Revised at 11:22, February 15, 2015
(2)
http://my.reset.jp/˜gok/math/statistics/
6
帰無仮説 H0 : 『スチールパイプの直径の平均値 m は 20.0mm である』
対立仮説 H1 : 『スチールパイプの直径の平均値 m は 20.0mm でない』
帰無仮説 H0 が正しいと仮定します。するとスチールパイプ全体の中からとった大き
≥
¥
2
さ100の標本平均 X̄ は正規分布 N 20.0, 0.23
100
に従います。
問題は直径の平均値が 20.0mm であるかどうかを問題にしていますから有意水準 0.01
で両側検定すれば良く、まずは棄却域を求めます。
0.01 = P [|X̄ − 20.0| ≥ d]
∑Ø µ
∂Ø
∏
Ø
0.232 ØØ
Ø
= P ØN 0,
≥d
100 Ø
£
°
¢§
= 2P d ≤ N 0, 0.0232
0.005 = 0.5 − P [0 ≤ N (0, 0.0232 ) ≤ d]
∑
∏
d
0.495 = P 0 ≤ N (0, 1) ≤
0.023
によれば正規分布表を参照して
d
0.023
れは
∼ 2.575、つまり、d ∼ 0.059 が分かります。こ
基本演習 15.12 (高専教科書 練習問題 16-4) ある工場で生産している製品は通
常重さの平均値が 80g、標準偏差が 4g の正規分布をしています。ある日の製品の
中から50個の標本を抽出して測定したところ、重さの平均値が 80.8g でした。そ
の日の製品は平常と比べて重いと言えるでしょうか。標準偏差は変わらないものと
して有意水準5%で検定して下さい。
帰無仮説 H0 : 『この日も重さの平均値は 80g であった』
対立仮説 H1 : 『この日は重さの平均値は 80g より重かった』
帰無仮説 H0 が正しいと仮定します。するとこの日の製品の中から取り出す大きさ5
≥
¥
2
4
0の標本平均 X̄ は正規分布 N 80, 50
に従います。
今回問題になっているのは平常より重いかどうかですから片側検定として有意水準5
%の棄却域を求めます。つまり、
0.05 = P [d ≤ X̄]
となる d > 0 を求めます。標準化すれば
0.01 ∼ P [|X̄ − 20.0| ≥ 0.059]
=P
を意味し、棄却域は (−1, 19.94] ∪ [20.06, 1) であり、今回の具体値 20.1 はこの棄却域
"
d − 80
4
√
5 2
に入っており、仮説は棄却されます。
#
≤ N (0, 1)
"
= 0.5 − P 0 ≤ N (0, 1) ≤
以上から主張は正しいとは言えません。
"
0.45 = P 0 ≤ N (0, 1) ≤
ですから正規分布表を参照して
れは
d−80
4
√
5 2
d − 80
d − 80
4
√
5 2
4
√
5 2
#
#
∼ 1.645、つまり、d ∼ 80.93 が分かります。こ
0.01 ∼ P [80.93 ≤ X̄]
を意味し、棄却域は [80.93, 1) であり、今回の具体値 80.8 はこの棄却域に入っておら
ず、仮説を棄却するだけの合理的な根拠はないと判定されます。
従ってこの日も平常よりも重かったとは言えません。
統計学 第 15 回
Revised at 11:22, February 15, 2015
基本演習 15.13 ある工場の資料によると、機械Aで作られた製品の平均重量は
5.68g です。新しい機械Bが導入されて同じ製品が作られていますが、製品の平均
重量に変化が生じたように思われたので、Bによる製品から100個無作為に抽出
したところ平均重量が 5.71g、標準偏差が 0.23g でした。Bを用いて作られた製品
の重量は正規分布に従うものとし、また標準偏差はサンプル値の 0.23g であると仮
定し、平均重量は変化したと言って良いかどうか、有意水準5%で仮説検定して下
さい。
帰無仮説 H0 : 『Bで作られた製品の平均重量は 5.68g である』
対立仮説 H1 : 『Bで作られた製品の平均重量は 5.68g でない』
帰無仮説 H0 を仮定します。すると問題に書かれている仮定から、Bで作られた製品
≥
¥
2
全体の中から取った大きさ100の標本平均 X̄ は正規分布 N 5.68, 0.23
に従います。
100
問題は平均重量に変化があったかどうかですから両側検定として有意水準5%の棄却
域を取ります。
0.05 = P [|X̄ − 5.68| ≥ d]
となる様な d > 0 を求めれば良いわけですが、標準化して
∑Ø µ
∂Ø
∏
Ø
0.232 ØØ
Ø
= P ØN 0,
≥d
100 Ø
∑
∏
d
= P |N (0, 1)| ≥ 0.23
10
∑
∏
d
= 1 − 2P 0 ≤ N (0, 1) ≤
0.023
∑
∏
d
0.475 = P 0 ≤ N (0, 1) ≤
0.023
ですから正規分布表を参照して
d
0.023
∼ 1.96、つまり、d ∼ 0.045 が分かります。これは
0.05 = P [|X̄ − 5.68| ≥ 0.045]
を意味し、棄却域は (−1, 5.635] ∪ [5.725, 1) となります。今回の具体値 5.71 はこの棄
却域に入っていませんので仮説を棄却するに足る理由はないと考えられ、平均重量が変
化したとは言えないことが分かります。
http://my.reset.jp/˜gok/math/statistics/
7