過去の検定で難しかった問題のオリジナル解説

統計検定 2 級 全 6 回のオリジナル解説より抜粋
【第 1 回】
問 5(解答番号 9 )
30 匹の小型犬の体重を x1 , x2 , · · · , x30 , それらの相加平均を x, 標準偏差を s と表しますと,
1 ∑
x=
xi = 4.5
30 i=1
30
1 ∑
(xi − x)2 = 1.02
30 i=1
30
s2 =
であり, 変動係数 a = s/x = 1.0/4.5 となります。ここで, 各犬の体重が 0.5kg ずつ増加したと
して,
それら新たな体重を x′1 , x′2 , · · · , x′30 と表しますと, x′i = xi + 0.5 であり, 新たな相加平均を x′ ,
標準偏差を s′ と表しますと, x′ = x + 0.5, s = s′ が成り立ちます。よって,
(新たな変動係数) = s′ /x′ = s/(x + 0.5) = 1.0/5.0 =
5.0
10
a=
a
4.5
9
となります。
よって,
9 の正解は 3 となります。
問 14(解答番号 18 )
平均 µ, 分散 σ 2 の正規分布の確率密度関数 f (x) は,
(
)
1
(x − µ)2
f (x) = √
exp −
2σ 2
2πσ
です。
1
a. x = µ において f (x) は最大値 √
をとります。
2πσ
b. σ が大きいほど, その最大値は大きいです。よって, a. と b. は正しいです。
c. X を N (0, σ12 ) に従う確率変数, Y を N (0, σ22 ) に従う確率変数, Z を標準正規分布に従う確率
変数としますと, P r(X ≥ x) = P r(Z ≥ x/σ1 ), P r(Y ≥ x) = P r(Z ≥ x/σ2 ) と書き直せます。
x ≥ 0, σ1 < σ2 から x/σ1 ≥ x/σ2 なので,
P r(Z ≥ x/σ1 ) ≤ P r(Z ≥ x/σ2 ), すなわち P r(X ≥ x) ≤ P r(Y ≥ x) です。よって c. も正し
いです。
以上より,
18 の正解は 5 となります。
問 17(解答番号 21 )
母支持率を p, 標本支持率を p̂, 標本数を n と表しますと, 通常 n は非常に大きいので, 中心極限
定理を用いて,
(
)
p(1 − p)
p̂ は正規分布 N p,
に従うと近似できます。よって, 例えば p の 95 %信頼区間は,
n
(
P r p − Z0.025
√
p(1 − p)
< p̂ < p + Z0.025
n
√
p(1 − p)
n
)
= 0.95
の () の中を, 分散に現れる p を p̂ で近似し, そののち p について整理した,
√
√
p̂(1 − p̂)
p̂(1 − p̂)
< p < p̂ + Z0.025
p̂ − Z0.025
n
n
√
p̂(1 − p̂)
となります。この信頼区間の幅は, 2Z0.025
です。n が 4 倍になれば, この幅は半分にな
n
ることがわかります。信頼係数が変わっても一緒です。
以上より,
21 の正解は 4 となります。
【第 2 回】
問 13(解答番号 20 )
n 個の世帯について, 各世帯の人数を X1 , X2 , · · · , Xn と表しますと, 「世帯毎の人数」の推定量
X1 + X2 + · · · + Xn
はX =
となります。すると, 人口の推定量は 100000X となります。
n
1
「世帯毎の人数」の推定量の期待値 E[X] = E[Xi ], 分散 V [X] = V [Xi ] ですので, その変動係
n
数は
√
V [X]
√
V [Xi ]
1
=√
n E[Xi ]
E[X]
となります。よって, 人口の推定量の変動係数は
√
V [100000X]
√
V [Xi ]
1
=√
n E[Xi ]
E[100000X]
となります。
ところで, 母集団の人口の平均を µ, 分散を σ 2 と表しますと,
E[100000Xi ] = µ,
V [10000Xi ] = σ 2
ですので, 変動係数は
√
√
V [10000X]
V [Xi ]
σ
=
=
µ
E[100000X]
E[Xi ]
となります。
以上より,
√
V [X]
√
V [Xi ]
1
1 σ
=√
=√
n E[Xi ]
nµ
E[X]
ですが, ここで母集団の変動係数(下線部)が 1.0 以下なので,
1
√ ≤ 0.05
n
より n ≥ 400 となります。 20 の正解は⃝
2 となります。
問 14(解答番号 21 ∼ 22 )
[1]
入場者数を N 人としますと, i 番目の人の通し番号 Xi は区間 (1, N ) の離散型一様分布に従いま
N +1
です。よって, 通し番号の合計 S = X1 + X2 + · · · + X300 の期
2
N +1
待値は E[S] = 300 ×
です。いま, N の推定量を N̂ と表し,
2
す。その期待値は E[Xi ] =
N̂ = 2 ×
S
−1
300
としますと, E[N̂ ] = N となり, N の不偏推定量になります。よって, 2 ×
答えとなります。 21 の正解は⃝
3 となります。
4510384
− 1 ≈ 30000 が
300
[2]
N の標準誤差とは, N̂ の標準偏差です。
V [N̂ ] =
22
× 300V [Xi ]
3002
ですが, ここで V [Xi ] は,
1 2
(1 + 22 + · · · + N 2 )
N
1
1
=
× N (N + 1)(2N + 1)
N
6
1
= (N + 1)(2N + 1)
6
E[Xi2 ] =
より,
V [Xi ] = E[Xi2 ] − (E[Xi ])2
1
1
= (N + 1)(2N + 1) − (N + 1)2
6
4
1
=
(N − 1)(N + 1)
12
√
となります。N ≈ 30000 を代入して, V [N̂ ] ≈ 1000 を得ます。 22 の正解は⃝
2 となります。
なお, N が非常に大きいことから, 離散型の一様分布ではなく連続型の一様分布とみなし,
V [Xi ] =
(N − 1)2
12
として, N ≈ 30000 を代入しても同じ答えが得られます。
【第 3 回】
問 4(解答番号 5 )
相関係数は, 各変数を標準化しても値は変わりませんので, A と C の値は同じになります。なお,
D は, x, y を標準化したものをそれぞれ x′ , y ′ とおくと,
x′i =
xi − x
,
sx
yi′ =
yi − y
sy
であり, x′ = y ′ = 0 です。よって,
1 ∑ ′
(xi − x′ )(yi′ − y ′ )
n−1
1 ∑ ′ ′
xi · yi
=
n−1
∑
(xi − x)(yi − y)
1
=
n−1
sx · sy
Cov(x′ , y ′ ) =
となりますが, 最後の式に問題文にある sx と sy を代入すると, rxy と等しくなることがわかります。
以上より, 5 の正解は⃝
5 となります。
なお, 本問では分散, 共分散ともに不偏推定量を用いています。不偏でない分散・共分散(n − 1
で割らずに n で割るもの)か, それとも本問のような分散・共分散か, テキストや試験によってどち
らを使うかマチマチですので, 問題文をよく読んで間違えないようにして下さい(統計検定試験は
不偏推定量で統一されています)。
問 16(解答番号 25 ∼ 26 )
[1]
標本比率 p̂, 標本数 n と表すと, 母比率 p の 95 %信頼区間は,
√
p̂ ± 1.96 ×
p̂(1 − p̂)
n
で表されます。p̂ = 0.25, n = 600 なので, 25 の正解は⃝
5 となります。
[2] 信頼区間の幅は,
√
2 × 1.96 ×
ですので,
√
2 × 1.96 ×
p̂(1 − p̂)
n
p̂(1 − p̂)
≤ 0.04
n
すなわち
(
n≥
2 × 1.96
0.04
)2
× p̂(1 − p̂)
となります。p̂(1 − p̂) は 0 ≤ p̂ ≤ 0.3 において単調増加なので, p̂ = 0.3 のときに最大になります
ので,
(
n≥
2 × 1.96
0.04
)2
× (0.3 × 0.7) = 2016
でなければなりません。 26 の正解は⃝
4 となります。
【第 4 回】
問 13(解答番号 20 ∼ 22 )
[1]
3 の目が出る回数 r は二項分布 B(7, 1/6) に従い,
( )4 ( )3
1
5
C
7 4
6
6
が求める確率になります。7 C4 = 35 なので, 20 の正解は⃝
4 となります。
[2]
帰無仮説が正しいとしたときに, 「3 の目が 4 回出る」という事象が起こる確率が非常に小さけれ
ば, 滅多に起こらないことが起こったということで, 帰無仮説を疑うことになります。このとき, 5
回以上の確率も加えた確率を P 値とし, 有意水準である 5 %と比較します。
21 の正解は⃝
1 となります。
[3]
1 の目が 4 回出る確率も [1] と同じ式で計算できて 0.015629, 2 の目が 4 回出る確率も同様に
0.015629, · · · , です。これらの事象は互いに排反なので, 求める確率は, 0.015629 × 6 ≈ 0.094 とな
ります。
22 の正解は⃝
3 となります。
問 18(解答番号 32 ∼ 33 )
[1]
標本回帰方程式によると, 気温が 1 度上がると傾きの大きさだけ(4.8617)降水量が増えます。
32 の正解は⃝
4 となります。
[2]
決定係数は B 君の分析の方が大きいので, I は誤りです。
切片や平均気温の標準誤差をみると, B 君の分析の方が小さくなっています。これらは, 標本回帰
方程式における切片と傾きの標準偏差です。II は正しいです。
自由度修正済み決定係数は, 説明変数の数の検討に用いられます。単回帰分析同士のこの決定係
数の比較は意味がありません。III は誤りです。
以上より, 33 の正解は⃝
2 となります。
【第 5 回】
問 6(解答番号 8 ∼ 11 )
[1]
以下のデータの平均を求めることになります。
0, 0, 0, · · · , 0, 1, 1, · · · , 1, 2, 2, · · · , 2, · · · , 6, 6, 6, 6, 6, 6
|
{z
} | {z } | {z }
|
{z
}
55 個
144 個
140 個
6個
よって,
(0 × 55 + 1 × 144 + 2 × 140 + · · · + 6 × 6) ÷ 500 = 2.00
となります。 8 の正解は⃝
3 です。
[2]
母数 λ のポアソン分布の確率関数は,
P (X = k) = e−λ
λk
k!
です。 9 の正解は⃝
5 です。
[3]
母数 λ のポアソン分布の期待値 E[X], 分散 V [X] はともに λ です。ここで V [X] = E[X 2 ] −
(E[X])2 ですので,
E[X 2 ] = V [X] + (E[X])2 = λ + λ2
になります。 10 の正解は⃝
4 です。
[4]
検定統計量としては,
χ2 =
(55 − 67.7)2
(144 − 135.3)2
(6 − 8.3)2
+
+ ··· +
≈ 4.498
67.7
135.3
8.3
を用い, 自由度 5 の χ2 分布の上側%点と比較します。
自由度に関して, セルが 7 つあるので, 7 − 1 = 6 とし, さらに, 母数を 1 つ最尤推定値で推定して
いるので, 1 減らして, 5 とします(推定した母数の数だけ自由度を減じます)。
以上より, 11 の正解は⃝
5 です。
【第 6 回】
問 8(解答番号 16 ∼ 18 )
[1]
5×7×3
3
=
13
15 C3
となり, 16 の正解は⃝
5 となります。
[2]
100 円玉が 2 枚と, あと 1 枚(何でもよい)あればよいです。100 円玉 3 枚をとる場合, 100 円玉
2 枚と 10 円玉 1 枚をとる場合, 100 円玉 2 枚と 1 円玉 1 枚をとる場合をそれぞれ考えて,
5 C3
+ 5 C2 × 7 + 5 C2 × 3
22
=
C
91
15 3
となります。 17 の正解は⃝
4 となります。
[3]
取り出した 3 枚の合計が 150 円以上で, かつ 1 円玉が含まれている確率は,
この確率を [2] の確率で割ると,
×3
となります。
15 C3
5 C2
3
となり, これが答えです。 18 の正解は⃝
2 となります。
11
問 11(解答番号 23 )
二項分布を用いて解くと計算が大変なことになりますので, n = 36 と試行回数が小さいのですが,
正規近似をします。正解した数を S と表しますと, S は二項分布
B(36,
(
) 1/2) に従い, ここで正規近
似を行いますと, S は期待値 36 ×
1
1
1
= 18, 分散 36 × × 1 −
2
2
2
= 9 の正規分布に従います。
よって,
(
P (S ≥ 24) = P
24 − 18
S − 18
≥
3
3
)
= P (Z ≥ 2) = 0.0228
となります(Z は標準正規分布に従う確率変数)。
ここで, 試行回数が小さいので, 連続補正を行いますと,
P (S ≥ 24 − 0.5) = P (Z ≥ 1.83) = 0.0336
となります。なお, 実際に二項分布のまま計算もしてみましたが, 約 3 %になりました(試験時間内
で計算するのは難しい)。 23 の正解は⃝
5 となります。
問 13(解答番号 25 ∼ 26 )
[1]
母分散未知の場合の母平均の検定です。 25 の正解は⃝
3 となります。
[2]
第二種の過誤率とは, H1 が正しいときに H0 を採択してしまう確率です。いま, H1 が何であれ,
H0 を採択してしまう確率は, 一様乱数の値が 0.01 より大きい確率なので, 0.99 になります。
なお, 第一種の過誤率とは, H0 が正しいときに H0 を棄却する確率であり, 有意水準に一致しま
すので, いまは 0.01 になり, 不合理な値ではありません。
26 の正解は⃝
3 となります。
(以上です)