期末テストの解答と講評 - econ.keio.ac.jp

統計学Ⅰ 2016 年度春学期 問題と解答
以下の設問の解答は解答用紙(別紙)を半分に折り左右2段組みにしたうえで問題順に記
しなさい。*印の問題では答えに至る途中過程も記しなさい
数表
標準正規分布 Z について P(Z<1.645)=0.95, P(Z<1.96)=0.975
1 標本統計量に関する以下の問いに答えよ。(20)
(1)標本平均 x や標本分散 s2 が持つ共通の望ましい性質を何というか。
(2) x や s2 が持つ共通の欠点は何か。
(3) x の代わりに(2)の欠点を補う統計量として何が利用されるか。一つ挙げよ。
(4)変動係数の定義とその利点を簡潔に述べよ。
解答 各 5 点
(1)不偏性 4 点(普遍性 etc 誤記、不偏性と効率性)、0 点(BLUE 等)
(2)外れ値の影響を受けやすい
(3)中央値または刈り込み平均 0 点(変動係数、歪度、尖度 過去問の弊害?)
(4)s/ x , 水準に差のある場合の散らばりの比較に利用できる 定義は言葉で説明しても可だが
x /s は× 3 点(定義 or 利点のみ正解)、利点として散らばりの尺度だけは×
2 ある学生 i が近視である xi=1 か否か xi=0 がベルヌイ分布 f(xi)=θxi(1-θ)1-xi に従うと
き以下の問いに答えよ。(25)
(1*)確率変数 xi の平均 E(xi)と分散 Var(xi)を定義から導出せよ。
(2)無作為に選んだ n 人の学生のうちの近視の学生の数 y=Σxi はどんな確率分布に従うか。
(3)無作為とはどのような状況かを簡潔に説明しなさい。
(4)n を増やしていくと y はどのような確率分布(平均と分散も答えよ)に従うか。
解答
(1)E(x)=1×θ+0×(1-θ)=θ, Var(x)=(1-θ)2 ×θ+(0-θ)2 ×(1-θ)=θ(1-θ)[( 1-
θ)+θ]=θ(1-θ) 各 5 点、4 点(Var(x)=E(x2)-μ2=…分散公式は定義ではない) 0 点
(E(x)=θや Var(x)=θ(1-θ)の答えだけ、ベルヌイ分布は離散確率変数なのに∫xf(x)dx など
連続確率変数の誤った定義は×)
(2)2 項分布 5 点 0 点(正規分布、ベルヌイ分布)
(3)互いに独立である(標本選択が他の標本の影響を受けない) 5 点 0 点(ランダム、偏り
がない) ランダムは無作為の英訳で答えにはならない、標本は「無作為かつ偏りなく」選
ぶ必要があるが、無作為と偏りのないは異なる基準です
(4)平均 nθ、分散 nθ(1-θ)の正規分布 5 点 3 点(正規分布のみ) 2 点(標準正規分布、0 点
にしたいけど、この回答が多かった。なぜΣx の平均が 0 に近づくのか?ありえない)
3 (2 の続き)無作為に選んだ n 人の学生の近視の割合 p=y/n について以下の問いに答えな
さい。(25)
(1*)近視の割合 p の平均 E(p)と分散 Var(p)をモーメント公式よりθと n の式にしなさい。
(2*)n=100 の調査で p=0.5 であったとき、母数 θ の 95%信頼区間を求めなさい。
(3*)「学生の近視率θは 0.8 である」という仮説を有意水準 5%で検定しなさい。
解答
(1)E(y/n)=1/nE(y)=1/n(nθ)=θ、Var(y/n)=1/n2Var(y)=1/n2{nθ(1-θ)}=θ(1-θ)/n 各 5 点 *
がついているので答えだけは 0 点 モーメント公式の演算が出来るか否かが問われている
(2)0.5-1.96 0.5  0. 5 100 =0.402<θ<0.598=0.5+1.96 0.5  0.5 100 5 点 4 点
(1.96 を 2 で近似) 3 点(計算ミス) 0 点(1.645 で計算)
(3)H0:θ=0.8, H1:θ<0.8 とする。帰無仮説 H0:θ=0.8 が真であるとすると、p~N(0.8,(0.04)2 =
0.8  0.2
100 )となるが、p=0.5 を標準化すると z=
p 
 (1   )
n
=(0.5-0.8)/0.04=-7.5
>-1.645 なので、対立仮説 H1 は棄却される。ゆえに有意水準 5%で 0.8 未満とは言えない。
10 点満点 各ステップで誤りがあると 3 点減点した。
多い誤りは①仮説設定の誤り(H0:θ=0.5、
H0:μ<0.8 など) ②標準化の誤り(分散を p=0.5 で計算して z=(0.5-0.8)/0.05=-6)③臨界値の
誤り(1.96) ④結論の誤り など。検定は重要なのに出来が悪かった。秋学期は検定が出来ない
と単位が取れなくなりますよ。
4 都心のあるバス停では、待ち時間 X が 0~5 分の一様分布に従うという。 (20)
(1)確率変数 X の確率密度関数 f(X)を求めなさい。
(2*)分布関数 F(X)を定義から導出しなさい。
(3*)確率変数 X の平均 E(X)と分散 Var(X)を求めなさい。
解答
(1)f(X)=1/5 5 点 1/6 という人がいたが、0.1.2…,6 のような離散確率変数ではない 密度
関数と書いてあるから連続確率変数
(2)F(X)=
(3)E(X)=

5
0


X
0
5
0
f ( x) dx = 15 x 0  15 X
X
定義を間違えて F(X)=1 とする人が散見された
 x   25 =2.5、Var(X)=E(x )- 
 x   125  各 5 点
1
2
2 5
0
3 5
0
1
15
xf ( x)dx = 15
x 2 f ( x)dx = 15
5点
1
3
1
10
2

5 2
2
= 1001275 
25
12
25
3
すべて計算ミスは 3 点とした
5 ある企業が作る部品の国別生産シェアが国内 P(XJ)=50%、アジア P(XA)=30%、米国
P(XU)=20%で、それぞれの不良品率が P(Y|XJ)=1%、P(Y|XA)=3%、P(Y|XU)=2%であるとき、
以下の問いに答えよ。(10)
(1*)この会社の不良品率 P(Y)を求めなさい。
(2*)この会社の不良品はどこで作られた確率が最も高くなるか。
解答
(1) 全確率の公式より
P(Y)=P(Y∩XJ)+P(Y∩XA)+P(Y∩XE)=0.5*0.01+0.3*0.03+0.2*0.02=18/1000 5 点
(2)ベイズの定理より
日本産 P(XJ|Y)= P(Y∩EJ)/P(Y)=(5/1000)÷(18/1000)=5/18
アジア産 P(XA|Y)= P(Y∩XA)/P(Y)=(9/1000)÷(18/1000)=9/18=0.5
米国産 P(XE|Y)= P(Y∩XE)/P(Y)=(4/1000)÷(18/1000)=4/18
なのでアジア産である確率が最も高くなる。 5 点 *がついているから答えだけは減点
採点結果
受験者数 341 人 平均点 62 点 標準偏差 22 点 最高点 100 点
下記は期末試験(100 点満点)の度数分布です。
最低点 0 点
多くの学生が 70 点以上でしたが、50 点未満の人もやや多いです。
成績は「総点=レポート乗数の平均値×期末試験得点」に基づき、A(総点≧80) B(80>総点≧
60) C(60>総点≧40) D(総点<40)でつけます。総点<50 を D としたら D の割合が高くなっ
たので、条件を緩めました。