の課題の解答 課題 4-1 あなたはランダムに配置された対象物(例えば

R で統計学を学ぶ(4)の課題の解答
課題 4-1
あなたはランダムに配置された対象物(例えば地雷や石油や埋蔵金など)を衛星からの
センサーデータを元に限定された時間(例えば 1 時間)内に検出する機器を作成した。100
個のデータに対し検出率は 0.70 であった。そして、その性能が従来の製品(検出率は 0.60
と宣伝されている)よりも優れていることを統計的仮説検定の手法により示したい。
どのような帰無仮説と対立仮説をたてればよいか、また検定方法は片側か両側か、有意
水準はどのくらいに設定したらよいか、考えを述べよ。
答:
対立仮説(これが言いたい、ということ): 作成した機器は従来の製品と異なる、つま
り検出率に差がある (検出率は優れている、と言いたいところであるが、「差がある」
にとどめておくのが常道)
帰無仮説(棄却したい説): 検出率には差がない
検定方法は両側検定(「差がある」という対立仮説なので両側を考える)
有意水準は 5%としておく(それよりも大きな数値では意味が無い、小さな数値の方
が良いことはよい)
課題 4-2
正規母集団 N (μ,σ2) から無作為に標本を抽出したとき、理論的に標本平均の平均と、
分散がそれぞれどのように表されるか、書きなさい(つまり、上の[ア], [イ]の箇所を補う
こと)。
またこれを標準化して得られる検定統計量が Z で表されている理由と、その平均およ
び分散を答えなさい。
答:
[ア] 平均値、つまりμ
[イ] 分散は、標本のサンプルサイズを n で表すと、σ2/n (4 章の「標本分布を求める」
参照)
標本データを「標準化」(平均 0、分散 1 の分布)して得られたものは Z 値と呼ばれる。
Z 値の計算は、「標本データそれぞれと標本データの平均の差」を、「標本データの分
散の平方根」で割って得られる。それに対し、検定統計量は「標本データの平均と理論
的な標本データの平均の差」(理論的には 0 になるはず)を、「理論的な標本データの分
散の平方根(標準偏差)」で割った値である。このことから Z 値との関係は明らかであ
ろう。(平均と分散を答えよ、という設問は無意味なので削除)
課題 4-3
標準正規分布のグラフを書き、有意水準 5%の棄却域を黄色で表し、例題の Z 値がどこ
に位置するかを重ね書きした図を作成せよ。
答:
kikyakuikiDraw <- function(pval, color,range=4) {
plot(dnorm, -range, range)
lmt <- qnorm(pval)
xvals <- seq(-range,lmt, length=30)
dvals <- dnorm(xvals)
polygon(c(xvals, rev(xvals)), c(rep(0,30), rev(dvals)), col=color)
xvals <- seq(-lmt, range, length=30)
dvals <- dnorm(xvals)
polygon(c(xvals, rev(xvals)), c(rep(0,30), rev(dvals)), col=color)
abline(v=0, lty=2)
abline(v=-range, lty=3)
abline(v=range, lty=3)
abline(h=0, lty=2)
}
kikyakuikiDraw(0.05, "yellow")
#
z <- (mean(指導法データ) - 12) / sqrt(10/length(指導法データ))
#
z = -2.828427
abline(v=z, , col="blue")