R で統計学を学ぶ(4)の課題の解答 課題 4-1 あなたはランダムに配置された対象物(例えば地雷や石油や埋蔵金など)を衛星からの センサーデータを元に限定された時間(例えば 1 時間)内に検出する機器を作成した。100 個のデータに対し検出率は 0.70 であった。そして、その性能が従来の製品(検出率は 0.60 と宣伝されている)よりも優れていることを統計的仮説検定の手法により示したい。 どのような帰無仮説と対立仮説をたてればよいか、また検定方法は片側か両側か、有意 水準はどのくらいに設定したらよいか、考えを述べよ。 答: 対立仮説(これが言いたい、ということ): 作成した機器は従来の製品と異なる、つま り検出率に差がある (検出率は優れている、と言いたいところであるが、「差がある」 にとどめておくのが常道) 帰無仮説(棄却したい説): 検出率には差がない 検定方法は両側検定(「差がある」という対立仮説なので両側を考える) 有意水準は 5%としておく(それよりも大きな数値では意味が無い、小さな数値の方 が良いことはよい) 課題 4-2 正規母集団 N (μ,σ2) から無作為に標本を抽出したとき、理論的に標本平均の平均と、 分散がそれぞれどのように表されるか、書きなさい(つまり、上の[ア], [イ]の箇所を補う こと)。 またこれを標準化して得られる検定統計量が Z で表されている理由と、その平均およ び分散を答えなさい。 答: [ア] 平均値、つまりμ [イ] 分散は、標本のサンプルサイズを n で表すと、σ2/n (4 章の「標本分布を求める」 参照) 標本データを「標準化」(平均 0、分散 1 の分布)して得られたものは Z 値と呼ばれる。 Z 値の計算は、「標本データそれぞれと標本データの平均の差」を、「標本データの分 散の平方根」で割って得られる。それに対し、検定統計量は「標本データの平均と理論 的な標本データの平均の差」(理論的には 0 になるはず)を、「理論的な標本データの分 散の平方根(標準偏差)」で割った値である。このことから Z 値との関係は明らかであ ろう。(平均と分散を答えよ、という設問は無意味なので削除) 課題 4-3 標準正規分布のグラフを書き、有意水準 5%の棄却域を黄色で表し、例題の Z 値がどこ に位置するかを重ね書きした図を作成せよ。 答: kikyakuikiDraw <- function(pval, color,range=4) { plot(dnorm, -range, range) lmt <- qnorm(pval) xvals <- seq(-range,lmt, length=30) dvals <- dnorm(xvals) polygon(c(xvals, rev(xvals)), c(rep(0,30), rev(dvals)), col=color) xvals <- seq(-lmt, range, length=30) dvals <- dnorm(xvals) polygon(c(xvals, rev(xvals)), c(rep(0,30), rev(dvals)), col=color) abline(v=0, lty=2) abline(v=-range, lty=3) abline(v=range, lty=3) abline(h=0, lty=2) } kikyakuikiDraw(0.05, "yellow") # z <- (mean(指導法データ) - 12) / sqrt(10/length(指導法データ)) # z = -2.828427 abline(v=z, , col="blue")
© Copyright 2024 ExpyDoc