これまで学んだこと データをとりまとめる(データの情報を取り出す) さまざまなグラフ、統計量(中心はどこか、ばらつきの大きさは etc. ) 統計量の性質を知る 標本/データ、それらから計算される統計量は、確率変数。 統計量の分布は? 平均は? 分散/標準偏差は? =>標本データの情報に基づき、母集団の特性をとらえること。 つまり、統計量をもとに母数の統計的推測を行うこと。 検定と推定 1 母集団と標本 その1 母集団と標本(サンプル)、データの関係 統計的方法を用いることにより、統計量から母数について どれほどのことが言えるか、知ることができる。 2 母集団と標本 その2 母数:母集団の分布の特徴を表す値 例. 母平均(μ)、母分散(σ2) 統計量:標本の特性値、データの関数として表さられる 例. データから計算した標本平均(xbar)、標本分散(V) データは確率変数なので、その計算結果である統計量も確率変数。 同じ母集団から、同じ大きさの標本を取り出したとしても、異なる標本 では、同じ統計量でも値が異なる。 =>統計量の分布の形や平均、分散に知る必要がある 3 統計的推測とは 検定 母集団に関する仮説を検証する 例. 「現在の母平均も、従来と同じ値である」 「2つの母集団の母平均は一致している」等の仮説 をデータに基づき確かめる 推定 母数(母集団の特性)を推定する 点推定、区間推定 4 統計量の分布 その1 標本平均 標本平均(xbar )は確率変数。 正規母集団N(μ,σ2)からランダムに抽出された、大きさ n のサンプルの平均は その平均は 母平均(μ) 2 その分散は 母分散(σ )/データ数(n) 正規分布する。 xbar ~ N(μ,σ2 /n) すなわち 標準化すると (xbar – μ)/sqrt (σ2/n) ~ N(0, 1) 母分散σ2 が未知の場合、標本分散Vで置き換えると (xbar –μ)/sqrt (V/n) ~ t (n-1) 自由度n-1のt分布 5 6 推定の考え方 (1) 推定 推定:分布の母数を統計学的に推測すること。 推定量:推定用の統計量 点推定:推定量により母数を推定すること μの推定量を、一般に、μhatで表す。 区間推定:母数について、区間を用いて推定する こと 7 推定の考え方 信頼区間(μL,μU):μを推定する区間。 信頼率(または信頼係数)1-αの確率でμを含んでいる。 (2) 区間推定 信頼下限(信頼区間の下限値) μL 信頼上限(信頼区間の上限値) μU 信頼区間は 1. 2. 3. 信頼率を小さくするほど Σが小さいほど サンプルの大きさが大きいほど 狭くなる。 8 1つの母平均に関する検定・推定 (1) 母標準偏差σが既知の場合 母平均(μ)についての推測では、平均値xbarが用 いられる。 母集団の分散σ2が既知である場合には、 xbarの分布がN(μ, σ2 /n)であることから、 基準化を行った (xbar – μ)/sqrt (σ2/n) は 標準正規分布 N(0, 1)に従うことを用いて、 検定・推定を行う。 9 1つの母平均に関する検定・推定(2) 母標準偏差σが未知の場合 σ2が未知である場合には、代わりにVを用いる。このとき (xbar – μ)/sqrt (V/n) は自由度n-1のt分布t(n-1)に従う。 標準正規分布の代わりにt分布を用いる点を除いては、 検定や推定の手順は同様。 10 母平均の推定 σ2が既知であっても、未知であっても、 点推定量としては xbarが用いられる。 区間推定の場合には、 2 σ が既知の場合には (xbar – μ)/sqrt (σ2 /n)が標準正規分布に従うこと、 2 σ が未知の場合には (xbar – μ)/sqrt (V /n)がt分布に従うこと を用いて信頼区間を導く。 11 検定の考え方 その1 検定とは、母集団の分布に関する仮定(仮説)を 統計的に検証する方法。 データや標本を検証するのではなく、 データを用いて、(そのデータがとられた)母集団に関する 仮説を検証する 「仮説」とは? ~ 帰無仮説H0 対立仮説H1 仮説の立て方 ~両側検定、右/左片側検定 判断の仕方 (どのような場合、仮説を信頼するか) ~有意水準、検出力、検定統計量、棄却域 12 検定の考え方 その2 仮説 帰無仮説(Ho) 疑わしいと思われる内容。 この仮説を正しいと仮定し検定を行う。 →これが認容できない(非常に低い確率でしか起こらない)時、 帰無仮説を棄却し、対立仮説を認容 (採択)する。 対立仮説(H1) 主張したい内容。帰無仮説の一部または全体を否定したもの。 13 検定の考え方 その3 両側検定、片側検定 帰無仮説 Ho : μ=μo (μはμoに等しい)に対し 対立仮説の取り方は3通り考えられる。 ( μo :基準値) 両側検定 μはμoと異なる H o : μ ≠ μo 右片側検定 μはμoより大きい Ho : μ > μo 左片側検定 Ho : μ < μo μはμoより小さい 14 検定の考え方 その4 有意水準、検出力 有意水準(危険率、第1種の過誤) α 帰無仮説が正しいのに、正しくないと判断してし まう確率。 標準的な値として、0.05(や0.01)が用いられる。 第2種の過誤 β 帰無仮説が正しくないのに、正しいと判断してしまう確率。 (対立仮説が正しいのに、それを見逃してしまう確率。) 検出力 1-β 対立仮説が正しいときに、それを正しく検出できる確率。 15 検定の考え方 検定統計量:検定に用いられる統計量 その5 検定統計量、棄却域 まず、その検定統計量がどのような分布に従うか考え、 有意水準に応じて、棄却域 R を設定する。 データを用いて検定統計量の値を計算し、棄却域に入るか どうかで、仮説の妥当性を判断する。 たとえば、母平均に関する検定を行うとき 検定統計量 (xbar – μ)/sqrt (σ2/n) は標準正規分布 N(0, 1)に従う。 ただし、σ2 が未知の場合、Vで置き換えると 検定統計量 (xbar –μ)/sqrt (V/n)は自由度n-1のt分布 t (n-1)に従う。 16 検定の考え方 その6 検定結果の解釈 棄却域は、めったに起こらない領域 データを用いて検定統計量を計算した結果が棄却域に入っ た場合、大変珍しいことが起こっている→設定に無理があっ たと考え、設定した有意水準で帰無仮説を棄却する。 このことを「検定結果は、有意水準●●%で有意」と言う。 有意:帰無仮説を棄却するに足るだけの意味を持っているという意味。 棄却域に入らない場合、有意ではない。帰無仮説は棄却さ れず、対立仮説は(そのデータでは)正しいとは言えない。 注意:「帰無仮説が正しい」ことが証明されたのではない 17
© Copyright 2024 ExpyDoc