こちらの資料をスクリーンに表示

これまで学んだこと

データをとりまとめる(データの情報を取り出す)
さまざまなグラフ、統計量(中心はどこか、ばらつきの大きさは etc. )

統計量の性質を知る


標本/データ、それらから計算される統計量は、確率変数。
統計量の分布は? 平均は? 分散/標準偏差は?
=>標本データの情報に基づき、母集団の特性をとらえること。
つまり、統計量をもとに母数の統計的推測を行うこと。
検定と推定
1
母集団と標本

その1
母集団と標本(サンプル)、データの関係
統計的方法を用いることにより、統計量から母数について
どれほどのことが言えるか、知ることができる。
2
母集団と標本

その2
母数:母集団の分布の特徴を表す値
例. 母平均(μ)、母分散(σ2)

統計量:標本の特性値、データの関数として表さられる
例. データから計算した標本平均(xbar)、標本分散(V)
データは確率変数なので、その計算結果である統計量も確率変数。
同じ母集団から、同じ大きさの標本を取り出したとしても、異なる標本
では、同じ統計量でも値が異なる。
=>統計量の分布の形や平均、分散に知る必要がある
3
統計的推測とは

検定
母集団に関する仮説を検証する
例. 「現在の母平均も、従来と同じ値である」
「2つの母集団の母平均は一致している」等の仮説
をデータに基づき確かめる

推定
母数(母集団の特性)を推定する
点推定、区間推定
4
統計量の分布

その1 標本平均
標本平均(xbar )は確率変数。
正規母集団N(μ,σ2)からランダムに抽出された、大きさ n のサンプルの平均は
 その平均は 母平均(μ)
2
 その分散は 母分散(σ )/データ数(n)
 正規分布する。
xbar ~ N(μ,σ2 /n)

すなわち

標準化すると (xbar – μ)/sqrt (σ2/n) ~ N(0, 1)

母分散σ2 が未知の場合、標本分散Vで置き換えると
(xbar –μ)/sqrt (V/n) ~ t (n-1)
自由度n-1のt分布
5
6
推定の考え方




(1) 推定
推定:分布の母数を統計学的に推測すること。
推定量:推定用の統計量
点推定:推定量により母数を推定すること
μの推定量を、一般に、μhatで表す。
区間推定:母数について、区間を用いて推定する
こと
7
推定の考え方

信頼区間(μL,μU):μを推定する区間。
信頼率(または信頼係数)1-αの確率でμを含んでいる。



(2) 区間推定
信頼下限(信頼区間の下限値) μL
信頼上限(信頼区間の上限値) μU
信頼区間は
1.
2.
3.
信頼率を小さくするほど
Σが小さいほど
サンプルの大きさが大きいほど
狭くなる。
8
1つの母平均に関する検定・推定
(1)
母標準偏差σが既知の場合


母平均(μ)についての推測では、平均値xbarが用
いられる。
母集団の分散σ2が既知である場合には、
xbarの分布がN(μ, σ2 /n)であることから、
基準化を行った (xbar – μ)/sqrt (σ2/n) は
標準正規分布 N(0, 1)に従うことを用いて、
検定・推定を行う。
9
1つの母平均に関する検定・推定(2)
母標準偏差σが未知の場合


σ2が未知である場合には、代わりにVを用いる。このとき
(xbar – μ)/sqrt (V/n) は自由度n-1のt分布t(n-1)に従う。
標準正規分布の代わりにt分布を用いる点を除いては、
検定や推定の手順は同様。
10
母平均の推定


σ2が既知であっても、未知であっても、
点推定量としては xbarが用いられる。
区間推定の場合には、
2
 σ が既知の場合には
(xbar – μ)/sqrt (σ2 /n)が標準正規分布に従うこと、
2
 σ が未知の場合には
(xbar – μ)/sqrt (V /n)がt分布に従うこと
を用いて信頼区間を導く。
11
検定の考え方

その1
検定とは、母集団の分布に関する仮定(仮説)を
統計的に検証する方法。
データや標本を検証するのではなく、
データを用いて、(そのデータがとられた)母集団に関する
仮説を検証する



「仮説」とは? ~ 帰無仮説H0 対立仮説H1
仮説の立て方 ~両側検定、右/左片側検定
判断の仕方 (どのような場合、仮説を信頼するか)
~有意水準、検出力、検定統計量、棄却域
12
検定の考え方

その2 仮説
帰無仮説(Ho)
疑わしいと思われる内容。
この仮説を正しいと仮定し検定を行う。
→これが認容できない(非常に低い確率でしか起こらない)時、
帰無仮説を棄却し、対立仮説を認容 (採択)する。

対立仮説(H1)
主張したい内容。帰無仮説の一部または全体を否定したもの。
13
検定の考え方

その3 両側検定、片側検定
帰無仮説 Ho : μ=μo (μはμoに等しい)に対し
対立仮説の取り方は3通り考えられる。 ( μo :基準値)


両側検定
μはμoと異なる
H o : μ ≠ μo
右片側検定
μはμoより大きい
Ho : μ > μo

左片側検定
Ho : μ < μo
μはμoより小さい
14
検定の考え方



その4 有意水準、検出力
有意水準(危険率、第1種の過誤) α
帰無仮説が正しいのに、正しくないと判断してし
まう確率。
標準的な値として、0.05(や0.01)が用いられる。
第2種の過誤 β
帰無仮説が正しくないのに、正しいと判断してしまう確率。
(対立仮説が正しいのに、それを見逃してしまう確率。)
検出力 1-β
対立仮説が正しいときに、それを正しく検出できる確率。
15
検定の考え方

検定統計量:検定に用いられる統計量




その5 検定統計量、棄却域
まず、その検定統計量がどのような分布に従うか考え、
有意水準に応じて、棄却域 R を設定する。
データを用いて検定統計量の値を計算し、棄却域に入るか
どうかで、仮説の妥当性を判断する。
たとえば、母平均に関する検定を行うとき
検定統計量 (xbar – μ)/sqrt (σ2/n) は標準正規分布 N(0, 1)に従う。
ただし、σ2 が未知の場合、Vで置き換えると
検定統計量 (xbar –μ)/sqrt (V/n)は自由度n-1のt分布 t (n-1)に従う。
16
検定の考え方


その6 検定結果の解釈
棄却域は、めったに起こらない領域
データを用いて検定統計量を計算した結果が棄却域に入っ
た場合、大変珍しいことが起こっている→設定に無理があっ
たと考え、設定した有意水準で帰無仮説を棄却する。
このことを「検定結果は、有意水準●●%で有意」と言う。
有意:帰無仮説を棄却するに足るだけの意味を持っているという意味。

棄却域に入らない場合、有意ではない。帰無仮説は棄却さ
れず、対立仮説は(そのデータでは)正しいとは言えない。
注意:「帰無仮説が正しい」ことが証明されたのではない
17