第2日目第3時限の学習目標 点推定と区間推定について学ぶ(続き)。 (1)区間推定の公式の導き方の基本を知 る。 (2)区間推定の演習を行う。 統計的検定の基本的な考え方について学ぶ。 (1)母平均の統計的検定の考え方を知る。 (2)帰無仮説とその採択・棄却の概念を 学ぶ。 (3)仮説検定に際しての危険率(有意水 準)の 概念を学ぶ。 信頼区間導出の概要-3(参考) 実際、標本が得られた母集団の母分散が未知の 場合、平均μ0なる正規分布からの N 個の標本を 用いて上記の t なる量を計算すると、 sx t ( x 0 ) / t N 1 すなわち、t は自由度 ν=N-1 の t-分布に従うこ とが証明できる。ここで、t-分布とは? 信頼区間導出の概要-4 (参考) t 分布とは、つぎのような関数から成る 分布で、f(t) は任意の t が特定の値を取 る確率を表す。また Γ はガンマ関数で ある: 1 1 2 2 t 2 f (t ) 1 2 自由度 v = N-1 の t-分布の分布とは? -正規分布に近い y 軸対称な分布 確率 斜線部 1-α t- 分布 t - t N-1(α/2) t N-1(α/2) 信頼区間導出の概要-5(参考) 上の分布の特徴からは、次式が成り立 つ: sx prob t N 1 ( x 0 ) / t N 1 2 2 N 1 1 . この式を変形し μ0 について解くと、先ほどの 信頼区間の公式となる。すなわち、 区間推定の公式-統計的推定問題の例 sx sx Pr ob x t N 1 ( ) 0 x t N 1 ( ) 2 2 N 1 N 1 1 上の式は、母平均を、標本平均や標本標準偏差等を 用いて、ある区間に入る確率がどれだけ、という言 い方で推定する式であり、 統計における基本的な2つの方法である、推定と検 定のうち、推定の問題の1つの例といえる。 演習6 平均値の区間推定を行う。 授業での演習のサンプル数は、10 と する。 (データセット1): 41,24,20,21,15,26 ,19,23,40,26 (データセット2): 38,24,15,26,10,22 ,14,29,37,29 演習6 区間推定の公式(再掲載) 標本 平均 標本標 準偏差 t-分布の上側 100 (α/2) %点 sx sx Pr ob x t N 1 ( ) 0 x t N 1 ( ) 2 2 N 1 N 1 1 母 平 均 演習6(計算の手順) (1)平均を求める。 (2)標準偏差 sx を求める。 (3) s / N 1 を計算する。 x • (4) つぎに示す t 分布表で、自由度 ν=N-1 の t 分布の5%棄却 点の値を読み取る。 • (5)区間推定の公式を用いて、母平均 の95パーセント信頼区間を求める。 演習6(自由度 ν=N-1 の t-分布の 棄却点の値 tN-1(α/2) の読み取り方) α のこ と ν p 0.9 0.8 … 0.05 1 .158 .325 … 2 .142 .289 … ∶ 9 0.02 … 12.706 31.821 … 4.303 6.965 … 2.262 2.821 … ∶ .129 .261 … ∶ ∶ ∞ … … 統計的検定の基本的な考え方(1) 区間推定の方法の復習ー1 母平均の区間推定の場合には、ある母集団から N 個の標本を手にしたとき、標本平均及び標本 標準偏差からつぎの量 t 、すなわち sx t ( x 0 ) / N 1 を計算すると、この量 t の値が、つぎの区間に 入る確率が、 統計的検定の基本的な考え方(2) 区間推定の方法の復習ー2 prob t N 1 t t N 1 1 . 2 2 となることを用いてこの式を変形し、μ0 につい て解くと、先ほど演習した、当該標本が得られ たもとの母集団の母平均の区間推定の公式 が導けることを学んだ。 統計的検定の基本的な考え方(3) 母平均の統計的検定(1) これに対して、ある母集団から N 個の標本を手 にしたとき、標本平均及び標本標準偏差からつ ぎの量 sx t ( x 0 ) / N 1 に入る確率を t t N 1 が t N 1 t , 2 2 考えてみよう。つまり、 自由度 v = N-1 の t-分布で、 横軸の値 t がこの図の斜線部に入る確率 裾野の両側 の斜線部の 合計が α 確 率 t- 分布 t - t N-1(α/2) 1-α t N-1(α/2) 統計的検定の基本的な考え方(4) 母平均の統計的検定(2)(参考) 上の分布の特徴からは、次式が成り立つ: sx prob t N 1 ( x 0 ) / , 2 N 1 sx ( x 0 ) / t N 1 . 2 N 1 この式を変形し x について解くと、つぎのよう になる。すなわち、 統計的検定の基本的な考え方(5) 母平均の統計的検定(3)(参考) sx prob0 t N 1 x, 2 N 1 s x x 0 t N 1 . 2 N 1 上式は、データが母平均μ0 なる母集団からの標 本ならば、標本平均が上記の範囲に入る確率は α % である、ことを意味している。 統計的検定の基本的な考え方(6) 母平均の統計的検定(4)(参考) ここでの αは、検定の文脈では危険率あるいは有 意水準と呼ばれる。 αは、通常、5% か1% が選ばれる。 また、「データが母平均μ0 なる母集団からの標 本である」という言明は、統計的検定の文脈で は、帰無仮説と呼ばれ、つぎのように表記され る: H 0 : 0 統計的検定の基本的な考え方(7) 母平均の統計的検定(5)(参考) ところで、危険率 α が5% の場合、データが母平 均μ0 なる母集団からの標本ならば、標本平均が 上記の範囲のような極端な値を取る可能性は、 100回のサンプリングでも5回ぐらいしかな いことになる。 万が一、うえの帰無仮説のもとで、このような 起こり得そうもないことが起きた場合、我々は その帰無仮説を捨てる。これを、統計学では、 帰無仮説を棄却する、という。さもなければ、 我々は、帰無仮説を採択する。これが、検定で ある。 統計的検定の基本的な考え方(8) 統計的検定における2種類の過誤 統計的検定における第1種及び第2種の過誤 (1) 第1種の過誤 : 帰無仮説が正しいのに、棄却する確率 (2) 第2種の過誤 : 帰無仮説が間違っているのに、採択する確率 2種類の過誤の関係 2種類の過誤は、一方を大きくすると他方は小 さく なり、その逆も成り立つという二律背反の関係 にある。
© Copyright 2024 ExpyDoc