母平均の区間推定 (第3章 統計的推定 補足) 統計学 2008年度 母集団(個体数N) × × × 標本(個体数n) × × × • • × × 母平均μ • × × 標本平均x 区間推定 母集団の一部として選ばれた標本の情報に基づき、母集団の特徴を推 論することが統計的推論である。 その1つに、「母平均を標本平均から推定する」ということがあるが、標本 平均が母平均にピタリと一致することはあまりなく、標本平均のまわりの ある区間を考え、その中に母平均が含まれる(可能性が高い)という推定 をおこなう。これが区間推定である。 たとえば、日本全国全世帯の家計の平均年収を知りたいとき、1万世帯 を標本として調査し、500万円という標本平均を得たとする。この500万 円±10万円という区間をとればよいのか、±30万円という区間を取れば よいのかを考えていく。(区間が広がれば母平均が含まれる可能性は高 くなるが、実用性に劣る) 母集団(大きさ N) 標本(大きさ n) × × × • 標本平均 x × × × × × × × × 標本平均 x × × 標本平均 x × × × 標本調査をおこなう場合、 通常は1つの標本について の標本平均がわかるだけで あるが、とりうるすべての標 本について標本平均を知る ことができたなら、その分布 を考えることができる。これ を標本分布という。 母平均 μ • 標本平均 x の分布の特性値は、 E( x ) V (x) 2 n N n 2 N n (正確には であるが、 Nが十分大きい場合 1となる。 ) N 1 n N 1 である。 • また、正規分布の再生性および中心極限定理から x の分布は、 母集団が正規分布にしたがうとき、または正規分布にしたがうかど うか分からなくても、nが十分に大きいときには となる。 2 N(μ, n ) (平均μ、分散 2 の正規分布) n x の分布 zの分布 標準化 z 1.96 n x 1.96 × μ 1.96 n × x x n -1.96 0 1.96 n x 1.96 × n 標準正規分布にしたがう確率変 数のうち、95%は、-1.96と1.96の 間の値をとるので、 x の95%は ( 1.96 n , 1.96 n ) という区間内に含まれる。 このことから、 ( x 1.96 n , x 1.96 n ) という区間(信頼区間)の95%は、 母平均μを区間内に含むといえ 母集団(個体数N) × × × 標本(個体数n) × × × • • × × 母平均μ 母分散σ2 • × × 標本平均x 区間推定 標本分散s2 標本平均 x の信頼区間の構成には、標本平均 、標本の個体数n、母 分散σ2が用いられる。 しかし、母平均がわからない状況で、母分散が分かっていることはあまり 多くない。(過去の調査において母分散のおおよその値が分かり、それを 用いるなどの例外はあるが) そのため、母分散σ2の代わりに標本分散s2が用いた区間推定をおこなう ことが多い。 x の分布 zの分布 標準化 z 1.96 n μ 1.96 x n -1.96 0 1.96 n tの分布 母分散が分からない場合、 t x が自由度n-1の s n 1 t分布にしたがう。 t統計量の95%が含まれる区 間の境界値であるt0.95の値を、 t分布表から探し出す。 変換 t (自由度n-1のt分布) x s n 1 -t0.95 t0.95 母分散σ2と標本分散s2の相違点 母分散σ2は定数であるのに対し、標本分散s2は確率変数である。 ns2 2 は自由度n-1のχ2 (カイ2乗)分布にしたがう。 カイ2乗分布の密度関数 0.6 自由度1 自由度2 自由度3 自由度4 自由度5 自由度6 0.5 0.4 0.3 0.2 0.1 0 0 2 4 6 8 10 12 x の分布 tの分布 変換 t x s n 1 μ -t0.95 t0.95 0 × × そのため、zとは異なり、tと x は1対1 対応をするわけではない。(同じ大き さの x であっても、sの大きさによって 対応するtの大きさが異なる。) sの変動も考慮に入れた上で、信頼区 間を構成することになる。 × x の分布 母分散が分からない場合の 信頼区間は、±1.96より広め の±t0.95を用いて構成される。 μ x t0.95 s n 1 s(正確には不偏分散 sˆ )とσ が等しいとき、母分散が分か らない場合のほうが信頼区間 が若干広くなる。 × x x t0.95 × × s n 1
© Copyright 2024 ExpyDoc