5章 標本と統計量の分布 湯浅 直弘 5-1 母集団と標本 ■母集合 今までは確率的なこと これからは,確率や割合がわかっていないときに, 推定することが目標. 個体:実験や観測を行う1つの対象 母集団:個体全部の集合 ・有限な場合:有限母集合→1つの箱に入っているねじ. ・無限な場合:無限母集合→将来つくられると思われるねじ. ■調査と標本 全数調査:母集団の個体すべてを調べること. 例:国勢調査,ファラの下ネタ発言 無限母集合は全数調査はできない. ※全数調査は多大な労力,費用,時間がかかる. ↓ 一部から,効率よく傾向や特性などが分かれば 嬉しい. 標本に関する用語 標本調査:母集団から1部の個体を抽出して特性を 推測する 標本抽出:母集団から1つの固体を抽出する 標本:抽出した固体の集合 標本の大きさ:個体の総数 無作為抽出:特性を推測するため,無作為に抽出. 無作為標本:無作為抽出によって取り出された標本. ■乱数表 乱数:無作為に抽出するための1つの手法として用 いる. 乱数表:0から9までの数字を同確率で独立に並べ たもの.P.212 ・復元抽出:重複を認める ・非復元抽出:重複を認めない. 層別抽出:母集団を性別や年齢などの層に分けて, それより抽出を行う手法. より正確な情報が得られる. 例題 例 100人の学生の中から10人を無作為抽出する. 解 00から99まで番号付けする 乱数表から2桁ずつを1つの数字として10個抽出. 今回は乱数表の10行目から抽出した. 96|75|41|76|76|55|65|94|41|05|47 この番号付けされた学生を抽出すればよい. 5-2 標本の整理 ■度数分布 抽出した標本から母集団の特性を推測する ために標本を整理する. 数値の範囲を区間に分けて,標本の個数を 数える. 階級:各区間のこと. 度数:その区間に入る標本の個数. 度数分布表. 身長の度数分布表 ■標本平均 抽出した標本の平均値. 標本の大きさn,各標本の値x1,x2,x3...xn 1 n 1 x xi ( x1 x2 ... xn ) n i 1 n 全体ではなく,抽出した標本についての算術平均. ・中央値(median):標本の値を並べたときの中央にある値. ・奇数なら,ちょうど真ん中. ・偶数なら,真ん中の値の平均を取る. ・最頻値(mode):度数分布表で度数のもっとも大きい階 級の標識の値.(一番出現する値.) 例題 ※例1.乱数を100個取得して,その値から度数分布表を生成. その値から標本平均を求める. ※例2.身長の度数分布から標本平均を求める. 標本値を用いたとき 全員の測定値を標本としたとき 度数分布は全員の計測値を元に計算した値のため,近似している. ■標本分散 標本のばらつきを示す量.各標本値と標本平 均との差を2乗した値. 標本標準偏差:標本分散の平方根s 標準分散σ^2は全体が分かっているときの分散 標本分散s^2は全体から抽出した標本について計 算した値. 5-3 統計量の性質 ■母集団の分布 母集団分布:有限母集団の数値付けを行った個体 に対して確率変数に従うときの値. 母集団分布の特性 母数 ・母平均:μ ・母分散:σ^2 ・母標準偏差:σ ・母比率:ある特性を持っている個体の割合 例題 不良品が20本含まれているねじ100本を母集 団とする. 不良品には1,正常品0と数値付ける. 母平均μ=1*0.2+0*0.8=0.2 母分散 σ^2={1-0.2}^2*0.2+{00.2}^2*0.8=0.16 不良品の割合母比率p=20/100=0.2 ■標本の分布 標本値から母集団の分布を考える. 母集団から標本xiを抽出するときの確 以上.率変数Xiを標本確率変数という 標本確率変数の平均(標本平均) 標本確率変数の分散(標本分散) 標本平均の分布を知るには, 大きさnの標本から多数回x~を計算することが重要 ■標本平均の期待値と分散 標本平均の期待値 E[X]=μ(母集団の平均) 標本平均の分散 E[(X-μ)^2]=σ^2(母集団の分散) 標本平均の期待値は母平均に等しい. 標本平均の分散は母分散を標本の大きさで 割ったものに等しい ■標本分散の期待値 標本分散S^2の期待値は母分散で表せる. 標本分散の期待値は母分散σ^2の(n-1)/n倍に等しい. 終わり. 標本空間に対する確率変数では根元事象に対して 数値を対応させたもの. 例えば,サイコロを振るとき1,2,...6の数値に対応す る6個の根元事象のみを確率変数に含ませる. 確率が先に分かっているとき. 母集団に対する確率変数では無限回の測定の個 体を数値化して対応させたもの. 無限回の測定結果を確率変数に含ませる. 全数調査をして初めて決まる.
© Copyright 2024 ExpyDoc