基礎統計 第6回講義資料 確率変数 4.3 確率変数 定義4.4 確率変数 ある変数 があって、次の2条件 (1) のとりうる値の全体 がわかっている。 (2) の各値に確率が与えられている。 が満たされているとき、 を確率変数という。 -離散型確率変数 -連続型確率変数(4.5節) 確率分布:与えられた確率がどのように分布している のかを表したもの 4.3.2 離散型確率変数 • • が飛び飛びの値しか取らない場合 の確率分布 • 定理4.5 (1) (2) 無限個の場合 離散型確率変数とすると 確率変数の性質: 期待値 確率変数の平均 離散型確率変数 を に対して, の平均または期待値という。 例題(期待値) • 例4.16(宝くじ) 発行枚数1万枚 当選金(円) 0 100 1000 10000 枚数 9000 800 150 50 xk 0 100 1000 10000 P( X x k ) 0.9 0.08 0.015 0.005 E ( X ) 0 0.9 100 0.08 1000 0.015 10000 0.005 73 練習問題 1から9までの整数が書かれたカードがある. この中から7枚のカードを無作為に取り出して, 書かれている数字の最大値を とする. ① ② となる確率 の期待値 を求めよ. を求めよ. 期待値の線形性 a, b を定数とすると, 宝くじ(手取り額)の例 E (0.9 X ) 0.9 E ( X ) 0.9 73 65.7 任意の関数 が成り立つ。 と に対して 定理4.7 平均は最小2乗値 • 以前、定理2.1 で紹介した性質が、確率変数の平均について も成り立つ。 • 定理4.7 実数 c の関数 h(c) を と定義すると、これは なる。 において最小と 確率変数の性質: 分散と標準偏差 • 確率変数の分散 の分散を で表し,次式で定義する。 ここに である。また,分散の正の平方根を の標準偏差といい, で表す: 例:2つの確率変数(期待値が同じ) k 0 1 2 3 4 5 0.2 0.2 0.2 0.1 P( X k ) 0.1 0.1 P(Y k ) 0 0.1 0.2 0.4 0.2 0.1 E ( X ) E (Y ) 3 V (X ) 3 V (Y ) (0 3) 2 0 (1 3) 2 0.1 (2 3) 2 0.2 6 0.1 (3 3) 2 0.4 (4 3) 2 0.2 (5 3) 2 0.1 (6 3) 2 0 0.4 0.2 0.2 0.4 1.2 V ( X ) V (Y ) 0 例題(分散) • サイコロの目 定理4.8 補足:チェビシェフの不等式 • 平均と分散しか分かっていない(確率分布はわからない)とき, 確率の見当をつけるのに有効. チェビシェフの不等式 確率変数 の期待値と分散を として,任意の に対して が成り立つ • 平均から標準偏差の k 倍以上離れる割合は高々 である. • 分布が単峰で対称と考えられるとき,平均から標準偏差の ±3倍以上離れる確率は0に非常に近い 正規分布 など 例題:チェビシェフの不等式 • ある確率変数について であることしか についてどん わかっていない.これから,確率 なことがいえるか。 チェビシェフの不等式 から より となり 1 2 P(0 X 2) P(| X 1 | 1) 1 3 3 約 0.677以上の確率 分布が正規分布の場合 0.91673 単位の変換(分散の性質) • a, b を定数とし、a>0 とすると,次式が成り立つ。 V ( X b) V ( X ) V (b) 0 補足(注4.8): モーメント • Xの(原点のまわりの)r次のモーメント(積率) • Xの期待値(平均)のまわりのr次のモーメント • Xのr次の標準化モーメント • 分布の形状に関する指標 • 歪度(わいど) • 尖度(せんど) 補足:モーメント母関数 • モーメント母関数 (離散型) (連続型) • モーメント母関数を繰り返し微分して0とおいた導関数から 各次数のモーメントがわかる 例:指数分布の場合 4.3.6 基準化変量 • 定義4.8 基準化変量 確率変数 X の基準化変量Z を次式で定義する。 • 定理4.10 基準化変量の平均と分散 確率分布の例 • 現象にふさわしい確率分布を用いる • アンケートの項目反応の集計値 2項分布 • 航空機事故件数 • 捕獲再捕獲 ポアソン分布 超幾何分布 対数正規分布 • 生物・人体測定値 正規分布 • システムの耐久年数 ガンマ分布 離散型 • 所得・貯蓄額 連続型 離散型確率分布 • 超幾何分布 • 2項分布 • 多項分布 • ベルヌーイ分布 • ポアソン分布 • 幾何分布 • 負の二項分布 • 一様分布 4.4 離散型確率分布の代表例 • 4.4.1 コイン投げ、ベルヌーイ試行 回目に表が出る は独立 ベルヌーイ試行と2項分布 • ベルヌーイ試行 成功確率 ,長さ n のベルヌーイ試行. 離散型 X=成功回数 • 2項分布(binomial distribution) 確率変数 • 期待値と分散 が次の確率分布を持つとき, に従うといい, は2項分布 と書く。 24 2項分布の期待値と分散 • 2項分布の期待値 • 2項分布の分散 例題:シュバリエ・ド・メレの問題 • 確率論が科学として歩みだしたきっかけとなった問題。 • 近代確率論 • 1654年 パスカル(1623-1662)とフェルマー(1601-1665)の間で取り交わさ れた往復書簡が端緒と言われている。 • シュバリエ・ド・メレ(1607-1684) フランス貴族,賭博師 • パスカルにこの問題を持ち込んだ。 • [問題] • 1個のサイコロで6の目を少なくとも1回だそうとするとき,4 回投げれば有利. • 2個のサイコロでゾロ目(6,6)を少なくとも1回出そうとすれ ば,24回投げれば良さそうだが,不利になるのはなぜか? ポアソン分布(Poisson distribution) 離散型 • 稀にしか起きない現象を長い期間観測して数え上げた数の分布 • 工場で大量生産される製品の1日当たりの不良品の数(例4.26) • 1日当たりの死亡事故件数 • 放射性物質からの放射線の単位時間当たりの放射回数 • プロシャの騎兵隊の訓練で、兵士が落馬しその馬に蹴られて死亡する という事故の数(一軍団当たり) • ポアソン分布 確率変数 布 が次の確率変数を持つとき、 はポアソン分 に従うといい、 と書く。 • 期待値と分散 28 2015/5/30 ポワソン分布と2項分布の関係 • 2項分布の平均値 np np = λ (一定), n -> ∞ とすると p -> 0 ポ ワ ソ ン 分 布 2 項 分 布 2項分布は平均λのポワ ソン分布に近づく λ=4 n=12 n=96 p=1/3 p=1/24 幾何分布と負の2項分布 • 成功Sの確率 ベルヌーイ試行 • 失敗Fの確率 • 最初の成功Sが出現するまでの試行回数(つまり何回目に初 成功したのか)をXとするならば, Xの確率分布は幾何分布と 呼ばれる 5回目で成功! 失敗 • K回目の成功を得るまでの失敗回数をXとするならば,Xの 確率分布は負の2項分布(パスカル分布)と呼ばれる 3回成功! 3回失敗 幾何分布(geometric distribution) 離散型 • 最初の成功Sが出現するまでの試行回数Xの確率分布 • 幾何分布 確率変数 が次の確率分布に従うとき、 は幾何分布 に従うといい、 と書く。 • 期待値と分散 • 失敗の回数(試行回数ー1)にて表現することもある. 幾何分布と無記憶性 • 幾何分布は を満足する ある一定の時間客が来なかったという情報は、 客の来店確率を評価することには役立たない。 負の2項分布(パスカル分布) (negative binomial distribution) • K回目の成功を得るまでの失敗回数X • 特徴:幾何分布の一般化 先の幾何分布に従う確率変数XをY=X-1と置くことで、 Yは初めて成功するまでの失敗回数となり,幾何分布に 従う。そのとき期待値は q/p . • 期待値と分散 非復元抽出と復元抽出 • 集団からr個のものを取り出す際に • 1つずつ元に戻さずに取り出す(非復元) • 集団の構成は変化する • 超幾何分布 • その都度元に戻してから,新たに取り出す(復元) • 集団の構成は常に同じ • 二項分布 同じ条件で繰り返す場合 超幾何分布(hypergeometric distribution) 離散型 • 確率分布 • N個のボールのうちM個が白,N-M個が黒とする.非 復元抽出で,n個のボールを無作為に選んだときに x 個が白である確率 N M N-M n x 湖にいる魚の総数の推定 4.5 連続型確率分布 • 確率変数 が連続の値をとりうる場合、 数という。 • 確率 • 確率密度関数 • 分布関数 を連続型確率変 連続型確率変数の期待値と分散 • 期待値 • 分散 正規分布 (normal distribution) • 代表的な連続型の確率分布 • C.F.ガウスによって提案された誤差関数が原型 • F.ゴルトンにより正規分布と呼ばれるようになる • 確率密度関数 • 期待値と分散 正規分布(期待値が異なる場合) μ= 0, σ=1 0.45 0.4 μ=-2, σ= 1 μ= 2, σ=1 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 -6 -4 -2 0 2 4 6 正規分布(標準偏差が異なる場合) 0.9 0.8 μ=0, σ=0.5 0.7 0.6 μ=0, σ=1 0.5 0.4 μ=0, σ=2 0.3 0.2 0.1 0 -6 -4 -2 0 2 4 6 標準正規分布 (standard normal distribution) • 標準化変数 • 密度関数 • 累積分布関数(付録の数表) 41 確率を求めるには? • 正規分布表(上側確率)を利用する. 平均 正規分布 分散 に従う 標準化変量に変換する 標準正規分布 平均0、分散1の標準正規分 布の数値表を利用して、確率 を求める 正規分布に従う確率変数 について より で置換積分すると , , より 標準正規分布に従う確率 変数 確率を求めるには? 例題 • 平均 50, 標準偏差 10 の正規分布に従う成績データ があるとする. • 50点以上51点以下の割合は? 付表1より 指数分布 (exponential distribution) • 待ち時間の分布: 寿命,耐用年数,災害までの年数 • 確率密度関数 • 累積分布関数 0.12 • 期待値と分散 0.1 0.08 0.06 0.04 0.02 0 0 10 20 30 40 ガンマ分布 (Gamma distribution) 0.6 0.5 0.4 0.3 0.2 0.1 0 -5 5 15 • 指数分布の一般化(α=1のとき指数分布と一致)となる分布 • 正の値をとり,右に歪んだ分布 • 確率密度関数 ガンマ関数 • 期待値と分散 25 ガンマ分布 0.6 0.5 0.4 α=3,λ=2 α=3,λ=1/3 0.3 α=3,λ=1/5 α=3,λ=1 0.2 0.1 0 0 5 10 15 20 25 ガンマ分布 • α個の確率変数が互いに独立で指数分布に従うならば, その確率変数の和はガンマ分布Ga(α,λ)に従う. • 標準正規分布の2乗はガンマ分布Ga(1/2,1/2)に従う. • ガンマ分布Ga(n/2,1/2)は自由度nのχ2(カイ二乗)分 布といわれる. 4 ベータ分布 (Beta distribution) 3 • 確率密度関数 0 2 1 0 ベータ関数 • 期待値と分散 • テスト得点の得点構造の分析などに利用 0.5 1 ベータ分布 α=8,β=2 4 3.5 α=1/2,β=1/2 α=5,β=5 3 2.5 2 α=2,β=8 1.5 1 0.5 0 0 一様分布 (α=1,β=1) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 一様分布(連続型) (uniform distribution) • テキスト 例4.31(p147)参照 • 確率密度関数 • 期待値と分散 • ベータ分布が 布と一致する のとき (0,1)区間の一様分 コーシー分布 (Cauchy distribution) • 確率密度関数 • 外観は正規分布に似ている • 期待値、分散が存在しない 標準正規分布 0.7 0.6 λ=0, α=0.5 0.5 0.4 λ=0,α=1 0.3 λ=0,α=2 0.2 0.1 0 -4 -3 -2 -1 0 1 2 3 4 対数正規分布 (log-normal distribution) • 正の値のみをとる確率変数 X (例:世帯の所得分布) • のとき, Xは対数正規分布に従う. • 確率密度関数 • 期待値と分散 μ=0,σ=1 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 1 2 3 4 5 パレート分布 (Pareto distribution) • 所得分布(特に高額所得)として用いられる • 確率密度関数 • 期待値と分散 2 ワイブル分布 (Weibul distribution) • 製品の耐用年数,寿命など 1.5 1 0.5 0 0 2 4 6 -0.5 • 瞬間故障率が一定(偶発故障)の場合は指数分布に従う • 劣化の進行に伴い,故障率が増加する • 初期故障では故障率が減少する ワイブル分布 • 確率密度関数 尺度母数 形状母数 • 期待値と分散 ワイブル分布 2 1.8 a=1,b=0.5 1.6 a=1,b=3 1.4 1.2 a=1,b=1 a=2,b=3 1 0.8 a=3,b= 3 0.6 0.4 0.2 0 0 -0.2 1 2 3 4 5 6 次回の講義内容(6/8) • 第4章:確率モデル • 4.1 標本空間と事象 • 4.2 確率 • 4.3 確率変数 • 4.4 離散型確率分布の代表例 • 4.5 連続型確率分布
© Copyright 2025 ExpyDoc