PDFファイル

基礎統計
第6回講義資料
確率変数
4.3 確率変数
定義4.4 確率変数
ある変数 があって、次の2条件
(1) のとりうる値の全体
がわかっている。
(2)
の各値に確率が与えられている。
が満たされているとき、 を確率変数という。
-離散型確率変数
-連続型確率変数(4.5節)
確率分布:与えられた確率がどのように分布している
のかを表したもの
4.3.2 離散型確率変数
•
•
が飛び飛びの値しか取らない場合
の確率分布
• 定理4.5
(1)
(2)
無限個の場合
離散型確率変数とすると
確率変数の性質: 期待値
確率変数の平均
離散型確率変数
を
に対して,
の平均または期待値という。
例題(期待値)
• 例4.16(宝くじ) 発行枚数1万枚
当選金(円)
0
100
1000
10000
枚数
9000
800
150
50
xk
0
100
1000
10000
P( X  x k )
0.9
0.08
0.015
0.005
E ( X )  0  0.9  100  0.08
 1000  0.015  10000  0.005
 73
練習問題
1から9までの整数が書かれたカードがある.
この中から7枚のカードを無作為に取り出して,
書かれている数字の最大値を とする.
①
②
となる確率
の期待値
を求めよ.
を求めよ.
期待値の線形性
a, b を定数とすると,
宝くじ(手取り額)の例
E (0.9 X )  0.9 E ( X )
 0.9  73
 65.7
任意の関数
が成り立つ。
と
に対して
定理4.7 平均は最小2乗値
• 以前、定理2.1 で紹介した性質が、確率変数の平均について
も成り立つ。
• 定理4.7 実数 c の関数 h(c) を
と定義すると、これは
なる。
において最小と
確率変数の性質: 分散と標準偏差
• 確率変数の分散
の分散を
で表し,次式で定義する。
ここに
である。また,分散の正の平方根を
の標準偏差といい,
で表す:
例:2つの確率変数(期待値が同じ)
k
0
1
2
3
4
5
0.2
0.2
0.2
0.1
P( X  k ) 0.1 0.1
P(Y  k ) 0
0.1
0.2
0.4
0.2
0.1
E ( X )  E (Y )  3
V (X )  3
V (Y )  (0  3) 2  0  (1  3) 2  0.1  (2  3) 2  0.2
6
0.1
 (3  3) 2  0.4  (4  3) 2  0.2  (5  3) 2  0.1
 (6  3) 2  0
 0.4  0.2  0.2  0.4
 1.2
V ( X )  V (Y )
0
例題(分散)
• サイコロの目
定理4.8
補足:チェビシェフの不等式
• 平均と分散しか分かっていない(確率分布はわからない)とき,
確率の見当をつけるのに有効.
チェビシェフの不等式
確率変数 の期待値と分散を
として,任意の
に対して
が成り立つ
• 平均から標準偏差の
 k 倍以上離れる割合は高々
である.
• 分布が単峰で対称と考えられるとき,平均から標準偏差の
±3倍以上離れる確率は0に非常に近い
正規分布
など
例題:チェビシェフの不等式
• ある確率変数について
であることしか
についてどん
わかっていない.これから,確率
なことがいえるか。
チェビシェフの不等式
から
より
となり
1 2
P(0  X  2)  P(| X  1 | 1)  1  
3 3
約 0.677以上の確率
分布が正規分布の場合 0.91673
単位の変換(分散の性質)
• a, b を定数とし、a>0 とすると,次式が成り立つ。
V ( X  b)  V ( X )
V (b)  0
補足(注4.8): モーメント
• Xの(原点のまわりの)r次のモーメント(積率)
• Xの期待値(平均)のまわりのr次のモーメント
• Xのr次の標準化モーメント
• 分布の形状に関する指標
• 歪度(わいど)
• 尖度(せんど)
補足:モーメント母関数
• モーメント母関数
(離散型)
(連続型)
• モーメント母関数を繰り返し微分して0とおいた導関数から
各次数のモーメントがわかる
例:指数分布の場合
4.3.6 基準化変量
• 定義4.8 基準化変量
確率変数 X の基準化変量Z を次式で定義する。
• 定理4.10 基準化変量の平均と分散
確率分布の例
• 現象にふさわしい確率分布を用いる
• アンケートの項目反応の集計値 2項分布
• 航空機事故件数
• 捕獲再捕獲
ポアソン分布
超幾何分布
対数正規分布
• 生物・人体測定値
正規分布
• システムの耐久年数
ガンマ分布
離散型
• 所得・貯蓄額
連続型
離散型確率分布
• 超幾何分布
• 2項分布
• 多項分布
• ベルヌーイ分布
• ポアソン分布
• 幾何分布
• 負の二項分布
• 一様分布
4.4 離散型確率分布の代表例
• 4.4.1 コイン投げ、ベルヌーイ試行
回目に表が出る
は独立
ベルヌーイ試行と2項分布
• ベルヌーイ試行
 成功確率
,長さ n のベルヌーイ試行.
離散型
X=成功回数
• 2項分布(binomial distribution)
確率変数
• 期待値と分散
が次の確率分布を持つとき,
に従うといい,
は2項分布
と書く。
24
2項分布の期待値と分散
• 2項分布の期待値
• 2項分布の分散
例題:シュバリエ・ド・メレの問題
• 確率論が科学として歩みだしたきっかけとなった問題。
• 近代確率論
• 1654年 パスカル(1623-1662)とフェルマー(1601-1665)の間で取り交わさ
れた往復書簡が端緒と言われている。
• シュバリエ・ド・メレ(1607-1684) フランス貴族,賭博師
• パスカルにこの問題を持ち込んだ。
• [問題]
• 1個のサイコロで6の目を少なくとも1回だそうとするとき,4
回投げれば有利.
• 2個のサイコロでゾロ目(6,6)を少なくとも1回出そうとすれ
ば,24回投げれば良さそうだが,不利になるのはなぜか?
ポアソン分布(Poisson distribution)
離散型
• 稀にしか起きない現象を長い期間観測して数え上げた数の分布
• 工場で大量生産される製品の1日当たりの不良品の数(例4.26)
• 1日当たりの死亡事故件数
• 放射性物質からの放射線の単位時間当たりの放射回数
• プロシャの騎兵隊の訓練で、兵士が落馬しその馬に蹴られて死亡する
という事故の数(一軍団当たり)
• ポアソン分布
確率変数
布
が次の確率変数を持つとき、 はポアソン分
に従うといい、
と書く。
• 期待値と分散
28
2015/5/30
ポワソン分布と2項分布の関係
• 2項分布の平均値 np
np = λ (一定), n -> ∞ とすると p -> 0
ポ
ワ
ソ
ン
分
布
2
項
分
布
2項分布は平均λのポワ
ソン分布に近づく
λ=4
n=12
n=96
p=1/3
p=1/24
幾何分布と負の2項分布
• 成功Sの確率
ベルヌーイ試行
• 失敗Fの確率
• 最初の成功Sが出現するまでの試行回数(つまり何回目に初
成功したのか)をXとするならば, Xの確率分布は幾何分布と
呼ばれる
5回目で成功!
失敗
• K回目の成功を得るまでの失敗回数をXとするならば,Xの
確率分布は負の2項分布(パスカル分布)と呼ばれる
3回成功!
3回失敗
幾何分布(geometric distribution)
離散型
• 最初の成功Sが出現するまでの試行回数Xの確率分布
• 幾何分布
確率変数 が次の確率分布に従うとき、 は幾何分布
に従うといい、
と書く。
• 期待値と分散
• 失敗の回数(試行回数ー1)にて表現することもある.
幾何分布と無記憶性
• 幾何分布は
を満足する
ある一定の時間客が来なかったという情報は、
客の来店確率を評価することには役立たない。
負の2項分布(パスカル分布)
(negative binomial distribution)
• K回目の成功を得るまでの失敗回数X
• 特徴:幾何分布の一般化
先の幾何分布に従う確率変数XをY=X-1と置くことで、
Yは初めて成功するまでの失敗回数となり,幾何分布に
従う。そのとき期待値は q/p .
• 期待値と分散
非復元抽出と復元抽出
• 集団からr個のものを取り出す際に
• 1つずつ元に戻さずに取り出す(非復元)
• 集団の構成は変化する
• 超幾何分布
• その都度元に戻してから,新たに取り出す(復元)
• 集団の構成は常に同じ
• 二項分布
同じ条件で繰り返す場合
超幾何分布(hypergeometric distribution)
離散型
• 確率分布
• N個のボールのうちM個が白,N-M個が黒とする.非
復元抽出で,n個のボールを無作為に選んだときに x
個が白である確率
N
M
N-M
n
x
湖にいる魚の総数の推定
4.5 連続型確率分布
• 確率変数
が連続の値をとりうる場合、
数という。
• 確率
• 確率密度関数
• 分布関数
を連続型確率変
連続型確率変数の期待値と分散
• 期待値
• 分散
正規分布
(normal distribution)
• 代表的な連続型の確率分布
• C.F.ガウスによって提案された誤差関数が原型
• F.ゴルトンにより正規分布と呼ばれるようになる
• 確率密度関数
• 期待値と分散
正規分布(期待値が異なる場合)
μ= 0, σ=1
0.45
0.4
μ=-2, σ=
1
μ= 2, σ=1
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-6
-4
-2
0
2
4
6
正規分布(標準偏差が異なる場合)
0.9
0.8
μ=0, σ=0.5
0.7
0.6
μ=0, σ=1
0.5
0.4
μ=0, σ=2
0.3
0.2
0.1
0
-6
-4
-2
0
2
4
6
標準正規分布
(standard normal distribution)
• 標準化変数
• 密度関数
• 累積分布関数(付録の数表)
41
確率を求めるには?
• 正規分布表(上側確率)を利用する.
平均
正規分布
分散
に従う
標準化変量に変換する
標準正規分布
平均0、分散1の標準正規分
布の数値表を利用して、確率
を求める
正規分布に従う確率変数
について
より
で置換積分すると
,
,
より
標準正規分布に従う確率
変数
確率を求めるには?
例題
• 平均 50, 標準偏差 10 の正規分布に従う成績データ
があるとする.
• 50点以上51点以下の割合は?
付表1より
指数分布
(exponential distribution)
• 待ち時間の分布: 寿命,耐用年数,災害までの年数
• 確率密度関数
• 累積分布関数
0.12
• 期待値と分散
0.1
0.08
0.06
0.04
0.02
0
0
10
20
30
40
ガンマ分布
(Gamma distribution)
0.6
0.5
0.4
0.3
0.2
0.1
0
-5
5
15
• 指数分布の一般化(α=1のとき指数分布と一致)となる分布
• 正の値をとり,右に歪んだ分布
• 確率密度関数
ガンマ関数
• 期待値と分散
25
ガンマ分布
0.6
0.5
0.4
α=3,λ=2
α=3,λ=1/3
0.3
α=3,λ=1/5
α=3,λ=1
0.2
0.1
0
0
5
10
15
20
25
ガンマ分布
• α個の確率変数が互いに独立で指数分布に従うならば,
その確率変数の和はガンマ分布Ga(α,λ)に従う.
• 標準正規分布の2乗はガンマ分布Ga(1/2,1/2)に従う.
• ガンマ分布Ga(n/2,1/2)は自由度nのχ2(カイ二乗)分
布といわれる.
4
ベータ分布
(Beta distribution)
3
• 確率密度関数
0
2
1
0
ベータ関数
• 期待値と分散
• テスト得点の得点構造の分析などに利用
0.5
1
ベータ分布
α=8,β=2
4
3.5
α=1/2,β=1/2
α=5,β=5
3
2.5
2
α=2,β=8
1.5
1
0.5
0
0
一様分布
(α=1,β=1)
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
一様分布(連続型)
(uniform distribution)
• テキスト 例4.31(p147)参照
• 確率密度関数
• 期待値と分散
• ベータ分布が
布と一致する
のとき (0,1)区間の一様分
コーシー分布
(Cauchy distribution)
• 確率密度関数
• 外観は正規分布に似ている
• 期待値、分散が存在しない
標準正規分布
0.7
0.6
λ=0, α=0.5
0.5
0.4
λ=0,α=1
0.3
λ=0,α=2
0.2
0.1
0
-4
-3
-2
-1
0
1
2
3
4
対数正規分布
(log-normal distribution)
• 正の値のみをとる確率変数 X (例:世帯の所得分布)
•
のとき, Xは対数正規分布に従う.
• 確率密度関数
• 期待値と分散
μ=0,σ=1
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
1
2
3
4
5
パレート分布
(Pareto distribution)
• 所得分布(特に高額所得)として用いられる
• 確率密度関数
• 期待値と分散
2
ワイブル分布
(Weibul distribution)
• 製品の耐用年数,寿命など
1.5
1
0.5
0
0
2
4
6
-0.5
• 瞬間故障率が一定(偶発故障)の場合は指数分布に従う
• 劣化の進行に伴い,故障率が増加する
• 初期故障では故障率が減少する
ワイブル分布
• 確率密度関数
尺度母数
形状母数
• 期待値と分散
ワイブル分布
2
1.8
a=1,b=0.5
1.6
a=1,b=3
1.4
1.2
a=1,b=1
a=2,b=3
1
0.8
a=3,b=
3
0.6
0.4
0.2
0
0
-0.2
1
2
3
4
5
6
次回の講義内容(6/8)
• 第4章:確率モデル
• 4.1 標本空間と事象
• 4.2 確率
• 4.3 確率変数
• 4.4 離散型確率分布の代表例
• 4.5 連続型確率分布