正規分布(スライド) - So-net

正規分布
6-1
目的

正規分布の特徴

標準正規分布のグラフの面積

正規分布に従う変数の確率

標準化
6-2
はじめに

多くの連続的確率変数は、つりがね型(bell shape)の
確率分布

正規分布も、つりがね型で、ガウス分布
6-3
学生の身長の確率密度
6-4
学生の洋服の金額の確率密度
6-5
学生の洋服の金額の確率(4万円以下)
6-6
学生のヘアカットの金額の確率密度
6-7
正規分布の確率密度関数
1
f ( x) 
e
2
1  x 
 

2  
2
ここで、
e  2.718
  3.14
 =平均
 =標準偏差
6-8
正規分布の特徴

正規分布の形と位置は、平均と標準偏差の2つの変
数に依存

正規分布に従う確率変数は、それぞれ独自の正規分
布のグラフをもち、このグラフはその確率変数の平均
と標準偏差に依存して決定
6-9
正規分布の特徴(続き)

正規分布のグラフはつりがね型(bell shape)

平均値、中央値(メディアン)、全て同じ値となり、グラフ
の中央にある

グラフの中央に山がある

グラフは左右対称
6-10
正規分布の特徴(続き)

グラフは連続型(完全につながったグラフで、途切れや
穴がない)。ある値X に対してそれに対応する値Y が
ひとつ存在する。

グラフはX軸と交わらない(グラフがどれだけX軸に沿
って伸びても、X軸と接することは絶対にないが、限り
なくX軸に近づく)。
6-11
正規分布の特徴(続き)

グラフの下の総面積は1.00 、または100%。

平均μ、標準偏差σとすると、グラフにおいてμ±σの範
囲にある面積は約0.68(68%)。μ±2σならば面積は
約0.95(95%)、 μ±3σならば面積は約0.997(
99.7%)
6-12
標準正規分布

正規分布に従う確率変数は、それぞれ独自の平均と
標準偏差をもち、その値によってグラフの形と位置が
変化する。これを簡単化するため、標準正規分布を利
用。

標準正規分布は、平均ゼロ、標準偏差1の正規分布
6-13
標準化とZ値

標準化の式
z


x

Z値の意味: x    z 
Z値とは、ある値Xが平均から標準偏差の何倍分
離れているかを示す。
6-14
zから左側全ての面積
P( z  z0 )
0
z0
6-15
zから左側全ての面積(エクセルの計算)
P( z  1.99)  0.977
6-16
右側の面積
P ( z  z0 ) 
 1  P ( z  z0 )
6-17
右側の面積(エクセルの計算)
P( z  1.11) 
 1  P( z  1.11) 
 1  0.8665  0.1335
6-18
二つの値の範囲にある面積
P( z1  z  z2 ) 
 P( z  z2 )  P( z  z1 )
z1
0
z2
6-19
二つの値の範囲にある面積(例)
P( z  1.5)  P(1.5  z  1.5)
 P( z  1.5)  P( z  1.5) 
 0.9332  0.0668  0.8664
6-20
両側確率p(面積)  値z0
P( z  z0 )  0.05
z0  ?
6-21
グラフの下の面積

グラフの下の面積は、確率に対応しているので、グラ
フの高さ(確率密度)よりも重要。
6-22
まとめ

正規分布は、様々な変
数(身長、気温)を記述
する際に利用できる

正規分布はつりがね型
で、 中央に山があり、左
右対称の連続したグラ
フ。平均と中央値が一致
6-23
まとめ(続き)

平均ゼロ、標準偏差1
の標準正規分布が便
利

様々なデータ応用分
析を簡単化するため
に、正規分布ではない
確率分布であっても、
ほとんど正規分布と同
じであるとして、利用
可能。
6-24