モジュール1のまとめ

統計学
第5回
西山
第4回のまとめ
主な確率分布
バイナリー分布(0‐1分布)
一様分布
正規分布 N(平均、分散)
正規分布の確率の求め方
1. 標準値に直す ⇒ 平均0、分散1
2. 数値表の使い方
1シグマ
区間じゃ
復習クイズ
1.確率変数Xは正規分布N(168,100)に従っている.確率
P(158 ≦ X ≦ 178)を求めなさい.更に、同じ分布で確率
P(170 ≦ X < 180)を求めなさい.
2.一様分布U[0,1]に従う確率変数Xから新たにY=2X+1
のように変数Yを定義する。E[Y]とV[Y]を求めなさい.
3.確率変数Xの確率分布は次の式で表される.
ax, 0  x  2
f ( x)  
 0, その他
定数aの値を求め、さらにE[X]とSD[X]を求めなさい.
2シグマ区間
はどうなる?
で、確率は?
3シグマも
たまあに使
うぞ!
第5回目の目標
標本分布とは何のことか?
データの平均値(=標本平均)の分
布とばらつき方
ここが最初の
難関かも知れ
んな
教科書: 第3章の頁99~108、特に
108頁の例題29
第3章に進みます
1.
2.
3.
第3章は難所です.
第3章は統計理論の急所です.
第3章はポイントだけをとりあげます.
まず、データは無作為が原則です!
サイコロを10回ほど振ってみましょう・・・
不規則というか
ランダムだなあ
1、1、4、6、4、3、2、3、6、5
得点状況をちょっと10人くらい見てみるか・・・
15、95、70、73、88、25、98、69、71、73
ン?これは作為がありますヨ、
図星でしょ!
なぜ無作為データであるべきか?
1.故意にとるデータは捏造と呼びます.
2.ランダムであるとき必然性が現れます.
つまりランダムにとったデータの結果だ
けは、定理や法則が知られています.
では、ちょっと実験してみよう
正しいサイコロを2個振って出る目の平均を
とろう・・・どうなる?
データ1
1回目
2回目
3回目
4回目
5回目
平均
分散
データ2
4
2
1
5
1
2.6
2.64
ここに出てくる
分布を標本分
布と言うな
2
5
5
5
3
4
1.6
標本平均 標本分散
3
1
3.5
2.25
3
4
5
0
2
1
3.3
1.65
0.96
1.89
ちょっと5回
やってみたん
じゃが・・・
平均値はや
るたびに違う
のう
5回くらいじゃ分からん!1000回やれ!
標本平均の分布
180
160
140
120
100
80
60
40
20
0
最大値
最小値
平均値
分散
1- 1.5- 2- 2.5- 3- 3.5- 4- 4.5- 5- 5.51.5 2 2.5 3 3.5 4 4.5 5 5.5 6
6
1
3.475
1.439314
着目点は分布の
中心とバラツキ
じゃ
1.これまた別の分布の形になりましたね
2.平均は元の値だが、分散は2.92の2分の1になりました.
データ数を増やすと・・・
2個のサイコロだと
う~む、何か法則
がありそうじゃのう
10個に増やすと
標本平均の分布
標本平均の分布
250
180
160
140
120
100
80
60
40
20
0
200
150
100
50
1- 1.5- 2- 2.5- 3- 3.5- 4- 4.5- 5- 5.51.5 2 2.5 3 3.5 4 4.5 5 5.5 6
最大値
最小値
平均値
分散
6
1
3.475
1.439314
1.
51
1. .86
86
-2
2. .22
22
-2
2. .58
58
-2
.
2. 94
94
-3
3. .3
33
3. .66
66
-4
4. .02
02
-4
4. .38
38
-4
.
4. 74
74
-5
.1
0
最大値
最小値
平均値
分散
5.1
1.5
3.4806
0.312917
理論としてはこうなる!
第3章の定理8が
基本じゃが、
定理10までは落と
せんな
平均がμ、分散がσ2 である集団から無作為に取り出した n 個のデータを X 1 , X 2 , X n と
し、データから求められる標本平均を X とおく。このとき、 X の標本分布の平均と分散は
それぞれ
E X   
V X  
となる。
形は常に正規分
布と思っていいの
じゃ・・・
2
n
教科書106頁
とにかくこれを使い
こなすのがポイント
じゃ
理論的に求めよう・・・
2個の正しいサイコロを振って出る目の平均と分散は
さっきの表を見な
がら定理8を証明
してごらん

E X   3.5


  V X   2.92  1.46
2
  2.92

2
  3 .5
では10個のサイコロを振ったときについて同じ質問!
実験結果と
合ってるじゃ
ろう?

E X   3.5



 V X   2.92  0.292
2
  2.92

10
  3 .5
データの結果もばらつきます
いくつかのデータの結果を統計量と言いま
す.代表例は平均値と分散、標準偏差.
 統計量は特有の確率法則にしたがいます.
この分布のことを標本分布と言います.
 特に標本平均(=データの平均)の標本分
布は重要です.

練習問題(1)
ある乗用車のブレーキはかけてから40メートルで停止するよう
に作られている.ただ踏み込むときの強さなどから停止距離に
はバラツキがあり、その標準偏差は1メートルとおいてよい.い
ま10回反復してブレーキのテストを行うと、10回の停止距離の
平均値はどの程度の値になるか.1シグマ区間で解答しなさい.
EX   40
1
V X  
 0.1 SDX   0.1  0.32
10
2
練習問題(2)
旅客機利用客の体重は全体として平均55Kg、標準偏差
10Kgで分布していると言われる。では定員400人が満席の
時の旅客総ウェイトの最大値をいくらと見込むとよいか?
標本平均の分布
合計をきいてい
るが、合計と平
均は紙一重じゃ
250
200
150
100
0
-5
3.
53
.83 83
-5
4.
54
.14 14
-5
4.
54
.44 44
-5
4.
54
.75 75
-5
5.
55
.05 05
-5
5.
55
.35 35
-5
5.
55
.66 66
-5
5.
55
.96 96
-5
6.
56
.26 26
-5
6.5
7
こうなることは理論
的にわかっておっ
た!定理8じゃ!
50
53
.53
総ウェイト= 400 
(400人の平均体重 )
最大値
最小値
平均値
分散
56.56709
53.53117
55.00031
0.256368
実験結果
じゃ
練習問題(2)の解答
全体として平均55kg、標準偏差10kgで分布している.
つまりμ=55、σ2=102だから
平均値の分布
E X   55
10 2
V X  
 0.25  SDX   0.25  0.5
400
図を描いて、2
シグマ区間を
示しなさい
最大値は3シグマ区間の上限で憶測するのが簡単な方法だから
Xの最大値  55  3  0.5  56.5
心配なら4シグマ
をとればまあ安心
じゃ.最大57kg
じゃナ!
次回への予習のポイント
次回は
標本平均の分布について問題が解けるよう
になってもらいます
教科書の関係部分:頁104~116までの特
に例題を参照してください