確率と統計

確率と統計
平成19年11月22日
(徐々に統計へと進みます)
今日の内容
1. 確率変数と期待値
2. 母集団と標本
3. パラメータと統計値
(μとm、およびσ2とs2)
4. 標本平均とその分散
確率変数と期待値
• 確率変数とは:
– 無作為行為により定義される(得られる)値を
とる変数のこと。
– 例:
• サイコロ投げでの出る目
• コイン投げでの裏表
• 箱から取り出される球の色 などの値をとる変数
確率変数の例
• サイコロ投げ
– 出る目: 1, 2, 3, 4, 5, 6 (確率変数Xのとる値)
• このように無作為行為により与えられる値をとる
変数(これをXとする)を、確率変数という。
• 「確率変数Xは1, 2, 3, 4, 5, 6の値をとり、Xが
それぞれの値をとる確率は、1/6である。」などと
いい、例えば P( X = 1 ) = 1/6 あるいは、P{ X =
1 } = 1/6 のように書く。
確率変数の例
(サイコロ投げ)
• 出る目: 確率変数X
• Xの値: 1, 2, 3, 4, 5, 6
• P(X):
X
1
P(X) 1/6
2
3
4
5
6
1/6
1/6
1/6
1/6
1/6
確率変数の例
(コイン投げ)
• 結果: 確率変数X
• Xの値: H(表、Head), T(裏、Tail)
• P(X):
X
H
P(X) 1/2
T
1/2
確率変数の例
(球の取り出し)
• 出る球: 確率変数X
• Xの値: 赤、青、黒
• P(X):
X
赤
P(X) 1/5
青
黒
3/5
1/5
?
確率変数と期待値
• 期待値とは:
– 確率変数のとる値の平均値
– E(X)などと書く。
• 数学的定義:
– 確率変数Xの取りうる値をxi(i=1,2,…,n)、
各xiの生起確率をP(xi)とするとき、
– E(X) = x1・ P(x1) +x2・ P(x2) +x3・ P(x3)
+ … +xn・ P(xn)
確率変数と期待値
• 例:サイコロ投げ
• 出る目X(これは確率変数)の期待値は、...
(各自考えてみてください)
期待値の例
(サイコロ投げ)
• 出る目: 確率変数X
• Xの値: 1, 2, 3, 4, 5, 6
• P(X):
X
1
P(X) 1/6
2
3
4
5
6
1/6
1/6
1/6
1/6
1/6
• 期待値E(X) = 1*(1/6) + 2*(1/6) + … + 6*(1/6)
= (1 + 2 + … + 6)/6 = 21/6 = 3.5
確率変数の例
(コイン投げ)
• 結果: 確率変数X
• Xの値: H(表、Head), T(裏、Tail)
• P(X):
X
H
P(X) 1/2
T
1/2
• 期待値E(X)=H*(1/2) + T*(1/2) <- non-sense!
さて、…
“確率”というものを前提として、これから統
計の話に入ります。
母集団と標本
• 母集団とは:
– 一般に、研究や調査の対象となっている集団
のこと。
• 標本とは:
– 母集団を代表する一部分として実際に観察さ
れている集団のこと。
– 通常、母集団を対象とする実験や調査により
得られる。
母集団と標本
母平均:μ
母分散:σ2
母集団
無作為
抽出
標本平均:m
標本分散:s2
標本
パラメータと統計値
• パラメータ(母数):
– 母集団の特徴を表わす数値
– μ(母平均)やσ2(母分散)など
• 統計値(統計量):
– 標本の特徴を表わす数値(データから算出)
– m(標本平均)やs2 (標本分散)など
パラメータと統計値
μとmの関係
σ2とs2の関係
を調べてみよう。
定義の確認
• 平均 = (データの合計)÷(データの個数)
= ( x 1 + x2 + x 3 + … + xn ) / n
• 分散 = (偏差の自乗)÷(データの個数 - 1)
= {(x1 – m)2 + (x2 – m)2 + … +
(xn – m)2 } / (n – 1)
この式を利用する。
母集団と標本
標本平均:m
標本分散:s2
母平均:μ
母分散:σ2
無作為抽出
5
1
2
4
1
3
4
3
標本
(標本の大きさn=3)
母集団
(母集団の大きさN=5)
母集団の分析
• 母集団 : {1, 2, 3, 4, 5} (大きさN=5)
– μ = (1 + 2 + 3 + 4 + 5) / 5 = 3
– σ2 = {(1-3)2 + (2-3) 2 + (3-3) 2
+ (4-3) 2 + (5-3) 2 } / (5-1)
= (4 + 1 + 0 + 1 + 4) / 4
= 2.5
標本の分析(n=5)
• 標本 : {1, 2, 3, 4, 5} (大きさn=5)
– m = (1 + 2 + 3 + 4 + 5) / 5 = 3
– s2 = {(1-3)2 + (2-3) 2 + (3-3) 2
+ (4-3) 2 + (5-3) 2 } / (5-1)
= (4 + 1 + 0 + 1 + 4) / 4
= 2.5
m=μ=3 s 2 = σ2 = 2.5 (当たり前!)
全数調査だから
標本の分析(n=4)
•
•
•
•
•
標本1: {1, 2, 3, 4}
標本2: {1, 2, 3, 5}
標本3: {1, 2, 4, 5}
標本4: {1, 3, 4, 5}
標本5: {2, 3, 4, 5}
m = 5/2,
m = 11/4,
m = 3,
m = 13/4,
m = 7/2,
s2 = 5/3
s2 = 35/12
s2 = 10/3
s2 = 35/12
s2 = 5/3
mの平均 = (5/2+11/4+3+13/4 +7/2)/5 = 3 = μ
s 2の平均 = (5/3+35/12+10/3+35/12+5/3)/5
= 2.5 =σ2 (ぴったり一致!スゴイ)
標本の分析(n=3,2,1)
• n=3
標本1: {1, 2, 3}
標本2: {1, 2, 4}
標本3: {1, 2, 5}
標本4: {1, 3, 4}
標本5: {1, 3, 5}
標本6: {1, 4, 5}
標本7: {2, 3, 4}
標本8: {2, 3, 5}
標本9: {2, 4, 5}
標本10: {3, 4, 5}
n=2
n=1
標本1: {1, 2}
標本2: {1, 3}
標本3: {1, 4}
標本4: {1, 5}
標本5: {2, 3}
標本6: {2, 4}
標本7: {2, 5}
標本8: {3, 4}
標本9: {3, 5}
標本10: {4, 5}
標本1:
標本1:
標本1:
標本1:
標本1:
{1}
{2}
{3}
{4}
{5}
各自でそれ
ぞれのmとs2
を 計算して
みよう!
是非計算してみてみよう!
• (手を動かして、汗して学んだものはよく身
につきます。)
練習問題(宿題)
問題 母集団 {1, 2, 3, 4, 5} (大きさN=5)に
対して、大きさn=3の標本を作るとき、以下の
問(1)~(4)に答えよ。
(1)n=3のときの標本をすべて列挙せよ。
(2)これらの各標本の平均をそれぞれ求めよ。
(3)「上記(2)で求めた平均」の平均を求めよ。
(4)上記(3)で求めた平均と母平均を比べよ。
母平均
標本平均の平均
E(m) =μ
標本平均
証明して
みよう!
発展問題
標本平均mの性質(重要)
大きさnの標本から求めた標本平均mの
平均(期待値)と分散は、次の性質を持つ。
• E(m) =μ
(標本平均mの期待値は、母平均μと等しい。)
• V(m) = σ2/n
(標本平均mの分散は、母分散σ2の1/n。)
標本分散s2の性質(重要)
大きさnの標本から求めた標本分散s2の
平均は、次の性質を持つ。
• E(s2) =σ2
(標本分散s2の期待値は、母分散σ2と等しい。)
(注) E(s) =!=σ
確認
•
•
•
•
E(m)=μ
V(m) = σ2/n
E(s2)=σ2
E(s) =!= σ
レポート課題(1/2)
課題1 母集団:{1, 2, 3, 4, 5, 6}に対し、
n=3の標本を作るとする。このとき、
E(m)=μ, E(s2)=σ2
であることを確かめよ。
レポート課題(2/2)
1. 課題: 前記の課題1を行いなさい。
2. 提出日:平成19年11月29日(木)
授業時間中
3. 提出形式:A4レポート用紙(表紙をつけ
ること)。手書きでもOK.
「確かめました」等だけのものは
不可とします。
予告
順次推定と検定へと話を
すすみましょう。お楽しみに!
途中で、確率分布 の話
も入ります。予習しておく
といいかも…