スライド 1

確率と統計2011
2012年1月12日(木)講義資料B
Version 4
今日も検定、検定また検定
2
PROBLEM

全国10歳の女子の身長は、平均 μ = 140cm、標準偏
差σ = 5cmの正規分布に従うことが知られている。いま、
ある地域に住む10歳の女子25名の身長を調べたところ、
平均 m = 137cmであった。この地域の女子の身長は
全国水準と比べてどうか?
3
平均μ = 140cm
標準偏差σ = 5cm
平均μ = 137cm
標準偏差
4
平均μ = 140cm
標準偏差σ = 5cm
平均m = 137cm
標準偏差
標本平均 m = 140cm
標準偏差σX = σ/√n
5








仮説H0:その地域に関するデータは、全国データの標本で
ある。
定理:N(μ=140, σ2=25)から得られる標本に関して、
標本平均の平均はN( μ, σ2 / n ) に従う。
事実(調査結果): 標本の平均m=137cm。
分析: N( μ, σ2 / n ) = N( 140, 52/ 25 ) = N( 140, 1 ) に
おいて、平均値mが137cm以下か143以上になる
確率Pを計算する(両側検定)。
判断基準:有意水準を5%とする。
計算(標準化):
Z = ( m - μ) / (σ / √n) = -3 および正規分布表より、
P = 0.0027 < 0.05
仮説H0を棄却する。
結論:有意水準5%でその地域の女子の身長は
全国平均よりも低い。
6
データ分析の練習をしてみよう!
7
PROBLEM

あるガン性疾患Xの疑いのある患者60名のうち、最終的
にガンXの診断が確定した者は20名であった。いま、全
症例についてその血液型を調べ、A型の人数を数えた
ところ以下のようになった。ガンXの患者ではA型の人が
多いと言えるか?考察せよ。
ガン陽性(+)
A
型
+
-
合計
ガン陰性
(-)
合 計
15
5
15
25
30
30
20
40
60
8
考察

2行2列の表になっているので、2×2分割表の検定法
を適用する。
2
2
(15 25  15 5)  60
 
 7.5
20 40 30 30
9
PROBLEM

前立腺ガンの患者150名をランダムに2群に分け、A,B
2種類の方法で治療を試みた。一定期間後、両群の生
存・死亡数を比較したところ以下のようになった。治療法
により生存率が異なると言えるか?
生存者数
死亡者数
治療法A
治療法B
合計
55
20
35
40
90
60
75
75
150
10
(55 40  35 20) 150
 
 11.11
75 75 90 60
2
2
11
PROBLEM

シャープペンシル用の芯を作っている工場において、
製造した芯の太さの平均値μ(母平均)が0.90mmにな
るようにしないと、シャープペンシルに合わない芯が出
て顧客から苦情が来るため、母平均が0.90mmではな
くなったときは機械を止めて調整することにしている。
母平均が0.90mmかどうかは、毎日製造される芯の中
から、無作為に100本を取り出して、その太さを測りその
平均値mを計算することで調べている。いまmを求めた
ら0.91mmであり、また、標準偏差s=0.03mmであった。
この場合あなたはどういう判断を下しますか?
(機械を止めて調整する? まだしない?)
12
考察
条件設定:
 分かっているもの:
母平均μ
 標本平均m
 標本の大きさn


分かっていないもの:

母標準偏差σ
13
数学的事実
標本平均Xは、標本の大きさが十分大きければ、
N( μ, σ2/n ) に従う。
 従って、Z=(X-μ) / ( σ /√n ) は、N(0, 1) に従う。

【疑問】
この定理が利用できるためには、母平均と母標準偏差
がともに分かっていなければならない。
しかしながら、今の場合には分かっていない!
どうすればいいのか?
14
新たな事実

標本の大きさnが十分大きければ、s≒σ とおける。
15
考察(続き)
Z
X 
X   0.91 0.90


 3 .3

s
0.03
n
n
100
有意水準1%とすると、
|Z0| > 2.576 だから、母平均は0.90mmではない。
機械を止めて調整しよう!
16
PROBLEM (平均値の差の検定)

A社とB社の食料品を、それぞれ無作為に100個ずつ
取り出して、その濃度を測定したところ、ma=45.36%,
sa=0.35%, mb=45.24%, sb=0.40% であった。
両社の製品に関する濃度の母平均には差があるだろう
か? 統計的に検討しなさい。
17
①
②
③
④
仮説H:2つの母平均には差がない。μa = μb。
ma=45.36, mb=45.24,
sa=0.35=σa, sb=0.40=σb,
na=nb
z0 
45.36  45.24
0.35  0.40
100
2
2
 2.26
|z0|>1.96だから、有意水準5%でHは棄却。
(A社の方がB社のものより濃度が高い。)
18
根拠

2つの標本の元の分布が正規分布ならば、
ma-mbの分布もまた正規分布で、
N(μa-μb, σa2/na + σb2 /nb) になる。
また、nが十分大きければ元の分布が正規分布でなくて
も、中心極限定理により正規分布とみなしてよい。
19
(重要) 統計学で重要な定理の紹介

これ以外にもチェビシェフの不等式なども重要な事実
(定理)です。
P.20
定理1

(xの標本分布に関する定理)
P.21
x が正規分布 N(μ,σ2) に従うとき、大きさ n の無作為
標本に基づく標本平均 mは、正規分布 N(μ、σ2/n)
に従う。
定理2(重要)

(中心極限定理)
P.22
xが任意の分布(平均=μ,分散=σ2)に従うとき、大きさ
n の無作為標本に基づく標本平均 m は、 n が無限に
大きくなるとき、正規分布 N(μ、σ2/n) に従う。
問題1

1.
2.
mが165を超える確率は?
mが150未満となる確率は?
P.23
ある学力テストの得点Xは、正規分布N(160,202)
に従うとする。いま、大きさ16の標本をとり、その標本
の平均値mの値を求めるとき、
中心極限定理の利用法
1.
2.
mが2.4未満となる確率は?
mが2.4~2.7となる確率は?
P.24
問題1.
ある大学の受験生の母集団から無作為に
選んだ1人の受験生の成績を x とする。
いま、過去の経験から、 x は平均 μ= 2.5,
標準偏差 σ = 0.4 であることがわかっているも
のする。
このとき、この母集団から 36人の受験生の
標本を採り、標本平均 m を求めるとき、
問題1のヒント

落ち着いて考えよう。
P.25
中心極限定理より
s=σ/√n =0.4/√36
z=(x-m)/s =(2.4-25)・0.067=
P{m<2.4} =P{z<-1.50}=
(標準正規分布表を利用)
レポート(確認)

「総合演習レポート」の提出日は、
平成24年2月8日(水)17時です。
提出先は研A6階レポートボックスです。
26