統計的検定と推定

臨界値の算出法(Excelの場合)
=normsinv( 確率 ) 下側累積確率Pr(z≦z0)に対応するz値
例 =normsinv( 0.95 ) = 1.64
臨界値の算出法(Excelの場合)
=tinv(有意確率、自由度) 両側検定での有意確率に対応するt値
例 =tinv( 0.05, 10) = 2.23 (両側検定でα=0.05に対応するt値)
(注意)片側検定のときは確率を2倍する。
有意確率の算出法(Excelの場合)
=normsdist( z値 ) z0値に対応する下側(累積)確率 P( z≦z0)
(標準正規分布において、zがz0以下の値をとる確率)
例 =normsdist( 1.34 )=0.91 (右片側なら、有意確率p=0.09)
有意確率の算出法(Excelの場合)
=tdist( t値, 自由度, 尾部 ) t分布でP(t≧|t0|)の確率を返す
尾部:片側検定なら1、両側検定なら2を指定する
例 =tdist(1.54, 10, 2 )=0.144
練習問題
Q1. ある工場で直径1インチの軸棒を標準偏差0.03の
管理水準で製造している。
ある日の製造品の中から10本の標本をとって直径を測定
したところ、平均値が0.978インチであった。品質管理上、
軸棒の直径が短すぎるだろうか、それとも、異常なしと判断
して、製造を続けてもよいであろうか。
有意水準5%で検定しなさい。
Q1 解答
文意より、μ=1, σ=0.03
N=10, Xbar=0.978, α=0.05
Z=Xbar-μ/σ/√n
1.帰無仮説 :μ= 1
対立仮説 :μ< 1(⇒左片側検定)
2.σが既知なので、検定量はz分布(標準正規分布)に従う。
α=0.05のとき、臨界値z=normsinv(0.05)= -1.64
検定量が-1.64以下なら、帰無仮説を棄却する。
3.z0=(0.978 - 1) / (0.03/sqrt(10) )= -2.3187
有意確率 P(z<z0)=normdist(-2.3187)=0.0102
4.検定量は-2.32で、臨界値-1.64より小さいので、帰無仮説を
棄却する(正確な有意確率P( z >|-2.32| ) = 0.0102)。
有意水準5%レベルで、標本の平均値は母平均よりも小さい
と言える。すなわち、品質管理上異常があると言える。
練習問題
Q2. わが国の高校生の知能指数IQの平均は110、標準偏差は
10である。
ある高校の高校生49名をランダムに選び、IQを調べたところ、
49名の平均は112であった。
この調査結果から、この高校の高校生のIQの平均は、わが国の
高校生の平均より高いと言えるだろうか。
有意水準5%で検定しなさい。
Q2 解答
文意より、μ=110、σ=10、N=49 、X-bar=112、α=0.05
1.帰無仮説H0:μ=110
対立仮説H1:μ>110(右片側検定)
2.σが既知なので、検定量はz分布(標準正規分布)に従う。
α=0.05より、境界値z=normsinv(0.95)=1.64
検定量z0が1.64以上なら、H0を棄却する
3.検定量z0=(112-110)/(10/√49)=1.4
4.検定量は1.4で、臨界値1.64より小さいので、帰無仮説を
棄却できない。
(正確な有意確率P( z>1.4) =1-normsdist(1.4)=0.081)
帰無仮説を採択する。すなわち、この高校の生徒のIQが
我が国の高校生のIQの平均よりも有意に高いとは言えな
い。
練習問題
Q3. 生後1年の犬は標準食を与えた場合には1ヶ月に平均
100g、標準偏差40の割合で体重が増加する。
ランダムに選ばれた50匹の1歳の犬に特別なドッグフードを与
えると、1ヶ月で体重が平均115g増加した(標準偏差30 )。この
ドッグフードは1歳の犬の体重増加に効果があると言えるか。
有意水準1%で検定しなさい。
Q3 解答
文意より、μ=100、σ=40、N=50、Xbar=115, S=30、α=0.01
1. 帰無仮説H0: μ=100
対立仮説H1: μ>100(右片側検定)
2. σが既知なので、検定量zは標準正規分布N(0,1)に従う。
α=0.01より、臨界値はz=normsinv(0.99)=2.33
検定統計量z0が2.33以上のとき、H0を棄却する。
3.検定統計量z0=(115-100)/(40/√50)=2.65
4.z0=2.65>2.33より、帰無仮説を棄却できる。
(正確な有意確率P(z>2.65)=1- normsdist(2.65)=0.004)
有意水準1%レベルで、このドッグフードは犬の体重増加に
効果があると言える。
2.65
練習問題
Q4. ある教育学者が、日本の大学生の平均知能指数IQは110
であると主張している。
そこで150人の大学生を無作為に選んで調査したところ、IQの
平均値は111.2であり、標準偏差は7.2であった。
この結果から、この教育学者の主張を認めることができるだろ
うか?
有意水準5%と1%で検定しなさい。
ヒント:両側検定。
Q4 解答
文意より、μ=110、N=150、Xbar=111.2、S=7.2、α=0.05, 0.01
1.帰無仮説H0:μ=110
対立仮説H1:μ≠110(両側検定)
2.σが未知であるが、Nが十分に大きいので、検定量zはz分布
に従う。
α=0.05のとき、臨界値z=normsinv(0.975)=1.96
α=0.01のとき、臨界値z=normsinv(0.995)=2.58
3.検定量 z0=(111.2-110)/(7.2/√150)=2.04
4.検定量z0=2.04は、5%のときの臨界値1.96よりも大きいので
5%レベルで帰無仮説を棄却できる(有意である)。
正確な有意確率はP(z>2.04)=1-normsdist(2.04)=0.021。
しかし、検定量z0=2.04は1%のときの臨界値z=2.58よりも小さ
い。従って、1%レベルでは帰無仮説を棄却できない。
α=0.05
2.5%
2.5%
1.96
z0=2.04
α=0.01
0.5%
0.5%
2.04
2.58
練習問題
Q5. ある下着メーカーが製造するパンティストッキングの寿命
は平均3200分以上、標準偏差は48分であると主張されている。
消費者センターが36足のランダムサンプルを検査した結果、
平均が3185分に過ぎなかった。メーカーの主張が正しいかどう
かを有意水準1%で検定しなさい。
Q5 解答
文意より、μ=3200、σ=48、N=36、Xbar=3185、α=0.05, 0.01
1.帰無仮説:μ=3200
対立仮説:μ<3200(左片側検定)
2.σが既知なので、統計量zはz分布に従う。
α=0.01のとき、境界値z=normsinv(0.01)=-2.33
3.検定統計量z0=(3185-3200) / (48/√36) = -1.88
有意確率P(z>|z0|) = normsdist(-1.88) = 0.030
4.z0=-1.88>-2.33より、H0を棄却できない。
すなわち、メーカーの主張が正しいことを否定できない。
1%
-1.88
-2.33
練習問題
Q6. ある薬品の1粒に含まれるブドウ糖の重量は30gであると
規定されている。
16粒をランダムに抽出し、ブドウ糖の含有量を測定したところ、
平均が30.4g、標準偏差が0.8gであった。
有意水準1%で、この製品は規定を満足している(重量30gの
誤差の範囲)といえるか、検定しなさい。
Q6 解答
文意より、μ=30、N=16、Xbar=30.4、S=0.8、α=0.01
1.帰無仮説:μ=30
対立仮説:μ≠30(両側検定)
2.σが未知でNが小さいので、標本抽出分布はt分布に従う。
α=0.01より、境界値t=tinv(0.01, 15)=2.95
3.検定統計量t0=(30.4-30)/ (0.8/√16) = 2.00
有意確率 P(t>|±2.00|)=tdist( 2.00, 15, 2 ) = 0.064
4.検定量t0=2.00<2.95より、H0を棄却できない。すなわち、この
製品のブドウ糖が30gであることを否定できない。
0.5%
-2.95
0.5%
2.95
練習問題
Q7. ある自動車メーカーがその製品の小型乗用車の燃料効率
について、ある標準状態において、1リットル当たり12km走行で
きると公言している。
そこで、10台の車について定められた状態の下で走行テストを
おこなってみたところ、平均11.8km、標準偏差0.3という結果
が得られた。
この結果から、この自動車メーカーの主張を認めてよいだろう
か。
有意水準5%で検定しなさい。
Q7 解答
文意より、μ=12、N=10、Xbar=11.8、S=0.3、α=0.05
1.帰無仮説:μ=12
対立仮説:μ<12(左片側検定)
2.σが未知でNが小さいので、統計量tはt分布に従う。
α=0.05のとき、臨界値t(0.05, 9)= tinv(0.1, 9)= -1.83
3.検定統計量t0=( 11.8 – 12 ) / ( 0.3 / √10 ) = -2.11
有意確率P(t>|-2.11|)= tdist(2.11, 9, 1)= 0.032
4.t0=-2.11<-1.83より、帰無仮説を棄却できる。すなわち、有意
水準5%レベルで、メーカーの主張は正しくないと言える。
5%
-2.11
-1.83
練習問題
8. 電球の製造工場では製品の基準を「平均寿命1000時間、
標準偏差40」と設定している。
ある単位量の製品の山(ロット)から64個のサンプルをランダム
に取り出して寿命を調べた。このとき、サンプルの平均寿命がい
くら以上であれば、そのロットを合格と判定してよいだろうか。
有意水準5%と1%で答えなさい。
(ヒント: 仮説検定の手順を応用して、Xbarの値を逆算する。)
Q8 解答
文意より、μ=1000、σ=40、N=64、α=0.05、0.01
帰無仮説の採択域(合格範囲=臨界値以上)を求める。
1.帰無仮説:μ=1000
対立仮説:μ<1000(左片側検定)
2.σが既知なので、統計量はz分布に従う。
α=0.05のとき、臨界値z=normsinv(0.05)= -1.64
α=0.01のとき、臨界値z=normsinv(0.01)= -2.32
3.臨界値
z > ( Xbar – 1000 ) / (40/√64)
α=0.05のとき z=-1.64を代入すると、Xbar>991.8
α=0.01のとき、z=-2.32を代入すると、Xbar>988.4
α=0.05
合格域
-1.96
1000-1.96*40/√64=998.1
1000
α=0.01
α=0.01
合格域
-2.32
1000-2.32*40/√64=988.4
1000
練習問題
Q9.在庫中のある種の銅線40巻の破断強度を調べたところ、
次のような結果が得られた。
565, 578, 573, 570, 575, 572, 580, 576, 583, 589, 570, 568
585, 574, 596, 571, 570, 563, 579, 595, 572, 564, 580, 568
570, 575, 589, 581, 575, 569, 572, 584, 580, 571, 574, 581
579, 577, 573, 586
この結果から、この種の銅線の平均破断強度を信頼係数95%
で区間推定しなさい。また、信頼係数99%ではどうなるか。
Q9 解答
標本データから、N=40、Xbar=576.3、S=7.832
信頼係数95%のとき、
臨界値t(0.05/2, 9) =tinv(0.05, 39)=2.021
下限値: 576.3 – 2.021*7.832/√40 = 573.80
上限値: 576.3 + 2.021*7.832/√40 = 578.80
95%信頼区間は、
573.80 < μ < 578.80
576.3 – 2.021*7.832/√40 = 573.80
576.3
578.80=576.3 + 2.021*7.832/√40
標本データから、N=40、Xbar=576.3、S=7.832
信頼係数99%の場合
臨界値t(0.01/2, 39) =tinv(0.01, 39)=2.704
下限値: 576.3 – 2.70*7.832/√40 = 572.96
上限値: 576.3 + 2.70*7.832/√40 = 579.64
母平均μの99%信頼区間は、
572.96 < μ < 579.64
2.32
-2.32
576.3 – 2.70*7.832/√40 = 572.96
576.3
579.64= 576.3 + 2.70*7.832/√40
練習問題
Q10.ある電気会社で製造した10個の電球の寿命を測定したとこ
ろ、次のようなデータを得た。
2529, 2520, 2516, 2772, 2593,
2592, 2565, 2645, 2561, 2639
この結果から、この電球会社製造の電球の平均寿命を信頼係数
95%で区間推定しなさい。
Q10 解答
N=10 df=9 Xbar=2593.2 S=77.4
信頼係数が95%で、t(0.05/2, 9)=tinv(0.05, 9)=2.26
下限値:2593.2 - 2.26*77.4√9
上限値:2593.2 + 2.26*77.4√9
母平均μの95%信頼区間は、
2534.9<μ<2651.5
よって、この電球会社製造の電球の平均寿命は、
信頼係数95%で2534.9時間から2651.5時間の間である。
練習問題
Q11.350世帯のうち12世帯が電動アシスト自転車を保有してい
た。この保有率は3%より高いと言えるだろうか。有意水準5%で
検定しなさい。
(上田拓治『44の例題で学ぶ統計的検定と
推定の解き方』、オーム社より転載)
Q11 解答例
文意より、n=350(n>30より、正規分布近似),
p=12/350=0.034, P0=0.03,
1. 帰無仮説 H0: P=0.03
対立仮説 H1: P>0.03(⇒右片側検定)
2. α=0.05より境界値z=normsinv(0.975)=1.64
3. 検定量 T=(0.034-0.03) /sqrt(0.03*(1-0.03)/350)
= 0.44
有意水準P(T>|0.44|)=1-normsdist(0.44)=0.33
4. T=0.44<1.64より、H0を棄却できない。すなわち、
電動アシスト自転車の保有世帯率は3%より高いと
は言えない。
5%
0.44
1.64
練習問題
Q12.ある小学校の総児童数は385人である。そのうち、肥満児
の割合は10%であった。このたび、休み時間を利用した運動プロ
グラムを導入したところ、28人が肥満児の判定となった。この結
果より、肥満児率は減少したといえるだろうか。有意水準5%で
検定しなさい。
内田治・西澤英子『Rによる統計的検定と
推定』、オーム社より転載)
Q12 解答例
文意より、N=385(z分布近似できる)、P0=0.1
p=28/385=0.073、α=0.05
1.帰無仮説H0:p=0.1
対立仮説H1:p<0.1(左片側検定)
2.α=0.05のとき、臨界値z=normsinv(0.05)=-1.64
検定量T<-1.64なら、H0を棄却する。
3.検定量T= (0.073-0.1)/sqrt( 0.073*0.927/385)
= -2.04
有意確率P(z>|-2.04|)=normsdist(-2.04)=0.013
4.検定量T=-2.04<-1.64より、帰無仮説p=0.1を棄却
できる。すなわち、有意水準5%レベルで、肥満児の
割合が減少したと言える。
5%
-2.04
-1.64
練習問題
Q13 道内の小学生250人に対して、あるサッカー選手の知名度
を調査した結果、知名者が86人いた。この選手の知名度を信頼
係数95%で推定しなさい。
(上田拓治『44の例題で学ぶ統計的検定と
推定の解き方』、オーム社より転載)
Q13 解答例
文意より、N=250(大標本なのでz分布近似できる)、
p=86/250=0.344、信頼係数95%よりα=0.05
α=0.05より、臨界値z(α/2)=normsinv(0.025)=-1.96
z(α/2)=normsinv(0.975)=1.96
下限値:0.344-1.96*sqrt(0.344*0.656/250)=0.285
上限値:0.344+1.96*sqrt(0.344*0.656/250)=0.403
母集団割合は信頼係数95%で、
0.285 < π < 0.403
SE=sqrt(p*(1-p)/N)
=sqrt(0.344*0.656/250)
1.96
-1.96
0.344-1.96*SE=0.285
0.344
0.403=0.344+1.96*SE