URL

前回の演習問題の答え
• 問題1(章末問題30)
次のデータは1972年春刊行の医学雑誌New England Journal
of Medicineで,数人の医師が報告した論文から引用したもので
ある.
この研究は,55人の非喫煙者,31人のパイプまたは葉巻きの
常用者,および401人の紙巻きタバコの常用者のそれぞれにつ
て,各人の肺気腫の程度を調べたもので,被験者はすべて60歳
未満の人々である.60歳以上の喫煙者は別の研究で取り上げ
られた.
次の表の階級の区分の仕方は,元の論文のものとは少し
違っている.
1
肺気腫
の程度
非喫煙
者
パイプま
たは葉
巻きの
常用者
0–1
53
1–2
2
紙巻きタバコの常用者
<1
1-2
>2
18
15
2
0
11
13
24
5
2–3
1
19
130
56
3–4
1
17
50
38
4
8
7
5–7
4
5
7–9
3
1
221
112
4–5
計
55
31
68
2
xを肺気腫の程度を測る変数とし,各階級値は𝑥1 = 0.5, 𝑥2 =
1.5, 𝑥3 = 2.5, 𝑥4 = 3.5, 𝑥5 = 4.5, 𝑥6 = 6.0, 𝑥7 = 8.0とする.
(a)紙巻きタバコ常用者グループの各データを1つの表にま
とめた上で,このグループのxの平均と標準偏差を求めよ.
(b)(a)で求めた結果を用いて,紙巻きタバコ常用者に対する
xの母集団平均の95%信頼区間を求めよ.
(c)非喫煙者グループ,パイプまたは葉巻きの常用者グルー
プそれぞれの平均を計算して,それが(b)で求めた信頼区間に
含まれるかどうかを調べよ.
3
答え:
(a) 紙巻きタバコ常用者グループの度数分布表
階級値x
度数𝒇𝒊
0.5
17
1.5
42
2.5
205
3.5
105
4.5
19
6
9
8
4
𝑘
標本サイズ 𝑛 =
𝑓𝑖 = 17 + 42 + ⋯ + 4 = 401
𝑖=1
テキストP.18 公式(4)
平均
1
𝑥=
𝑛
𝑘
𝑥𝑖 𝑓𝑖
標準偏差 𝑠 =
𝑖=1
1
𝑛−1
𝑘
(𝑥𝑖 − 𝑥)2 𝑓𝑖
𝑖=1
手で計算するのが面倒!
エクセルで計算する.
4
 度数分布表から平均、標準偏差を計算する方法(第3回講義の実践)
分類されたデータに対する分散の計算公式
1 k
x   xi f i
n i 1
1 k
2
s 
(
x

x
)
fi

i
n  1 i 1
2
階級
階級値xi
度数fi
0~1
1~2
2~3
3~4
4~5
5~7
7~9
0.5
1.5
2.5
3.5
4.5
6
8
合計
17
42
205
105
19
9
4
401
階級値*度数
xi*fi
8.5
63
512.5
367.5
85.5
54
32
1123
平均
分散
標準偏差
2.800498753
1.215099751
1.102315631
偏差の2乗*度数
(xi-平均)^2*fi
89.96900672
71.03447429
18.51139763
51.37670941
54.87778527
92.13127406
108.1392529
486.0399002
紙巻きタバコ常用者の平均肺気腫の程度𝑥 = 2.80,
標準偏差𝑠 = 1.10
5
(b)(a)で求めた結果を用いて,紙巻きタバコ常用者に対する
xの母集団平均の95%信頼区間を求めよ.
答え:
𝑛 = 401, 𝑥 = 2.80, 𝑠 = 1.10
標本の大きさは401(> 25)だから,
大標本法が使える.𝜎 ≈ 𝑠
公式2
信頼水準95%信頼区間 x  1.96
信頼区間 𝑥 ± 1.96

n
𝑠
1.10
= 2.80 ± 1.96
𝑛
401
= 2.80 ± 0.11
従って、 紙巻きタバコ常用者に対するxの母集団平均の95%信頼区間
2.69 ≤ 𝜇 ≤ 2.91
6
(c)非喫煙者グループ,パイプまたは葉巻きの常用者グループそれぞれの平均
を計算して,それが(b)で求めた信頼区間に含まれるかどうかを調べよ.
答え:
• 非喫煙者グループの度数分布表
階級値x
度数𝒇𝒊
1
非喫煙者の平均 𝑥 =
𝑛
0.5
53
𝑘
𝑖=1
1.5
2
1
𝑥𝑖 𝑓𝑖 =
0.5 × 53 + 1.5 × 2 = 0.54
55
• パイプまたは葉巻きの常用者グループの度数分布表
階級値x
0.5
1.5
2.5
3.5
度数𝒇𝒊
18
11
1
1
1
パイプまたは
𝑥=
𝑛
葉巻き党の平均
𝑘
𝑖=1
1
𝑥𝑖 𝑓𝑖 =
0.5 × 18 + ⋯ 3.5 × 1 = 1.02
31
• それぞれの平均は(b)の信頼区間に含まれていない
7
• 問題2(章末問題31)
次のデータは,ルーテル医科大学精神科の3人の教授が
1974年2月刊行の医学雑誌Archives of General Psychiatryに発
表した研究報告からの引用で,これはゼネラル・モーターズの工
場で働いている自動車労働者の仕事に対する満足度を調べた
ものである.
あなたは自
分の仕事に 現在,患者で
あるもの
満足していま
すか?
以前,患者で
あったもの
“病的”であ “健康”であ
ると分類され ると分類され
たもの
たもの
満足と答えた
人の数
13
19
90
463
標本の大きさ
17
26
95
481
%
76
73
95
96
8
この表の2つの“患者”グループはジョンズ・ホプキンス病院
にある米国自動車労働組合診療所で発見または診断された労
働者からなる.残りの労働者は,精神の健康状態をはかるのに
使われる“マクミラン指数”によって,“病的”グループと“健康”グ
ループに分類されている.
(a)健康な労働者で仕事に満足しているものの割合に対す
る95%信頼区間を求めよ.
(b)病的な労働者で仕事に満足しているものの割合に対す
る90%信頼区間を求めよ.
(c)労働者が診療所の患者でなかったとして,このデータから,
仕事に対する労働者の満足度はその精神の健康状態に無関
係であるといえるか.
9
問題文から、この問題は割合pの推定に関するものであることが分かった.
答え:
(a)健康な労働者で仕事に満足しているものの割合𝑝1 とする.
標本割合𝑝1 =
𝑥1
𝑛1
=
463
481
≈ 0.96
𝑝1 に対する95%信頼区間は
𝑝1 (1 − 𝑝1 )
𝑝1 ± 1.96
𝑛1
𝑛1 = 481は大標本だから,
信頼区間公式では,𝑝1 を𝑝1 に置き換えてもよい.
よって,求める信頼区間は
𝑝1 (1 − 𝑝1 )
𝑝1 ± 1.96
= 0.96 ± 1.96 × 0.0087 = 0.96 ± 0.02
𝑛1
0.94 ≤ 𝑝1 ≤ 0.98
10
答え:
(b)病的な労働者で仕事に満足しているものの割合𝑝2 とする.
標本割合𝑝2 =
𝑥2
𝑛2
=
90
95
≈ 0.95
𝑝2 に対する90%信頼区間は
𝑝2 (1 − 𝑝2 )
𝑝2 ± 1.645
𝑛2
𝑛2 = 95は大標本だから,
信頼区間公式では,𝑝2 を𝑝2 に置き換えてもよい.
よって,求める信頼区間は
𝑝2 (1 − 𝑝2 )
𝑝2 ± 1.645
= 0.95 ± 1.645 × 0.023 = 0.95 ± 0.04
𝑛2
0.91 ≤ 𝑝2 ≤ 0.99
11
答え:
(c)診療所の患者でなかった労働者で仕事に満足している
ものの割合𝑝とする.
標本割合𝑝 =
𝑥
𝑛
=
𝑥1 +𝑥2
𝑛1 +𝑛2
=
𝑝に対する95%信頼区間は
553
576
≈ 0.96
𝑝 ± 1.96
𝑝(1 − 𝑝)
𝑛
𝑛 = 576は大標本だから,
信頼区間公式では,𝑝を𝑝に置き換えてもよい.
よって,求める信頼区間は
𝑝 (1 − 𝑝)
𝑝 ± 1.96
= 0.96 ± 1.96 × 0.008 = 0.96 ± 0.02
𝑛
0.94 ≤ 𝑝 ≤ 0.98
健康な労働者で仕事に満足しているものの割合𝑝1 の95%信頼区間は
0.94 ≤ 𝑝1 ≤ 0.98
𝑝 ≈ 𝑝1 従って、仕事に対する労働者の満足度はその
精神の健康状態に無関係であるといえる.
12