第1章 記述統計の復習

度数分布表における平均・分散
(第1章 記述統計の復習 補足)
統計学 2007年度
• 右のような度数分布表が入手
できたとする。(元のデータは
入手できなかったとする。)
• この度数分布表で、20点以上
30点未満の階級は8人いるが、
この8人の個々の点数につい
ては情報がない。
階級
以上
0
10
20
30
40
50
60
70
80
90
-
-
-
-
-
-
-
-
-
-
計
未満
10
20
30
40
50
60
70
80
90
100
階級値
(yi)
5
15
25
35
45
55
65
75
85
95
度数
(fi)
1
1
8
6
6
3
9
4
2
0
40
• 算術平均を求める場合、8人の個々の点数について何らか
の仮定が必要となる。
• 8人全員が上限のあたりや下限のあたり(8人全員が20点と
か、8人全員が29点とか)という状態はあまり考えられない。
通常は上限の近くから下限の近くまで適当に散らばっている
と考えられる。このとき、8人の算術平均を取れば階級の真
ん中あたりの値となると考えるのは自然な発想である。
• 階級値は、そういう意味で階級を代表する値である。
• 算術平均を求める場合、8人全員が階級値の25点であった
と仮定する。
• すると、8人の点数の合計は
8×25 = 200(点)
となる。
• このように、各階級について 度数×階級値 (fiyi)を求め、そ
れを全階級について加えたものが全員の点数の合計(に近
い値)と考えられる。
• よって、算術平均は(度数×階級値)の総和÷度数の総和
として求められる。
m
f y  f 2 y2    f m ym
y 1 1

f1  f 2    f m
fy
i 1
m
i
f
i 1
i
i
• 度数分布表において算術平均を求めるには、度数×階級値
(fiyi)の列を計算し、その和を求める。
• そしてその和を度数の合計で割れば算術平均が求まる。
階級
以上
0
10
20
30
40
50
60
70
80
90
-
-
-
-
-
-
-
-
-
-
計
未満
10
20
30
40
50
60
70
80
90
100
階級値
(yi)
度数
(fi)
5
15
25
35
45
55
65
75
85
95
• 算術平均は
y
となる。
1920
 48
40
fiyi
1
1
8
6
6
3
9
4
2
0
40
5
15
200
210
270
165
585
300
170
0
1920
fiyi2
25
225
5000
7350
12150
9075
38025
22500
14450
0
108800
• 分散の計算にも、8人全員が階級値の25点であったと仮定
する。
• すると、8人の偏差2乗和は
8×(25 – 48)2 = 8×529 = 4232
となる。
• 各階級について 度数×(階級値-算術平均)2 を求め、その
総和を度数の総和で割ったものが分散となる。
m
f1 ( y1  y ) 2  f 2 ( y2  y ) 2    f m ( ym  y ) 2
s 

f1  f 2    f m
2

i 1
f i ( yi  y ) 2
m
f
i 1
i
この式は次のように変形できる。
f1 ( y1  y ) 2  f 2 ( y2  y ) 2    f m ( ym  y ) 2
s 
f1  f 2    f m
2
f1 y12  2 f1 y1 y  f1 y 2  f 2 y22  2 f 2 y2 y  f 2 y 2    f m ym2  2 f m ym y  f m y 2

f1  f 2    f m
f1 y12  f 2 y22   f m ym2  2 y ( f1 y1  f 2 y2    f m ym )  y 2 ( f1  f 2    f m )

f1  f 2    f m
f1 y12  f 2 y22   f m ym2

 2y  y  y2
f1  f 2    f m
f1 y12  f 2 y22   f m ym2

 y2
f1  f 2    f m
よって、fiyi2の列を求め、その総和を度数の総和で割り、算術
平均の2乗を引いたものが分散の近似値となる。
s2 
108800
 48 2  2720  2304  416
40