度数分布表における平均・分散 (第1章 記述統計の復習 補足) 統計学 2007年度 • 右のような度数分布表が入手 できたとする。(元のデータは 入手できなかったとする。) • この度数分布表で、20点以上 30点未満の階級は8人いるが、 この8人の個々の点数につい ては情報がない。 階級 以上 0 10 20 30 40 50 60 70 80 90 - - - - - - - - - - 計 未満 10 20 30 40 50 60 70 80 90 100 階級値 (yi) 5 15 25 35 45 55 65 75 85 95 度数 (fi) 1 1 8 6 6 3 9 4 2 0 40 • 算術平均を求める場合、8人の個々の点数について何らか の仮定が必要となる。 • 8人全員が上限のあたりや下限のあたり(8人全員が20点と か、8人全員が29点とか)という状態はあまり考えられない。 通常は上限の近くから下限の近くまで適当に散らばっている と考えられる。このとき、8人の算術平均を取れば階級の真 ん中あたりの値となると考えるのは自然な発想である。 • 階級値は、そういう意味で階級を代表する値である。 • 算術平均を求める場合、8人全員が階級値の25点であった と仮定する。 • すると、8人の点数の合計は 8×25 = 200(点) となる。 • このように、各階級について 度数×階級値 (fiyi)を求め、そ れを全階級について加えたものが全員の点数の合計(に近 い値)と考えられる。 • よって、算術平均は(度数×階級値)の総和÷度数の総和 として求められる。 m f y f 2 y2 f m ym y 1 1 f1 f 2 f m fy i 1 m i f i 1 i i • 度数分布表において算術平均を求めるには、度数×階級値 (fiyi)の列を計算し、その和を求める。 • そしてその和を度数の合計で割れば算術平均が求まる。 階級 以上 0 10 20 30 40 50 60 70 80 90 - - - - - - - - - - 計 未満 10 20 30 40 50 60 70 80 90 100 階級値 (yi) 度数 (fi) 5 15 25 35 45 55 65 75 85 95 • 算術平均は y となる。 1920 48 40 fiyi 1 1 8 6 6 3 9 4 2 0 40 5 15 200 210 270 165 585 300 170 0 1920 fiyi2 25 225 5000 7350 12150 9075 38025 22500 14450 0 108800 • 分散の計算にも、8人全員が階級値の25点であったと仮定 する。 • すると、8人の偏差2乗和は 8×(25 – 48)2 = 8×529 = 4232 となる。 • 各階級について 度数×(階級値-算術平均)2 を求め、その 総和を度数の総和で割ったものが分散となる。 m f1 ( y1 y ) 2 f 2 ( y2 y ) 2 f m ( ym y ) 2 s f1 f 2 f m 2 i 1 f i ( yi y ) 2 m f i 1 i この式は次のように変形できる。 f1 ( y1 y ) 2 f 2 ( y2 y ) 2 f m ( ym y ) 2 s f1 f 2 f m 2 f1 y12 2 f1 y1 y f1 y 2 f 2 y22 2 f 2 y2 y f 2 y 2 f m ym2 2 f m ym y f m y 2 f1 f 2 f m f1 y12 f 2 y22 f m ym2 2 y ( f1 y1 f 2 y2 f m ym ) y 2 ( f1 f 2 f m ) f1 f 2 f m f1 y12 f 2 y22 f m ym2 2y y y2 f1 f 2 f m f1 y12 f 2 y22 f m ym2 y2 f1 f 2 f m よって、fiyi2の列を求め、その総和を度数の総和で割り、算術 平均の2乗を引いたものが分散の近似値となる。 s2 108800 48 2 2720 2304 416 40
© Copyright 2024 ExpyDoc