データの散布度と代表値 2(ヒストグラム、正規分布、標準偏差)

4.データの分布
(1)ヒストグラム
ヒストグラム
データを一定範囲に区切り、各範囲における度数を表した棒グラフ
ヒストグラムを作る目的
データの分布の状態を把握するため。
例4
表3
テスト得点の分布
得点範囲
人数
得点範囲
人数
0~4点
2人
40 ~ 44 点
9人
5~9点
4人
45 ~ 49 点
12 人
10 ~ 14 点
2人
50 ~ 54 点
6人
15 ~ 19 点
4人
55 ~ 59 点
8人
20 ~ 24 点
7人
60 ~ 64 点
4人
25 ~ 29 点
10 人
65 ~ 70 点
2人
30 ~ 34 点
16 人
70 ~ 75 点
1人
35 ~ 39 点
14 人
75 点以上
0人
18
16
度
14
12
10
数
8
6
4
2
0
0
5 10 15 20 25 30 35 40 45 50 55 60 65 70 75
得
図1
点
範
ヒストグラム
-1-
囲
(2)ヒストグラムの作り方
1)最高点と最低点を見つける。
【例】最高点:75点
2)その差を算出し、得点の幅を求める。
【例】
最低点:0点
75 - 0 = 75
3)データを何段階に区切るか(級間の数)を決める。(一般に5~20が適当)
データ数が 50 であれば 6 ~ 7 段階、100 であれば 7 ~ 8 段階程度でよい。
※
適当なクラス数
1 + 3.3log n
【例】 15段階に区切ることとする。
4)2)で求めた得点の幅を、4)で決めた級間の数で割り、級間の幅を決める。
【例】
75÷15=5
5)これで、データを5点毎に区切って15段階で集計することになった。
集計表にしてみる。(表3を参照)
6) 5)で作成した集計表をもとにヒストグラムを描く。縦軸に度数(人数など)をと
り、横軸を得点の範囲を表示し、棒グラフで描く。
7)グラフの縦軸は下限をゼロから始める。 横軸は必ずしもゼロから始めなくてよい。
横軸には得点の最低と最高の範囲を示す。
8)実際にグラフを描くときには、軸の長さ、間隔のとり方、縦横の比率などに注意す
る。グラフが横長になったり、縦長になったりすると、データの分布に関して見か
けの印象が大きく変わってしまう。
※
ここで示した級間の上限点、下限点は、正しくは得点限界といい、真の限点とは異なるが、
ここでは説明を省略する。
例5
ヒストグラムの問題例
分布の山が2つできている。
得点が二極化していると
考えられる。
↓
数値を平均して扱うことが
難しい。2つのグループが
混在している可能性がある。
極端値が存在する。
↓
数値を平均して扱うことが
難しい。代表値にはメディ
アンを用いる。あるいは、
極端値が生じた原因を明ら
かにして除外する。
-2-
(3)正規分布曲線
人間の身長、体重、知能
平均値に近いところに一番多くの人が存在し、それよりも大きな人、小さな人は、
差が極端になるほど徐々に減少する。→
34.13%
正規分布曲線に近い分布を示す
34.13%
13.59%
13.59%
2.145%
2.145%
0.135%
-4
0.135%
-3
-2
-1
+1
0
+2
+3
+4
平均値
・横軸の数字は標準偏差を表す
図2
○
正規分布曲線
データが正規分布しているときには、平均値±1標準偏差の範囲に全データの 68 %
が収まる。算術平均は、データが正規分布していることを前提に用いられる。
例6
日本人の成人男性の平均身長は 169 センチメートルで、標準偏差は 9 センチメート
ルであった。
→
日本人の成人男性の約7割の身長が 160 ~ 178 センチメートルの
範囲に収まっていることを示している。
表4
正規分布における平均周囲の得点分布と%
得点の範囲
度数(%)
平均値±1標準偏差
68.26 %
平均値±2標準偏差
95.44 %
平均値±3標準偏差
99.74 %
平均値±4標準偏差
99.99 %
-3-
表4
知能検査の得点分布と判定基準(標準偏差を 15 とするもの)
SD値(範囲)
IQ(知能指数)
%
知能水準
平均値+5標準偏差
IQ 160 ~
-
平均値+4標準偏差
IQ 145 ~ 159
上位 0.13 %
特に優れている
平均値+3標準偏差
IQ 130 ~ 144
上位 2.15 %
優れている
平均値+2標準偏差
IQ 115 ~ 129
上位 13.59 %
やや優れている
平均値±1標準偏差
IQ 85 ~ 114
全体の 68.26 %
平均的知能
平均値-2標準偏差
IQ 70 ~ 84
下位 13.59 %
やや劣る
平均値-3標準偏差
IQ 55 ~ 69
下位 2.15 %
劣る
平均値-4標準偏差
IQ 40 ~ 55
下位 0.13 %
特に劣る
平均値-5標準偏差
IQ 39 以下
-
表5
-
-
知的障害の
理論値
WISC - III(ウェクスラー児童用知能検査第3版)におけるIQ
IQ
SD値
145
+3
SD
99.9
140
+22/3 SD
99.6
135
+21/3 SD
99
130
+2
SD
98
125
+12/3
SD
95
120
+11/3
SD
91
115
+1
SD
84
110
+
2/3
SD
75
105
+
1/3
SD
63
0
SD
50
95
-
1/3
SD
37
90
-
2/3
SD
25
85
-1
SD
16
80
-11/3 SD
9
75
-12/3
SD
5
70
-2
SD
2
65
-21/3 SD
1
60
-22/3 SD
0.4
55
-3
SD
0.1
100
パーセンタイル順位
知能水準
非常に優れている
2.2 %
優れている
6.7%
平均の上
平
均
平均の下
-4-
理論的割合
16.1%
50%
16.1%
境界線
6.7%
精神遅滞
2.2%
(4)標準偏差(Standard Deviation: SD)
平均偏差
各データの平均値からのズレを絶対値で合計し、算術平均したもの
標準偏差
各データの平均値からのズレを平均化したもの
○
平均偏差は算出が容易であるが、絶対値を使う。標準偏差の計算では、データの
-(マイナス)を消すために、いったんズレの値を自乗し、後に √
する。
標準偏差の計算式
(データ①-平均値)
SD
2
+ (データ②-平均値)
2
+
・・・・・・
=
N
例7
A群
B群
A群
B群
回答者
得点
回答者
得点
N
5
5
イ
2
イ
5
M
4
7
ロ
3
ロ
5
SD
1.4
1.8
ハ
4
ハ
7
ニ
5
ニ
9
ホ
6
ホ
9
平均偏差
算出方法の確認
-5-
=
A群 1.2、B群 1.6