4.データの分布 (1)ヒストグラム ヒストグラム データを一定範囲に区切り、各範囲における度数を表した棒グラフ ヒストグラムを作る目的 データの分布の状態を把握するため。 例4 表3 テスト得点の分布 得点範囲 人数 得点範囲 人数 0~4点 2人 40 ~ 44 点 9人 5~9点 4人 45 ~ 49 点 12 人 10 ~ 14 点 2人 50 ~ 54 点 6人 15 ~ 19 点 4人 55 ~ 59 点 8人 20 ~ 24 点 7人 60 ~ 64 点 4人 25 ~ 29 点 10 人 65 ~ 70 点 2人 30 ~ 34 点 16 人 70 ~ 75 点 1人 35 ~ 39 点 14 人 75 点以上 0人 18 16 度 14 12 10 数 8 6 4 2 0 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 得 図1 点 範 ヒストグラム -1- 囲 (2)ヒストグラムの作り方 1)最高点と最低点を見つける。 【例】最高点:75点 2)その差を算出し、得点の幅を求める。 【例】 最低点:0点 75 - 0 = 75 3)データを何段階に区切るか(級間の数)を決める。(一般に5~20が適当) データ数が 50 であれば 6 ~ 7 段階、100 であれば 7 ~ 8 段階程度でよい。 ※ 適当なクラス数 1 + 3.3log n 【例】 15段階に区切ることとする。 4)2)で求めた得点の幅を、4)で決めた級間の数で割り、級間の幅を決める。 【例】 75÷15=5 5)これで、データを5点毎に区切って15段階で集計することになった。 集計表にしてみる。(表3を参照) 6) 5)で作成した集計表をもとにヒストグラムを描く。縦軸に度数(人数など)をと り、横軸を得点の範囲を表示し、棒グラフで描く。 7)グラフの縦軸は下限をゼロから始める。 横軸は必ずしもゼロから始めなくてよい。 横軸には得点の最低と最高の範囲を示す。 8)実際にグラフを描くときには、軸の長さ、間隔のとり方、縦横の比率などに注意す る。グラフが横長になったり、縦長になったりすると、データの分布に関して見か けの印象が大きく変わってしまう。 ※ ここで示した級間の上限点、下限点は、正しくは得点限界といい、真の限点とは異なるが、 ここでは説明を省略する。 例5 ヒストグラムの問題例 分布の山が2つできている。 得点が二極化していると 考えられる。 ↓ 数値を平均して扱うことが 難しい。2つのグループが 混在している可能性がある。 極端値が存在する。 ↓ 数値を平均して扱うことが 難しい。代表値にはメディ アンを用いる。あるいは、 極端値が生じた原因を明ら かにして除外する。 -2- (3)正規分布曲線 人間の身長、体重、知能 平均値に近いところに一番多くの人が存在し、それよりも大きな人、小さな人は、 差が極端になるほど徐々に減少する。→ 34.13% 正規分布曲線に近い分布を示す 34.13% 13.59% 13.59% 2.145% 2.145% 0.135% -4 0.135% -3 -2 -1 +1 0 +2 +3 +4 平均値 ・横軸の数字は標準偏差を表す 図2 ○ 正規分布曲線 データが正規分布しているときには、平均値±1標準偏差の範囲に全データの 68 % が収まる。算術平均は、データが正規分布していることを前提に用いられる。 例6 日本人の成人男性の平均身長は 169 センチメートルで、標準偏差は 9 センチメート ルであった。 → 日本人の成人男性の約7割の身長が 160 ~ 178 センチメートルの 範囲に収まっていることを示している。 表4 正規分布における平均周囲の得点分布と% 得点の範囲 度数(%) 平均値±1標準偏差 68.26 % 平均値±2標準偏差 95.44 % 平均値±3標準偏差 99.74 % 平均値±4標準偏差 99.99 % -3- 表4 知能検査の得点分布と判定基準(標準偏差を 15 とするもの) SD値(範囲) IQ(知能指数) % 知能水準 平均値+5標準偏差 IQ 160 ~ - 平均値+4標準偏差 IQ 145 ~ 159 上位 0.13 % 特に優れている 平均値+3標準偏差 IQ 130 ~ 144 上位 2.15 % 優れている 平均値+2標準偏差 IQ 115 ~ 129 上位 13.59 % やや優れている 平均値±1標準偏差 IQ 85 ~ 114 全体の 68.26 % 平均的知能 平均値-2標準偏差 IQ 70 ~ 84 下位 13.59 % やや劣る 平均値-3標準偏差 IQ 55 ~ 69 下位 2.15 % 劣る 平均値-4標準偏差 IQ 40 ~ 55 下位 0.13 % 特に劣る 平均値-5標準偏差 IQ 39 以下 - 表5 - - 知的障害の 理論値 WISC - III(ウェクスラー児童用知能検査第3版)におけるIQ IQ SD値 145 +3 SD 99.9 140 +22/3 SD 99.6 135 +21/3 SD 99 130 +2 SD 98 125 +12/3 SD 95 120 +11/3 SD 91 115 +1 SD 84 110 + 2/3 SD 75 105 + 1/3 SD 63 0 SD 50 95 - 1/3 SD 37 90 - 2/3 SD 25 85 -1 SD 16 80 -11/3 SD 9 75 -12/3 SD 5 70 -2 SD 2 65 -21/3 SD 1 60 -22/3 SD 0.4 55 -3 SD 0.1 100 パーセンタイル順位 知能水準 非常に優れている 2.2 % 優れている 6.7% 平均の上 平 均 平均の下 -4- 理論的割合 16.1% 50% 16.1% 境界線 6.7% 精神遅滞 2.2% (4)標準偏差(Standard Deviation: SD) 平均偏差 各データの平均値からのズレを絶対値で合計し、算術平均したもの 標準偏差 各データの平均値からのズレを平均化したもの ○ 平均偏差は算出が容易であるが、絶対値を使う。標準偏差の計算では、データの -(マイナス)を消すために、いったんズレの値を自乗し、後に √ する。 標準偏差の計算式 (データ①-平均値) SD 2 + (データ②-平均値) 2 + ・・・・・・ = N 例7 A群 B群 A群 B群 回答者 得点 回答者 得点 N 5 5 イ 2 イ 5 M 4 7 ロ 3 ロ 5 SD 1.4 1.8 ハ 4 ハ 7 ニ 5 ニ 9 ホ 6 ホ 9 平均偏差 算出方法の確認 -5- = A群 1.2、B群 1.6
© Copyright 2024 ExpyDoc