講義資料No.1

確率と統計 1 資料 No. 1
担当:松田晴英
データの整理
1
1.1
度数分布表と度数分布図
実験などで得られたデータをそのまま示されても,集団の特性を一目で把握することは難し
いでしょう。ここでは,これを簡便にする手法を学びます。
実験 1. 硬貨を 20 回投げて,表が出た回数を数えてください。
硬貨を 1 回投げるごとに下の数にチェックを入れ,表が出たときの回数を丸で囲むと数えやすいでしょう。
1
11
2
12
3
13
4
14
5
15
6
16
7
17
8
18
9 10
19 20
本日,この授業に出席している全員の結果をまとめてみましょう。
0回
1回
2回
3回
4回
5回
6回
7回
8回
9回
10 回
11 回
12 回
13 回
14 回
15 回
16 回
17 回
18 回
19 回
20 回
これらのデータはこのままでは単なる数の集まりでしかなく,分類,整理して種々の情報
を導きだすことが必要です。データが存在する範囲をいくつかの区間に分けたとき,それ
ぞれの区間を階級といい,各階級の中央の値を階級値といいます。また,各階級に入るデー
タの個数を度数といいます。また,各階級に度数を対応させてできる表を度数分布表とい
います。
練習問題 1 以下にしたがって,上の実験結果を整理せよ。
⃝
1 データの最大値は :=Max,
最小値は :=Min である。
階級(回数)
0∼2
3∼5
6∼8
9∼11
12∼14
15∼17
18∼20
データの範囲 R は
R =Max−Min= である。
⃝
2 階級の幅を 3 として,
右の度数分布表を完成せよ。
1
階級値(回)
度数(人数)
分布の様子は,度数分布表をグラフにするとよりわかりやすいでしょう。横軸を階級値と
し,各階数の度数を柱状に表したグラフをヒストグラムといいます。
練習問題 2 上の度数分布表について,ヒストグラムを作成せよ。
1.2
代表値
集団を構成するそれぞれの個体の数量データを示されても,集団の特性を一目で把握するこ
とは難しいでしょう。これを簡便にする手法として代表値の提示があります。
代表値とは,分布の特徴を代表する数値で,いくつかの方法があります。
単純算術平均値 · · · 全データを合計し,データ数で割った数値。ここでは,x と表す。
∑n
xi
x1 + x2 + · · · + xn
x = i=1 =
(n はデータ数,xi は各データ)
n
n
中央値 (メディアン) · · · 全データを大きさ順に並べたときの真ん中の値。ここでは M e と表
す。n が奇数のときは (n + 1)/2 番目が中央値であり,n が偶数のときは n/2 番目と n/2 + 1
番目の中間値である。著しく歪んだ分布では,平均値より中央値のほうが代表値として
の一般の概念をよりよく示す。
最頻値 (並数,モード) · · · データのなかで最大の度数をもつ,最も多く現れている値。ここで
は M o と表す。中央値と同様に極端なデータや分布の歪みの影響を受けにくい。
幾何平均値 · · · 測定値 xi が,極めて小さい値と極めて大きい値からなる標本の平均を求める場合
など,分布に歪みがある場合には算術平均値より幾何平均値を用いるとよい。すべてのデー
√
タを掛けた数値の n 乗根で表される。つまり,幾何平均 Gm は,Gm = n x1 × x2 × · · · × xn
である。(ただし,測定値に 0 が含まれる場合には,すべての値に 1 を加えて計算する。)
今日のまとめ :教科書 1 ページ∼5 ページ
復習問題 :次は,ある工場で作られた製品の 1 日ごとの不良品の個数を数えた,1 週間分の
データである。
1, 3, 0, 3, 3, 0, 4
次の問に答えよ。
(1) 単純算術平均値を求めよ。
(2) モードを求めよ。
(3) メディアンを求めよ。
次回 :教科書 6 ページ∼9 ページ
復習問題の略解 (1) x =
1+3+0+3+3+0+4
7
=2
(2) 3
(3) データを小さい順に並べると,
0, 0, 1, 3, 3, 3, 4 である。この並び順で中央の値がメディアンだから,3
2