情報科学の基礎

統計学
第6回
基本統計量:平均・中央値
今日の内容


ヒストグラムのよみかたの復習と前回の問
題の解説
練習問題
統計学入門(1)第6回
2
分布(Distribution)
データのバラツキの形状 , もしくは、
様子を数量的に把握したもの
データが集中している範囲、バラツキの大きさ、
データの値や範囲を指定した場合、 そこに全体の
何%のデータが含まれるか・・・.
を教えてくれるもの
統計学入門(1)第6回
3
分布を知るためのグラフ

ヒストグラム
(人)
30
20
10

箱ひげ図
(6月に説明予定)
0
50 55 60 65 70 75 80 85 90 95 100
統計学入門(1)第6回
4
分布をみる視点

中心は?
どこ(どのような値)を中心に

バラツキの程度(広さ)は?
どの程度まで広がっているのか
統計学入門(1)第6回
5
前回の練習問題

ある1時間にコンビニエ
ンスストアでの購買金額
を記録し、そのデータを
店舗別に集計したところ
次のような集計表が得ら
れた。ヒストグラムを作
成し、(a)-(d)の問題に
答えなさい。
(a)
(b)
(c)
(d)
0-200
200-400
400-600
600-1000
1000-1500
1500-2000
2000-3000
3000-5000
合計
店舗A
28
36
32
40
35
25
30
40
266
店舗Aで購買金額が3500円と300円では、どちらの可能性が高いか
店舗Bで購買金額が700円と100円では、どちらの可能性が高いか
売上の平均はどちらの店舗が高いと思われるか
記録された1時間での総売上はどちらの店舗が高いと思われるか
統計学入門(1)第6回
店舗B
10
20
20
24
25
15
20
20
154
(
(
(
(
)
)
)
)
6
店舗Aのヒストグラムの作成手順


区間の幅が異なるので、
基準の幅を決めて、ヒスト
グラムの高さを算出(右の
表の計算では基準幅を
200としている)
算出された高さを基にヒス
トグラムを作成
0-200
200-400
400-600
600-1000
1000-1500
1500-2000
2000-3000
3000-5000
合計
店舗A
区間幅
28
200
36
200
32
200
40
400
35
500
25
500
30
1000
40
2000
266
40
30
20

購買金額が3500円と300円で
は、どちらの可能性が高いか
(300円)
10
0
1000 2000 3000 4000 5000
高さ
28
36
32
20
14
10
6
4
店舗Bのヒストグラムの作成手順


区間の幅が異なるので、
基準の幅を決めて、ヒスト
グラムの高さを算出(右
の表の計算では基準幅を
200としている)
算出された高さを基にヒ
ストグラムを作成
0-200
200-400
400-600
600-1000
1000-1500
1500-2000
2000-3000
3000-5000
合計
店舗B
区間幅
10
200
20
200
20
200
24
400
25
500
15
500
20
1000
20
2000
154
高さ
40
30
20

購買金額が700円と100
円では、どちらの可能性
が高いか(700円)
10
0
1000 2000 3000 4000 5000
10
20
20
12
10
6
4
2
売上の平均はどちらの店舗が高い
と思われるか

分布を比較して考えてみよう
店舗A
店舗B
40
40
30
30
20
20
10
10
0
1000 2000 3000 4000 5000
0
1000 2000 3000 4000 5000
統計学入門(1)第6回
9
顧客数(度数)が違うので、
比率(相対度数)に直して比較
0-200
200-400
400-600
600-1000
1000-1500
1500-2000
2000-3000
3000-5000
合計
度数
店舗A
店舗B
28
10
36
20
32
20
40
24
35
25
25
15
30
20
40
20
266
154
統計学入門(1)第6回
相対度数
店舗A
店舗B
11%
6%
14%
13%
12%
13%
15%
16%
13%
16%
9%
10%
11%
13%
15%
13%
10
グラフ化して重ねると…
(注意:店舗Bの平均が高いという回答をグラフから得るつもりで問題を作成したが、分布
のゆがみの影響で、実際の平均は店舗Aが高い。これはグラフからだけでは判断不能)
0.15
店舗A
0.10
店舗B
0.05
0.00
0
1000
2000
3000
統計学入門(1)第6回
4000
5000
11
総売上については

度数のまま比較して、店舗Aが多いことが
すぐ分かる
店舗A
店舗B
40
40
30
30
20
20
10
10
0
1000 2000 3000 4000 5000
0
1000 2000 3000 4000 5000
統計学入門(1)第6回
12
練習問題

(a)
(b)
(c)
(d)
ある1時間にコンビニエンス
ストアでの購買金額を記録
し、そのデータを店舗別に
集計したところ次のような
集計表が得られた。ヒスト
グラムを作成し、(a)-(d)の
問題に答えなさい。
0-200
200-400
400-600
600-1000
1000-1500
1500-2000
2000-3000
3000-5000
合計
店舗A
40
60
52
88
50
30
40
40
400
店舗B
10
20
32
88
80
50
60
60
400
2000円以上の買い物をする顧客の割合はどちらの店舗が高いか ( 店舗B
店舗Aでは、どのような金額の買い物をする顧客が多いと考えればよいか
( 200円から400円ぐらいの金額の顧客が多い
)
店舗Bでは、どのような金額の買い物をする顧客が多いと考えればよいか
( 1000円弱の金額の顧客が多い
)
顧客の購買金額の平均はどちらの店舗が高いと思われるか
( 店舗B
)
)