加重平均 - 金沢学院大学

加重平均
経営統計の補足資料
2015年6月29日
金沢学院大学経営情報学部
藤本祥二
加重合計
例) {3, 3, 4, 4, 4, 5, 5, 5, 5, 6}の10個のデータ
合計= 3 + 3 + 4 + 4 + 4 + 5 + 5 + 5 + 5 + 6 = 44, 平均= 44/10 = 4.4
度数で纏めてから合計や平均を計算する.
↓度数の重みを掛ける ↓相対度数の重みを掛ける
データ
番号
𝒊
データ
(の値)
𝒙𝒊
度数
相対度数
𝒓𝒊
度数×
データ
𝒇𝒊 𝒙𝒊
相対度数×
データ
𝒓𝒊 𝒙𝒊
𝒇𝒊
1
𝑥1 = 3
𝑓1 = 2
𝑟1 = 0.2
𝑓1 𝑥1 = 6
𝑟1 𝑥1 = 0.6
2
𝑥2 = 4
𝑓2 = 3
𝑟2 = 0.3
𝑓2 𝑥2 = 12
𝑟2 𝑥2 = 1.2
3
𝑥3 = 5
𝑓3 = 4
𝑟3 = 0.4
𝑓3 𝑥3 = 20
𝑟3 𝑥3 = 2.0
4
𝑥4 = 6
𝑟4 = 0.1
𝑓4 𝑥4 = 6
𝑟4 𝑥4 = 0.6
合計
-
1.0
44
4.4
↑最頻値
𝑓4 =
10
4
1
4
𝑓𝑖
𝑖=1
度数の和は
全データ数
4
𝑟𝑖
𝑖=1
相対度数の
和は1
4
𝑓𝑖 𝑥𝑖
𝑖=1
度数×データ
の和はデータの合計
𝑟𝑖 𝑥𝑖
𝑖=1
相対度数×データ
の和はデータの平均
加重平均その1
例) {3, 3, 4, 4, 4, 5, 5, 5, 5, 6}の10個のデータ
𝑓1 𝑥1
𝑓2 𝑥2
𝑓3 𝑥3
𝑓4 𝑥4
4というデータ
が3個ある
5というデータ
が4個ある
4
合計 = 2 × 3 + 3 × 4 + 4 × 5 + 1 × 6 =
3というデータ
が2個ある
𝑓1
𝑓2
𝑓3
𝑓4
6というデータ
が1個ある
𝑓𝑖 𝑥𝑖
度数という重みを掛けた
データの合計
𝑖=1
4
データ数 = 2 + 3 + 4 + 1 =
𝑓𝑖
重みの合計
𝑖=1
4
重みを掛けた合計
平均 

重みの合計
fx
i 1
4
i i
f
i 1
i
44

 4 .4
10
このような
平均の計算方法を
加重平均という
加重平均その2
例) {3, 3, 4, 4, 4, 5, 5, 5, 5, 6}の10個のデータ
𝑟1
𝑥1
𝑟2
𝑥2
𝑟3
𝑥3
𝑟4
𝑥4
4
0.2 × 3 + 0.3 × 4 + 0.4 × 5 + 0.1 × 6 =
3というデータ
が2割ある
5というデータ
が4割ある
4というデータ
が3割ある
𝑟1
𝑟2
𝑟3
6というデータ
が1割ある
𝑟𝑖 𝑥𝑖
𝑖=1
相対度数という
重みを掛けた
データの合計
4
𝑟4
1.0 = 0.2 + 0.3 + 0.4 + 0.1 =
𝑟𝑖
重みの合計
𝑖=1
4
重みを掛けた合計
平均 

重みの合計
r x
i 1
4
i i
r
i 1
4 .4

 4 .4
1 .0
このような
平均の計算方法を
加重平均という
i
相対度数の場合は重みの合計が必ず1になるので
加重合計がそのまま加重平均になる
異なる重さの重りの釣り合い
重さ(weight)
の違う重りの
釣り合う位置
(重心)を計算
するのに加重
平均の公式が
使える
𝑑1 = 𝑥1 − 𝑥
−1.4
𝑑2
重さ
−0.4
𝑤2
𝑤1
3
2
𝑥1
3
4
x
w x
i 1
4
i i
w
i 1
i
𝑥2
4
𝑥
4.4
𝑑4
1.6
𝑑3
0.6
𝑤3
4
𝑤4
1
𝑥3
5
𝑥4
6
44

 4 .4
10
加重平均の公式で求めた位置が
ちゃんと釣り合いの位置になってる
左側(反時計回り)のトルク
−𝑤1 𝑑1 − 𝑤2 𝑑2 = 2.8 +1.2=3.0
右側(時計回り)のトルク
𝑤3 𝑑3 + 𝑤4 𝑑4 = 2.4 + 1.6 = 3.0
左右のトルクは釣り合ってる
釣り合いの条件
• 前ページの例で,4個の重さが異なる重りでは
−𝑤1 𝑑1 − 𝑤2 𝑑2 = 𝑤3 𝑑3 + 𝑤4 𝑑4
が釣り合うための条件であることが分かった
移項すると
𝑤1 𝑑1 + 𝑤2 𝑑2 + 𝑤3 𝑑3 + 𝑤4 𝑑4 = 0
が釣り合うための条件であることが分かる.
• 一般に𝑛個の重さが異なる重りでは
𝑤1 𝑥1 + 𝑤2 𝑥2 + ⋯ + 𝑤𝑛 𝑥𝑛
𝑥=
𝑤1 + 𝑤2 + ⋯ + 𝑤𝑛
が平均(重心)の位置になり,偏差 𝑑𝑖 = 𝑥𝑖 − 𝑥 を使った
𝑤1 𝑑1 + 𝑤2 𝑑2 + ⋯ + 𝑤𝑛 𝑑𝑛 = 0
の釣り合いの条件が必ず成り立つことが証明できる.
「加重平均は釣り合いの位置」の証明
𝑑𝑖 = 𝑥𝑖 − 𝑥
を使う
𝑤1 𝑑1 + 𝑤2 𝑑2 + ⋯ + 𝑤𝑛 𝑑𝑛
= 𝑤1 𝑥1 − 𝑥 + 𝑤2 𝑥2 − 𝑥 + ⋯ + 𝑤2 𝑥𝑛 − 𝑥
= 𝑤1 𝑥1 + 𝑤2 𝑥2 + ⋯ + 𝑤𝑛 𝑥𝑛
−𝑤1 𝑥 − 𝑤2 𝑥 − ⋯ − 𝑤𝑛 𝑥
括弧を外し
計算の順番を変える
後半部分を −𝑥 で括る
= 𝑤1 𝑥1 + 𝑤2 𝑥2 + ⋯ + 𝑤𝑛 𝑥𝑛
− 𝑤1 + 𝑤2 + ⋯ + 𝑤𝑛 𝑥
= 𝑤1 𝑥1 + 𝑤2 𝑥2 + ⋯ + 𝑤𝑛 𝑥𝑛
− 𝑤1 + 𝑤2 + ⋯ + 𝑤𝑛
𝑥 の定義を使う
𝑤1 𝑥1 + 𝑤2 𝑥2 + ⋯ + 𝑤𝑛 𝑥𝑛
𝑤1 + 𝑤2 + ⋯ + 𝑤𝑛
= 𝑤1 𝑥1 + 𝑤2 𝑥2 + ⋯ + 𝑤𝑛 𝑥𝑛 − 𝑤1 𝑥1 + 𝑤2 𝑥2 + ⋯ + 𝑤𝑛 𝑥𝑛
=0
平均の左右のトルクが釣り合って0になる事が示せた
約分
これまでの平均との関係
• 加重平均の公式
𝑤1 𝑥1 + 𝑤2 𝑥2 + ⋯ + 𝑤𝑛 𝑥𝑛
𝑥=
𝑤1 + 𝑤2 + ⋯ + 𝑤𝑛
で全ての𝑤𝑖 の重さが等しい値 𝑐 だとする
• 𝑤1 = 𝑤2 = ⋯ = 𝑤𝑛 = 𝑐 とすると上の式は次のようになる
𝑐𝑥1 + 𝑐𝑥2 + ⋯ + 𝑐𝑥𝑛
𝑥=
𝑐 + 𝑐 + ⋯+ 𝑐
𝑐 𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛
=
𝑐𝑛
これまでの平均の式は
全ての重さが等しい場合の
加重平均に相当する
1
= 𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛
𝑛
共通因子 𝑐 で括る
𝑐 を 𝑛 個足すので 𝑐𝑛
約分
(教科書P.107)
度数分布から代表値を概算する
階級値を使った平均値と最頻値の
概算
連続データの分析
量的データは大きく分けて2種類ある
• 離散データ(discret data,整数データ)
– 階級に分けなくても度数分布を調べられる
• 連続データ(continuous data,実数データ)
– 小数点以下いくらでも小さく半端な値を持つので
殆ど全てのデータの度数は1になってしまう
(例えば身長データでは156.77[cm]と156.78[cm]
は違う値のデータ.156.771や156.772も違う)
– 度数の集計をする際には「○○以上○○未満」な
どの階級(class)に分ける
階級と階級値
• 階級値(class value)
– 階級を代表する値
– (階級の間の値なら何でも良いが)普通は階級の真ん中
の値を階級値にする
階級の下限 + 階級の上限
階級値 =
2
– 階級内のデータを全て階級値の値に近似することによっ
てデータ全体の合計や平均の概算ができる
(階級値に度数や相対度数の重みを掛けた加重平均で計算)
– 階級に要約する前のデータ(生データ)はデータ量が多い
等の様々な理由で手に入らないことがあるので階級値を
使った概算は重要
表2.3.9の女性の体重の度数分布
階級にまとめる前のデータが以下のものだったとする.
{18.1, 20.2, 22.5, 25.3, 27.4, 28.0, 30.2, 31.2, 34.9, 36.4,
37.1, 37.9, 38.4, 39.1, 41.4, 41.8, 43.2, 46.2, 48.6, 55.7} 単位[kg]
合計703.6, 平均: 35.18
階級
番号
𝒊
階級
階級値
度数
𝒙𝒊
𝒇𝒊
1
10 ≤ 𝑥 < 20
15
1
2
20 ≤ 𝑥 < 30
25
3
30 ≤ 𝑥 < 40
35
4
40 ≤ 𝑥 < 50
45
5
50 ≤ 𝑥 < 60
合計
-
相対
度数
𝒓𝒊
𝒇𝒊 𝒙𝒊
𝒓𝒊 𝒙𝒊
0.05
15
0.75
5
0.25
125
6.25
8
0.40
280
14.00
5
0.25
225
11.25
55
1
0.05
55
2.75
-
20
1.00
700
35.00
↑最頻値の概算
↑合計の概算
↑平均の概算
女性の体重の度数分布
度数の目盛
10
相対度数の目盛
0.5
8
0.4
6
0.3
4
0.2
2
0.1
0
0
0
10
連続データの度数分布は
階級間を隙間なくくっつけたグラフ
「ヒストグラム」で表現する
20
30
𝑥
35
40
50
60
70
[kg]
表2.3.10の男性の体重の度数分布
階級にまとめる前のデータが以下のものだったとする.
{29.8, 34.2, 38.8, 41.6, 43.3, 47.0, 48.2, 50.8, 52.5, 54.8,
55.2, 57.6, 59.3, 60.5, 61.2, 64.6, 66.2, 66.6, 67.4, 69.2} 単位[kg]
合計1068.8, 平均: 53.44
階級
番号
𝒊
階級
階級値
度数
𝒙𝒊
𝒇𝒊
1
20 ≤ 𝑥 < 30
25
1
2
30 ≤ 𝑥 < 40
35
3
40 ≤ 𝑥 < 50
45
4
50 ≤ 𝑥 < 60
5
60 ≤ 𝑥 < 70
合計
-
相対
度数
𝒓𝒊
𝒇𝒊 𝒙𝒊
𝒓𝒊 𝒙𝒊
0.05
25
1.25
2
0.10
70
3.50
4
0.20
180
9.00
55↓最頻値の概算
6
0.30
330
16.50
65
7
0.35
455
22.75
-
20
1.00
1060
53.00
↑合計の概算
↑平均の概算
男性の体重の度数分布
度数の目盛
10
相対度数の目盛
0.5
8
0.4
6
0.3
4
0.2
2
0.1
0
0
10
20
30
40
50
𝑥
53
60
70
80
[kg]
P.128問11
番号
𝒊
階級
階級値
𝒙𝒊
1
0.0 < 𝑥 ≤ 0.5
0.25
2
0.5 < 𝑥 ≤ 1.0
3
4
度数
𝒇𝒊
相度
𝒓𝒊
𝒇𝒊 𝒙𝒊
𝒓𝒊 𝒙𝒊
8
0.040
2.00
0.01000
0.75
27
0.135
20.25
0.10125
1.0 < 𝑥 ≤ 1.5
1.25
45
0.225
56.25
0.28125
1.5 < 𝑥 ≤ 2.0
1.75
50
0.250
87.50
0.43750
↑最頻値の概算
5
2.0 < 𝑥 ≤ 2.5
2.25
39
0.195
87.75
0.43875
6
2.5 < 𝑥 ≤ 3.0
2.75
21
0.105
57.75
0.28875
7
3.0 < 𝑥 ≤ 3.5
3.25
7
0.035
22.75
0.11375
8
3.5 < 𝑥 ≤ 4.0
3.75
3
0.015
11.25
0.05625
合計
-
-
200
1.00
345.5
1.7275
↑合計の概算
↑平均の概算
1日に飲む水の量の度数分布
度数の目盛
60
相対度数の目盛
0.3
50
0.25
40
0.2
30
0.15
20
0.1
10
0.05
0
0
-0.5
0
0.5
1
1.5
2
𝑥
1.7275
2.5
3
3.5
4
4.5
[l]