1章 データの整理

1章 データの整理
1.5 発展したデータの代表値
■刈り込み平均(調整平均)
Trimmed Mean
例: { x[1], …, x[5] } = { 1, 3, 4, 6, 7 }
1
20%刈り込み平均:
2
3
4
5
6
x trim 20%
7
データの最小部 20% = {x[1]}、最大部 20% = {x[5]} を
データから除外 → { x[2], x[3], x[4] }
x trim 20%
3  4  6 13


 4.3
3
3
■幾何平均 Geometric Mean
幾何平均値
Π = Product 積
x geom   x 1 x 2  x n 
1/ n


   x i 
 i 1 
n
1/ n
性質) 対数領域における算術平均に対応
log x geom
1
 log x1  log x 2    log x n 
n
1 n
  log x i
n i 1
対前年比
GDP 対前年比
1.04
1.03
1.02
1.01
1.00
0.99
0.98
0.97
幾何平均
暦年
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
表1 GDP(2000年連鎖価格)とその伸び
1997
1998
1999
2000
2001
2002
暦年
GDP
500.1
489.8
489.1
503.1
504.0
505.4
(兆円)
0.979404 0.998571 1.028624 1.001789 1.002778
対前年比
-
2003
2004
2005
2006
2007
暦年
幾何平均
GDP
512.5
526.6
536.8
549.8
561.4
(兆円)
対前年比 1.014048 1.027512 1.019370 1.024218 1.021099 1.011630
2007/1997年 GDP比 = 1.122575
左の値1/10 = 1.011630
[参考]算術平均値= 1.011741
なぜ
(2007/1997年 GDP比) 1/10 = 対前年比の幾何平均値
なのか?
GDP2007  GDP1998  GDP1999   GDP2007 

 
  x1 x2  x10
 
GDP1997  GDP1997  GDP1998   GDP2006 
 GDP2007

 GDP1997



1 / 10
  x1 x 2  x10 
1 / 10
× 平均成長率 = 成長率の算術平均値
○ 平均成長率 = 対前期比の幾何平均値 - 1
■加重平均値(Weighted Mean)
n
x weight  c1 x1  c2 x2    cn xn   ci xi
i 1
n
0 ≦ ci ≦1 i  1,, n,  ci  1
i 1
階級区分されたデータの平均値
= 相対度数を重みとする加重平均値
例:
xi
1
3
4
6
7
7/19
2/19
1/19
計
1
ci 7/19 5/19 4/19 2/19 1/19
5/19
4/19
2
3
4
1
加重平均 = 3
5
6
7
■移動平均 Moving Average
(時系列データの場合)
5期の移動平均(期数は奇数のみ)
1
例:
x t   x t  2  x t 1  x t  x t 1  x t  2 
5
1 t 2
  xi
5 i t 2
t
t  3, , n  2
20
x
原系列
5期移動平均
平均期間
15
10
5
t
0
0
1
2
3
4
5
6
7
8
9 10
1
2
3
4
5
6
7
8
9
5期
xt 移動
平均
19
18
13
14
11
12
9
10
9
8
8
6
3
1
終値
12,000
08/4/27
08/4/17
08/4/7
08/3/28
08/3/18
終値
12,000
08/3/8
08/2/27
08/2/17
08/2/7
08/1/28
日経平均株価
円
15,000
14,000
拡
大
図
日経平均株価
円
15,000
14,000
13,000
5期移動平均
11,000
13,000
5期移動平均
11,000
08/3/28
08/3/18
08/3/8
08/2/27
08/2/17
08/2/7
08/1/28
■変動係数 Coefficient of Variation: CV
非負の計測値 xi ≧ 0 (i = 1, …, n) について、
標本標準偏差 S
変動係数CV   
標本平均
x
例:上智大学生の身体特性値(2002年度統計学履修者)
男子
(n=283)
身長
体重
靴サイズ
(cm)
(kg)
(cm)
平均
標準偏
差
変動係
数
172.47
61.13
26.65
0
5.14
7.13
0.84
0.030
0.117
0.031
0
50
20
100
40
150
60
80
200
cm
100 kg
■変数の標準化と偏差値
変数の標準化( z値 ):
x  標本平均 x  x
z 
標本標準偏差
S
値 x を平均からの偏差に変換し、
単位を標準偏差の倍数で表現
偏差値  z  10 50
性別
靴サイズ
女子
25 (cm)
女子 靴サイズ
19
z値
1.72
偏差値
67
20
21
22
23
= (25 – 23.67) / 0.78
= 1.72×10 + 50
24
25
26
27
28
cm