第2回基本統計

基本統計量
P.133
とにかくデータがあったら
まず基本統計量
分布の位置、ばらつき、形を知ろう
基本統計量
名義尺度
度数、比率(割合)、最頻度値
順序尺度
度数、比率(割合)、最頻度値、中央値、範囲
連続尺度(間隔尺度、比例尺度)
平均値、中央値、最頻度値、範囲、分位点、
分散、標準偏差、変動係数、標準誤差
歪度、尖度
ばらつき
最頻度値(Mode)
度数が最も大きいデータ値
離散型・棒グラフ(名義・順序)
度
数
A
AB
水準
B
O
P.27
ヒストグラム(連続)
度
数
区間
平均(Mean)
ケース
1
2
3
x データの合計
x
データの数
データ値
x1  x 2    x n

5
n
7
xi


3
n
4
37
5
8
5  7  3  37  8 60
例) x 

5
5
 12
★ デ-タの中に極端な値がある場合は、その値に大きく影響される
歪度>0
歪度<0
中央値・分位点
大
最大値
四分位点 75%
中央値
四分位点 25%
小
最小値
Q1
3
9
2
7
5
中央値はどれか
歪度
右方向に裾をひく分布
歪度>0
左方向に裾をひく分布
歪度=0
歪度<0
尖度
尖度>0
尖度=0
(正規分布)
尖度<0
Q4
尖度 3.5
歪度 -2.4
の分布の形は?
ばらつき
主に比較に使う
どちらのばらつきが大きいの?
Aグループ
Bグループ
ばらつき(分散・標準偏差)を計算する
偏差
 ( xi  x )
平均値
偏差

分散 V=
2
n
×
ばらつき(分散・標準偏差)を計算する
偏差
 ( xi  x )
平均値
偏差

分散 V=
2
n
不偏分散 V=
2
偏差

n -1
ばらつき
分散
標準偏差= 分散
標準偏差 100
変動係数=
平均値
標準偏差
標準誤差=
n
変動係数
(データの単位に影響を受けないばらつき)
●比較する2つの集団の単位は同じであるが、平均値が極めて違う時。
(例) 成人女子の体重と10歳の女子の体重のばらつきの比較
平均値 標準偏差
成人女子
51.1kg
5.0kg
10歳女子
26.5kg
3.7kg
体重のばらつきは、成人女子が10歳女子より大きい?
※成人では、10歳より体重が2倍も重い!
もし同じ体重であったらどうだろうか。
成人女子の変動係数=5.0÷51.1×100=9.7(%)
10歳女子の変動係数=3.7÷26.5×100=13.9(%)
10歳の方がばらつきの程度が大きい!
●比較する2つの集団の性質が違う時。
(例) 身長と体重の比較 など
標準誤差(Standard Error)
平均値のばらつきの程度を示す。
集団
実験1
実験2
実験3
平均値
平均値
平均値
実験4
平均値
実験5
平均値
平均値(をデータとした)のばらつき
標準誤差 SE 
SD
n