Statistik I für Betriebswirte Vorlesung 2

Statistik I f¨ur Betriebswirte
Vorlesung 2
PD Dr. Frank Heyde
TU Bergakademie Freiberg
Institut f¨
ur Stochastik
16. April 2015
PD Dr. Frank Heyde
Statistik I f¨
ur Betriebswirte Vorlesung 2
1
ii) empirische Quantile
I
Ordnen der Datenreihe x1 , x2 , . . . , xn ergibt geordnete Datenreihe
(geordnete Stichprobe, Variationsreihe)
xmin := x(1) ≤ x(2) ≤ . . . ≤ x(n−1) ≤ x(n) =: xmax
I
empirisches α-Quantil (0 < α < 1): Zahlenwert xα , so dass
α · 100% der Werte in der Variationsreihe links davon liegen:

falls nα keine ganze Zahl ist, k ist dann




die auf nα folgende ganze Zahl
xα =




falls nα =: k eine ganze Zahl ist
PD Dr. Frank Heyde
Statistik I f¨
ur Betriebswirte Vorlesung 2
2
empirischer Median, empirische Quartile
empirischer Median: empirisches 0.5-Quantil, (mittlerer Wert der
geordneten Stichprobe)
x˜ = xmed := x0.5 =



falls n ungerade


falls n gerade
unteres empirisches Quartil (unterer Viertelwert):
oberes empirisches Quartil (oberer Viertelwert):
Bemerkung: Der arithmetische Mittelwert x ist empfindlich gegen¨
uber
Ausreißern, der Median x˜ weniger.
PD Dr. Frank Heyde
Statistik I f¨
ur Betriebswirte Vorlesung 2
3
iii) empirischer Modalwert, Modus
I
xmod Wert mit der gr¨
oßten H¨aufigkeit in der Stichprobe
I
h¨angt bei klassierten Daten stark von der gew¨ahlten
Klasseneinteilung ab → Modalklasse
I
im Allgemeinen gilt
I
auch verwendbar bei
I
zum Beispiel Partei mit den meisten Stimmen bei einer Wahl
PD Dr. Frank Heyde
Statistik I f¨
ur Betriebswirte Vorlesung 2
4
Streumaße (f¨ur metrisch skalierte Daten)
I
Spannweite:
I
Quartilsabstand (Viertelweite):
I
empirische Varianz (Stichprobenstreuung):
n
1 X
1
(xi − x)2 =
s =
n−1
n−1
2
i=1
I
empirische Standardabweichung:
I
Variationskoeffizient:
I
Ausreißergrenzen:
n
X
!
xi2
− nx
2
i=1
s
· 100% (falls x > 0)
x
keine phys. Einheit, f¨
ur kleine Werte x nicht sehr aussagekr¨aftig
v=
Au = Vu − 1.5dQ
Ao = Vo + 1.5dQ
(sogenannte innere Z¨aune; ¨außere Z¨aune bei ±3d)
PD Dr. Frank Heyde
Statistik I f¨
ur Betriebswirte Vorlesung 2
5
d) Box-Plot I
I
aussagekr¨aftige graphische Darstellung der F¨
unfer-Charakteristik“,
”
bestehend aus Median x˜, den empirischen Quartilen (Viertelwerten)
Vu , Vo und den Ausreißergrenzen Au , Ao
I
die untere Begrenzungslinie wird dabei bestimmt durch den kleinsten
Wert, der ≥ Au ist, (= xmin falls xmin ≥ Au ) w¨ahrend die obere
Begrenzungslinie durch den gr¨
oßten Wert, der ≤ Ao ist, definiert
wird (= xmax falls xmax ≤ Ao )
I
Ausreißer (Datenwerte außerhalb der Ausreißergrenzen) werden
extra durch Punkte angegeben
PD Dr. Frank Heyde
Statistik I f¨
ur Betriebswirte Vorlesung 2
6
Box-Plot II
Box-and-Whisker Plot
40
Punkte
30
20
10
0
1
2
3
4
5
6
7
Fach
1: Bilanzierung
2: Wirtschaftsinformatik
3: Organisation
4: Marketing
PD Dr. Frank Heyde
Statistik I f¨
ur Betriebswirte Vorlesung 2
5: Produktion und Beschaffung
6: Investition und Finanzierung
7: Anlagenwirtschaft
7
Konzentrationsmaße I
I
f¨
ur
Merkmale
I
Konzentrationsmaße messen die Gleichm¨aßigkeit der Aufteilung der
Merkmalssumme auf die Merkmalstr¨ager
I
z.B.: Wie teilt sich ein Markt auf die Anbieter auf
(Marktkonzentration)?
Konzentriert sich der Gesamtumsatz auf wenige Firmen, oder haben
alle Firmen ungef¨ahr den gleichen Anteil?
I
typische Merkmale, f¨
ur die Konzentrationen bestimmt werden
Merkmal
Jahreseinkommen
Jahresumsatz
Einwohnerzahl
PD Dr. Frank Heyde
Merkmalstr¨ager
Unternehmen
Statistik I f¨
ur Betriebswirte Vorlesung 2
8
Konzentrationsmaße II
I
Extremf¨alle:
I
I
I
Merkmalssumme ist gleichm¨aßig auf alle
Merkmalstr¨ager verteilt
ein Element tr¨agt die gesamte
Merkmalssumme, die anderen ”gehen leer aus”
Beispiel
Betrieb
1
2
3
4
5
PD Dr. Frank Heyde
tats. Marktanteil
x1 = 5%
x2 = 25%
x3 = 10%
x4 = 20%
x5 = 40%
Marktant. bei Gleichvert.
20 %
20 %
20 %
20 %
20 %
Statistik I f¨
ur Betriebswirte Vorlesung 2
9
Konzentrationsmaße III: Lorenzkurve
I
I
I
I
I
graphische Darstellung durch Lorenzkurve
n Merkmalstr¨ager (5 Betriebe)
geordnete Merkmalswerte
x(1) = 5 ≤ x(2) = 10 ≤ x(3) = 20 ≤ x(4) = 25 ≤ x(5) = 40
Pi
i
j=1 x(j)
berechnen ui =
und vi = Pn
f¨
ur i = 1, . . . , n
n
j=1 x(j)
außerdem (u0 , v0 ) = (0, 0)
im Beispiel
(u0 , v0 ) = (0.0, 0.00)
(u1 , v1 ) = (0.2, 0.05)
(u2 , v2 ) = (0.4, 0.15)
(u3 , v3 ) = (0.6, 0.35)
(u4 , v4 ) = (0.8, 0.60)
(u5 , v5 ) = (1.0, 1.00)
PD Dr. Frank Heyde
Statistik I f¨
ur Betriebswirte Vorlesung 2
10
Konzentrationsmaße III: Lorenzkurven
I
Wie wirkt sich eine Fusion der Betriebe 2 und 5 aus, wie eine Fusion
der Betriebe 1 und 3 ?
blau:
rot:
gr¨
un:
schwarz:
PD Dr. Frank Heyde
Ausgangsdaten
Fusion Betriebe 2 und 5
Fusion Betriebe 1 und 3
Diagonale (Gleichverteilung)
Statistik I f¨
ur Betriebswirte Vorlesung 2
11
Lorenzsches Konzentrationsmaß (Gini-Koeffizient)
I
I
zahlenm¨aßige Kenngr¨
oße f¨
ur Konzentration
G = 2 mal Fl¨ache zwischen Diagonale und Lorenzkurve
n
1X
(vi + vi−1 )
G =1−
n
i=1
0
bei Gleichverteilung
wenn gesamte Masse in einem von n Punkten
I
⇒
I
normierter Gini-Koeffizient:
I
im Beispiel:
G=
I
I
I
n−1
n
Ausgangsdaten:
G = 1 − 15 (0.05 + 0.20 + 0.50 + 0.95 + 1.60) = 0.34
Fusion Betriebe 2 und 5:
G = 1 − 14 (0.05 + 0.20 + 0.50 + 1.35) = 0.475
Fusion Betriebe 1 und 3:
G = 1 − 14 (0.15 + 0.50 + 0.95 + 1.60) = 0.20
PD Dr. Frank Heyde
Statistik I f¨
ur Betriebswirte Vorlesung 2
12
Modifikation bei klassierten positiven Merkmalen
I
m Klassen mit relativen H¨aufigkeiten hi und Merkmalssummen pro
Klasse Mi , i = 1, . . . , m
I
Punkte der Lorenzkurve definiert durch
ui =
i
X
i
P
hj ,
vi =
j=1
j=1
m
P
Mj
,
i = 1, . . . , m
Mj
j=1
I
Gini-Koeffizient:
G =1−
m
X
hi (vi + vi−1 )
i=1
PD Dr. Frank Heyde
Statistik I f¨
ur Betriebswirte Vorlesung 2
13
Beispiel: Verteilung der landwirtschaftlichen Nutzfl¨ache
i
1
2
3
4
5
Fl¨ache in ha
< 5 ha
5 − 10 ha
10 − 20 ha
20 − 50 ha
> 50 ha
Hi
21
9
9
8
3
hier
PD Dr. Frank Heyde
hi
0.42
0.18
0.18
0.16
0.06
Mi
63
72
135
280
450
ui
0.42
0.6
0.78
0.94
1.00
vi
0.063
0.135
0.270
0.550
1.000
G = 0.6408
Statistik I f¨
ur Betriebswirte Vorlesung 2
14