Statistik I f¨ur Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut f¨ ur Stochastik 16. April 2015 PD Dr. Frank Heyde Statistik I f¨ ur Betriebswirte Vorlesung 2 1 ii) empirische Quantile I Ordnen der Datenreihe x1 , x2 , . . . , xn ergibt geordnete Datenreihe (geordnete Stichprobe, Variationsreihe) xmin := x(1) ≤ x(2) ≤ . . . ≤ x(n−1) ≤ x(n) =: xmax I empirisches α-Quantil (0 < α < 1): Zahlenwert xα , so dass α · 100% der Werte in der Variationsreihe links davon liegen: falls nα keine ganze Zahl ist, k ist dann die auf nα folgende ganze Zahl xα = falls nα =: k eine ganze Zahl ist PD Dr. Frank Heyde Statistik I f¨ ur Betriebswirte Vorlesung 2 2 empirischer Median, empirische Quartile empirischer Median: empirisches 0.5-Quantil, (mittlerer Wert der geordneten Stichprobe) x˜ = xmed := x0.5 = falls n ungerade falls n gerade unteres empirisches Quartil (unterer Viertelwert): oberes empirisches Quartil (oberer Viertelwert): Bemerkung: Der arithmetische Mittelwert x ist empfindlich gegen¨ uber Ausreißern, der Median x˜ weniger. PD Dr. Frank Heyde Statistik I f¨ ur Betriebswirte Vorlesung 2 3 iii) empirischer Modalwert, Modus I xmod Wert mit der gr¨ oßten H¨aufigkeit in der Stichprobe I h¨angt bei klassierten Daten stark von der gew¨ahlten Klasseneinteilung ab → Modalklasse I im Allgemeinen gilt I auch verwendbar bei I zum Beispiel Partei mit den meisten Stimmen bei einer Wahl PD Dr. Frank Heyde Statistik I f¨ ur Betriebswirte Vorlesung 2 4 Streumaße (f¨ur metrisch skalierte Daten) I Spannweite: I Quartilsabstand (Viertelweite): I empirische Varianz (Stichprobenstreuung): n 1 X 1 (xi − x)2 = s = n−1 n−1 2 i=1 I empirische Standardabweichung: I Variationskoeffizient: I Ausreißergrenzen: n X ! xi2 − nx 2 i=1 s · 100% (falls x > 0) x keine phys. Einheit, f¨ ur kleine Werte x nicht sehr aussagekr¨aftig v= Au = Vu − 1.5dQ Ao = Vo + 1.5dQ (sogenannte innere Z¨aune; ¨außere Z¨aune bei ±3d) PD Dr. Frank Heyde Statistik I f¨ ur Betriebswirte Vorlesung 2 5 d) Box-Plot I I aussagekr¨aftige graphische Darstellung der F¨ unfer-Charakteristik“, ” bestehend aus Median x˜, den empirischen Quartilen (Viertelwerten) Vu , Vo und den Ausreißergrenzen Au , Ao I die untere Begrenzungslinie wird dabei bestimmt durch den kleinsten Wert, der ≥ Au ist, (= xmin falls xmin ≥ Au ) w¨ahrend die obere Begrenzungslinie durch den gr¨ oßten Wert, der ≤ Ao ist, definiert wird (= xmax falls xmax ≤ Ao ) I Ausreißer (Datenwerte außerhalb der Ausreißergrenzen) werden extra durch Punkte angegeben PD Dr. Frank Heyde Statistik I f¨ ur Betriebswirte Vorlesung 2 6 Box-Plot II Box-and-Whisker Plot 40 Punkte 30 20 10 0 1 2 3 4 5 6 7 Fach 1: Bilanzierung 2: Wirtschaftsinformatik 3: Organisation 4: Marketing PD Dr. Frank Heyde Statistik I f¨ ur Betriebswirte Vorlesung 2 5: Produktion und Beschaffung 6: Investition und Finanzierung 7: Anlagenwirtschaft 7 Konzentrationsmaße I I f¨ ur Merkmale I Konzentrationsmaße messen die Gleichm¨aßigkeit der Aufteilung der Merkmalssumme auf die Merkmalstr¨ager I z.B.: Wie teilt sich ein Markt auf die Anbieter auf (Marktkonzentration)? Konzentriert sich der Gesamtumsatz auf wenige Firmen, oder haben alle Firmen ungef¨ahr den gleichen Anteil? I typische Merkmale, f¨ ur die Konzentrationen bestimmt werden Merkmal Jahreseinkommen Jahresumsatz Einwohnerzahl PD Dr. Frank Heyde Merkmalstr¨ager Unternehmen Statistik I f¨ ur Betriebswirte Vorlesung 2 8 Konzentrationsmaße II I Extremf¨alle: I I I Merkmalssumme ist gleichm¨aßig auf alle Merkmalstr¨ager verteilt ein Element tr¨agt die gesamte Merkmalssumme, die anderen ”gehen leer aus” Beispiel Betrieb 1 2 3 4 5 PD Dr. Frank Heyde tats. Marktanteil x1 = 5% x2 = 25% x3 = 10% x4 = 20% x5 = 40% Marktant. bei Gleichvert. 20 % 20 % 20 % 20 % 20 % Statistik I f¨ ur Betriebswirte Vorlesung 2 9 Konzentrationsmaße III: Lorenzkurve I I I I I graphische Darstellung durch Lorenzkurve n Merkmalstr¨ager (5 Betriebe) geordnete Merkmalswerte x(1) = 5 ≤ x(2) = 10 ≤ x(3) = 20 ≤ x(4) = 25 ≤ x(5) = 40 Pi i j=1 x(j) berechnen ui = und vi = Pn f¨ ur i = 1, . . . , n n j=1 x(j) außerdem (u0 , v0 ) = (0, 0) im Beispiel (u0 , v0 ) = (0.0, 0.00) (u1 , v1 ) = (0.2, 0.05) (u2 , v2 ) = (0.4, 0.15) (u3 , v3 ) = (0.6, 0.35) (u4 , v4 ) = (0.8, 0.60) (u5 , v5 ) = (1.0, 1.00) PD Dr. Frank Heyde Statistik I f¨ ur Betriebswirte Vorlesung 2 10 Konzentrationsmaße III: Lorenzkurven I Wie wirkt sich eine Fusion der Betriebe 2 und 5 aus, wie eine Fusion der Betriebe 1 und 3 ? blau: rot: gr¨ un: schwarz: PD Dr. Frank Heyde Ausgangsdaten Fusion Betriebe 2 und 5 Fusion Betriebe 1 und 3 Diagonale (Gleichverteilung) Statistik I f¨ ur Betriebswirte Vorlesung 2 11 Lorenzsches Konzentrationsmaß (Gini-Koeffizient) I I zahlenm¨aßige Kenngr¨ oße f¨ ur Konzentration G = 2 mal Fl¨ache zwischen Diagonale und Lorenzkurve n 1X (vi + vi−1 ) G =1− n i=1 0 bei Gleichverteilung wenn gesamte Masse in einem von n Punkten I ⇒ I normierter Gini-Koeffizient: I im Beispiel: G= I I I n−1 n Ausgangsdaten: G = 1 − 15 (0.05 + 0.20 + 0.50 + 0.95 + 1.60) = 0.34 Fusion Betriebe 2 und 5: G = 1 − 14 (0.05 + 0.20 + 0.50 + 1.35) = 0.475 Fusion Betriebe 1 und 3: G = 1 − 14 (0.15 + 0.50 + 0.95 + 1.60) = 0.20 PD Dr. Frank Heyde Statistik I f¨ ur Betriebswirte Vorlesung 2 12 Modifikation bei klassierten positiven Merkmalen I m Klassen mit relativen H¨aufigkeiten hi und Merkmalssummen pro Klasse Mi , i = 1, . . . , m I Punkte der Lorenzkurve definiert durch ui = i X i P hj , vi = j=1 j=1 m P Mj , i = 1, . . . , m Mj j=1 I Gini-Koeffizient: G =1− m X hi (vi + vi−1 ) i=1 PD Dr. Frank Heyde Statistik I f¨ ur Betriebswirte Vorlesung 2 13 Beispiel: Verteilung der landwirtschaftlichen Nutzfl¨ache i 1 2 3 4 5 Fl¨ache in ha < 5 ha 5 − 10 ha 10 − 20 ha 20 − 50 ha > 50 ha Hi 21 9 9 8 3 hier PD Dr. Frank Heyde hi 0.42 0.18 0.18 0.16 0.06 Mi 63 72 135 280 450 ui 0.42 0.6 0.78 0.94 1.00 vi 0.063 0.135 0.270 0.550 1.000 G = 0.6408 Statistik I f¨ ur Betriebswirte Vorlesung 2 14
© Copyright 2024 ExpyDoc