Kapitel 5: Beschreibende StaƟsƟk 163 5 Beschreibende Statistik 5.1 Einführung Inhalt und Aufgaben der Beschreibenden Statistik Der Begriff Statistik wird häufig mit Schaubildern, Grafiken und Tabellen in Verbindung gebracht, mit denen umfangreiche Datenmengen übersichtlich dargestellt werden. Beispiele hierfür sind Statistiken über die Entwicklung von Bevölkerungszahlen über einen längeren Zeitraum, Wahlergebnisse, Zusammensetzung von Benzinpreisen (s. nebenstehende Graphik), Arbeitslosenstatistiken oder Beobachtungsreihen über Wetterverhältnisse (Anzahl der Regentage, Temperaturentwicklung). Mehrwert-, Mineralöl- und Bevorratungssteuer Ökosteuer Wareneinstandspreis Kosten/Invesonen/Gewinnanteil 4% 24% 59% 13% Zusammensetzung des Benzinpreises Die grafische Darstellung von Datenmengen ist aber nur eine Aufgabe der Beschreibenden Statistik. Bevor solche Datenmengen grafisch dargestellt werden können, müssen sie vorher erst durch Zählen, Befragen, Beobachten oder Messen erhoben werden. Um das erhobene Datenmaterial besser beurteilen und vergleichen zu können, wird es oftmals noch durch zusätzliche Kenngrößen zusammengefasst (verdichtet). Merke: Inhaltlich beschäftigt sich die Beschreibende Satistik mit umfangreichem Datenmaterial. Hierbei fallen folgende Aufgaben an: - Sammeln (erheben) der benötigten Daten durch Abzählen, Befragen, Beobachten oder Messen; - Ordnen und Zusammenfassen (klassifizieren) der erhobenen Daten; - Darstellen der Daten mit geeigneten Hilfsmitteln (Tabellen oder Schaubilder); - Beschreiben der Daten durch Kenngrößen. Anhand eines einfachen Beispiels aus der Schulpraxis werden zunächst die Grundlagen zu den Schritten eines statistischen Untersuchungsprozesses grob dargestellt. In weiteren Abschnitten dieses Kapitels erfolgt eine eingehendere Darlegung der benötigten Begriffe und Methoden, die die Arbeitsweisen der Beschreibenden Statistik verdeutlichen sollen. 164 Kapitel 5: Beschreibende StaƟsƟk Gesamtdarstellung einer statistischen Erhebung Einführungsbeispiel: Es ist eine Statistik zu den Fehlzeiten der Schülerinnen und Schüler einer Schulklasse anzufertigen. 1. Schritt: Formulierung einer Fragestellung Jeder statistischen Erhebung Fragestellung zugrunde. liegt eine „Wie hoch sind die Fehlzeiten der einzelnen Schülerinnen und Schüler innerhalb der Klasse FOW 11a?“ 2. Schritt: Vorüberlegungen a) Welche Schülerinnen und Schüler gehören zur Klasse? Diese bilden die Grundgesamtheit der Untersuchung. Die Schülerinnen und Schüler sind die Elemente der Grundgesamtheit. Es gehören alle Schülerinnen und Schüler zur Klasse, die zu einem bestimmten Zeitpunkt in der Schülerkartei der Klasse FO W 11a geführt werden. b) Welche Eigenschaft soll untersucht werden? Hier wird das zu untersuchende Merkmal festgelegt. Die Fehlzeiten werden an den Fehltagen und Fehlstunden der Schülerinnen und Schüler gemessen. c) Wie kann die gewählte Eigenschaft erhoben werden? Dies geschieht durch Abzählen, Befragen, Beobachten oder Messen. Die Fehlzeiten werden entweder über die Eintragungen im Klassenbuch oder über Befragen der in der Klasse unterrichtenden Lehrkräfte erhoben. 3. Schritt: Erhebung der Daten Die erhobenen Daten werden zunächst in ungeordneter Form in der Reihenfolge ihrer Erhebung gesammelt. Die daraus entstehende Liste wird als Urliste bezeichnet. Bei den 30 Schüler/-innen der FOW 11a gab es im vergangenen Halbjahr folgende Fehlzeite in Tagen: 4. Schritt: Urliste zu den Fehlzeiten in Tagen: 2 4 3 0 0 2 1 4 2 5 3 0 1 1 2 1 2 5 2 4 0 2 2 3 2 1 2 0 1 3 Aufbereitung und Darstellung der Daten Die meist unübersichtliche Darstellung der Urliste ist zunächst zu ordnen. Bei großen Datenmengen geschieht dies über eine Strichliste. Danach werden den vorkommenden Fehltagen ihre Häufigkeiten zugeordnet. So entsteht eine Häufigkeitstabelle, die die Häufigkeitsverteilung für das Merkmal Fehltage in der Klasse FOW 11a angibt. Strichliste und Häufigkeitstabelle: Fehltage 0 1 2 3 4 5 Strichliste ||||| |||||| |||||||||| |||| ||| || Häufigkeit 5 6 10 4 3 2 Kapitel 5: Beschreibende StaƟsƟk 165 Schließlich kann die Häufigkeitstabelle durch ein Schaubild, zum Beispiel durch ein Säulendiagramm, dargestellt und veranschaulicht werden. Häufigkeit 15 10 5 0 0 1 2 3 4 5 Anzahl der Fehltage 5. Schritt: Beschreibung der Häufigkeitsverteilung durch Kenngrößen Das Zahlenmaterial kann schließlich durch Kenngrößen in knapper Form beschrieben werden. Sie werden zu Vergleichszwecken mit gleichartigen Grundgesamtheiten herangezogen, z. B. Vergleich der Fehlzeiten in den Parallelklassen der FOW 11a. Beispiele für Kenngrößen: Niedrigster Wert Höchster Wert Häufigster Wert Mittlerer Wert (Median) Arithmetischer Mittelwert Spannweite 0 Tage 5 Tage 2 Tage 2 Tage 2 Tage 5 Tage Die Schrittfolge einer statistischen Erhebung kann wie folgt allgemein zusammengefasst werden: Merke Schritte einer statistischen Erhebung: 1. Formulierung einer Fragestellung Mit der Fragestellung wird der Inhalt der Untersuchung herausgestellt. 2. Planung der Erhebung Festlegung der Grundgesamtheit durch zeitliche, sachliche und örtliche Abgrenzung, Vereinbarung des zu untersuchenden Merkmals, Entscheidung, wie die Daten erhoben werden sollen. 3. Durchführung der Erhebung durch Abzählen, Befragen, Beobachten, Messen. 4. Aufbereitung der Daten durch Strichliste, Tabelle, Schaubild. 5. Kennzeichnung der Daten durch Kenngrößen. Beispiele: niedrigster, höchster und häufigster Wert, Mittelwerte und Streuungsmaße. • Aufgabe zur Festigung des erworbenen Wissens Führen Sie dieselben Schritte einer statistischen Erhebung aus, mit der a) die Alterszusammensetzung Ihrer Schulklasse, b) der Durchgangsverkehr in einer Wohnstraße untersucht werden soll. 166 Kapitel 5: Beschreibende StaƟsƟk Grundgesamtheit, Merkmale und ihre Ausprägungen Bei der Aufbereitung statistischer Daten sind zuvor bestimmte Grundbegriffe zu klären, damit eindeutig festgelegt ist, was inhaltlich zu erarbeiten ist. Grundgesamtheit Die Grundgesamtheit gibt an, auf welchen Personenkreis oder welche Gegenstände (Objekte) sich die statistische Untersuchung bezieht. Die einzelnen Objekte werden als Elemente der Grundgesamtheit bezeichnet. Beispiel: Grundgesamtheit Element der Grundgesamtheit Schulklasse FOW 11a Schüler der Schulklasse FOW 11a Oftmals ist die Festlegung der Grundgesamtheit und ihrer Elemente noch zu ungenau. Deshalb wird zusätzlich angegeben, in welchem Zeitraum bzw. zu welchem Zeitpunkt, an welchem Ort und wodurch die Elemente untersucht werden. Dieses wird als zeitliche, örtliche und sachliche Abgrenzung bezeichnet. Beispiel: Schulklasse FOW 11a (= Grundgesamtheit) zeitliche Abgrenzung: sachliche Abgrenzung: örtliche Abgrenzung: z. B.: Stand 1. August 20.. z. B.: Schülerkartei der Klasse FOW 11a z. B.: BBS der Stadt Fulda Merkmal und Merkmalsausprägung Mit dem Merkmal wird angegeben, welche Eigenschaft an den Elementen einer Grundgesamtheit untersucht werden soll. Werden die Schülerinnen und Schüler einer bestimmten Schulklasse zum Beispiel nach ihrem Alter (= Merkmal) befragt, so ergeben sich in der Regel verschiedene Altersangaben (= Merkmalsausprägungen). Diese werden als Ausprägungen des Merkmals „Alter“ bezeichnet. Es sind also die Antwortmöglichkeiten für ein bestimmtes Merkmal. Wichtig ist, sich vor der Untersuchung Gedanken zu machen, welche Merkmalsausprägungen infrage kommen können. Kapitel 5: Beschreibende StaƟsƟk 167 Beispiele: Elemente der Grundgesamtheit: Untersuchtes Merkmal: Merkmalsausprägungen: Schüler der Schulklasse Alter 17, 18, 19, … Jahre Nationalität Deutsch, türkisch, polnisch, … Benutztes Verkehrsmittel Zu Fuß, Fahrrad, Bus, Pkw, … Familienstand Ledig, verheiratet, geschieden, ... Steuerklasse I, II, III, IV, V, VI Marke VW, BMW, Fiat, Toyota, … Farbe Rot, schwarz, blau, … Betriebsangehörige Mietwagen Merke Vor jeder statistischen Erhebung sind neben der Grundgesamtheit und ihrer Elemente die zu untersuchenden Merkmale und deren Ausprägungen festzulegen. Merkmale sind Eigenschaften, die an den Elementen einer Grundgesamtheit untersucht werden. Merkmalsausprägungen sind Werte, die ein bestimmtes Merkmal annehmen kann. Arten von Merkmalen Betrachtet man die Merkmalsausprägungen von Merkmalen, so lassen sich grob zwei Arten von Merkmalen unterscheiden: Quantitative und qualitative Merkmale. Quantitative Merkmale Quantitative Merkmale liegen dann vor, wenn deren Ausprägungen durch Zählen, Messen, Wiegen erfasst werden, wie zum Beispiel Gewicht, Längen, Alter. Neben der Festlegung einer Rangordnung lassen sie noch Aussagen durch Differenz- und Verhältnisbildung ihrer Ausprägungen zu. Beispiel: Grundgesamtheit: Wohnungen in einem Mietshaus Untersuchtes Merkmal: Wohnungsgröße in m2 Ergebnis: Wohnung A ist 80 m2 groß; Wohnung B ist 120 m2 groß Abgeleitete Aussagen über die Wohnungen A und B: Rangordnung: Wohnung A ist kleiner als Wohnung B. Differenzbildung: Wohnung B ist 40 m2 größer als Wohnung A. Verhältnisbildung: Wohnung B ist 1,5-mal so groß wie Wohnung A. 168 Kapitel 5: Beschreibende StaƟsƟk Innerhalb der quantitativen Merkmale werden noch diskrete und stetige Merkmale unterschieden. Merkmalsausprägungen diskreter Merkmale können nur isolierte Zahlenwerte annehmen, zum Beispiel Alter, Anzahl der Urlaubstage usw. Ausprägungen stetiger Merkmale können auf einer Zahlenskala jeden beliebigen Zahlenwert annehmen (Beispiele: Körpergewicht, Längenmaße, Säuregehalt einer Flüssigkeit). Somit weisen stetige Merkmale theoretisch unendlich viele Ausprägungen auf. Qualitative Merkmale Qualitative Merkmale sind durch eine sie kennzeichnende Eigenschaft bestimmt, etwa Farben, Religionszugehörigkeit, Berufsbezeichnungen. Eine Rangordnung ist in Ausnahmefällen durchaus noch möglich (Beispiel: Schulnoten lassen sich noch in besser oder schlechter vergleichen), eine Differenz- oder Verhältnisbildung ist jedoch meist nicht sinnvoll. So lassen zum Beispiel die Merkmale Farben oder Religionszugehörigkeit keine Rangordnung zu. Arten von Merkmalen Quantitative Merkmale Qualitative Merkmale Durch Zählen, Messen, Wiegen erfassbar. Nur über die Angabe kennzeichnender Eigenschaften erfassbar. diskret stetig = isoliert = kontinuierlich angeordnete angeordnete Zahlenwerte Zahlenwerte Anmerkung: Für die symbolische Fassung von Merkmalsausprägungen wird in der Mathematik häufig ein Platzhalter eingeführt, zum Beispiel x. Ordnet man die Ausprägungen der Reihe nach an, so werden die Ausprägungen mit x1, x2, x3 … bezeichnet (z.B. bei Altersangaben x1=16, x2=17, x3=18, … Eine beliebige Ausprägung i heißt dann xi. Aufgaben zur Wiederholung 1. Geben Sie eine Schrittfolge für eine statistische Erhebung zum Freizeitverhalten (Hobbies) ihrer Schulklasse an. 2. Gegenstand einer statistischen Untersuchung seien die a) Wohnbevölkerung b) Mitglieder eines Sportvereins c) Wohnungen einer Stadt d) verkaufte Zeitschriften eines Wochenendes Geben Sie drei verschiedene Merkmale an, auf die sich die Untersuchung beziehen kann. 3. Geben Sie mögliche Ausprägungen der folgenden Merkmale an: a) Geschlecht d) Körpergewicht g) Jahreszeit b) Schulbildung e) Wohnungsgröße h) Lieblingssportart c) Wochentag f) Zahl der Kinder eines Haushalts i) Augenzahl beim Würfel Kapitel 5: Beschreibende StaƟsƟk 169 4. Unterteilen Sie die folgenden Merkmale in quantitative bzw. in qualitative Merkmale. Zahl der Verkehrsunfälle, Geschlecht, Jahreszeit, Studienwunsch, Durchschnittsnote, Dauer eines Ferngesprächs, Alkoholgehalt im Blut, Jahresumsatz, Augenfarbe. 5. Geben Sie an, welche der folgenden quantitativen Merkmale diskret und welche stetig sind. a) Zahl der Geschwindigkeitsübertretungen an einem Wochenende b) Geschwindigkeit eines Aufschlags beim Tennis c) Körpertemperatur d) Anzahl der Spieler im Aufgebot einer Fußballmannschaft 5.2 Aufbereitung und Darstellung statistischer Daten Ziel der Aufbereitung statistischer Daten ist es, das erhobene Zahlenmaterial zu ordnen, zusammenzufassen und tabellarisch oder grafisch darzustellen. Hierbei stellt sich zunächst die Frage, wie häufig eine bestimmte Merkmalsausprägung in den Elementen der Grundgesamtheit vorkommt. Dies führt auf die Begriffe der absoluten und relativen Häufigkeiten. Absolute und relative Häufigkeiten Werden die durch Auszählen ermittelten Häufigkeiten durch Zahlenwerte angegeben, so bezeichnet man diese als absolute Häufigkeiten h. Werden sie jeweils zur Gesamtheit aller Häufigkeiten ins Verhältnis gesetzt, so erhält man die relativen Häufigkeiten r. Sie geben an, mit welchem Anteil eine Ausprägung in der Grundgesamtheit enthalten ist. Oftmals werden sie auch in Prozenten ausgedrückt. Die Zuordnung der absoluten und relativen Häufigkeiten zu den Merkmalsausprägungen ergibt die Häufigkeitsverteilung des zu untersuchenden Merkmals. Beispiel: Die Zusammenstellung der Ergebnisse einer Klassenarbeit von den 25 Schülerinnen und Schülern einer Schulklasse ergab folgende Urliste: 3 2 1 6 3 2 1 3 2 4 4 6 3 2 4 2 3 3 5 3 1 4 3 5 5 a) Fertigen Sie eine Strichliste an und ermitteln Sie die absoluten Häufigkeiten hi. b) Berechnen Sie die relativen Häufigkeiten ri und stellen Sie das Ergebnis der Klassenarbeit in einer Häufigkeitsverteilung tabellarisch dar. Lösung: a) Die vergebenen Noten (= Merkmalsausprägungen) werden untereinander geschrieben. Die einzelnen Schülerergebnisse können dann in Form von Strichen in einer Strichliste festgehalten werden. Aus der Anzahl der Striche erhält man die absoluten Häufigkeien h1, h2, …, h6. Die absolute Häufigkeit der Note xi wird mit hi bezeichnet. Absolute Häufigkeiten Note xi 1 2 3 4 5 6 Summe Strichliste | | | | | | | | | | | | | | | | | | | | | | | | | absolute Häufigkeiten hi 3 5 8 4 3 2 25 170 Kapitel 5: Beschreibende StaƟsƟk b) Die relativen Häufigkeiten ri ergeben sich aus der Formel ri = Relative Häufigkeiten: Note xi 1 2 3 4 5 6 Relative Häufigkeiten ri 0,12 0,20 0,32 0,16 0,12 0,08 Summe 1.00 absolute Häufigekeit Summe aller Häufigkeiten in Kurzform: ri = relative Häufigkeit der Note xi r1 = 3 = 0,12; r2 = 5 = 0,20; 25 25 8 = 0,32; r4 = 4 = 0,16; r3 = 25 25 3 = 0,12; r6 = 2 = 0,08 r5 = 25 25 Relative Häufigkeit en (in %) 12 20 32 16 12 8 100 Summenhäufigkeiten In der Häufigkeitsverteilung lässt sich nicht unmittelbar ablesen, wie viel Schüler eine Note besser als 3 oder 4 geschrieben haben bzw. wie hoch die Durchfallquote der Arbeit ist. Hierfür sind die Häufigkeiten der einzelnen Merkmalsausprägungen nacheinander aufzusummieren. So erhält man die Tabelle der Summenhäufigkeiten. Beispiel: Die Ergebnisse der Abschlussklausur in Mathematik haben für eine Klasse der Fachoberschule das folgende Ergebnis ergeben: Note Anzahl 1 3 2 4 3 6 4 5 5 2 6 0 a) Ermitteln Sie die absoluten und relativen Summenhäufigkeiten dieser Verteilung. b) Beantworten Sie mithilfe der Tabelle der Summenhäufigkeiten die folgenden Fragen: 1. Wie viel Schüler haben eine Note besser als 3? 2. Wie viel Schüler haben die Klausur bestanden? 3. Wie hoch ist die Durchfallquote der Klausur? Lösung: a) Durch Aufsummieren ergeben sich die absoluten und relativen Summenhäufigkeiten, zum Beispiel so: Note bis einschließlich 1: 3 Note bis einschließlich 2: 3 + 4 = 7 Note bis einschließlich 3: 3 + 4 + 6 = 13 usw. (siehe Tabelle 1). Für die relativen Summenhäufigkeiten werden zunächst die relativen Häufigkeiten ermittelt, bevor diese aufsummiert werden (siehe Tabelle 2). Tabelle 1: Absolute Summenhäufigkeiten: Note Absolute Absolute Häufigkeit hi Summenhäufigkeit Hi 1 3 3 2 4 7 3 6 13 4 5 18 5 2 20 6 0 20 20 Kapitel 5: Beschreibende StaƟsƟk 171 b) Zu 1.: Besser als 3 haben die Schüler mit den Noten 1 und 2, das sind laut Tabelle 7 Schüler (relativer Anteil 0,35 oder 35 %). Zu 2.: Alle Schüler bis einschließlich Note 4 haben bestanden, das sind 18 Schüler, Anteil 0,9 oder 90 %. Zu 3.: Die Durchfallquote ergibt sich aus dem Ergebnis zu 2: 20 – 18 = 2 Schüler bzw. 10 %. Tabelle 2: Relative Summenhäufigkeiten Relative Note Relative Summenhäufigkeit Häufigkeit ri Ri 1 0,15 0,15 2 0,20 0,35 3 0,30 0,65 4 0,25 0,90 5 0,10 1,00 6 0,00 1,00 1,00 Merke Die absolute Häufigkeit h gibt an, wie viel Elemente einer Grundgesamtheit die Ausprägung eines Merkmals aufweisen. Man erhält sie durch Abzählen; folglich ist sie immer eine natürliche Zahl. Die relative Häufigkeit r ergibt sich aus dem Verhältnis aus absoluter Häufigkeit h und der h Gesamtzahl der Elemente n einer Grundgesamtheit, kurz: r = n . Summenhäufigkeiten H ergeben sich durch Aufsummieren der absoluten bzw. relativen Häufigkeiten, wobei die Merkmalsausprägungen zunächst noch in eine sinnvolle Reihenfolge gebracht werden müssen. • Aufgaben zur Festigung des erworbenen Wissens 1. Der Altersaufbau einer Schulklasse soll statistisch erhoben werden. Hierzu liegt die folgende Urliste vor. Ermitteln Sie zunächst mithilfe einer Strichliste die absoluten und dann die relativen Häufigkeiten der vorkommenden Merkmalsausprägungen. Geben Sie die relativen Häufigkeiten auch als Prozentanteile an. 16 20 17 16 20 18 19 18 19 17 17 17 18 16 18 16 17 18 19 17 2. a) Geben Sie die folgenden relativen Häufigkeiten in Prozent an: 0,03 0,4 0,23 0,56 0,001 0,72 0,435 0,75 0,98 0,187 b) Drücken Sie die folgenden in Prozent angegebenen relativen Häufigkeiten als Dezimalzahl aus: 16 % 22,4 % 0,4 % 19,5 % 3 % 5,6 % 95 % 43,6% 3,2 % 7,5 % 3. Bestimmen Sie zu den folgenden Häufigkeitsverteilungen die absoluten und relativen Summenhäufigkeiten. a) Ausprägungen xi Absolute Häufigkeit hi 1 8 2 7 3 12 4 14 5 10 6 5 7 3 8 1 Ausprägungen xi Absolute Häufigkeit hi 1 35 2 47 3 52 4 44 5 20 6 15 7 23 8 4 b) 172 Kapitel 5: Beschreibende StaƟsƟk Darstellung von Häufigkeitsverteilungen Eine weitere Aufgabe bei der Aufbereitung statistischer Daten besteht in der grafischen Darstellung von Häufigkeitsverteilungen. Hierfür gibt es verschiedene Möglichkeiten, von denen drei hier vorgestellt werden. Welche Form der Darstellung gewählt wird, hängt von der Art der vorliegenden Datenmenge ab. Säulendiagramm Säulendiagramme werden zur Darstellung von absoluten Häufigkeiten von Ausprägungen eines bestimmten Merkmals eingesetzt. Meist lassen sich diese vorher größenmäßig anordnen. Säulendiagramme werden auch als Histogramme bezeichnet. Beispiel: Die Zusammenstellung der Abschlussnoten eines Schuljahrgangs in Mathematik ergab folgendes Ergebnis: Note xi Häufikgkeit hi 1 6 2 14 3 36 4 32 5 10 6 2 Stellen Sie die Häufigkeitsverteilung als Säulendiagramm dar. Lösung: Abbildung 1: Häufigkeitstabelle Abbildung 2: Säulendiagramm Eingabe in den TI-Nspire CAS: Home – Lists & Spreadsheet – Eingabe der Spalten wie oben (Häufigkeitstabelle) – menu – 3: Daten – 5: Ergebnisdiagramm – x-Werte: Noten – Ergebnisliste: Häufigkeiten – Anzeige: neue Seite. • Aufgaben zur Festigung des erworbenen Wissens 1. Zeichnen Sie für die folgenden Häufigkeitsverteilungen ein Säulendiagramm. a) xi 0 1 2 3 hi 800 410 750 150 4 100 Kapitel 5: Beschreibende StaƟsƟk 173 b) xi hi 10 850 15 400 20 250 25 150 30 100 xi ri 10 0,15 15 0,20 20 0,25 25 0,15 30 0,25 c) 2. Bei einer Qualitätskontrolle werden Verpackungsmengen von Drahtstiften kontrolliert. Hierzu werden der Tagesproduktion 200 Packungen mit einer Sollstückzahl von je 50 Stück entnommen und die tatsächliche Anzahl von Drahtstiften festgestellt. Erstellen Sie aus der folgenden Häufigkeitsverteilung ein Säulendiagramm. Anzahl Stifte xi Häufigkeit hi 47 15 48 18 49 30 50 80 51 30 52 10 53 12 54 5 Streckendiagramm Streckendiagramme (Streckenzüge) werden in der Regel zur Darstellung absoluter Häufigkeiten herangezogen, die sich aus einer zeitlichen Entwicklung ergeben. Sie ermöglichen es aus dem bisherigen Verlauf Aussagen über die zukünftige Entwicklung (Trend) der Daten abzuleiten. Die aus der Häufigkeitstabelle erhaltenen Daten werden als Punkte in das Diagramm übernommen. Werden die Punkte miteinander verbunden, so entsteht der zugehörige Streckenzug. Beispiel: Ein Elektronikmarkt stellt die Umsatzentwicklung der DVD-Abteilung für die ersten 8 Jahre seit der Betriebsgründung zusammen: Jahr Umsatz in Tsd. € 1 6 2 4,5 3 5 4 7,5 5 8 6 8 7 9,5 8 10 a) Stellen Sie die Umsatzentwicklung als Streckenzug dar. b) Beurteilen Sie die Umsatzentwicklung anhand der Darstellung. Lösung: a) b) Im zweiten Jahr nach Geschäftsgründung ging der Umsatz zurück. Danach entwickelte er sich positiv weiter. In den Jahren 5 und 6 blieb der Umsatz konstant. Umsatzentwicklung seit Betriebsgründung 174 Kapitel 5: Beschreibende StaƟsƟk • Aufgaben zur Festigung des erworbenen Wissens 1. Der Kurs einer Aktie entwickelte sich in den letzten beiden Wochen an der Börse wie folgt: Tag Mo Di Mi Do Fr Mo Di Mi Do Fr Kurs (€) 9,60 9,80 9,50 9,90 10,30 10,60 11,00 11,20 10,70 10,60 a) Stellen Sie die Kursentwicklung in Form eines Streckenzuges grafisch dar. b) Nennen Sie Gründe für den Kursrückgang am Ende der zweiten Woche. 2. In der Medizin werden in Krankheitsfällen typische Verläufe von Fieberkurven unterschieden. Die folgenden Tabellen zeigen zwei Verläufe, einmal bei undulierendem Fieber (Verlauf A), das zum Beispiel bei Bakterieninfektionen auftritt, zum anderen das rezidivierende Fieber (Verlauf B), dessen Temperaturverlauf zum Beispiel auf eine Malaria-Erkrankung schließen lässt. Stellen Sie diese Verläufe grafisch dar und vergleichen Sie die erhaltenen Streckenzüge. Messzeitpunkte A: Temperatur (C0) 0 B: Temperatur (C ) 0 37,0 37,0 1 37,4 37,5 2 39,9 39,0 3 36,6 40,0 4 37,0 39,5 5 37,1 40,0 6 37,0 37,0 7 37,6 37,0 8 40,0 36,6 9 37,0 37,0 10 36,0 40,0 3. Der Gasverbrauch eines Einfamilienhauses wird jeweils am 1. eines jeden Monats abgelesen und tabellarisch festgehalten. Monat Jan. Febr. März April Verbrauch 500 420 340 230 in kwh Mai Juni 170 80 Juli 40 Aug. Sept. Okt. Nov. 20 90 150 280 Dez. 440 a) Veranschaulichen Sie die Verbrauchsangaben anhand eines Streckenzuges. b) Erstellen Sie die Tabelle der Summenhäufigkeiten und entwickeln Sie daraus ebenso einen Streckenzug. Deuten Sie die unterschiedlichen Steigungen der einzelnen Teilabschnitte. Kreisdiagramm Kreisdiagramme werden zur Darstellung von Häufigkeiten qualitativer Merkmale herangezogen, deren Ausprägungen nicht zahlenmäßig in eine Reihenfolge gebracht werden können. Meist liegen die Daten in Form von relativen Häufigkeiten vor. Beispiel: Eine überregionale Befragung von Absolventen von Fachoberschulen nach dem angestrebten Berufs- und Studienwunschverhalten ergab folgendes Ergebnis: Anzahl xi Häufikgkeit hi (1) Berufsausbildung 400 (2) Studium 760 (3) „etwas anderes“ 440 a) Bestimmen Sie die relativen Häufigkeiten ri der Verteilung. b) Stellen Sie die Häufigkeitsverteilung als Kreisdiagramm dar. (4) Keine Angabe 150 (5) „weiß nicht“ 250 Kapitel 5: Beschreibende StaƟsƟk 175 Lösung: absolute Häufigkeit Gesamtzahl der Befragten 150 250 r4 = = 0,075; r5 = = 0,125; 2000 2000 a) Berechnung der relativen Häufigkeiten nach der Formel ri = r1 = 400 760 440 = 0,2; r2 = = 0,38; r3 = = 0,22; 2000 2000 2000 Tabelle der relativen Häufigkeiten: Anzahl xi Relative Häufikgkeit ri b) (1) Berufsausbildung 0,2 = 20 % (2) Studium 0,3 = 38 % Abbildung 1: (3) „etwas anderes“ 0,22 = 22 % (4) Keine Angabe 0,075 =7,5 % (5) „weiß nicht“ 0,125 = 12,5 % Abbildung 2: Eingabe in den TI Nspire CAS: Home – Lists & spreadsheets – Tabelle ausfüllen (s. Abb. 1) – home – data & statistics – Achsenbeschriftung (Wunsch; Häufigkeit) – menu – 2: Plot Eigenschaften – C: kategorisches Y erzwingen – menu – 1: Plot Typ – Tortendiagramm auswählen – mit rechter Maustaste 3: Alle Bezeichnungen anzeigen wählen (s. Abb. 2). Für die handschriftliche Berechnung der Kreisausschnitte sind die zugehörigen Winkel α nach der Formel α = 3600 ⋅ relative Häufigkeit zu bestimmen. Es ergeben sich folgende Winkel: Berufsausbildung: Studium: Etwas anderes: Keine Angabe : Weiß nicht: Vollwinkel 3600 ⋅ 0,2 = 720 3600 ⋅ 0,38 = 136,80 3600 ⋅ 0,22 = 79,20 3600 ⋅ 0,075 = 270 3600 ⋅ 0,125 = 450 3600 176 Kapitel 5: Beschreibende StaƟsƟk • Aufgaben zur Festigung des erworbenen Wissens 1. Der Neubau eines Eigenheimes im Gesamtwert von 360 000,00 € soll zu einem Drittel mit Bauspargeldern, zur Hälfte mit einer Hypothek und der verbleibende Rest aus Eigenleistungen finanziert werden. Welche Anteile am Bauwert entfallen auf die einzelnen Finanzierungsarten? Stellen Sie das Finanzierungsmodell grafisch dar. 2. Für einen Wohnbezirk wurde eine statistische Erhebung über die Beschäftigungssituation der Einwohnerinnen und Einwohner durchgeführt. Danach waren 30 % der Befragten Arbeiter, 35 % Angestellte, 15 % Beamte und 20 % Selbstständige. Stellen Sie die soziale Struktur dieses Wohnbezirks in einem Kreisdiagramm dar. 3. Von den Gesamtkosten eines Pkw entfallen auf die einzelnen Kostenarten in einem Jahr: Kraftstoffverbrauch 40 %; Wertverlust 25 %; Werkstatt 15 %; Steuern/Versicherungen 15 % und Sonstiges 5 %. Stellen Sie die Aufteilung der Kosten als Kreisdiagramm dar. 4. Der Strompreis setzt sich aus den folgenden Kostenbestandteilen wie folgt zusammen: Netzkosten 27 %; Konzessionsabgaben 6 %; KWK/EEG 5 %; Stromsteuer 8 %; Umsatzsteuer 16 %; Erzeugung/Vertrieb 38 %. Erstellen Sie ein Kreisdiagramm. Darstellung von Klassenhäufigkeiten Oftmals liegen Häufigkeiten in einer sehr großen Anzahl von Merkmalsausprägungen vor, z. B. bei Geburtsgewichten von Babys, Wohnungsgrößen in m2-Angaben innerhalb eines Stadtbezirks usw. Eine Darstellung in der Form von zum Beispiel Säulendiagrammen ist in solchen Fällen unübersichtlich und praktisch nicht durchführbar. Um eine anschauliche Darstellung zu erreichen, werden mehrere Merkmalsausprägungen zu sogenannten Merkmalsklassen zusammengefasst. Diesen Klassen werden dann die zusammengefassten Häufigkeiten zugeordnet. Sie werden als Klassenhäufigkeiten bezeichnet. Beispiel: Die Befragung von Betrieben innerhalb eines Landkreises nach der Anzahl der Beschäftigten ergab folgendes Ergebnis: Besch. 1 2 3 4 5 6 7 8 9 Anz. 2 4 4 5 4 3 4 4 6 Besch. 10 11 12 13 14 15 16 17 18 Anz. 8 4 7 5 4 2 3 6 3 Besch. 19 20 21 22 23 24 25 26 27 Anz. 2 1 2 3 2 0 2 1 2 Besch. 28 29 30 31 32 33 34 35 36 Anz. 2 0 3 1 0 0 3 2 1 Besch. 37 38 39 40 41 42 43 44 45 Anz. 0 0 1 1 0 0 2 0 1 a) Fassen Sie die insgesamt 45 Merkmalsausprägungen (Anzahl der Beschäftigten) zu fünf Klassen mit gleicher Klassenbreite zusammen und ermitteln Sie die in diese Klassen fallenden absoluten Häufigkeiten. b) Stellen Sie die Klassenhäufigkeiten in einem Säulendiagramm dar. c) In welcher Klasse ergibt sich der häufigste Wert? Kapitel 5: Beschreibende StaƟsƟk 177 Lösung: a) Tabelle der Klassenhäufigkeiten: Beschäftigte Anzahl 1-9 36 10 - 18 42 19 - 27 15 28 - 36 12 37 - 45 5 c) Es zeigt sich, dass Betriebe mit 10 bis 18 Beschäftigten am häufigsten vorkommen. Hier ist die Säule am höchsten. Die Klassenhäufigkeiten werden bei Verteilungen mit gleicher Klassenbreite durch die Höhe der einzelnen Säulen wiedergegeben. Werden Klassen mit ungleicher Breite gewählt, so kann dies optisch zu Verfälschungen führen, weil nicht mehr die Höhe, sondern die Fläche der betreffenden Säule optisch im Vordergrund steht. Dieses Problem wird gelöst, indem die Klassenhäufigkeiten durch die jeweiligen Klassenbreiten geteilt werden (= normieren). Dadurch wird die Häufigkeit nicht mehr durch die Höhe, sondern durch die Fläche der Säulen veranschaulicht. Beispiel: Für das obige Beispiel ist die folgende ungleiche Verteilung der Klassen gewählt. Beschäftigte 1-6 7 - 10 11 - 15 16 - 23 24 - 45 a) Geben Sie die neuen Klassenhäufigkeiten an und zeigen Sie, dass sich dabei eine Gleichverteilung ergibt. Bestimmen Sie auch die Klassenbreiten. b) Stellen Sie die Klassenhäufigkeiten in einem Säulendiagramm dar, das die unterschiedlichen Klassenbreiten berücksichtigt. Normieren Sie dazu die Klassenhäufigkeiten. Lösung: a) Beschäftigte 1-6 7 - 10 11 - 15 16 - 23 24 - 45 Häufigkeit 22 22 22 22 22 Klassenbreite 6 4 5 7 22 178 Kapitel 5: Beschreibende StaƟsƟk b) Normierte Häufigkeiten: Klasse 1-6 Säulenhöhe 22 ≈ 3,67 7 - 10 22 11 - 15 22 16 - 23 22 24 - 45 22 6 4 5 7 22 = 5,5 = 4,4 ≈ 3,14 =1 Anmerkung: Aufgrund der gleichen Häufigkeiten in allen Klassen ergeben sich Rechtecke mit gleich großem Flächeninhalt. Merke: Häufigkeitsverteilungen können dargestellt werden, zum Beispiel in Form von Säulendiagrammen Streckendiagrammen Kreisdiagrammen. Bearbeitung von Klassenhäufigkeiten: Anwendung: Bei großer Anzahl von Merkmalsausprägungen Darstellung: Säulendiagramme Bei gleicher Klassenbreite wird die Klassenhäufigkeit durch die Säulenhöhe wiedergegeben. Bei ungleicher Klassenbreite wird sie durch die Säulenfläche wiedergegeben. Es gilt: Klassenhäufigkeit = Klassenbreite Rechteckhöhe. • Aufgaben zur Festigung des erworbenen Wissens 1. Die folgende Tabelle gibt die Höhe der Monatsumsätze von Industriebetrieben in einer Region wieder. Stellen Sie die Verteilung durch ein Säulendiagramm dar. Monatsumsätze in € Von … € bis unter … € (in Tsd. €) 0 – 200 200 – 500 500 – 1 000 1 000 – 2 000 2 000 – 5 000 Anzahl der Betriebe 5 12 30 50 30 2. In einer Schule werden alljährlich vom Zahnarzt Reihenuntersuchungen bei Schülerinnen und Schülern durchgeführt und deren Zähne auf Erkrankungen (z. B. durch Karies) untersucht. Die Anzahl der erkrankten Zähne wird jeweils in einer Strichliste festgehalten und anschließend in eine Häufigkeitstabelle überführt. Diese brachte folgendes Ergebnis: Zahl der erkrankten Zähne 0 1 2 3 4 5 6 7 8 9 Absolute Häufigkeit 24 26 14 6 3 4 2 1 1 1 Kapitel 5: Beschreibende StaƟsƟk 179 a) Fassen Sie diese Tabelle zu drei Klassen wie folgt zusammen: Klasse A: ohne oder geringer Befall (0, 1 erkrankte Zähne) Klasse B: mittlerer Befall (2-3 erkrankte Zähne) Klasse C: starker Befall (4 und mehr erkrankte Zähne) b) Berechnen Sie die relativen Klassenhäufigkeiten. c) Stellen Sie die Verteilung grafisch dar. Aufgaben zur Wiederholung 1. Eine Umfrage bei 240 Haushalten nach der Größe der Wohnungen ergab folgende Verteilung der relativen Häufigkeiten: Zahl der Zimmer 1 2 3 4 5 und mehr Anzahl der Haushalte 0,15 0,20 0,25 0,35 0,05 a) Geben Sie die absoluten Häufigkeiten dieser Verteilung an. b) Fertigen Sie ein Säulendiagramm an. 2. Bei einer Umfrage über den durchschnittlichen Fernsehkonsum pro Tag ergaben sich unter den insgesamt 700 befragten Haushalten die folgenden relativen Häufigkeiten: Anzahl der Stunden 1 2 3 4 5 6 und mehr Anzahl der Haushalte 0,09 0,14 0,25 0,22 ? 0,10 a) Ermitteln Sie die absoluten Häufigkeiten und die absoluten Summenhäufigkeiten. b) Wie viel Prozent der befragten Haushalte sehen mehr als 4 Stunden pro Tag? c) Stellen Sie die absoluten Häufigkeiten als Streckendiagramm dar. 3. Erstellen Sie aus der Tabelle der relativen Summenhäufigkeiten die Häufigkeitsverteilung der relativen Häufigkeiten: Ausprägungen xi Summenhäufigkeiten Hi 1 2 3 4 5 6 7 0,05 0,25 0,42 0,68 0,82 0,95 1,0 4. Begründen Sie, warum die folgende Aufstellung keine Tabelle von Summenhäufigkeiten sein kann: Ausprägung xi Summenhäufigkeiten Hi 1 0,05 2 0,15 3 0,48 4 0,58 5 0,82 6 0,80 7 1,0 5. Für Fehlzeiten in der Schule wurden im vergangenen Halbjahr folgende Gründe angegeben: Gründe Relat. Häuf. Krankheit 0,30 Verschlafen Busverspätung 0,25 0,30 Stellen Sie die Häufigkeitsverteilung als Kreisdiagramm dar. Unentschuldigt 0,10 Sonderurlaub 0,05 180 Kapitel 5: Beschreibende StaƟsƟk 6. Anlässlich eines Bewerbungsverfahrens wurde ein Eignungstest durchgeführt. Seine Auswertung ergab folgende Häufigkeitsverteilung der Falschantworten: Anzahl der Falschantworten xi Absolute Häufigkeiten hi 0 6 1 8 2 10 3 14 4 6 5 2 6 3 7 1 a) Ermitteln Sie die absoluten und relativen Summenhäufigkeiten dieser Verteilung. b) Wie viel Prozent der Bewerber hatten mehr als eine, aber weniger als 6 Falschantworten? c) Stellen Sie die Verteilung in Form eines Säulendiagramms dar. 7. In einer Kleinstadt wurde die Größe von Mietwohnungen ermittelt (auf 10 m2 gerundet). m2 Anzahl 50 300 60 200 70 500 80 300 90 400 100 100 120 200 a) Berechnen Sie die relativen Häufigkeiten der vorliegenden Verteilung. b) Wie hoch sind die absoluten und relativen Summenhäufigkeiten? c) Wie viel Prozent der Wohnungen sind höchstens 70 m2 groß? d) Stellen Sie die Verteilung anhand eines Säulendiagramms dar. 8. Dem Geschäftsbericht einer Textilgroßhandlung entnehmen wir die Umsatzzahlen der letzten 10 Jahre seit der Betriebsgründung. Diese sind mithilfe eines Streckendiagramms darzustellen. Jahr Umsatz in Tsd. € 1 95 2 120 3 135 4 155 5 140 6 150 7 132 8 148 9 162 10 170 9. Die folgende Tabelle zeigt die Entwicklung des Börsenkurses einer Automobil-Aktie in der vergangenen Woche an. Stellen Sie diese mithilfe eines Streckendiagramms dar. Tag Kurs in € Montag 23,60 Dienstag 24,20 Mittwoch 24,30 Donnerstag 25,20 Freitag 24,80 10. Der Umsatz eines Betriebes hat sich in den letzten 6 Jahren wie folgt entwickelt: Jahr Umsatz in Mio. € 1 5,1 2 7,2 3 8,3 4 12,4 5 19,8 6 38,6 Stellen Sie die Umsatzentwicklung durch ein Streckendiagramm dar. Wählen Sie dabei die angegebenen Maßstäbe und beurteilen Sie die beiden Darstellungen. a) x-Achse: 1 Jahr = 4 cm; y-Achse: 10 Mio. € = 1 cm b) x-Achse: 1 Jahr = 1 cm; y-Achse: 5 Mio. € = 1 cm 11. Als Gründe für das Ausscheiden aus dem Berufsleben nannten die befragten Personen zu 45 % Erwerbsunfähigkeit, 14 % Arbeitslosigkeit, 28 % vorzeitigen Ruhestand und 8 % das Erreichen der regulären Altersgrenze. Der Rest führte sonstige Gründe an. Fertigen Sie ein Kreisdiagramm an. Kapitel 5: Beschreibende StaƟsƟk 181 12. Bei einer Gemeinderatswahl ergab sich folgende Stimmenverteilung der angetretenen Parteien: CDU 34 %, SPD 23 %, FDP 12,5 %, Grüne 10 %, Die Linke 8 %, Freie Wähler 6,5 %. Die anderen Parteien (= Sonstige) erreichten nicht den Einzug in den Gemeinderat. Stellen Sie die Stimmanteile in einem Kreisdiagramm dar. 13. Die Polizei hat in einer Wohnstraße Geschwindigkeitskontrollen bei insgesamt 500 Fahrzeugen durchgeführt und dabei folgende Verteilung erhalten (vorgeschriebene Höchstgeschwindigkeit 30 km/h): Geschwindigkeit (in km/h) von … km/h bis unter … km/h 30 – 35 35 – 40 40 – 45 45 – 50 50 – 55 55 – 60 60 und mehr Absolute Häufigkeit hi 42 68 75 102 32 5 0 a) Wie viel Fahrzeuge hielten die vorgeschriebene Geschwindigkeit ein? b) Wie viel Prozent der Fahrzeuge blieben insgesamt ohne Beanstandung, wenn die Polizei erst ab einer Geschwindigkeit von mehr als 35 km/h Bußgelder verhängte? c) Erstellen Sie die Tabelle der relativen Summenhäufigkeiten und stellen Sie diese als Streckendiagramm dar (Wählen Sie auf der x-Achse jeweils die Klassenmitte für die Zuordnung der Häufigkeit Hi). d) Lesen Sie anhand der Graphik ab, wie viel Prozent mit einem Fahrverbot rechnen müssen, die ab einer Überschreitung von mehr als 20 km/h verhängt wird. 5.3 Beschreibung von Häufigkeitsverteilungen durch Kenngrößen Häufigkeitsverteilungen in tabellarischer und grafischer Form sind oftmals sehr umfangreich und daher unübersichtlich. Deshalb werden sie zusätzlich noch durch bestimmte Kenngrößen in knapper Form gekennzeichnet. Auf diese Weise können sie leicht mit anderen Häufigkeitsverteilungen verglichen werden. In der Beschreibenden Statistik wird zwischen Lagemaßen und Streuungsmaßen unterschieden. Lagemaße Mithilfe von Lagemaßen lassen sich Aussagen über das Zentrum einer Verteilung treffen. Sie sollen die Häufigkeitsverteilung charakterisieren. In der Regel werden der häufigste Wert, der Zentralwert (Median) und der Mittelwert (arithmetisches Mittel) unterschieden. Häufigster Wert (Modus) Der häufigste Wert (Modus) ist der Wert, der am häufigsten in der Verteilung vorkommt. Er gilt als der „typische“ oder „normale“ Wert der Verteilung, zum Beispiel das typische Alter von Schülern in einer Schulklasse oder die normale Körpergröße eines erwachsenen Mannes. 182 Kapitel 5: Beschreibende StaƟsƟk Zentralwert (Median) Die Berechnung des Zentralwertes (Median) setzt voraus, dass es sich um ein Merkmal handelt, dessen Ausprägungen sich der Größe nach anordnen lassen (Alter, Gewicht, Körpergröße). Es ist derjenige Wert x, der „in der Mitte“ der größenmäßig angeordneten Verteilung liegt. Er teilt die Werte also so auf, dass möglichst genauso viele Werte kleiner bzw. größer als der Zentralwert sind. Ist die Anzahl der Werte n ungerade, so ist der Zentralwert der mittlere Wert, ist die Anzahl gerade, so ist der Zentralwert gewöhnlich der Mittelwert aus den beiden mittleren Werten. Beispiel: Fall 1: n ungerade: x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 Berechnung des Zentralwerts für n ungerade: 0,5 ⋅ (13+1) = 7 Fall 2: n gerade: x= x7 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 1 x= ሺx6 + x7) 2 Berechnung des Zentralwerts für n gerade: 0,5 ⋅ (6 + 7) = 6,5 Der Zentralwert (Median) ܠeiner Häufigkeitsverteilung wird berechnet nach der Formel 1 x = ⋅ͳ für ungerade n 2 1 x = ⋅ሺͲǡͷͲǡͷͳሻ für gerade n. 2 Arithmetisches Mittel Das arithmetische Mittel fasst alle vorliegenden Werte zu einem einzigen, dem Mittelwert, zusammen. Er wird berechnet, indem man alle vorliegenden Werte addiert und anschließend durch die Anzahl der Werte teilt. Da es von besonderer Bedeutung ist, wird die Formel noch einmal angegeben. Merke Das arithmetische Mittel x wird nach folgenden Formeln berechnet: bei absoluten Häufigkeiten: bei relativen Häufigkeiten: n x ⋅ h + x ⋅ h + x ⋅ h +...+ xn ⋅ hn x= 1 1 2 2 3 3 = h1 + h2 + h3 +...+ hn ¦x ⋅ h i i =1 n ത = n ¦ i hi ¦x ⋅r i i i =1 i =1 x1, x2, x3,…, xn : Merkmalsausprägungen absolute Häufigkeiten: h1, h2, h3,…, hn relative Häufigkeiten: r1, r2, r3, …, rn Alle drei Größen sollen anhand eines Beispiels vorgestellt werden.
© Copyright 2025 ExpyDoc