254 Leistungskurs 4 Wahrscheinlichkeitsrechnung 4.3 Bedingte Wahrscheinlichkeiten 4.3.1 Darstellen von Daten in Vierfeldertafeln selbst lernen Ziel Wenn statistische Daten in den Medien veröffentlicht werden, dann geschieht dies selten in Form von vollständigen Tabellen, aus denen die Leser bzw. Zuschauer selbst die Informationen entnehmen können. In den meisten Fällen werden nur einzelne Aspekte ausgewählt und dargestellt, sodass die Informationen über die behandelten Themen oft unvollständig sind. Statistische Daten geben Informationen darüber, mit welchen (absoluten oder relativen) Häufigkeiten bestimmte Merkmale und deren Ausprägungen in einer betrachteten Gesamtheit auftreten. Untersucht man gleichzeitig zwei Merkmale, dann ist es wichtig, dass die enthaltenen Informationen übersichtlich präsentiert und richtig interpretiert werden. In diesem Abschnitt werden Sie hierfür verschiedene Darstellungsformen kennen lernen. Zum Erarbeiten (1) Rekonstruktion von Daten – Vierfeldertafeln Die im Zeitungsartikel enthaltenen ausgewählten Informationen über Schulabgänger von allgemeinbildenden Schulen lassen sich vervollständigen: Mädchen bei höheren Schulabschlüssen vorn Düsseldorf 2009 Wie aus den jetzt veröffentlichten D aten des Statistischen Landesamtes NRW hervorgeht, m achen die Mädchen bessere Abschlüsse als die Jungen: Im zurück liegenden Schuljahr verließen insgesamt 219 100 Schüler innen und Schüler die allgemeinbildenden Schulen, darunter 49,9 % Mädchen. 74 900 Abgänger erreichten als Abschluss die Allgemeine Hochschulreife (AHR) oder Fachhochschul reife (FHR); hier betrug der Mädchenanteil 55,1 %. 55,1 % von 74 900 Im Artikel sind Informationen über zwei Merkmale (Geschlecht bzw. Schulabschluss) mit jeweils zwei anderer /kein Abschluss) enthalten, die sich in Form einer Tabelle in einer Vierfeldertafel mit absolu- Geschlecht Merkmalsausprägungen (Mädchen bzw. Junge und Fachhochschulreife /Allgemeine Hochschulreife bzw. 49,9 % von 219 100 Schulabschluss ten Häufigkeiten darstellen lassen: absolute Häufigkeiten FHR/AHR anderer/kein Abschluss gesamt Mädchen 41 300 68 000 109 300 Jungen 33 600 76 200 109 800 gesamt 74 900 144 200 219 100 blau eingetragene Zahlen: durch Differenzbildung ermittelt Hieraus gewinnt man eine Vierfeldertafel mit rela- Schulabschluss tiven Häufigkeiten, indem man jeweils die absolute Geschlecht Häufigkeit durch die Gesamtzahl der erfassten Personen, also durch 219 100, dividiert. FHR/AHR anderer/kein Abschluss gesamt Mädchen 0,189 0,310 0,499 Jungen 0,153 0,348 0,501 gesamt 0,342 0,658 1 relative Häufigkeiten 4.3 Bedingte Wahrscheinlichkeiten Leistungskurs 255 (2) Übersichtliche Darstellung der Informationen durch Baumdiagramme Wenn man nähere Informationen zu den Schulabgängern erhalten möchte, gibt es zwei Möglichkeiten: Entweder man betrachtet zunächst das Merkmal Geschlecht und dann das Merkmal Schulabschluss und stellt die sich hieraus ergebenden Informationen in Form eines Baumdiagramms dar oder man geht in der umgekehrten Reihenfolge vor. Zu einer Vierfeldertafel gehören also grundsätzlich zwei Baumdiagramme. Die an den Baumdiagrammen notierten relativen Häufigkeiten kann man als Schätzwerte für Wahrscheinlichkeiten auffassen, wenn Schulabgänger zufällig ausgewählt werden. Diese Schätzwerte geben an, mit welchen Wahrscheinlichkeiten bestimmte Ereignisse auftreten. Die am Ende der Pfade notierten Pfad-Wahrscheinlichkeiten entsprechen den Wahrscheinlichkeiten in den inneren Feldern der Vierfeldertafel. Beispiele • Aus der Gesamtheit aller Schulabgänger wird eine Person zufällig ausgewählt. Wie groß ist die Wahrscheinlichkeit, dass es sich um ein Mädchen handelt? Wie groß ist die Wahrscheinlichkeit, dass eine Person die FHR/AHR erreicht hat? Die Wahrscheinlichkeiten lassen sich in der Vierfeldertafel als Zeilen- bzw. Spaltensumme ablesen. Sie stehen daher als Wahrscheinlichkeiten jeweils an den Pfaden auf der 1. Stufe des 1. Baumdiagramms bzw. des 2. Baumdiagramms: 49,9 % bzw. 34,2 %. • Aus der Gesamtheit aller Mädchen, die im vergangenen Jahr die Schule verlassen haben, wird eine Person ausgewählt. Wie groß ist die Wahrscheinlichkeit, dass diese den Abschluss FHR/AHR erreicht hat? Die Wahrscheinlichkeit eines einzelnen Pfades auf der 2. Stufe beim ersten Baumdiagramm erhält man 0,189 ≈ 0,379, oder mit absodurch Quotientenbildung innerhalb einer Zeile der Vierfeldertafel: p = } 0,499 41 300 ≈ 0,378. luten Häufigkeiten berechnet: p = } 109 300 Nach Pfadmultiplikationsregel gilt: 0,499∙p = 0,189 • Aus der Gesamtheit aller Schulabgänger des letzten Jahres mit FHR/AHR wird eine Person zufällig ausgewählt. Wie groß ist die Wahrscheinlichkeit, dass es sich um einen Jungen handelt? Die Wahrscheinlichkeit eines einzelnen Pfades auf der 2. Stufe beim zweiten Baumdiagramm erhält 0,153 ≈ 0,447, oder mit man durch Quotientenbildung innerhalb einer Spalte der Vierfeldertafel: p = } 0,342 ≈ 0,449. absoluten Häufigkeiten berechnet: p = 33 600 } 74 900 Nach Pfadmultiplikationsregel gilt: 0,342∙p = 0,153 Hinweis: Berechnet man die Wahrscheinlichkeiten der Pfade auf der 2. Stufe mit den absoluten Häufigkeiten, erhält man geringfügig abweichende Werte. 256 Leistungskurs Information 4 Wahrscheinlichkeitsrechnung (1) Vierfeldertafel Oben haben wir statistische Daten über zwei Merkmale mit je zwei Ausprägungen in einer Tabelle mit vier inneren Feldern, einer Vierfeldertafel, notiert. In die inneren Felder der Vierfeldertafel wird eingetragen, wie viele der Merkmalsträger (im Beispiel oben: Schulabgänger) bestimmte Kombinationen von Ausprägungen haben (z.B. ein Mädchen sind und einen anderen/keinen Abschluss haben). Für die einzelnen Merkmalsausprägungen kann man Summen bilden, die in die Randfelder der Vierfeldertafel eingetragen werden. Schließlich wird in das Randfeld unten rechts die Gesamtzahl aller insgesamt betrachteten Merkmalsträger (Grundgesamtheit) notiert. Durch die Angaben in den inneren Feldern ist eine Vierfeldertafel eindeutig festgelegt, d. h. alle anderen Felder (das heißt: die Randfelder) lassen sich hieraus eindeutig berechnen. (2) Zwei mögliche Baumdiagramme Man nennt die beiden Baumdiagramme auch Umkehrungen voneinander. Zu jeder Vierfeldertafel gehören zwei mögliche Baumdiagramme, die sich durch die Reihenfolge unterscheiden, in der die beiden in der Vierfeldertafel erfassten Merkmale betrachtet werden. Die Wahrscheinlichkeiten, die an der 2. Stufe der beiden Baumdiagramme stehen, ergeben sich (nach der Pfadmultiplikationsregel) als Quotienten innerhalb einer Zeile bzw. innerhalb einer Spalte der Vierfelder tafel. In der Regel unterscheiden sich die Wahrscheinlichkeiten der beiden Baumdiagramme auf der 2. Stufe, da sie sich auf verschiedene Merkmale und daher auf verschiedene Teilgesamtheiten beziehen. Dagegen stimmen die (am Ende der Pfade notierten) Pfadwahrscheinlichkeiten bis auf die Reihenfolge überein, da sie die Wahrscheinlichkeiten der inneren Felder derselben Vierfeldertafel sind. 1. Stufe 2. Stufe Zum Üben 1 Lesen Sie die beiden Zeitungsartikel zur theoretischen Führerscheinprüfung. Zeigen sie dann, dass beide Zeitungsartikel auf Daten beruhen, die zur selben Vierfeldertafel gehören. 75 % der Anmeldungen zur theoretischen Führerscheinprüfung er folgen als Erstmeldungen. Von diesen Prüfungen gehen 73 % erfolgreich aus, während 43 % der Kandidaten, die zur Wiederholungsprüfung antreten, auch bei dieser Prüfung durchfallen. 31 % der Prüflinge bestehen die theoretische Führerscheinprüfung nicht; von diesen hatten es 34 % schon vorher mindestens einmal vergeblich versucht. Unter den erfolgreichen Kandidaten sind immerhin 20 %, die vor her schon einmal durchgefallen waren. 4.3 Bedingte Wahrscheinlichkeiten Leistungskurs 257 2 Zeigen Sie, dass die beiden Artikel auf denselben statistischen Daten beruhen. Auf welche Veränderungen wollen die Autoren der beiden Artikel besonders aufmerksam machen? Fahrstuhleffekt im Schulsystem Schulform Gymnasium immer beliebter Eltern wünschen einen höheren Bildungsabschluss für ihre Kinder Viele Eltern bevorzugen aber eine Schulform, die ihnen bekannt ist 37 % aller 10- bis 16-Jährigen besuchen derzeit die Schulform Gymnasium. Jedoch nur 35 % dieser Jugendlichen haben Eltern, von denen mindestens ein Elternteil selbst zum Gymnasium ging. Umgekehrt findet man unter den Schüle rinnen und Schülern, die eine Haupt- oder Real schule besuchen, nur 8 %, bei denen mindestens ein Elternteil ein Gymnasium absolvierte. 72 % der Eltern, von denen mindestens ein El ternteil selbst ein Gymnasium besuchte, schicken heute ihr Kind wieder auf ein Gymnasium; bei den Eltern, die beide eine Haupt- oder Realschule absolvierten, ist es ähnlich: 71 % lassen ihr Kind ebenfalls eine Schule dieser Schulform besuchen. Der Anteil der Gymnasiasten ist allerdings in ei ner Generation von 18 % auf 37 % angewachsen. 3 Bei den Bundestagswahlen 2009 zeigte sich, dass auch 19 Jahre nach der Wiedervereinigung Unterschiede im Wahlverhalten zwischen den neuen und alten Bundesländern bestehen. Die auf der 1. Stufe des Baumdiagramms angegebenen Anteile beziehen sich auf die Anteile der in Ost und West abgegebenen gültigen Stimmen. (1)Bestimmen Sie die zugehörige Mehrfeldertafel. (2)Erstellen Sie auch das Baum diagramm, bei dem auf der 1. Stufe die verschiedenen Parteien und auf der 2. Stufe das Wahlgebiet betrachtet wird. Schreiben Sie dazu einen kurzen Zeitungstext. 4 Das Baumdiagramm enthält Informationen zu den im Verkehrszentralregister in Flensburg erfassten Personen über das Geschlecht (männlich, weiblich) und die Frage, ob der Führerschein entzogen wurde (ja, nein). a)Erstellen Sie eine Vierfeldertafel mit relativen Häufigkeiten. b)Entwickeln Sie aus der Vierfeldertafel das andere mögliche Baumdiagramm. Schreiben Sie hierzu einen kurzen Zeitungsartikel. Im Flensburger Zentralregister sind 6,7 Milli onen Personen registriert; wegen der Schwere des Verkehrsvergehens wurden in vielen Fällen die Führerscheine entzogen. 258 Leistungskurs 5 Eine 4 Wahrscheinlichkeitsrechnung Arbeitsmarkt-Statistik enthält folgende weiblich männlich gesamt Informationen über Teilzeit- und Vollzeitbeschäf- Vollzeit 21,9 % 44,0 % 65,9 % tigte in Deutschland: Teilzeit 23,4 % 10,7 % 34,1 % gesamt 45,3 % 54,7 % 100,0 % a)Stellen Sie diese Informationen auf zwei Arten durch Baumdiagramme dar. b)Schreiben Sie dazu Zeitungstexte, die wie folgt beginnen: Von 1000 Erwerbstätigen … (1) … sind 453 weiblich und 547 männlich … (2) … haben 659 einen Vollzeit-Job und 341 eine Teilzeit-Beschäftigung. … 6 Wirtschaftswissenschaften beliebtestes Studienfach bei Frauen und Männern Im Wintersemester 2009/2010 sind 46,4 % der Stu dierenden an nordrhein-westfälischen Hochschulen Frauen; von diesen haben 16,5 % das Fach Wirt schaftswissenschaften belegt. Bei den Männern ent schieden sich sogar 18,3 % für diesen Fachbereich. Stellen Sie die Informationen des Zeitungsartikels in Form eines Baumdiagramms dar und zeigen Sie, dass man die Informationen auch in der folgenden Form hätte veröffentlichen können: 7 17,5 % der Studierenden an den nordrheinwestfälischen Hochschulen haben das Fach Wirtschaftswissenschaften belegt; von diesen sind 43,8 % Frauen. Nimmt man alle übrigen Fachrichtungen zusammen, dann liegen auch dort die Männer mit einem Anteil von 53,1 % vorn. Bei den Bundestagswahlen 2009 erreichte die CDU/CSU insgesamt 33,8 % der abgegebenen gültigen Zweitstimmen [die SPD 23,0 %]. Bei den Wählern/innen unter 35 Jahren, deren Stimmen insgesamt 19,7 % der Stimmen ausmachten, kam die CDU/CSU auf 28,2 % [die SPD auf 17,5 %]; bei den Wählern/innen zwischen 35 und 60 erreichte die CDU/CSU 29,7 % [die SPD 22,2 %]. Bei den Wählern/innen über 60 Jahren, deren Stimmen insgesamt 34,7 % der Stimmen ausmachten, kam die CDU/CSU auf 42,4 % [die SPD auf 27,3 %]. Stellen Sie die Informationen in einem Baumdiagramm übersichtlich dar. Betrachten Sie dabei nur die Stimmen für die CDU/CSU [für die SPD] und für die übrigen Parteien. Welche Aussagen kann man dem umgekehrten Baumdiagramm entnehmen? 8 Stellen Sie die Informationen in einem Baumdiagramm zusammen. Welche Aussagen kann man dem umgekehrten Baumdiagramm entnehmen? Bestimmen Sie auch die zugehörige Mehrfelder-Tafel. Auch bei den Bundestagswahlen 2009 profitierte die CDU/CSU am meisten von der Möglichkeit für die Wahlberechtigten, ihre Stimme durch Briefwahl abzugeben: Während sie bei den Brief wählern auf 37,3 % der Stimmen kam, erreichte sie bei den Urnen-Wählern gerade einmal 32,9 %. Bei der SPD war es umgekehrt: Sie erhielt 23,6 % der Stimmen bei den Urnen-Wählern, aber nur 20,8 % bei den Briefwählern. Insgesamt waren durch Briefwahl 21,4 % aller gültigen Stimmen abgegeben worden. Leistungskurs 4.3 Bedingte Wahrscheinlichkeiten 259 4.3.2Bedingte Wahrscheinlichkeiten – Abhängigkeit und Unabhängigkeit von Merkmalen In diesem Abschnitt werden wir uns damit beschäftigen, welche besondere Bedeutung die Wahrscheinlichkeiten auf der 2. Stufe der Baumdiagramme haben, die wir aus Vierfeldertafeln gewinnen können. Aufgabe1 Ablesen von Informationen aus Mehrfeldertafeln Betrachten Sie die Ausschnitte aus zwei Zeitungsmeldungen nach den Bundestagswahlen 2009: „… Bei der Bundestagswahl erreichte die CDU/ CSU einen Stimmanteil von 33,8 %, die SPD nur 23,0 %. Beide Parteien erhielten ihre Stim men überwiegend von Frauen: CDU/CSU zu 55,6 %, SPD zu 51,7 %. Die anderen Parteien wurden überwiegend von Männern gewählt (Stimmanteil der Männer 51,9 %) …“ „… 51,5 % der Wählerinnen und Wähler der Bundestagswahl waren Frauen. Wenn nur Frauen das Wahlrecht gehabt hätten, wäre die CDU/CSU mit 36,5 % als Sieger aus der Wahl hervorgegangen, die SPD hätte 23,1 % erreicht. Bei den Männern lag die CDU/CSU ebenfalls vorne, allerdings nur mit 30,9 %, aber auch hier deutlich vor der SPD (22,9 %) …“ Die Angaben in den Zeitungsausschnitten scheinen CDU/CSU SPD andere gesamt Männer 15,0 % 11,1 % 22,4 % 48,5 % Frauen 18,8 % 11,9 % 20,8 % 51,5 % Gesamt 33,8 % 23,0 % 43,2 % 100,0 % sich zu widersprechen, zumindest sind die Prozent angaben unterschiedlich. Zeigen Sie, dass sich die in den beiden Texten enthaltenen Informationen tatsächlich aus der nebenstehenden Datenquelle (Mehrfeldertafel) ablesen bzw. entwickeln lassen. Spielt das Geschlecht bei der Stimmabgabe eine Rolle? LösungBeide Zeitungstexte enthalten Informationen über zwei Merkmale, nämlich über das Merkmal Anteil der Zweitstimmen der Parteien mit den Ausprägungen SPD, CDU/CSU und übrige Parteien sowie über das Merkmal Stimmanteil der Geschlechter mit den Ausprägungen Männer und Frauen. 260 Leistungskurs 4 Wahrscheinlichkeitsrechnung Die Reihenfolge, in der diese beiden Merkmale betrachtet werden, ist jedoch unterschiedlich: Die schwarzen Werte wurden aus den Zeitungsmeldungen abgelesen. Die roten Werte wurden ergänzt. (1)erst Partei, dann Geschlecht (2)erst Geschlecht, dann Partei Multipliziert man die Anteile längs der Pfade in den beiden Baumdiagrammen aus, dann erkennt man, dass es sich um die in der Mehrfeldertafel angegebenen Anteile handelt. Beispiel 23 % SPD 51,7 % w 0,119 = 11,9 % 51,5 % w 23,1 % SPD 0,119 = 11,9 % Die Wahlergebnisse (relative Häufigkeiten) lassen sich in Form der Mehrfeldertafel erfassen. Betrachtet man zunächst das Merkmal Partei, dann lesen wir die Anteile in der unteren Summenzeile der Mehrfeldertafel ab, z. B. SPD 23,0 %. Diese 23,0 % setzen sich aus 11,1 % (Männer) und 11,9 % (Frauen) zusammen. Durch Quotientenbildung erhalten wir den Anteil der Männer- bzw. Frauenstimmen an den SPD-Stimmen: 11,1 % 11,9 % ≈ 0,483 = 48,3 %;} ≈ 0,517 = 51,7 % } 23,0 % 23,0 % Betrachtet man zunächst das Merkmal Geschlecht, dann geht man entsprechend von der rechten Summenspalte der Mehrfeldertafel aus und bildet Quotienten innerhalb der Zeilen, z. B. den Anteil der CDU/CSUStimmen unter den Männern bzw. den Frauen: 15,0 % 18,8 % ≈ 0,309 = 30,9 %} ≈ 0,365 = 36,5 % } 48,5 % 51,5 % In beiden Fällen sind die Anteile voneinander verschieden. Information(1) Abhängigkeit und Unabhängigkeit von Merkmalen In Aufgabe 1 haben wir untersucht, ob das Geschlecht bei der Stimmabgabe eine Rolle spielt. Wir stellten fest, dass es zum Teil deutliche Unterschiede im Wahlverhalten von Frauen und Männern bei der Bundestagswahl 2009 gab. Dies konnten wir an beiden Baumdiagrammen ablesen. Betrachtet man erst das Merkmal Partei, dann ergaben sich unterschiedliche Wahrscheinlichkeiten für Männer und Frauen auf der 2. Stufe. Betrachtet man erst das Merkmal Geschlecht, dann ergaben sich unterschiedliche Wahrscheinlichkeiten für die verschiedenen Parteien auf der 2. Stufe. Ob das Geschlecht hinsichtlich des Wahlverhaltens eine Rolle spielt, kann man unmittelbar an den beiden Baumdiagrammen ablesen. Beispiel für die Unabhängigkeit von Merkmalen Abstimmungs alternativen Bei einem Bürgerentscheid über einen Bebauungsplan einer Gemeinde konnten sich die Bürger zwischen den Alternativen A und B entscheiden. Die Vierfeldertafel enthält Informationen über das Abstimmungsverhalten. Geschlecht gesamt gesamt A B weiblich 22 % 33 % männlich 18 % 27 % 45 % 40 % 60 % 100 % 55 % 4.3 Bedingte Wahrscheinlichkeiten Leistungskurs 261 Ist das Abstimmungsergebnis für Alternative A oder B vom Geschlecht abhängig? Wir betrachten dazu = 40 %; • den Anteil der Frauen, die für A gestimmt haben: 22 % } 55 % • den Anteil der Männer, die für A gestimmt haben: 18 % = 40 %. } 45 % = 60 % und 27 % 45 % = 60 %. Beide Anteile sind gleich. Entsprechendes gilt für die Anteile der B-Stimmen: 33 % } } 55 % Es spielt also keine Rolle, ob wir die Frauen oder die Männer der Gemeinde betrachten, d. h. die Abstimmung für die Alternativen A oder B war vom Geschlecht unabhängig. Zudem gilt: Die A-Stimmen und die B-Stimmen kamen jeweils zu 55 % von Frauen und zu 45 % von Män = 55 % bzw. 18 % = 45 % und 33 % = 55 % bzw. 27 % = 45 %. nern: 22 % } } } } 40 % 40 % 60 % 60 % Es spielt also keine Rolle, ob wir die A-Stimmen oder die B-Stimmen betrachten, d. h. das Abstimmungs- verhalten bei Männern und Frauen war von den Abstimmungsalternativen unabhängig. Um die Unabhängigkeit (oder Abhängigkeit) von Merkmalen feststellen zu können, müssen – wie in Abschnitt 8.1.1 – die Wahrscheinlichkeiten als Quotienten bestimmt werden. Notiert man diese Wahrscheinlichkeiten an den Pfaden der 2. Stufe der beiden zugehörigen Baumdiagramme, kann man die Unabhängigkeit (oder Abhängigkeit) auch direkt an beiden Baumdiagrammen ablesen: Für beide Baumdiagramme gilt: Die beiden Teilbäume der 2. Stufe stimmen überein. Beispiel für die Abhängigkeit von Merkmalen Die Stimmen für die Alternative A beim oben be- Abstimmungs alternativen trachteten Bürgerentscheid setzen sich – wie in der Vierfeldertafel rechts ablesbar – aus den Stimmen verschiedener Altersgruppen zusammen. Wir erkennen: Alternative A erhielt bei den über -mal so viele 40-Jährigen mit 24 % der Stimmen 1 1} 2 Alter gesamt gesamt A B bis 40 J. 16 % 30 % über 40 J. 24 % 30 % 54 % 40 % 60 % 100 % 46 % Stimmen wie bei den bis 40-Jährigen mit 16 % – im Gegensatz zur Gesamtbevölkerung, in der beide Anteile mit 54 % und 46 % nicht in diesem Verhältnis stehen. Das Abstimmungsverhalten bezüglich der Alternative A war also altersabhängig. Entsprechend haben wir unterschiedliche Teilbäume auf der 2. Stufe der beiden zugehörigen Baumdiagramme: 262 Leistungskurs 4 Wahrscheinlichkeitsrechnung Kriterien für Abhängigkeit / Unabhängigkeit von Merkmalen in Mehrfeldertafeln Informationen über zwei Merkmale und ihre Ausprägungen lassen sich mithilfe von zweistufigen Baumdiagrammen darstellen. Treten dabei auf der 2. Stufe der (beiden möglichen) Baumdiagramme gleiche Teilbäume auf, dann sind die betrachteten Merkmale voneinander unabhängig, sonst voneinander abhängig. Aufgabe 2 Umkehren von Baumdiagrammen – bedingte Wahrscheinlichkeiten Die Wahrscheinlichkeit, durch ein Testverfahren eine gesunde Person als gesund zu erkennen, wird als Spezifität bezeichnet. Bei Infektionskrankheiten ist es wichtig, dass man schnell die Art der Krankheit erkennt, damit man sie bekämpfen kann. Hierzu führt man Schnelltests durch, die allerdings Mängel haben: Manchmal wird eine Krankheit angezeigt, obwohl sie nicht vorliegt; gelegentlich wird eine Krankheit nicht angezeigt, obwohl sie vorhanden ist. Die vorliegenden Testverfahren zum Nachweis einer HIV-Infekti on haben mittlerweile eine hohe Sicherheit (sogenannte Sensitivität): Bei 99,9 % der tatsächlich Infizierten erfolgt eine positive Testreaktion. Nur bei 0,3 % der nichtinfi zierten Testpersonen wird irrtümlich eine Infektion angezeigt (sogenannte Spezifität 99,7 %). Man kann heute davon ausgehen, dass etwa 0,1 % der Bevölkerung in Deutschland HIV-infiziert ist. Die Wahrscheinlichkeit, durch ein Testverfahren eine erkrankte Person als krank zu erkennen, wird als Sensitivität bezeichnet. a)Stellen Sie die Informationen in Form eines Baumdiagramms dar und bestimmen Sie hiermit die zugehörige Vierfeldertafel. b)Um Vorstellungen von der Größenordnung der Anzahl der betroffenen Personen zu bekommen, ist es sinnvoll, auch die Vierfeldertafel mit absoluten Häufigkeiten zu bestimmen. Geben Sie diese an. Die Gesamtbevölkerung in Deutschland liegt bei rund 80 Mio. c)Angenommen, eine Person wird zufällig ausgewählt: Wie groß ist die Wahrscheinlichkeit, dass bei einem positiven Testergebnis tatsächlich eine HIV-Infektion vorliegt? Wie groß ist die Wahrscheinlichkeit, dass bei negativem Testergebnis dennoch eine Infektion vorliegt? Warum erscheint das Rechenergebnis so paradox? Stellen Sie dazu das Baumdiagramm mit vertauschter Abfolge der Merkmale auf. Lösung a) Im Text ist beschrieben, mit welchen Wahrscheinlichkeiten der HIV-Test positiv bzw. negativ bei Infizierten bzw. Nicht-Infizierten reagiert. Daher muss auf der 1. Stufe das Merkmal Vorliegen der Infektion mit den Merkmalsausprägungen ja bzw. nein betrachtet werden, auf der 2. Stufe dann das Merkmal Testreaktion mit den Merkmalsausprägungen positiv bzw. negativ. Die Pfadwahrscheinlichkeiten des Baumdiagrammes Testreaktion bestimmen die inneren Felder der zugehörigen Vierfeldertafel. Anmerkung: Die Zahlen können fälschlicherweise vorspiegeln, dass Aussagen mit 6-stelliger Genau- positiv negativ gesamt 0,000999 Vorliegen der ja Infektion nein 0,002997 0,000001 0,001 0,996003 0,999 gesamt 0,996004 1 0,003996 igkeit möglich sind. Dies ist sicherlich nicht der Fall. Die 6 Stellen nach dem Komma ergeben sich zwangsläufig aus dem kleinsten auftretenden Wert von 0,000001 (ein Millionstel). Leistungskurs 4.3 Bedingte Wahrscheinlichkeiten b) Entsprechend ist auch die Vierfeldertafel mit Testreaktion absoluten Häufigkeiten „übertrieben“ genau; aber sie gibt uns klare Vorstellungen von den Größenordnungen. positiv 79 920 negativ 80 263 gesamt Vorliegen der ja Infektion nein 239 760 79 680 240 79 920 000 80 000 gesamt 319 680 79 680 320 80 000 000 c) Das Baumdiagramm mit vertauschten Merkmalen ergibt sich wie folgt: 1. Stufe: Testreaktion Die Wahrscheinlichkeiten entnehmen wir den Summenfeldern der Spalten der Tabelle von Seite 262. 2. Stufe: Vorliegen der Infektion Die Wahrscheinlichkeiten berechnen wir als Quotienten in den Spalten der Tabellen: Die Wahrscheinlichkeit, dass bei einer zufällig ausgewählten Person tatsächlich eine HIV-Infektion vorliegt, nachdem der HIV-Text eine positive Reaktion gezeigt hatte, beträgt nur 25 %. Die Chancen dafür, dass eine Person mit negativem Testergebnis dennoch HIV-infiziert ist, stehen wie 1 zu 1 Million (Wahrscheinlichkeit 0,000001). Die berechnete Wahrscheinlichkeit von 25 % für das tatsächliche Vorliegen einer HIV-Infektion scheint im Widerspruch zur angegebenen Sensitivität von 99,9 % zu stehen, die doch eine hohe Sicherheit des Testverfahrens zu versprechen scheint. Insbesondere an den absoluten Häufigkeiten lesen wir jedoch ab, welche quantitativen Auswirkungen die 0,3 % falschen Reaktionen bei der großen Zahl der Nicht-Infizierten haben. Weiterführende 3 Gefahr der Verwechslung von Wahrscheinlichkeiten Aufgabe a)Bei einer Wahl wurde Partei A vor allem von Wahl der Partei jüngeren Wählern gewählt. Eine repräsentative Befragung am Wahltag ergab die nebenstehenden Daten. Welche Zeitungsmeldung (Schlagzeile) ist richtig? gesamt A sonstige bis 30 J. Alter 30 J. und älter 4,5 % 13,5 % 18,0 % 7,5 % 74,5 % 82,0 % gesamt 12,0 % 88,0 % 100 % (1) Jeder vierte Wähler der Partei A ist unter 30. (2) Jeder vierte Wähler unter 30 entschied sich für Partei A. b) Was bedeutet es, wenn in einem Text steht: (1) der Anteil der Männer, die Partei A gewählt haben, beträgt 10 %; (2) der Anteil der männlichen Wähler der Partei A beträgt 10 %; (3) der Anteil der Personen, die männlich sind und Partei A gewählt haben, beträgt 10 %; (4) der Anteil der Wähler der Partei A unter den Männern beträgt 10 %; (5) der Anteil der Männer unter den Wählern der Partei A beträgt 10 %? 264 Leistungskurs Information 4 Wahrscheinlichkeitsrechnung (2) Bedingte Wahrscheinlichkeiten Wenn man nicht genau formuliert oder oberflächlich liest, können leicht Verwechslungen bei der Angabe von Wahrscheinlichkeiten auftreten (siehe Aufgabe 2). Wenn man die Wahrscheinlichkeiten auf der 2. Stufe beschreibt, muss man auf die Voraussetzungen (Bedingungen) achten, die durch die 1. Stufe gegeben sind. Diese Bedingungen machen wir durch eine Index-Schreibweise deutlich. Beispiel aus (1) PA (B) bedeutet Wahrscheinlichkeit für B unter der Bedingung A. P (A ù B) bedeutet Wahrscheinlichkeit für A und B. } A bedeutet: nicht A, also das Gegenereignis von A Bedingte Wahrscheinlichkeiten lassen sich also als B } B gesamt berechnen: Der Zähler des Bruches lässt sich aus A } A P ( A ù B ) P ( } A ù B ) P ( A ù } B ) P ( } A ù } B ) P ( A ) P ( } A ) einem inneren Feld der Mehrfeldertafel ablesen; gesamt P ( B ) P ( } B ) 1 Anteile auffassen, d. h. als Brüche (Quotienten) der Nenner des Bruches steht als Zeilen- oder Spaltensumme am Rand. Hieraus ergibt sich das folgende allgemeine Baum- Entsprechend für das zugehörige umgekehrte diagramm für einen 2-stufigen Zufallsversuch: Baumdiagramm: Die bedingten Wahrscheinlichkeiten auf der 2. Stufe kann man wie folgt berechnen: Man kennt die Wahrscheinlichkeit für den gesamten Pfad, beispielsweise P (A ù B), und die Wahrscheinlichkeit P (A) für den Teilpfad der 1. Stufe. Wegen P (A)∙PA (B) = P (A ù B) gemäß der Pfadmultiplikationsregel ergibt sich die P (A ù B) P (A) . Wahrscheinlichkeit für den Teilpfad der 2. Stufe als Quotient PA (B) = } Man definiert deshalb allgemein: Definition: Bedingte Wahrscheinlichkeit Die Wahrscheinlichkeit, dass ein Ereignis A eintritt unter der Bedingung, dass ein Ereignis B bereits P (A ù B) P (B) eingetreten ist, berechnet man wie folgt: PB (A) = } Die Wahrscheinlichkeit, dass ein Ereignis B eintritt unter der Bedingung, dass ein Ereignis A bereits P (A ù B) P (A) eingetreten ist, berechnet man wie folgt: PA (B) = } Leistungskurs 4.3 Bedingte Wahrscheinlichkeiten 265 (3) Satz von Bayes Oft sind in Anwendungssituationen Informationen gegeben, die man unmittelbar in ein Baumdiagramm übertragen kann. Interessiert man sich aber für eine Wahrscheinlichkeit, die nur aus dem umgekehrten Baumdiagramm abgelesen werden kann, so kann man diese Wahrscheinlichkeit auch der Vierfeldertafel entnehmen, ohne dass man das umgekehrte Baumdiagramm vollständig aufstellt. Die hierbei verwendete Rechenregel geht auf den englischen Mathematiker Thomas Bayes zurück: Satz von Bayes Thomas Bayes (1702 – 1761); englischer Mathematiker Wir betrachten die Ereignisse A und B und interessieren uns für die Wahrscheinlichkeit, dass A eintritt unter der Bedingung, dass B bereits eingetreten ist. Dann gilt: P (A ù B) P (B) für A unter der Bedingung B berechnet sich wie folgt: Die Wahrscheinlichkeit PB (A) = } P (A)∙P (B) P (A ù B) A } PB (A) = } P (A)∙PA (B) + P ( A ) ∙P}A (B) (4) Formale Definition der Unabhängigkeit von Ereignissen Nach der Definition der bedingten Wahrscheinlichkeit gilt: P (A)∙PA (B) = P (A ù B) und auch P (B)∙PB (A) = P (A ù B). Wenn es aber für das Eintreten des Ereignisses A keine Rolle spielt, ob B eingetreten ist, also PB (A) = P (A), und umgekehrt PA (B) = P (B), dann sind A und B voneinander unabhängig. Es gilt dann: P (A)∙P (B) = P (A ù B). Daher definiert man: Zwei Ereignisse A und B heißen stochastisch voneinander unabhängig genau dann, wenn gilt: P (A)∙P (B) = P (A ù B), andernfalls heißen sie stochastisch voneinander abhängig. Übungsaufgaben 4 Widersprechen sich die Angaben in dem Zeitungsartikel rechts oder können die Informationen so stimmen? 33 % aller Männer rauchen. 61 % aller Raucher sind Männer. 22 % aller Frauen rauchen. 54 % aller Nichtraucher sind Frauen. 5 In der Warenausgabe einer Fabrik, die SIM-Karten fertigt, werden Kontrollmessungen durchgeführt. SIM-Karten, die nicht vollständig funktionstüchtig sind, werden zu 95 % als solche erkannt, allerdings kommt es auch in 2 % der Fälle vor, dass wegen eines Messfehlers brauchbare SIM-Karten irrtümlich als Polizei warnt vor Alkohol am Steuer In Deutschland wurden im vergangenen Jahr insgesamt ca. 390 000 Unfälle mit Personenschaden registriert, davon waren 10,2 % durch Alkohol verursacht. Während sich 24,6 % der Verkehrsunfälle ohne Alkoholeinfluss in der Zeit zwischen 18 Uhr abends und 4 Uhr morgens ereigneten, fiel bei den AlkoholUnfällen ein Anteil von 68,0 % in diesen Zeitraum. fehlerhaft angezeigt werden. Erfahrungsgemäß sind 90 % der produzierten SIM-Karten in Ordnung. a) (1) Eine zufällig herausgegriffene SIM-Karte wird als fehlerhaft angezeigt. Mit welcher Wahrscheinlichkeit ist sie tatsächlich nicht zu gebrauchen? (2) Eine zufällig herausgegriffene SIM-Karte wird als funktionstüchtig angezeigt. Mit welcher Wahrscheinlichkeit ist sie tatsächlich zu gebrauchen? b)Wie verringert sich die Fehlerquote, wenn die Kontrollmessung zweifach durchgeführt wird? 6 a) Stellen Sie die Daten des Zeitungsartikels in einer Vierfeldertafel und in einem Baumdiagramm zusammen. Welche Daten kann man dem umgekehrten Baumdiagramm entnehmen? Schreiben Sie dazu einen Zeitungstext. b)Ein Unfall mit Personenschaden wird zufällig ausgewählt. Wie groß ist die Wahrscheinlichkeit, dass dieser Unfall unter Alkoholeinwirkung geschah, wenn bekannt ist, dass er zwischen 4 Uhr morgens und 18 Uhr abends stattfand [zwischen 4 Uhr morgens und 18 Uhr abends stattfand, wenn bekannt ist, dass Alkohol im Spiel war]? 266 Leistungskurs 4 Wahrscheinlichkeitsrechnung 7 Der Glukosetoleranztest Beim Glukosetoleranztest gibt der Arzt dem Patienten eine genau abgemessene Zuckerwassermenge zu trinken und prüft nach einer kurzen Wartezeit die Blutzuckerwerte. Die Sensitivität dieses Tests beträgt 72 %, d. h. bei Personen, die an Diabetes erkrankt sind, reagiert der Test in 72 % der Fälle („positiv“). Die Spezifität des Tests beträgt 73 %, d. h. bei Personen, die nicht an Diabetes erkrankt sind, zeigt der Test in 73 % der Fälle keine Reaktion („negativ“). Etwa 1 % der Bevölkerung ist an Diabetes erkrankt und weiß nichts von der Tatsache der Erkrankung. Was bedeutet es, wenn bei einer Vorsorgeuntersuchung bei einem nichts-ahnenden Patienten ein „positiver“ Befund festgestellt wird? Mit welcher Wahrscheinlichkeit ist diese Person tatsächlich an Diabetes erkrankt? Wie brauchbar ist der Glukosetoleranztest überhaupt? 8 Impfschutz gegen Malaria Trotz aller Warnungen fahren viele Urlauber ohne Impfschutz in tropische Gegenden. Offensichtlich halten sie z. B. die Ansteckungsrate von 6 % für Malaria für nicht gefährlich. Hotels in diesen Regionen halten für die Touristen Schnelltests bereit, mit denen diese ohne großen Aufwand überprüfen können, ob sie sich mit Malaria infiziert haben. Unabhängig von den Schwierigkeiten, die manche Touristen haben, den Schnelltest nach Anleitung durchzuführen, sind die Schnelltests selbst nicht sicher: Nur bei 77 % der tatsächlich Infizierten erfolgt eine „positive“ Testreaktion; bei 95 % der tatsächlich Nicht-Infizierten erfolgt eine „negative“ Testreaktion. Angenommen, eine Person führt vorsichtshalber einen Schnelltest durch und das Testergebnis ist „positiv“. Mit welcher Wahrscheinlichkeit ist diese Person tatsächlich an Malaria erkrankt? 9 Wahlentscheidungen sind in der Regel in starkem Maße vom Stimmverhalten der verschiedenen Alters- gruppen abhängig. Untersuchen Sie dazu die folgenden Daten zur Landtagswahl 2011 in Rheinland-Pfalz; hier waren 70 % der Wähler/innen unter 60 Jahre alt. Hätten bei der Landtagswahl 2011 in Rheinland-Pfalz nur die Wähler/innen unter 60 Jahren ein Stimmrecht gehabt, dann hätten die beiden großen Parteien schlechter abgeschnitten als insgesamt (SPD 34 %, CDU 31 %). Wenn nur die Wähler/innen ab 60 Jahren hätten wählen dürfen, hätten beide davon profitiert (SPD 40 %, CDU 45 %). a) Stellen Sie die Informationen in Form eines Baumdiagramms dar. b) Bestimmen Sie auch das umgekehrte Baumdiagramm und schreiben Sie dazu einen Zeitungstext. 10 Das Wahlverhalten bei der Landtagswahl 2011 in Rheinland-Pfalz war in den verschiedenen Konfes- sionsgruppen sehr unterschiedlich: Während die CDU bei den Katholiken auf 45 % der Stimmen kam, erreichte sie bei den Protestanten nur 28 % und in der übrigen Bevölkerung (andere/ohne Konfession) sogar nur 21 %. Die SPD dagegen kam auf 43 % in der protestantischen Bevölkerung, auf 31 % bei den Katholiken und auf 34 % sonst. Bei der Wahl erhielt die SPD insgesamt 35,7 %, die CDU 35,2 % der Stimmen. Stellen Sie diese Informationen in geeigneten Baumdiagrammen und einer Mehrfeldertafel dar. Schreiben Sie einen weiteren Text über das Wahlverhalten der CDU- bzw. SPD-Wählerschaft. 4.3 Bedingte Wahrscheinlichkeiten 11 Leistungskurs 267 Drei Lokalzeitungen A, B, C haben Markt anteile von 45 %, 37 % und 18 %. Bei Zeitung A erfolgt 10 % des Verkaufs an Abonnementen, bei Zeitung B sind dies 60 %, bei Zeitung C 75 %. a)Bestimmen Sie den Anteil der Abonnenten unter den Zeitungslesern. b)An einem Kiosk wird gerade eine Lokalzeitung verkauft. Mit welcher Wahrscheinlichkeit ist dies die Zeitung B? 12 Ein Autohersteller lässt bei einem neuen Wagentyp Scheibenwischer von drei verschiedenen Zulie- ferfirmen einbauen. Vom ersten Zulieferer stammen 20 %, vom zweiten 30 %, vom dritten 50 %. Bei den Inspektionen nach 6 Monaten wird festgestellt, dass 15 % der Scheibenwischer der ersten Zulieferfirma, 18 % der zweiten und 9 % der dritten Firma unbrauchbar geworden sind. a)Stellen Sie die Daten in einem Baumdiagramm zusammen und berechnen Sie die Wahrscheinlichkeit dafür, dass ein zufällig ausgewählter Scheibenwischer unbrauchbar ist. b)Stellen Sie die Angaben in einer Mehrfeldertafel zusammen und berechnen Sie die bedingten Wahrscheinlichkeiten dafür, dass ein zufällig ausgewählter Scheibenwischer, der sich als unbrauchbar erwiesen hat, aus der ersten [zweiten; dritten] Firma stammt. 13 a)Wenn ein HIV-Test positiv verlaufen ist, wird der Test bei der betreffenden Person noch einmal durchgeführt. Was bedeutet es nun, wenn zweimal hintereinander eine positive Testreaktion erfolgte (Ereignis „pp“)? Vervollständigen Sie das nebenstehende Baumdiagramm. Geben Sie das Ergebnis in Worten wieder. b)In der Praxis wird bei Vorliegen eines positiven Testergebnisses der aufwendigere Western-Blot-Test durchgeführt. Dieser hat eine Spezifität von 99,95 % (bei gleicher Sensitivität). Erläutern Sie, wieso hiermit die Aussagen über das Vorliegen/Nicht-Vorliegen einer HIV-Infektion sicherer sind. Kohorte: Bevölkerungsgruppe mit gemeinsamen zeit- oder jahrgangsspezifischen Merkmalen Geburtskohorte: Bevölkerungsgruppe mit gleichem Geburtsjahr 14 Zu den frühkindlichen Vorsorgemaßnahmen zählen auch die Untersuchungen von Neugeborenen hinsichtlich einer Hörschädigung, das sogenannte Hörscreening. Im Abschlussbericht eines Ausschusses der Bundesärztekammer heißt es: „Bei einer Spezifität von 98 % und einer Sensitivität von 90 % würden bei einer Geburtskohorte von 686 000 (Jahr 2005) von 823 Kindern mit Hörstörungen 741 durch ein universelles Neugeborenen-Hörscreening erkannt und 13 704 Kinder hätten einen falsch-positiven Befund. […] Aufgrund des geringen Schadenpotenzials bei falsch-positiven Befunden und des erheblichen zu erwartenden Nutzens bei Kindern, deren Hörstörung durch das Screening entdeckt wird, überwiegt nach Ansicht der Arbeitsgruppe der potenzielle Nutzen den potenziellen Schaden.“ Was bedeutet dieser Text? Stellen Sie die Informationen in Form eines Baumdiagramms dar und bestimmen Sie das umgekehrte Baumdiagramm.
© Copyright 2024 ExpyDoc