Bedingte Wahrscheinlichkeiten

254
Leistungskurs
4 Wahrscheinlichkeitsrechnung
4.3 Bedingte Wahrscheinlichkeiten
4.3.1 Darstellen von Daten in Vierfeldertafeln
selbst lernen
Ziel
Wenn statistische Daten in den Medien veröffentlicht werden, dann geschieht dies selten in Form von
vollständigen Tabellen, aus denen die Leser bzw. Zuschauer selbst die Informationen entnehmen können.
In den meisten Fällen werden nur einzelne Aspekte ausgewählt und dargestellt, sodass die Informationen
über die behandelten Themen oft unvollständig sind.
Statistische Daten geben Informationen darüber, mit welchen (absoluten oder relativen) Häufigkeiten
bestimmte Merkmale und deren Ausprägungen in einer betrachteten Gesamtheit auftreten. Untersucht
man gleichzeitig zwei Merkmale, dann ist es wichtig, dass die enthaltenen Informationen übersichtlich
präsentiert und richtig interpretiert werden. In diesem Abschnitt werden Sie hierfür verschiedene Darstellungsformen kennen lernen.
Zum Erarbeiten (1) Rekonstruktion von Daten – Vierfeldertafeln
Die im Zeitungsartikel enthaltenen ausgewählten Informationen über Schulabgänger von allgemeinbildenden Schulen lassen sich vervollständigen:
Mädchen bei höheren Schulabschlüssen vorn
Düsseldorf 2009 Wie aus den jetzt veröffentlichten D
­ aten
des Statistischen Landesamtes NRW hervorgeht, m
­ achen
die Mädchen bessere Abschlüsse als die Jungen: Im zurück­
liegenden Schuljahr verließen insgesamt 219 100 Schüler­
innen und Schüler die allgemeinbildenden Schulen, darunter
49,9 % Mädchen. 74 900 Abgänger erreichten als Abschluss
die Allgemeine Hochschulreife (AHR) oder Fachhochschul­
reife (FHR); hier betrug der Mädchenanteil 55,1 %.
55,1 % von 74 900
Im Artikel sind Informationen über zwei Merkmale
(Geschlecht bzw. Schulabschluss) mit jeweils zwei
anderer /kein Abschluss) ent­halten, die sich in Form
einer Tabelle in einer Vierfeldertafel mit absolu-
Geschlecht
Merkmalsausprägungen (Mädchen bzw. Junge und
Fach­hochschulreife /Allgemeine Hoch­schul­reife bzw.
49,9 % von 219 100
Schulabschluss
ten Häufigkeiten darstellen lassen:
absolute
Häufigkeiten
FHR/AHR
anderer/kein
Abschluss
gesamt
Mädchen
41 300
68 000
109 300
Jungen
33 600
76 200
109 800
gesamt
74 900
144 200
219 100
blau eingetragene Zahlen: durch Differenzbildung ermittelt
Hieraus gewinnt man eine Vierfeldertafel mit rela-
Schulabschluss
tiven Häufigkeiten, indem man jeweils die absolute
Geschlecht
Häufigkeit durch die Gesamtzahl der erfassten Personen, also durch 219 100, dividiert.
FHR/AHR
anderer/kein
Abschluss
gesamt
Mädchen
0,189
0,310
0,499
Jungen
0,153
0,348
0,501
gesamt
0,342
0,658
1
relative
Häufigkeiten
4.3 Bedingte Wahrscheinlichkeiten
Leistungskurs
255
(2) Übersichtliche Darstellung der Informationen durch Baumdiagramme
Wenn man nähere Informationen zu den Schulabgängern erhalten möchte, gibt es zwei Möglichkeiten:
Entweder man betrachtet zunächst das Merkmal Geschlecht und dann das Merkmal Schulabschluss und stellt
die sich hieraus ergebenden Informationen in Form eines Baumdiagramms dar oder man geht in der umgekehrten Reihenfolge vor. Zu einer Vierfeldertafel gehören also grundsätzlich zwei Baumdiagramme.
Die an den Baumdiagrammen notierten relativen Häufigkeiten kann man als Schätzwerte für Wahrscheinlichkeiten auffassen, wenn Schulabgänger zufällig ausgewählt werden. Diese Schätzwerte geben an, mit
welchen Wahrscheinlichkeiten bestimmte Ereignisse auftreten.
Die am Ende der Pfade notierten Pfad-Wahrscheinlichkeiten entsprechen den Wahrscheinlichkeiten in den
inneren Feldern der Vierfeldertafel.
Beispiele
• Aus der Gesamtheit aller Schulabgänger wird eine Person zufällig ausgewählt.
Wie groß ist die Wahrscheinlichkeit, dass es sich um ein Mädchen handelt?
Wie groß ist die Wahrscheinlichkeit, dass eine Person die FHR/AHR erreicht hat?
Die Wahrscheinlichkeiten lassen sich in der Vierfeldertafel als Zeilen- bzw. Spaltensumme ablesen. Sie
stehen daher als Wahrscheinlichkeiten jeweils an den Pfaden auf der 1. Stufe des 1. Baumdiagramms
bzw. des 2. Baumdiagramms: 49,9 % bzw. 34,2 %.
• Aus der Gesamtheit aller Mädchen, die im vergangenen Jahr die Schule verlassen haben, wird eine
Person ausgewählt.
Wie groß ist die Wahrscheinlichkeit, dass diese den Abschluss FHR/AHR erreicht hat?
Die Wahrscheinlichkeit eines einzelnen Pfades auf der 2. Stufe beim ersten Baumdiagramm erhält man
0,189
​  
≈ 0,379, oder mit absodurch Quotientenbildung innerhalb einer Zeile der Vierfeldertafel: p = ​} 
0,499
41 300
 
​  ≈ 0,378.
luten Häufigkeiten berechnet: p = ​ } 
109 300
Nach Pfadmultiplika­tionsregel gilt: 0,499∙p = 0,189
• Aus der Gesamtheit aller Schulabgänger des letzten Jahres mit FHR/AHR wird eine Person zufällig
ausgewählt.
Wie groß ist die Wahrscheinlichkeit, dass es sich um einen Jungen handelt?
Die Wahrscheinlichkeit eines einzelnen Pfades auf der 2. Stufe beim zweiten Baumdiagramm erhält
0,153
​  
≈ 0,447, oder mit
man durch Quotientenbildung innerhalb einer Spalte der Vierfeldertafel: p = ​} 
0,342
​  
≈ 0,449.
absoluten Häufigkeiten berechnet: p = ​33 600
} 
74 900
Nach Pfadmultiplika­tionsregel gilt: 0,342∙p = 0,153
Hinweis: Berechnet man die Wahrscheinlichkeiten der Pfade auf der 2. Stufe mit den absoluten Häufigkeiten, erhält man geringfügig abweichende Werte.
256
Leistungskurs
Information 4 Wahrscheinlichkeitsrechnung
(1) Vierfeldertafel
Oben haben wir statistische Daten über zwei Merkmale mit je zwei Ausprägungen in einer Tabelle mit vier
inneren Feldern, einer Vierfeldertafel, notiert.
In die inneren Felder der Vierfeldertafel wird eingetragen, wie viele der Merkmalsträger (im Beispiel oben:
Schulabgänger) bestimmte Kombinationen von Ausprägungen haben (z.B. ein Mädchen sind und einen
anderen/keinen Abschluss haben). Für die einzelnen Merkmalsausprägungen kann man Summen bilden, die
in die Randfelder der Vierfeldertafel eingetragen werden. Schließlich wird in das Randfeld unten rechts die
Gesamtzahl aller insgesamt betrachteten Merkmalsträger (Grundgesamtheit) notiert.
Durch die Angaben in den inneren Feldern ist eine Vierfeldertafel eindeutig festgelegt, d. h. alle anderen
Felder (das heißt: die Randfelder) lassen sich hieraus eindeutig berechnen.
(2)
Zwei mögliche Baumdiagramme
Man nennt die beiden
Baumdiagramme auch
Umkehrungen von­einander.
Zu jeder Vierfeldertafel gehören zwei mögliche Baumdiagramme, die sich durch die Reihenfolge unterscheiden, in der die beiden in der Vierfeldertafel erfassten Merkmale betrachtet werden.
Die Wahrscheinlichkeiten, die an der 2. Stufe der beiden Baumdiagramme stehen, ergeben sich (nach der
Pfadmultiplikationsregel) als Quotienten innerhalb einer Zeile bzw. innerhalb einer Spalte der Vierfelder­
tafel. In der Regel unterscheiden sich die Wahrscheinlichkeiten der beiden Baumdiagramme auf der 2.
Stufe, da sie sich auf verschiedene Merkmale und daher auf verschiedene Teilgesamtheiten beziehen.
Dagegen stimmen die (am Ende der Pfade notierten) Pfadwahrscheinlichkeiten bis auf die Reihenfolge
überein, da sie die Wahrscheinlichkeiten der inneren Felder derselben Vierfeldertafel sind.
1. Stufe 2. Stufe
Zum Üben
1 Lesen Sie die beiden Zeitungsartikel zur theoretischen Führerscheinprüfung. Zeigen sie dann, dass
beide Zeitungsartikel auf Daten beruhen, die zur selben Vierfeldertafel gehören.
75 % der Anmeldungen zur theoretischen Führerscheinprüfung er­
folgen als Erstmeldungen.
Von diesen Prüfungen gehen 73 % erfolgreich aus, während 43 %
der Kandidaten, die zur Wiederholungsprüfung antreten, auch bei
dieser Prüfung durchfallen.
31 % der Prüflinge bestehen die theoretische Führerscheinprüfung
nicht; von diesen hatten es 34 % schon vorher mindestens einmal
vergeblich versucht.
Unter den erfolgreichen Kandidaten sind immerhin 20 %, die vor­
her schon einmal durchgefallen waren.
4.3 Bedingte Wahrscheinlichkeiten
Leistungskurs
257
2 Zeigen Sie, dass die beiden Artikel auf denselben statistischen Daten beruhen. Auf welche Veränderungen wollen die Autoren der beiden Artikel besonders aufmerksam machen?
Fahrstuhleffekt im Schulsystem
Schulform Gymnasium immer beliebter
Eltern wünschen einen höheren
Bildungsabschluss für ihre Kinder
Viele Eltern bevorzugen aber eine Schulform, die ihnen bekannt ist
37 % aller 10- bis 16-Jährigen besuchen derzeit
die Schulform Gymnasium. Jedoch nur 35 %
dieser Jugendlichen haben Eltern, von denen
mindestens ein Elternteil selbst zum Gymnasium
ging. Umgekehrt findet man unter den Schüle­
rinnen und Schülern, die eine Haupt- oder Real­
schule besuchen, nur 8 %, bei denen mindestens
ein Elternteil ein Gymnasium absolvierte.
72 % der Eltern, von denen mindestens ein El­
ternteil selbst ein Gymnasium besuchte, schicken
heute ihr Kind wieder auf ein Gymnasium; bei
den Eltern, die beide eine Haupt- oder Realschule
absolvierten, ist es ähnlich: 71 % lassen ihr Kind
ebenfalls eine Schule dieser Schulform besuchen.
Der Anteil der Gymnasiasten ist allerdings in ei­
ner Generation von 18 % auf 37 % angewachsen.
3
Bei den Bundestagswahlen
2009 zeigte sich, dass auch 19
Jahre nach der Wiedervereinigung Unterschiede im Wahlverhalten zwischen den neuen und
alten Bundesländern bestehen.
Die auf der 1. Stufe des Baumdiagramms angegebenen Anteile
beziehen sich auf die Anteile
der in Ost und West abgegebenen gültigen Stimmen.
(1)Bestimmen Sie die zugehörige Mehrfeldertafel.
(2)Erstellen Sie auch das Baum­
diagramm, bei dem auf der 1. Stufe die verschiedenen Parteien und auf der 2. Stufe das Wahlgebiet
betrachtet wird.
Schreiben Sie dazu einen kurzen Zeitungstext.
4 Das
Baumdiagramm enthält Informationen zu
den im Verkehrszentralregister in Flensburg erfassten Personen über das Geschlecht (männlich,
weiblich) und die Frage, ob der Führerschein entzogen wurde (ja, nein).
a)Erstellen Sie eine Vierfeldertafel mit relativen
Häufigkeiten.
b)Entwickeln Sie aus der Vierfeldertafel das andere mögliche Baumdiagramm. Schreiben Sie
hierzu einen kurzen Zeitungsartikel.
Im Flensburger Zentralregister sind 6,7 Milli­
onen Personen registriert; wegen der Schwere
des Verkehrsvergehens wurden in vielen Fällen
die Führerscheine entzogen.
258
Leistungskurs
5 Eine
4 Wahrscheinlichkeitsrechnung
Arbeitsmarkt-Statistik enthält folgende
weiblich
männlich
gesamt
Informationen über Teilzeit- und Vollzeitbeschäf-
Vollzeit
21,9 %
44,0 %
65,9 %
tigte in Deutschland:
Teilzeit
23,4 %
10,7 %
34,1 %
gesamt
45,3 %
54,7 %
100,0 %
a)Stellen Sie diese Informationen auf zwei Arten durch Baumdiagramme dar.
b)Schreiben Sie dazu Zeitungstexte, die wie folgt beginnen: Von 1000 Erwerbstätigen …
(1) … sind 453 weiblich und 547 männlich …
(2) … haben 659 einen Vollzeit-Job und 341 eine Teilzeit-Beschäftigung. …
6
Wirtschaftswissenschaften beliebtestes
Studienfach bei Frauen und Männern
Im Wintersemester 2009/2010 sind 46,4 % der Stu­
dierenden an nordrhein-westfälischen Hochschulen
Frauen; von diesen haben 16,5 % das Fach Wirt­
schaftswissenschaften belegt. Bei den Männern ent­
schieden sich sogar 18,3 % für diesen Fachbereich.
Stellen Sie die Informationen des Zeitungsartikels
in Form eines Baumdiagramms dar und zeigen Sie,
dass man die Informationen auch in der folgenden
Form hätte veröffentlichen können:
7
17,5 % der Studierenden an den nordrheinwestfälischen Hochschulen haben das Fach
Wirtschaftswissenschaften belegt; von diesen
sind 43,8 % Frauen. Nimmt man alle übrigen
Fachrichtungen zusammen, dann liegen auch
dort die Männer mit einem Anteil von 53,1 %
vorn.
Bei den Bundestagswahlen 2009 erreichte die CDU/CSU insgesamt 33,8 % der abgegebenen gültigen
Zweitstimmen [die SPD 23,0 %]. Bei den Wählern/innen unter 35 Jahren, deren Stimmen insgesamt 19,7 %
der Stimmen ausmachten, kam die CDU/CSU auf 28,2 % [die SPD auf 17,5 %]; bei den Wählern/innen zwischen
35 und 60 erreichte die CDU/CSU 29,7 % [die SPD 22,2 %]. Bei den Wählern/innen über 60 Jahren, deren
Stimmen insgesamt 34,7 % der Stimmen ausmachten, kam die CDU/CSU auf 42,4 % [die SPD auf 27,3 %].
Stellen Sie die Informationen in einem Baumdiagramm übersichtlich dar. Betrachten Sie dabei nur die
Stimmen für die CDU/CSU [für die SPD] und für die übrigen Parteien.
Welche Aussagen kann man dem umgekehrten Baumdiagramm entnehmen?
8 Stellen Sie die Informationen in einem Baumdiagramm zusammen.
Welche Aussagen kann man dem umgekehrten
Baumdiagramm entnehmen?
Bestimmen Sie auch die zugehörige Mehrfelder-Tafel.
Auch bei den Bundestagswahlen 2009 profitierte
die CDU/CSU am meisten von der Möglichkeit
für die Wahlberechtigten, ihre Stimme durch
Briefwahl abzugeben: Während sie bei den Brief­
wählern auf 37,3 % der Stimmen kam, erreichte sie
bei den Urnen-Wählern gerade einmal 32,9 %.
Bei der SPD war es umgekehrt: Sie erhielt 23,6 %
der Stimmen bei den Urnen-Wählern, aber nur
20,8 % bei den Briefwählern. Insgesamt waren
durch Briefwahl 21,4 % aller gültigen Stimmen
abgegeben worden.
Leistungskurs
4.3 Bedingte Wahrscheinlichkeiten
259
4.3.2Bedingte Wahrscheinlichkeiten –
Abhängigkeit und Unabhängigkeit von Merkmalen
In diesem Abschnitt werden wir uns damit beschäftigen, welche besondere Bedeutung die Wahrscheinlichkeiten auf der 2. Stufe der Baumdiagramme haben, die wir aus Vierfeldertafeln gewinnen können.
Aufgabe1 Ablesen von Informationen aus Mehrfeldertafeln
Betrachten Sie die Ausschnitte aus zwei Zeitungsmeldungen nach den Bundestagswahlen 2009:
„… Bei der Bundestagswahl erreichte die CDU/
CSU einen Stimmanteil von 33,8 %, die SPD
nur 23,0 %. Beide Parteien erhielten ihre Stim­
men überwiegend von Frauen: CDU/CSU zu
55,6 %, SPD zu 51,7 %. Die anderen Parteien
wurden überwiegend von Männern gewählt
(Stimm­anteil der Männer 51,9 %) …“
„… 51,5 % der Wählerinnen und Wähler der
Bundestagswahl waren Frauen. Wenn nur
Frauen das Wahlrecht gehabt hätten, wäre die
CDU/CSU mit 36,5 % als Sieger aus der Wahl
hervorgegangen, die SPD hätte 23,1 % erreicht.
Bei den Männern lag die CDU/CSU ebenfalls
vorne, allerdings nur mit 30,9 %, aber auch hier
deutlich vor der SPD (22,9 %) …“
Die Angaben in den Zeitungsausschnitten scheinen
CDU/CSU
SPD
andere
gesamt
Männer
15,0 %
11,1 %
22,4 %
48,5 %
Frauen
18,8 %
11,9 %
20,8 %
51,5 %
Gesamt
33,8 %
23,0 %
43,2 %
100,0 %
sich zu widersprechen, zumindest sind die Prozent­
angaben unterschiedlich.
Zeigen Sie, dass sich die in den beiden Texten enthaltenen Informationen tatsächlich aus der nebenstehenden Datenquelle (Mehrfeldertafel) ablesen
bzw. entwickeln lassen.
Spielt das Geschlecht bei der Stimmabgabe eine Rolle?
LösungBeide Zeitungstexte enthalten Informationen über zwei Merkmale, nämlich über das Merkmal Anteil der
Zweitstimmen der Parteien mit den Ausprägungen SPD, CDU/CSU und übrige Parteien sowie über das Merkmal Stimmanteil der Geschlechter mit den Ausprägungen Männer und Frauen.
260
Leistungskurs
4 Wahrscheinlichkeitsrechnung
Die Reihenfolge, in der diese beiden Merkmale betrachtet werden, ist jedoch unterschiedlich:
Die schwarzen Werte
wurden aus den
Zeitungsmeldungen
abgelesen. Die roten
Werte wurden ergänzt.
(1)erst Partei, dann Geschlecht (2)erst Geschlecht, dann Partei
Multipliziert man die Anteile längs der Pfade in den beiden Baumdiagrammen aus, dann erkennt man, dass
es sich um die in der Mehrfeldertafel angegebenen Anteile handelt.
Beispiel
23 %
SPD
51,7 % w 0,119 = 11,9 %
51,5 % w
23,1 % SPD 0,119 = 11,9 %
Die Wahlergebnisse (relative Häufigkeiten) lassen sich in Form der Mehrfeldertafel erfassen. Betrachtet
man zunächst das Merkmal Partei, dann lesen wir die Anteile in der unteren Summenzeile der Mehrfeldertafel ab, z. B. SPD 23,0 %. Diese 23,0 % setzen sich aus 11,1 % (Männer) und 11,9 % (Frauen) zusammen.
Durch Quotientenbildung erhalten wir den Anteil der Männer- bzw. Frauenstimmen an den SPD-Stimmen:
11,1 %
11,9 %
​ 
≈ 0,483 = 48,3 %;​} 
​ 
≈ 0,517 = 51,7 %
​
} 
23,0 %
23,0 %
Betrachtet man zunächst das Merkmal Geschlecht, dann geht man entsprechend von der rechten Summenspalte der Mehrfeldertafel aus und bildet Quotienten innerhalb der Zeilen, z. B. den Anteil der CDU/CSUStimmen unter den Männern bzw. den Frauen:
15,0 %
18,8 %
​ 
≈ 0,309 = 30,9 %​} 
​  
≈ 0,365 = 36,5 %
​
} 
48,5 %
51,5 %
In beiden Fällen sind die Anteile voneinander verschieden.
Information(1)
Abhängigkeit und Unabhängigkeit von Merkmalen
In Aufgabe 1 haben wir untersucht, ob das Geschlecht bei der Stimmabgabe eine Rolle spielt. Wir stellten
fest, dass es zum Teil deutliche Unterschiede im Wahlverhalten von Frauen und Männern bei der Bundestagswahl 2009 gab. Dies konnten wir an beiden Baumdiagrammen ablesen. Betrachtet man erst das
Merkmal Partei, dann ergaben sich unterschiedliche Wahrscheinlichkeiten für Männer und Frauen auf der
2. Stufe. Betrachtet man erst das Merkmal Geschlecht, dann ergaben sich unterschiedliche Wahrscheinlichkeiten für die verschiedenen Parteien auf der 2. Stufe.
Ob das Geschlecht hinsichtlich des Wahlverhaltens eine Rolle spielt, kann man unmittelbar an den beiden
Baumdiagrammen ablesen.
Beispiel für die Unabhängigkeit von Merkmalen
Abstimmungs­
alternativen
Bei einem Bürgerentscheid über einen Bebauungsplan einer Gemeinde konnten sich die Bürger zwischen den Alternativen A und B entscheiden. Die
Vierfeldertafel enthält Informationen über das Abstimmungsverhalten.
Geschlecht
gesamt
gesamt
A
B
weiblich
22 %
33 %
männlich
18 %
27 %
45 %
40 %
60 %
100 %
55 %
4.3 Bedingte Wahrscheinlichkeiten
Leistungskurs
261
Ist das Abstimmungsergebnis für Alternative A oder B vom Geschlecht abhängig?
Wir betrachten dazu
​ = 40 %;
• den Anteil der Frauen, die für A gestimmt haben: ​22 %
} 
55 %
• den Anteil der Männer, die für A gestimmt haben: ​18 %
 
​ = 40 %.
} 
45 %
​ = 60 % und 27 %
​45 %​ = 60 %.
 
Beide Anteile sind gleich. Entsprechendes gilt für die Anteile der B-Stimmen: 33 %
​  
} 
} 
55 %
Es spielt also keine Rolle, ob wir die Frauen oder die Männer der Gemeinde betrachten, d. h. die Abstimmung für die Alternativen A oder B war vom Geschlecht unabhängig.
Zudem gilt: Die A-Stimmen und die B-Stimmen kamen jeweils zu 55 % von Frauen und zu 45 % von Män 
​ = 55 %
bzw. 18 %
​ ​ = 45 %
 
und 33 %
​ ​ = 55 %
 
bzw. 27 %
​ ​ = 45 %.
 
nern: ​22 %
} 
} 
} 
} 
40 %
40 %
60 %
60 %
Es spielt also keine Rolle, ob wir die A-Stimmen oder die B-Stimmen betrachten, d. h. das Abstimmungs-
verhalten bei Männern und Frauen war von den Abstimmungsalternativen unabhängig.
Um die Unabhängigkeit (oder Abhängigkeit) von Merkmalen feststellen zu können, müssen – wie in Abschnitt 8.1.1 – die Wahrscheinlichkeiten als Quotienten bestimmt werden.
Notiert man diese Wahrscheinlichkeiten an den Pfaden der 2. Stufe der beiden zugehörigen Baumdiagramme, kann man die Unabhängigkeit (oder Abhängigkeit) auch direkt an beiden Baumdiagrammen ablesen:
Für beide Baumdiagramme gilt: Die beiden Teilbäume der 2. Stufe stimmen überein.
Beispiel für die Abhängigkeit von Merkmalen
Die Stimmen für die Alternative A beim oben be-
Abstimmungs­
alternativen
trachteten Bürgerentscheid setzen sich – wie in der
Vierfeldertafel rechts ablesbar – aus den Stimmen
verschiedener Altersgruppen zusammen.
Wir erkennen: Alternative A erhielt bei den über
​  -mal so viele
40-Jährigen mit 24 % der Stimmen 1 ​1} 
2
Alter
gesamt
gesamt
A
B
bis 40 J.
16 %
30 %
über 40 J.
24 %
30 %
54 %
40 %
60 %
100 %
46 %
Stimmen wie bei den bis 40-Jährigen mit 16 % – im Gegensatz zur Gesamtbevölkerung, in der beide Anteile
mit 54 % und 46 % nicht in diesem Verhältnis stehen.
Das Abstimmungsverhalten bezüglich der Alternative A war also altersabhängig.
Entsprechend haben wir unterschiedliche Teilbäume auf der 2. Stufe der beiden zugehörigen Baumdiagramme:
262
Leistungskurs
4 Wahrscheinlichkeitsrechnung
Kriterien für Abhängigkeit / Unabhängigkeit von Merkmalen in Mehrfeldertafeln
Informationen über zwei Merkmale und ihre Ausprägungen lassen sich mithilfe von zweistufigen Baumdiagrammen darstellen.
Treten dabei auf der 2. Stufe der (beiden möglichen) Baumdiagramme gleiche Teilbäume auf, dann sind
die betrachteten Merkmale voneinander unabhängig, sonst voneinander abhängig.
Aufgabe
2 Umkehren von Baumdiagrammen – bedingte Wahrscheinlichkeiten
Die Wahrscheinlichkeit,
durch ein Testverfahren
eine gesunde Person
als gesund zu erkennen, wird als Spezifität
bezeichnet.
Bei Infektionskrankheiten ist es wichtig, dass man schnell die Art der Krankheit
erkennt, damit man sie bekämpfen kann. Hierzu führt man Schnelltests durch,
die allerdings Mängel haben: Manchmal wird eine Krankheit angezeigt, obwohl
sie nicht vorliegt; gelegentlich wird eine Krankheit nicht angezeigt, obwohl sie
vorhanden ist. Die vorliegenden Testverfahren zum Nachweis einer HIV-Infekti­
on haben mittlerweile eine hohe Sicherheit (sogenannte Sensitivität):
Bei 99,9 % der tatsächlich Infizierten erfolgt eine positive Test­reaktion. Nur bei 0,3 % der nichtinfi­
zierten Testpersonen wird irrtümlich eine Infektion angezeigt (sogenannte Spezifität 99,7 %).
Man kann heute davon ausgehen, dass etwa 0,1 % der Bevölkerung in Deutschland HIV-infiziert ist.
Die Wahrscheinlichkeit,
durch ein Testverfahren
eine erkrankte Person
als krank zu erkennen,
wird als Sensitivität
bezeichnet.
a)Stellen Sie die Informationen in Form eines Baumdiagramms dar und bestimmen Sie hiermit die
zugehörige Vierfeldertafel.
b)Um Vorstellungen von der Größenordnung der Anzahl der betroffenen Personen zu bekommen, ist es
sinnvoll, auch die Vierfeldertafel mit absoluten Häufigkeiten zu bestimmen. Geben Sie diese an. Die
Gesamtbevölkerung in Deutschland liegt bei rund 80 Mio.
c)Angenommen, eine Person wird zufällig ausgewählt: Wie groß ist die Wahrscheinlichkeit, dass bei
einem positiven Testergebnis tatsächlich eine HIV-Infektion vorliegt?
Wie groß ist die Wahrscheinlichkeit, dass bei negativem Testergebnis dennoch eine Infektion vorliegt?
Warum erscheint das Rechenergebnis so paradox?
Stellen Sie dazu das Baumdiagramm mit vertauschter Abfolge der Merkmale auf.
Lösung
a) Im Text ist beschrieben, mit welchen Wahrscheinlichkeiten der HIV-Test positiv bzw. negativ
bei Infizierten bzw. Nicht-Infizierten reagiert. Daher muss auf der 1. Stufe das Merkmal Vorliegen der
Infektion mit den Merkmalsausprägungen ja bzw.
nein betrachtet werden, auf der 2. Stufe dann das
Merkmal Testreaktion mit den Merkmalsausprägungen positiv bzw. negativ.
Die Pfadwahrscheinlichkeiten des Baumdiagrammes
Testreaktion
bestimmen die inneren Felder der zugehörigen
Vierfeldertafel.
Anmerkung: Die Zahlen können fälschlicherweise
vorspiegeln, dass Aussagen mit 6-stelliger Genau-
positiv
negativ
gesamt
0,000999
Vorliegen der ja
Infektion
nein 0,002997
0,000001
0,001
0,996003
0,999
gesamt
0,996004
1
0,003996
igkeit möglich sind. Dies ist sicherlich nicht der Fall. Die 6 Stellen nach dem Komma ergeben sich zwangsläufig aus dem kleinsten auftretenden Wert von 0,000001 (ein Millionstel).
Leistungskurs
4.3 Bedingte Wahrscheinlichkeiten
b) Entsprechend ist auch die Vierfeldertafel mit
Testreaktion
absoluten Häufigkeiten „übertrieben“ genau; aber
sie gibt uns klare Vorstellungen von den Größenordnungen.
positiv
79 920
negativ
80
263
gesamt
Vorliegen der ja
Infektion
nein
239 760
79 680 240 79 920 000
80 000
gesamt
319 680
79 680 320 80 000 000
c) Das Baumdiagramm mit vertauschten Merkmalen ergibt sich wie folgt:
1. Stufe: Testreaktion
Die Wahrscheinlichkeiten entnehmen wir den Summenfeldern der
Spalten der Tabelle von Seite 262.
2. Stufe: Vorliegen der Infektion
Die Wahrscheinlichkeiten berechnen wir als Quotienten in den Spalten der Tabellen:
Die Wahrscheinlichkeit, dass bei einer zufällig ausgewählten Person tatsächlich eine HIV-Infektion vorliegt, nachdem der HIV-Text eine positive Reak­tion gezeigt hatte, beträgt nur 25 %. Die Chancen dafür,
dass eine Person mit negativem Testergebnis dennoch HIV-infiziert ist, stehen wie 1 zu 1 Million (Wahrscheinlichkeit 0,000001).
Die berechnete Wahrscheinlichkeit von 25 % für das tatsächliche Vorliegen einer HIV-Infektion scheint
im Widerspruch zur angegebenen Sensitivität von 99,9 % zu stehen, die doch eine hohe Sicherheit des
Testverfahrens zu versprechen scheint. Insbesondere an den absoluten Häufigkeiten lesen wir jedoch ab,
welche quantitativen Auswirkungen die 0,3 % falschen Reaktionen bei der großen Zahl der Nicht-Infizierten haben.
Weiterführende
3 Gefahr der Verwechslung von Wahrscheinlichkeiten
Aufgabe
a)Bei einer Wahl wurde Partei A vor allem von
Wahl der Partei
jüngeren Wählern gewählt. Eine repräsentative
Befragung am Wahltag ergab die nebenstehenden Daten. Welche Zeitungsmeldung (Schlagzeile) ist richtig?
gesamt
A
sonstige
bis 30 J.
Alter 30 J. und
älter
4,5 %
13,5 %
18,0 %
7,5 %
74,5 %
82,0 %
gesamt
12,0 %
88,0 %
100 %
(1) Jeder vierte Wähler der Partei A ist unter 30.
(2) Jeder vierte Wähler unter 30 entschied sich für Partei A.
b) Was bedeutet es, wenn in einem Text steht:
(1) der Anteil der Männer, die Partei A gewählt haben, beträgt 10 %;
(2) der Anteil der männlichen Wähler der Partei A beträgt 10 %;
(3) der Anteil der Personen, die männlich sind und Partei A gewählt haben, beträgt 10 %;
(4) der Anteil der Wähler der Partei A unter den Männern beträgt 10 %;
(5) der Anteil der Männer unter den Wählern der Partei A beträgt 10 %?
264
Leistungskurs
Information
4 Wahrscheinlichkeitsrechnung
(2) Bedingte Wahrscheinlichkeiten
Wenn man nicht genau formuliert oder oberflächlich liest, können leicht Verwechslungen bei der Angabe
von Wahrscheinlichkeiten auftreten (siehe Aufgabe 2). Wenn man die Wahrscheinlichkeiten auf der 2. Stufe beschreibt, muss man auf die Voraussetzungen (Bedingungen) achten, die durch die 1. Stufe gegeben
sind. Diese Bedingungen machen wir durch eine Index-Schreibweise deutlich.
Beispiel aus (1)
PA (B) bedeutet Wahrscheinlichkeit für B
unter der Bedingung A.
P (A ù B) bedeutet
Wahrscheinlichkeit für
A und B.
}
​A ​  bedeutet:
nicht A, also das
­Gegenereignis von A
Bedingte Wahrscheinlichkeiten lassen sich also als
B
​}
B ​ 
gesamt
berechnen: Der Zähler des Bruches lässt sich aus
A
}
​A ​ 
P ​( A ù B )​
P ​( }
​A ​  ù B )​
P ​( A ù ​}
B ​  )​
P ​( }
​A ​  ù ​}
B ​  )​
P ​( A )​
P ​( }
​A ​  )​
einem inneren Feld der Mehrfeldertafel ablesen;
gesamt
P ​( B )​
P ​( }
​B ​  )​
1
Anteile auffassen, d. h. als Brüche (Quotienten)
der Nenner des Bruches steht als Zeilen- oder Spaltensumme am Rand.
Hieraus ergibt sich das folgende allgemeine Baum-
Entsprechend für das zugehörige umgekehrte
diagramm für einen 2-stufigen Zufallsversuch:
Baumdiagramm:
Die bedingten Wahrscheinlichkeiten auf der 2. Stufe kann man wie folgt berechnen: Man kennt die Wahrscheinlichkeit für den gesamten Pfad, beispielsweise P (A ù B), und die Wahrscheinlichkeit P (A) für den
Teilpfad der 1. Stufe. Wegen P (A)∙PA (B)  =  P (A  ù B) gemäß der Pfadmultiplikationsregel ergibt sich die
P (A  ù B)
P (A)
   
​.
Wahrscheinlichkeit für den Teilpfad der 2. Stufe als Quotient PA (B) = ​} 
Man definiert deshalb allgemein:
Definition: Bedingte Wahrscheinlichkeit
Die Wahrscheinlichkeit, dass ein Ereignis A eintritt unter der Bedingung, dass ein Ereignis B bereits
P (A  ù B)
P (B)
  ​ 
eingetreten ist, berechnet man wie folgt: PB (A) = ​} 
Die Wahrscheinlichkeit, dass ein Ereignis B eintritt unter der Bedingung, dass ein Ereignis A bereits
P (A  ù B)
P (A)
  ​ 
eingetreten ist, berechnet man wie folgt: PA (B) = ​} 
Leistungskurs
4.3 Bedingte Wahrscheinlichkeiten
265
(3)
Satz von Bayes
Oft sind in Anwendungssituationen Informationen gegeben, die man unmittelbar in ein Baumdiagramm
übertragen kann. Interessiert man sich aber für eine Wahrscheinlichkeit, die nur aus dem umgekehrten
Baumdiagramm abgelesen werden kann, so kann man diese Wahrscheinlichkeit auch der Vierfeldertafel
entnehmen, ohne dass man das umgekehrte Baumdiagramm vollständig aufstellt.
Die hierbei verwendete Rechenregel geht auf den englischen Mathematiker Thomas Bayes zurück:
Satz von Bayes
Thomas Bayes
(1702 – 1761); englischer Mathematiker
Wir betrachten die Ereignisse A und B und interessieren uns für die Wahrscheinlichkeit, dass A eintritt
unter der Bedingung, dass B bereits eingetreten ist. Dann gilt:
P (A  ù B)
P (B)
   
​ für A unter der Bedingung B berechnet sich wie folgt:
Die Wahrscheinlichkeit PB (A) = ​} 
P (A)∙P
(B)
P (A  ù B)
A
  }
​
PB (A) = ​   
}
P (A)∙PA (B)  +  P ​( ​ A  ​ ) ​∙​P​}​A ​​  (B)
(4)
Formale Definition der Unabhängigkeit von Ereignissen
Nach der Definition der bedingten Wahrscheinlichkeit gilt: P (A)∙PA (B)  =  P (A  ù  B) und auch P (B)∙PB (A)  = 
P (A  ù B). Wenn es aber für das Eintreten des Ereignisses A keine Rolle spielt, ob B eingetreten ist, also
PB (A) = P (A), und umgekehrt PA (B) = P (B), dann sind A und B voneinander unabhängig. Es gilt dann:
P (A)∙P (B)  =  P (A  ù B).
Daher definiert man: Zwei Ereignisse A und B heißen stochastisch voneinander unabhängig genau dann,
wenn gilt: P (A)∙P (B) = P (A ù B), andernfalls heißen sie stochastisch voneinander abhängig.
Übungsaufgaben
4 Widersprechen sich die Angaben in dem Zeitungsartikel rechts oder können die Informationen
so stimmen?
33 % aller Männer rauchen.
61 % aller Raucher sind Männer.
22 % aller Frauen rauchen.
54 % aller Nicht­raucher sind Frauen.
5 In der Warenausgabe einer Fabrik, die SIM-Karten fertigt, werden Kontrollmessungen durchgeführt.
SIM-Karten, die nicht vollständig funktionstüchtig sind, werden zu 95 % als solche erkannt, allerdings
kommt es auch in 2 % der Fälle vor, dass wegen eines Messfehlers brauchbare SIM-Karten irrtümlich als
Polizei warnt vor
Alkohol am Steuer
In Deutschland wurden
im vergangenen
Jahr insgesamt ca.
390 000 Unfälle mit
Personenschaden
registriert, davon
waren 10,2 % durch
Alkohol verursacht.
Während sich 24,6 %
der Verkehrsunfälle
ohne Alkoholeinfluss
in der Zeit zwischen 18
Uhr abends und 4 Uhr
morgens ereigneten,
fiel bei den AlkoholUnfällen ein Anteil
von 68,0 % in diesen
Zeitraum.
fehler­haft angezeigt werden. Erfahrungsgemäß sind 90 % der produzierten SIM-Karten in Ordnung.
a) (1) Eine zufällig herausgegriffene SIM-Karte wird als fehlerhaft angezeigt.
Mit welcher Wahrscheinlichkeit ist sie tatsächlich nicht zu gebrauchen?
(2) Eine zufällig herausgegriffene SIM-Karte wird als funktionstüchtig angezeigt.
Mit welcher Wahrscheinlichkeit ist sie tatsächlich zu gebrauchen?
b)Wie verringert sich die Fehlerquote, wenn die Kontrollmessung zweifach durchgeführt wird?
6
a) Stellen Sie die Daten des Zeitungsartikels in einer Vierfeldertafel und in einem Baumdiagramm zusammen. Welche Daten kann man dem umgekehrten Baum­diagramm entnehmen? Schreiben Sie dazu einen
Zeitungstext.
b)Ein Unfall mit Personenschaden wird zufällig ausgewählt. Wie groß ist die Wahrscheinlichkeit, dass
dieser Unfall unter Alkoholeinwirkung geschah, wenn bekannt ist, dass er zwischen 4 Uhr morgens und
18 Uhr abends stattfand [zwischen 4 Uhr morgens und 18 Uhr abends stattfand, wenn bekannt ist,
dass Alkohol im Spiel war]?
266
Leistungskurs
4 Wahrscheinlichkeitsrechnung
7 Der Glukosetoleranztest
Beim Glukosetoleranztest gibt der Arzt dem Patienten eine genau abgemessene Zuckerwassermenge zu trinken und prüft nach einer kurzen Wartezeit die Blutzuckerwerte.
Die Sensitivität dieses Tests beträgt 72 %, d. h. bei Personen, die an Diabetes erkrankt sind, reagiert der Test
in 72 % der Fälle („positiv“). Die Spezifität des Tests beträgt 73 %, d. h. bei Personen, die nicht an Diabetes
erkrankt sind, zeigt der Test in 73 % der Fälle keine Reaktion („negativ“). Etwa 1 % der Bevölkerung ist an
Diabetes erkrankt und weiß nichts von der Tatsache der Erkrankung.
Was bedeutet es, wenn bei einer Vorsorgeuntersuchung bei einem nichts-ahnenden Patienten ein „positiver“ Befund festgestellt wird? Mit welcher Wahrscheinlichkeit ist diese Person tatsächlich an Diabetes
erkrankt? Wie brauchbar ist der Glukosetoleranztest überhaupt?
8
Impfschutz gegen Malaria
Trotz aller Warnungen fahren viele Urlauber ohne Impfschutz in tropische Gegenden. Offensichtlich halten sie
z. B. die Ansteckungsrate von 6 % für Malaria für nicht
gefährlich. Hotels in diesen Regionen halten für die
Touristen Schnelltests bereit, mit denen diese ohne
großen Aufwand überprüfen können, ob sie sich mit
Malaria infiziert haben. Unabhängig von den Schwierigkeiten, die manche Touristen haben, den Schnelltest nach Anleitung durchzuführen, sind die Schnelltests selbst nicht sicher: Nur bei 77 % der tatsächlich
Infizierten erfolgt eine „positive“ Testreaktion; bei
­
95 % der tatsächlich Nicht-Infizierten erfolgt eine „negative“ Testreaktion.
Angenommen, eine Person führt vorsichtshalber einen Schnelltest durch und das Testergebnis ist „positiv“.
Mit welcher Wahrscheinlichkeit ist diese Person tatsächlich an Malaria erkrankt?
9
Wahlentscheidungen sind in der Regel in starkem Maße vom Stimmverhalten der verschiedenen Alters-
gruppen abhängig. Untersuchen Sie dazu die folgenden Daten zur Landtagswahl 2011 in Rheinland-Pfalz;
hier waren 70 % der Wähler/innen unter 60 Jahre alt. Hätten bei der Landtagswahl 2011 in Rheinland-Pfalz
nur die Wähler/innen unter 60 Jahren ein Stimmrecht gehabt, dann hätten die beiden großen Parteien
schlechter abgeschnitten als insgesamt (SPD 34 %, CDU 31 %). Wenn nur die Wähler/innen ab 60 Jahren
hätten wählen dürfen, hätten beide davon profitiert (SPD 40 %, CDU 45 %).
a) Stellen Sie die Informationen in Form eines Baumdiagramms dar.
b) Bestimmen Sie auch das umgekehrte Baumdiagramm und schreiben Sie dazu einen Zeitungstext.
10 Das Wahlverhalten bei der Landtagswahl 2011 in Rheinland-Pfalz war in den verschiedenen Konfes-
sionsgruppen sehr unterschiedlich: Während die CDU bei den Katholiken auf 45 % der Stimmen kam, erreichte sie bei den Protestanten nur 28 % und in der übrigen Bevölkerung (andere/ohne Konfession) sogar
nur 21 %. Die SPD dagegen kam auf 43 % in der protestantischen Bevölkerung, auf 31 % bei den ­Katholiken
und auf 34 % sonst. Bei der Wahl erhielt die SPD insgesamt 35,7 %, die CDU 35,2 % der Stimmen. Stellen
Sie diese Informationen in geeigneten Baumdiagrammen und einer Mehrfeldertafel dar. Schreiben Sie
einen weiteren Text über das Wahlverhalten der CDU- bzw. SPD-Wählerschaft.
4.3 Bedingte Wahrscheinlichkeiten
11 Leistungskurs
267
Drei Lokalzeitungen A, B, C haben Markt­
anteile von 45 %, 37 % und 18 %. Bei Zeitung A
erfolgt 10 % des Verkaufs an Abonnementen, bei
Zeitung B sind dies 60 %, bei Zeitung C 75 %.
a)Bestimmen Sie den Anteil der Abonnenten unter den Zeitungs­lesern.
b)An einem Kiosk wird gerade eine Lokalzeitung
verkauft. Mit welcher Wahrscheinlichkeit ist
dies die Zeitung B?
12 Ein Autohersteller lässt bei einem neuen Wagentyp Scheibenwischer von drei verschiedenen Zulie-
ferfirmen einbauen. Vom ersten Zulieferer stammen 20 %, vom zweiten 30 %, vom dritten 50 %.
Bei den Inspektionen nach 6 Monaten wird festgestellt, dass 15 % der Scheibenwischer der ersten Zulieferfirma, 18 % der zweiten und 9 % der dritten Firma unbrauchbar geworden sind.
a)Stellen Sie die Daten in einem Baumdiagramm zusammen und berechnen Sie die Wahrscheinlichkeit
dafür, dass ein zufällig ausgewählter Scheibenwischer unbrauchbar ist.
b)Stellen Sie die Angaben in einer Mehrfeldertafel zusammen und berechnen Sie die bedingten Wahrscheinlichkeiten dafür, dass ein zufällig ausgewählter Scheibenwischer, der sich als unbrauchbar erwiesen hat, aus der ersten [zweiten; dritten] Firma stammt.
13 a)Wenn ein HIV-Test positiv verlaufen ist, wird der Test bei der
betreffenden Person noch einmal durchgeführt. Was bedeutet es
nun, wenn zweimal hintereinander eine positive Testreaktion erfolgte (Ereignis „pp“)? Vervollständigen Sie das nebenstehende
Baumdiagramm. Geben Sie das Ergebnis in Worten wieder.
b)In der Praxis wird bei Vorliegen eines positiven Testergebnisses
der aufwendigere Western-Blot-Test durchgeführt. Dieser hat eine Spezifität von 99,95 % (bei gleicher
Sensitivität).
Erläutern Sie, wieso hiermit die Aussagen über das Vorliegen/Nicht-Vorliegen einer HIV-Infektion
sicherer sind.
Kohorte: Bevölkerungsgruppe mit gemeinsamen zeit- oder
jahrgangsspezifischen
Merkmalen
Geburtskohorte: Bevölkerungsgruppe mit
gleichem Geburtsjahr
14 Zu den frühkindlichen Vorsorgemaßnahmen zählen auch die Untersuchungen von Neugeborenen
hinsichtlich einer Hörschädigung, das sogenannte Hörscreening.
Im Abschlussbericht eines Ausschusses der Bundesärztekammer heißt es:
„Bei einer Spezifität von 98 % und einer Sensitivität von 90 % würden bei einer Geburtskohorte von 686 000
(Jahr 2005) von 823 Kindern mit Hörstörungen 741 durch ein universelles Neugeborenen-Hörscreening
erkannt und 13 704 Kinder hätten einen falsch-positiven Befund. […]
Aufgrund des geringen Schadenpotenzials bei falsch-positiven Befunden und des erheblichen zu erwartenden Nutzens bei Kindern, deren Hörstörung durch das Screening entdeckt wird, überwiegt nach Ansicht
der Arbeitsgruppe der potenzielle Nutzen den potenziellen Schaden.“
Was bedeutet dieser Text? Stellen Sie die Informationen in Form eines Baumdiagramms dar und bestimmen
Sie das umgekehrte Baumdiagramm.