Bedingte Wahrscheinlichkeit

aus ZUM-Wiki, dem Wiki für Lehr- und Lerninhalte auf ZUM.de
Wechseln zu: Navigation, Suche

Inhaltsverzeichnis

Wann spricht man von einer bedingten Wahrscheinlichkeit?

Bei mehrmaligem Würfeln hängt die Wahrscheinlichkeit eine bestimmte Zahl zwischen 1 und 6 zu werfen nicht von dem vorherigen Ergebnis ab. Jeder Wurf geschieht unabhängig von dem vorigen. Werden hingegen aus einer Urne, die z.B. mehrere Kugeln mit zwei unterschiedlichen Farben enthält nacheinander Kugeln gezogen, ohne sie wieder zurückzulegen, dann ist die Wahrscheinlichkeit für ein bestimmtes Ergebnis oft von dem vorigen Ergebnis abhängig. In diesem Fall spricht man von einer bedingten Wahrscheinlichkeit.

Einführungsbeispiel

Eine Urne enthält 100 Kugeln.
70 Kugeln bestehen aus dem Material Holz und 30 Kugeln sind aus Kunststoff.
25 der Holzkugeln sind mit der Farbe rot gestrichen und 45 sind grün.
10 der Kunststoffkugeln sind rot und 20 sind grün.
Folgende Ereignisse werden definiert:
A\,: Die Kugel ist aus Holz.       \bar A: Die Kugel ist aus Kunststoff.
B\,: Die Kugel ist rot.               \bar B: Die Kugel ist grün.
Die Kugeln tragen zwei Merkmale mit jeweils zwei Ausprägungen.
Bw 01.gif
Dieser Sachverhalt kann in einer Vierfeldtafel dargestellt werden:
Bw 02.gif
Aus der Urne wird eine Kugel zufällig gezogen.
Mit den Daten der Tafel lassen sich direkt folgende Wahrscheinlichkeiten berechnen:
P(A)= \frac {70} {100}= \frac {7} {10}=0{,}7 P(\bar A)= \frac {30} {100}= \frac {3} {10}=0{,}3
P(B)= \frac {35} {100}= \frac {7} {20}=0{,}35 P(\bar B)= \frac {65} {100}= \frac {13} {20}=0{,}65
P(A \cap B)= \frac {25} {100}= \frac {1} {4}=0{,}25 P(A \cap \bar B)= \frac {45} {100}= \frac {9} {20}=0{,}45
P(\bar A \cap B)= \frac {10} {100}= \frac {1} {10}=0{,}1 P(\bar A \cap \bar B)= \frac {20} {100}= \frac {2} {10}=0{,}2
Die zugehörige Vierfeld – Tafel:

 

B\,

\bar B

Summe

A\,

P(A \cap B)=0{,}25

P(A \cap \bar B)=0{,}45

P(A)=0{,}7\,

\bar A

P(\bar A \cap B)=0{,}1

P(\bar A \cap \bar B)=0{,}2

P(\bar A)=0{,}3

Summe

P(B)=0{,}35\,

P(\bar B)=0{,}65

 1\,

Jemand zieht eine Kugel und spürt mit der Hand, dass es sich um eine Kunststoffkugel handelt.
Wie groß ist nun die Wahrscheinlichkeit dafür, dass die Kugel in seiner Hand grün ist?
Das ist nicht die Wahrscheinlichkeit, mit der man eine grüne Kunststoffkugel zieht.
Aus der Vierfeld – Tafel lässt sich die gesuchte Wahrscheinlichkeit nicht ablesen.
Mit einem Ereignisbaum soll diese Frage nun geklärt werden.
Bw 03.gif
Die Bezeichnung P_A(B)\, bedeutet:
Die Wahrscheinlichkeit von B unter der Bedingung, dass A bereits eingetreten ist.
Diese Wahrscheinlichkeit heißt bedingte Wahrscheinlichkeit.
In Bezug auf die Fragestellung wird also P_\bar A(\bar B) gesucht.
In Worten: Wie groß ist die Wahrscheinlichkeit dafür eine grüne Kugel gezogen zu haben, wenn man weiß, dass die gezogene Kugel aus Kunststoff ist?
Es wird nach einer Wahrscheinlichkeit gesucht, die von einer Bedingung abhängt.
In diesem Fall lautet die Bedingung: Die gezogene Kugel ist aus Kunststoff.
Um die im Baumdiagramm noch fehlenden bedingten Wahrscheinlichkeiten auszurechnen, verwendet man die Pfadmultiplikationsregel:
P(A) \cdot P_A(B)=P(A \cap B) \Leftrightarrow P_A(B)= \frac {P(A \cap B)} {P(A) }


Die Regel, nach der die bedingte Wahrscheinlichkeit berechnet wird, geht auf den englischen Mathematiker Thomas Bayes (1702 - 1761) zurück und wird daher auch Bayes'sche Regel oder auch Satz von Bayes genannt.
Sind A\, und  B\, Ereignisse mit P(A) \not = 0 \, dann gilt:
 P_A(B)= \frac {P(A \cap B)} {P(A) }


Berechnung der bedingten Wahrscheinlichkeiten:
 P_A(B)= \frac {P(A \cap B)} {P(A) }=\frac {5} {20}: \frac {7} {10}=\frac {5 \cdot 10} {7 \cdot 20}=\frac {5} {14} \approx 0{,}36
 P_A(\bar B)= \frac {P(A \cap \bar B)} {P(A) }=\frac {9} {20}: \frac {7} {10}=\frac {9 \cdot 10} {7 \cdot 20}=\frac {9} {14} \approx 0{,}64
 P_\bar A (B)= \frac {P(\bar A \cap B)} {P(\bar A) }=\frac {2} {20}: \frac {3} {10}=\frac {2 \cdot 10} {3 \cdot 20}=\frac {1} {3} = 0{,}\bar 3
 P_\bar A( \bar B)= \frac {P( \bar A \cap \bar B)} {P( \bar A) }=\frac {4} {20}: \frac {3} {10}=\frac {4 \cdot 10} {3 \cdot 20}=\frac {2} {3} = 0{,}\bar 6
Wenn man also weiß, dass die gezogene Kugel aus Kunststoff besteht,
dann ist die Wahrscheinlichkeit dafür, dass sie Farbe grün hat: 2/3.
Die Wahrscheinlichkeit, eine grüne Kunststoffkugel zu ziehen, ist hingegen 0,2.

Ein etwas anderer Zugang

Eine Urne enthält 3 grüne und 2 rote Kugeln.
Zwei Kugeln werden nacheinander ohne Zurücklegen gezogen.
Es werden vier Ereignisse definiert:
A: Grün wird im 1. Zug gezogen
B: Grün wird im 2. Zug gezogen.
C: Grün wird im ersten und zweiten Zug gezogen.
D: Grün im zweiten Zug unter der Bedingung, dass grün bereits im ersten Zug gezogen wurde.
Zu bestimmen sind die Wahrscheinlichkeiten aller Ereignisse.
Ein Baumdiagramm mit den Pfadwahrscheinlichkeiten veranschaulicht den Zusammenhang.
Bw 04.gif
Dem Baumdiagramm sind folgende Ergebnisse zu entnehmen:
Grün im 1. Zug: P(A)=\frac {3} {5}=0{,}6 und
Grün im 2. Zug: P(B)=\frac {3} {10} + \frac {3} {10}= \frac {6} {10}=0{,}6
Für grün im 1. Zug und grün im 2. Zug erhält man mit der Pfadmultiplikationsregel:
P(C)=P(A \cap B)= \frac {3} {5} \cdot \frac {1} {2}= \frac {3} {10}=0{,}3
P(D)=\frac {1} {2} wird abgelesen.
Der Wert von P(D)\, wurde wie folgt ermittelt:
Unter der Voraussetzung (Bedingung), dass im 1. Zug grün gezogen wurde, weiß man, dass noch 2 grüne und 2 rote Kugeln in der Urne sind.
Die Wahrscheinlichkeit für grün im 2. Zug ist dann 1/2.
Für die Wahrscheinlichkeit von D (grün im 2. Zug) unter der Voraussetzung, dass A (grün im 1. Zug) schon eingetreten ist, wählt man die Bezeichnung P(D)=P_A(B)\,.
Im dargestellten Fall gilt P_A(B)= \frac {1} {2}       (\not = P(B)=\frac {3} {5})
Für eine weitere Untersuchung dient der Ausschnitt aus dem Pfaddiagramm, in dem P_A(B)\, vorkommt.

Bw 05.gif

Ist nach der Wahrscheinlichkeit P_A(B)\, gefragt, so kann obige Gleichung wie folgt umgeformt werden:
 P_A(B)= \frac {P(A \cap B)} {P(A) } für P(A) \not = 0\,
P_A(B)\, ist die Wahrscheinlichkeit von B\, unter der Bedingung, dass A \, bereits eingetreten ist.
Wir überprüfen dieses Gesetz mit den vorliegenden Ergebnissen:
P(A \cap B)=\frac {3} {10} und P(A)=\frac {3} {5}\Rightarrow P_A(B)=\frac {P(A \cap B)} {P(A)}=\frac {3} {10}:\frac {3} {5}=\frac {3 \cdot 5} {3 \cdot 10}=\frac {1} {2}
Aus dem Urnenversuch (mehrfaches Ziehen ohne Zurücklegen) geht klar hervor, dass die Wahrscheinlichkeiten für die jeweils nächste Ziehung von der vorigen abhängt.
In einem solchen Fall sagt man, die Ereignisse sind voneinander abhängig.

Unabhängigkeit von Ereignissen

Bei einem Urnenversuch (mehrfaches Ziehen mit Zurücklegen), wird die Anfangsbedingung immer wieder hergestellt, so dass die Wahrscheinlichkeit für die jeweils nächste Ziehung gleich ist, wie bei der ersten.
In einem solchen Fall sagt man, die Ereignisse sind voneinander unabhängig.
Eine Urne enthält 3 grüne und 2 rote Kugeln. Zwei Kugeln werden nacheinander mit Zurücklegen gezogen.
Es werden vier Ereignisse definiert:
A: Grün wird im 1. Zug gezogen
B: Grün wird im 2. Zug gezogen.
C: Grün wird im ersten und zweiten Zug gezogen.
D: Grün im zweiten Zug unter der Bedingung, dass grün bereits im ersten Zug gezogen wurde.
Das Baumdiagramm mit den zugehörigen Pfadwahrscheinlichkeiten:
Bw 06.gif
Dem Baumdiagramm sind folgende Ergebnisse zu entnehmen:
Grün im 1. Zug: P(A)=\frac {3} {5}=0{,}6 und
Grün im 2. Zug: P(B)= \frac {9} {25} + \frac {6} {25} = \frac {15} {25}=\frac {3} {5}=0{,}6
Für grün im 1. Zug und grün im 2. Zug erhält man mit der Pfadmultiplikationsregel:
P(C)=P(A \cap B)= \frac {3} {5} \cdot \frac {3} {5}= \frac {9} {25}=0{,}36
P(D)=\frac {3} {5} wird abgelesen.
Die Wahrscheinlichkeit, eine grüne Kugel zu ziehen, bleibt immer gleich, da nach jedem Zug durch Zurücklegen der Kugel, die Ausgangssituation wieder hergestellt wird.
Die Wahrscheinlichkeit für grün im 2. Zug unter der Bedingung, das grün im 1. Zug bereits gezogen wurde, ist P(D) = P_A(B)\,.
Ein Ausschnitt aus dem Baumdiagramm:
Bw 07.gif
Eine Auflistung der Ergebnisse ergibt:


P(A)=\frac {3} {5} und P_A(B)=\frac {3} {5} und P(B)=\frac {3} {5}
Es ist also: P_A(B)=P(B)\,
Damit gilt mit der Pfadmultiplikationsregel: P(A \cap B=P(A)\cdot P(B)
Gilt P_A(B) = P(B)\,, so beeinflusst das Eintreten des Ereignisses A\, die Wahrscheinlichkeit von B\, nicht.
Man sagt, die Ereignisse A\, und B\, sind unabhängig voneinander.


Definition

Unabhängige Ereignisse:

Das Ereignis B heißt unabhängig vom Ereignis A, wenn das Eintreten von A die Wahrscheinlichkeit für das Eintreten von B nicht beeinflusst.
Es gilt: P(A \cap B)=P(A) \cdot P(B)
Beispiel: Urnenziehung mit Zurücklegen.


Maehnrot.jpg
Merke:
Für den Nachweis der Unabhängigkeit zweier Ereignisse A und B geht man wie folgt vor:
Man berechnet P(A)\,; P(B)\, und P(A \cap B).
Gilt P(A \cap B)=P(A) \cdot P(B),
dann sind die Ereignisse A und B voneinander unabhängig.


Beispiel zur statistischen Unabhängigkeit

Eine Umfrage an Schulen über die Essgewohnheiten der Schüler hat ergeben, dass 45% aller Schüler gerne Schokolade essen. 55% aller Schüler ziehen andere Süßigkeiten vor. 60% aller Schüler gaben an, Geschwister zu haben. 27% aller Schüler haben Geschwister und essen zugleich gerne Schokolade.
Ein Schokoladenhersteller interessiert sich dafür, ob Schüler mit Geschwister eine besondere Vorliebe für Schokolade haben.
Anders ausgedrückt: Hat die Tatsache, dass ein Schüler Geschwister hat, einen Einfluss auf seine Vorliebe für Schokolade?


Die Erhebungsdaten lassen sich in einer Vierfeld–Tafel darstellen:

 

B\,

\bar B

Summe

A\,

P(A \cap B)=0{,}27

P(A \cap \bar B)=0{,}33

P(A)=0{,}6\,

\bar A

P(\bar A \cap B)=0{,}18

P(\bar A \cap \bar B)=0{,}22

P(\bar A)=0{,}4

Summe

P(B)=0{,}45\,

P(\bar B)=0{,}55

 1\,

Die zugehörigen Ereignisse sind:
A: Der Schüler hat Geschwister.           B: Der Schüler isst gerne Schokolade.
P(A)=0{,}6 \,

P(B)=0{,}45 \,
P(A \cap B)=0{,}27

\Rightarrow P_A(B)= \frac {P(A \cap B)} {P(A)}= \frac {0{,}27} {0{,}6}=0{,}45=P(B)
Die Ereignisse sind unabhängig voneinander.
Das bedeutet, ob ein Schüler Geschwister hat oder nicht, hat keinen Einfluss auf seine Vorliebe für Schokolade.

Zusammenhang zwischen Vierfeldtafel und Baumdiagramm

Ein Berufskolleg hat 1000 Schüler. Die folgende Vierfeldtafel gibt Aufschluss darüber, wie die Handys auf die Schüler verteilt sind.

 

B\, weiblich

\bar B männlich

Summe

A\, besitzt ein Handy

410\,

397 \,

807\,

\bar A besitzt kein Handy

114 \,

79 \,

193 \,

Summe

524\,

476 \,

 1000\,

Die relativen Häufigkeiten werden berechnet und in eine neue Vierfeld-Tafel eingetragen.

 

B\, weiblich

\bar B männlich

Summe

A\, besitzt ein Handy

0{,}410\,

0{,}397 \,

0{,}807\,

\bar A besitzt kein Handy

0{,}114 \,

0{,}079 \,

0{,}193 \,

Summe

0{,}524\,

0{,}476 \,

 1\,

Folgende Vierfeld-Tafel zeigt die Bedeutung der Feldinhalte:
Allgemeine Form der Vierfeld-Tafel

 

B\,

\bar B

Summe

A\,

P(A \cap B)

P(A \cap \bar B)

P(A)\,

\bar A

P(\bar A \cap B)

P(\bar A \cap \bar B)

P(\bar A)

Summe

P(B)\,

P(\bar B)

 1\,

Jeder Vierfeldtafel lässt sich ein Ereignisbaum zuordnen.
Baumdiagramm umgekehrtes Baumdiagramm

Baum 01.gif

Ibaum 01.gif

Vertauscht man bei einem Baumdiagramm die Reihenfolge der betrachteten Merkmale, dann erhält man das umgekehrte oder inverse Baumdiagramm.
Die Wahrscheinlichkeiten an den Pfadenden stimmen in beiden Baumdiagrammen bis auf die Reihenfolge überein.
Die Pfadwahrscheinlichkeiten und damit auch die bedingten Wahrscheinlichkeiten unterscheiden sich im Allgemeinen voneinander. Sie beziehen sich auf verschiedene Merkmale und daher auch auf verschiedene Teilgesamtheiten.


Baumdiagramm mit den bisher bekannten Wahrscheinlichkeiten:
Baum 02.gif Ibaum 02.gif


Zur Berechnung der bedingten Wahrscheinlichkeiten eine Auflistung der relevanten Daten:

 

B\, weiblich

\bar B männlich

Summe

A\, besitzt ein Handy

P(A \cap B)=0{,}410

P(A \cap \bar B)=0{,}397

P(A)=0{,}807\,

\bar A besitzt kein Handy

P(\bar A \cap B)=0{,}114

P(\bar A \cap \bar B)=0{,}079

P(\bar A)=0{,}193

Summe

P(B)=0{,}524\,

P(\bar B)=0{,}476

 1\,

Berechnung der bedingten Wahrscheinlichkeiten:
P_A(B)=\frac {P(A \cap B)} {P(A)}=\frac {0{,}410} {0{,}807}\approx 0{,}508       P_B(A)=\frac {P(A \cap B)} {P(B)}=\frac {0{,}410} {0{,}524}\approx 0{,}782
P_A(\bar B)=\frac {P(A \cap \bar B)} {P(A)}=\frac {0{,}397} {0{,}807}\approx 0{,}492       P_B(\bar A)=\frac {P(\bar A \cap B)} {P(B)}=\frac {0{,}114} {0{,}524}\approx 0{,}218
P_\bar A(B)=\frac {P(\bar A \cap B)} {P(\bar A)}=\frac {0{,}114} {0{,}193}\approx 0{,}591       P_\bar B(A)=\frac {P(A \cap \bar B)} {P(\bar B)}=\frac {0{,}397} {0{,}476}\approx 0{,}834
P_\bar A(\bar B)=\frac {P(\bar A \cap \bar B)} {P(\bar A)}=\frac {0{,}079} {0{,}193}\approx 0{,}409       P_\bar B(\bar A)=\frac {P(\bar A \cap \bar B)} {P(\bar B)}=\frac {0{,}079} {0{,}476}\approx 0{,}166


Baumdiagramm mit allen Wahrscheinlichkeiten:
Baum 03.gif Ibaum 03.gif
Aus dem Baum lassen sich nun viele Informationen ablesen. Dazu einige Beispiele.
  • Die Wahrscheinlichkeit, mit der eine zufällig ausgewählte Person kein Handy besitzt, ist: P(\bar A)=0{,}193\,
  • Die Wahrscheinlichkeit dafür, zufällig eine Frau auszuwählen, ist: P(B)=0{,}524 \,
  • Wenn man weiß, dass die zufällig ausgewählte Person kein Handy besitzt, ist die Wahrscheinlichkeit dafür, dass es sich bei der Person um einen Mann handelt: P_\bar A(\bar B)=0{,}409
  • Wenn man weiß, dass die zufällig ausgewählte Person weiblich ist, ist die Wahrscheinlichkeit dafür, dass sie ein Handy besitzt: P_B(A)=0{,}782 \,
Hat man den Zusammenhang einer Vierfeldtafel mit den Baumdiagrammen begriffen, dann lassen sich solche Aufgaben auch mit weniger Aufwand lösen. Das soll ein weiteres Beispiel zeigen.

Beispiel Spam-Mails

Viele Internetnutzer klagen über Spam-Mails.
Nehmen wir an, in 1% der guten und 40% der Spam-Mails komme das Wort „Viagra“ vor.
Außerdem seien 10% der Mails gut und 90% Spam.
Wie groß ist die Wahrscheinlichkeit, dass eine Mail, von der man weiß, das in ihr das Wort „Viagra“ vorkommt, eine Spam-Mail ist.?
Ereignisse:
A: Die E-Mail enthält das Wort „Viagra“.
B: Die E-Mail ist Spam.
Aufstellen der Vierfeldtafel mit den vorgegebenen Daten:
Die %-Werte entsprechen den relativen Häufigkeiten (Wahrscheinlichkeiten).
90 % Spam bedutet Summe Spam = 0,9
10% gute Mails bedeutet Summe gute Mails = 0,1
40% der Spam-Mails enthalten das Wort Viagra, bedeutet 0,9 \cdot 0,4 = 0,36
1% der guten Mails enthält das Wort Viagra, bedeutet 0,1 \cdot 0,01 = 0,001

 

B\, Spam

\bar B gute Mail

Summe

A\, mit Viagra

0{,}36\,

0{,}001 \,

 

\bar A ohne Viagra

 

 

 

Summe

0{,}9\,

0{,}1 \,

 1\,

Die restliche Werte lassen sich ausrechnen, da die Summen bekannt sind.
Spam ohne Viagra: 0,9 – 0,36 = 0,54
Gute Mail ohne Viagra: 0,1 – 0,001 = 0,099
Summe aller Mails mit Viagra: 0,36 + 0,001 = 0,361
Summe aller Mails ohne Viagra: 0,54 + 0,099 = 0,639
Mit diesen Werten wird die Vierfeldtafel vervollständigt.

 

B\, Spam

\bar B gute Mail

Summe

A\, mit Viagra

0{,}36\,

0{,}001 \,

0{,}361 \,

\bar A ohne Viagra

0{,}54 \,

0{,}099 \,

0{,}639 \,

Summe

0{,}9\,

0{,}1 \,

 1\,

Die Aufgabenstellung lautete:
Wie groß ist die Wahrscheinlichkeit, dass eine Mail, in der „Viagra“ steht, Spam ist?
Gesucht ist also die Wahrscheinlichkeit von B unter der Bedingung, dass A bereits eingetreten ist.
P_A(B)=\frac {P(A \cap B)} {P(A)}=\frac {0{,}36} {0{,}361} \approx 0{,}997
Das bedeutet, in 99,7% aller Fälle ist eine Mail, von der man weiß, dass in ihr das Wort „Viagra“ steht, eine Spam-Mail.

Bedingte Wahrscheinlichkeit/Aufgaben

Preise und Konditionen (Die ultimative Mathe CD)

Linkliste

Siehe auch