Bedingte Wahrscheinlichkeiten

aus ZUM-Wiki, dem Wiki für Lehr- und Lerninhalte auf ZUM.de
Wechseln zu: Navigation, Suche

Inhaltsverzeichnis

Einführung

Definition

Die Bedingte Wahrscheinlichkeit ist die Wahrscheinlichkeit des Ereignisses A unter der Bedingung, dass B bereits eingetreten ist.

Im Weiteren wird dies bezeichnet mit P(A|B) ("A gegeben B" oder "A unter der Bedingung B")

Formale Definition: Sind A und B zwei beliebige Ereignisse und P(B)>0, so definiert man P(A|B)= \frac{P(A \cap B )}{P(B)}

Dabei bezeichnet  P(A \cap B) die Wahrscheinlichkeit des gemeinsamen Auftretens von A und B

Formeln und Definitionen

Formt man die Definition der bedingten Wahrscheinlichkeit um, so erhält man die Pfadregel (Multiplikationssatz):

P(A \cap B) = P(A|B)P(B)

Diese lässt sich sich verallgemeinern, so gilt P(A_1 \cap A_2 \cap ... \cap A_n) =P(A_1)P(A_2|A_1)P(A_3|A_1 \cap A_2)...P(A_n|A_1 \cap A_2 \cap ... \cap A_{n-1})
Diese Formel wird durch Rechnungen mit Wahrscheinlichkeits-/Entscheidungsbäumen bereits ohne Kenntnis dieser Formel früh erlernt.

A und B heißen stochastisch Unabhängig, falls gilt P(A \cap B)=P(A)P(B), anschaulich also, wenn sich die Wahrscheinlichkeit des Eintretens von A nicht ändert, wenn man bereits weiß, ob B eingetreten ist, formal P(A|B) = P(A) und umgekehrt.

Sind zu einem Ereignis A nur die bedingten Wahrscheinlichkeiten und die Wahrscheinlichkeiten der bedingenden Ereignisse bekannt, so hilft das Gesetz der totalen Wahrscheinlichkeit
P(A)=P(A|B_1)P(B_1)+...+P(A|B_n)P(B_n) für P(B_i)>0 \forall i\in \left\{ {1,..,n} \right\} und P(B_1 \cup ... \cup B_n)=1
Auch dies ist mithilfe des Wahrscheinlichkeitsbaums aber auch mit Kreuztabellen anschaulich zu vermitteln.

Direkt aus der Definition der bedingten Wahrscheinlichkeit folgt mittels Umformung auch das Bayestheorem, welches P(A|B) und P(B|A) in Beziehung setzt.
Es gilt P(A|B) = \frac{P(B|A)P(A)}{P(B)}
Diese formale Herangehensweise eignet sich gut, um zu rechnen. Allerdings ist eine anschaulichere Herangehensweise zum Verständnis angebracht.

Kreuztabellen

Alternativ zur obigen formalen Herangehensweise bietet sich die Berechnung mittels Kreuztabellen an. Diese verzichten auf Formalisierung und ermöglichen es, das Ergebnis abzulesen.

Die Idee der Kreuztabelle lässt sich anhand der Vierfeldertafen erkennen, welche besonders zur Einführung geeignet ist.

A_1 A_2 Gesamt
B_1 P(A_1 \cap B_1) P(A_2 \cap B_1) P(B_1)
B_2 P(A_1 \cap B_2) P(A_2 \cap B_2) P(B_2)
Gesamt P(A_1) P(A_2) 1

Aufgrund des Gesetzes der totalen Wahrscheinlichkeit, lässt sich die letzte Zelle einer Spalte bzw Zeile als Summe der restlichen Zellen darstellen

Alternativ zur Wahrscheinlichkeit, kann auch eine Zufallsgröße in die Tabelle eingetragen werden, wie folgendes Beispiel zeigt:

Produkt A Produkt B Gesamt
Frauen 660 340 1000
Maenner 340 660 1000
Gesamt 1000 1000 2000

Umsetzung

Aufgaben: Test auf eine Krankheit

Stift.gif   Aufgabe

Nutze ein Tabellenkalkulationsprogramm und erstelle eine Kreuztabelle mit folgenden Werten: P(Test positiv | gesund)=10% , P(Test positiv | krank) = 98% , P(krank) = 0,01%
Nutze zur besseren Veranschaulichung als Gesamtzahl 1 Mio Einwohner.
Mögliche Fragen: Wie hoch ist P(krank | Test positiv)?
Ist P(gesund | Test negativ) wohl besser?

Information icon.svg Lösung

Diese Aufgabe lässt sich mit der Pfadregel und dem Gesetz der totalen Wahrscheinlichkeit lösen. Zur Veranschaulichung hilft eventuell ein Wahrscheinlichkeitsbaum.
Die Lösungen auf die Fragen lauten dann P(krank|Testpositiv)=0,1% und P(gesund|Testnegativ)=99,9%

Krank Gesund Gesamt
Test positiv 98 99990 100088
Test negativ 2 899910 899912
Gesamt 100 999900 1000000
Stift.gif   Aufgabe

Ergänze die Tabelle um Zellen zur Eingabe von P(krank) , P(Testpositiv|gesund) und P(Testpositiv|gesund).
Wie verändern sich die Werte aus der vorherigen Aufgabe? Überlegen!

Information icon.svg Lösung

Die Aufgabe orientiert sich an der Vorigen. Sie zwingt dazu, die Abhängigkeiten als Formeln auszudrücken und veranschaulicht die Abhängigkeiten von den Parametern.
Dies sind die Formeln der einzelnen Tabellenzellen: Kreuztabelle.JPG


Aufgaben: Analyse einer unbekannten Urne

In einer Urne befinden sich insgesamt 4 Kugeln. Davon sind entweder 2 Grüne und 2 Weiße (2K-Urne) oder 1 Grüne und 3 Weiße (1K-Urne)

Stift.gif   Aufgabe

Es soll "geraten" werden, ob eine vorliegende Urne eine oder zwei grüne Kugeln enthält. Da keine weiteren Informationen vorliegen, gilt ersteinmal P(1K)=P(2K)=0,5. Erstelle eine Kreuztabelle mit den Ereignissen 1K,2K und Grün,Weiß. Wie groß ist die Wahrscheinlichkeit, ohne Kenntnis der Urne, eine grüne beziehnungsweise eine weiße Kugel zu ziehen?

Information icon.svg Lösung

Diese Aufgabe lässt sich nach den vorherigen Aufgaben ganz analog lösen. Die Antworten lassen sich dann aus der Tabelle ablesen:
P(Gruen)=\frac{3}{8} ; P(Weiss)=\frac{5}{8}


Grün Weiß Gesamt
1K 1/8 3/8 1/2
2K 1/4 1/4 1/2
Gesamt 3/8 5/8 1


Stift.gif   Aufgabe

Wie hoch sind die Wahrscheinlichkeiten für 1K und 2K, wenn im ersten Zug eine weiße Kugel gezogen wurde? Also P(1K|weiss) und  P(2K|weiss)? Verwende hierzu die Pfadregel mit den bereits bekannten Wahrscheinlichkeiten, darunter auch der Lösung der vorherigen Aufgabe. Zur Veranschaulichung kann ein Wahrscheinlichkeitsbaum genutzt werden.

Information icon.svg Lösung


Stift.gif   Aufgabe

Führe das Experiment selbst mehrmals durch und Stelle den Verlauf von P(1K | bisherige Zuege) und P(2K|bisherige Zuege) in einer Tabelle sowie graphisch dar.

Information icon.svg Lösung



Notwendige Voraussetzungen

  • Grundlegendes Verständnis der Wahrscheinlichkeitsrechnung
  • Pfadregel – Anschauliche Vorstellung am Wahrscheinlichkeitsbaum
  • Gleichzeitiges Eintreten von Ereignissen
  • Totale Wahrscheinlichkeit
  • Einführung in bedinge Wahrscheinlichkeiten
  • Umgang mit Tabellenkalulationsprogrammen

Kompetenzen

  • Entwickeln von Formeln in der Tabellenkalkulation
  • Strukturierung von Daten aus Sachzusammenhängen
  • Idee der Wahrscheinlichkeit wird weiterentwickelt

Rolle des Rechners

  • Zwingt zur Strukturierung der Daten
  • Formalisierung bei Einrichtung der Tabelle wird entwickelt
  • Einfluss einzelner Parameter durch Veränderungen schnell sichtbar
  • Berechnung wird automatisiert -> Häufigere Durchführung schnell möglich

Kommentar

Bedingte Wahrscheinlichkeiten werden intuitiv häufig falsch interpretiert. So ist bereits der Unterschied zwischen P(A|B) und P(B|A) oft nicht klar – das Verständnis ist allerdings entscheidend! Den Unterschied sowie die gravierende Missinterpretation zeigt das häufig gewählte Beispiel des Tests auf eine Krankheit. P(Test positiv | krank) = 98% ; P(Test positiv | gesund) = 1% ; P(Krank) = 0,01%.
Intuitiv würde man diesen Test als sehr zuverlässig empfinden und bei einem positiven Test davon ausgehen, dass man höchstwahrscheinlich erkrankt ist. Berechnet man jedoch P(krank | Test positiv), kommt man nur auf einen Wert von \approx 1%

Die intuitive Interpretation ist hier also meist sehr unzuverlässig – ein Verständnis des Unterschiedes zwischen P(A|B) und P(B|A) und der Zusammenhang über das Bayestheorem sind daher sehr wichtig!

Literatur

Pallack, Andreas und Langlotz, Hubert (2012) Wann muss man um die Ecke denken? Preprint. Erscheint im Cornelsen Verlag: Daten und Zufall im Mathematikunterricht - mit neuen Medien verständlich erklärt. Pallack, Andreas und Schmidt, Ursula (Hrsg.)