Hypothesentests

aus ZUM-Wiki, dem Wiki für Lehr- und Lerninhalte auf ZUM.de
Wechseln zu: Navigation, Suche

In der Oberstufe werden ab der 12. oder 13. Klasse im Rahmen der Stochastik Hypothesentests eingeführt. Das Thema verlangt dabei viele mathematische Vokabeln und ist für die Schülerinnen und Schüler erfahrungsgemäß eher schwierig. Im Folgenden soll daher ein Weg dargeboten werden, wie man dieses anspruchsvolle Thema mit dem TI-Nspire CAS einführen kann.

Inhaltsverzeichnis

Fachlicher Hintergrund

Beschreibung: Der Hypothesentest ist ein Entscheidungsverfahren, bei dem festgestellt wird, ob eine Hypothese H0 (Nullhypothese) angenommen oder verworfen wird . In diesem Rahmen gibt es einen einseitigen (eine Grenze für den Annahmebereich) und einen zweiseitigen Hypothesentest (zwei Grenzen - nach unten und oben - für den Annahmebereich). Wir werden uns im Folgenden mit zweiseitigen Hypothesentests befassen.


Das Testen von Hypothesen ist immer ein Vorgang, den man in mehrere Schritte unterteilen kann:

  • Formulierung der Nullhypothese H0 und der Alternativhypothese H1
  • Festlegung des Signifikanzniveaus
  • Bestimmung des Annahme- und Ablehnungsbereichs der Nullhypothese
  • Ziehung der Stichprobe
  • Aussage über Annahme oder Ablehnung der Nullhypothese

Notwendige Voraussetzungen

  • Binomialverteilungen sollten bekannt sein.
  • Die Idee der Wahrscheinlichkeit sollte bekannt sein.

Aufgaben

Hinweis:Wahrscheinlichkeitsverteilungen lassen sich eindeutig durch die Angabe ihrer Verteilungsfunktion F(x):=P(X \le x) beschreiben. Quantile entsprechen dann quasi einer Umkehrung dieser Verteilungsfunktionen: x ist (für unsere Zwecke) ein p-Quantil, wenn gilt x_p=inf {x : P(X \le x) \ge p}.

Ist die Verteilungsfunktion umkehrbar, so gilt x_p=F^-1(p). Bekannt ist wahrscheinlich das 0,5-Quantil einer Verteilung, der so genannte Median. Häufig verwendet werden auch die linken und rechten Quartile, das 0,25- bzw. das 0,75-Quantil, z.B. bei Boxplots. Im TI-Nspire ist die Binomialverteilung[1] mit binomcdf(n,p,x) implementiert.

Stift.gif   Aufgabe 1

(Zur Erschließung des Intervalschätzerbegriffs)

Eine Standardaufgabe lautet: „Es sei bekannt, dass männliche deutsche Studenten in Bielefeld mit 68,5% Mittwochs feiern gehn. Eine Stichprobe vom Umfang 720 wird durchgeführt. Wie viele Studenten waren am Mittwoch feiern? (Hinweis: Hier wird ein Schluss von der Gesamtheit auf die Stichprobe durchgeführt).

Stift.gif   Aufgabe 2

(Schluss von der Stichprobe auf die Gesamtheit).

Bei einer Umfrage unter 836 Studenten gaben 423 an, Studiengebühren zu boykotieren. Der ASTA der Uni Bielefeld möcht nun wissen, ob er mit der Mehrheit aller Studenten rechnen könne oder ob er seinen Werbeaufwand noch verstärken sollte.

Stift.gif   Aufgabe 3

(zweiseitiger Hypothesentest)

Bei einem Prof beträgt die Durchfallwahrscheinlichkeit p=0,3. Diese Angabe soll durch 170 Studenten überprüft werden. Gesucht ist der Fehler 1. und 2. Art

Information icon.svg Lösung 1

Zuerst legen wir eine Sicherheitswahrscheinlichkeit (zumeist 95%) fest. Jetzt müssen wir einfach nur noch die Quantile der zugehörigen Verteilungsfunktion bestimmen. Es sollen die 5% unwahrscheinlichsten Anzahlen ausgeschlossen werden, bei denen die Stichprobe signifikant zu wenig oder zuviele Studenten die feiern waren enthält. Also bestimmt man wie oben beschrieben das 0,025- und das 0,975-Quantil der Binomialverteilung mit den Parametern n=720 und p=0,685. Der TI-Nspire liefert x_0,025\approx 469 und x_0,975\approx 517.


Information icon.svg Lösung 2

Dieses Mal ist der Parameter p unbekannt. Geschätzt werden soll die zugrundeliegende Wahrscheinlichkeit. Hier hilft uns, dass die Funktion binomcdf() fest implementiert ist. Erneut legt man die Sicherheitswahrscheinlichkeit z.B. zu 0,95 fest. Man sucht dann die Wahrscheinlichkeit p_0.025, so dass der Anteil \frac{836}{423} gerade noch im entsprechenden Intervallschätzer der Binomialverteilung mit den Parametern n=836 und p=p_0,025 liegt.

Als Schnittstelle ergibt sich p_0,025\approx 0,540. Analog erhält man p_0.975\approx 0,473. Die zu Grunde liegende Wahrscheinlichkeit wird also mit großer Wahrscheinlichkeit im Intervall [0,473; 0,540] liegen.

Der ASTA kann sich der absoluten Mehrheit damit noch nicht hinreichend sicher sein.


Information icon.svg Lösung 3

Die mathematische Behandlung zweiseitiger Hypothesentests mit einer Hypothese H: p=p_0 und einer Alternative K: p\neqp_0 lässt sich sehr leicht auf die obige Diskussion von Intervallschätzern zurückführen. Man geht von der Richtigkeit der Hypothese aus und bestimmt einen Annahmebereich A so, dass P_p0(X\epsilon A)\ge 1-\alpha gilt (Beschränkung des Fehlers 1. Art), wobei \alpha das Niveau des Tests ist. Man bestimmt also den Intervallschätzer wie oben mit dem \frac{2}{\alpha}-Quantil und dem (1-\frac{\alpha}{2})-Quantil für den Annahmebereich.

Beim Fehler 1. Art ergibt sich ein Annahmebereich des Tests bei einem Testniveau \alpha = 0,05 aus dem 0,025-Quantil x_[0,025] und dem 0,975-Quantil x_[0,975] der Binomialverteilung mit den Parametern n=170 und p_0=0,3 zu A=[40;63]. Liegt also das Stichprobenergebnis nicht in A, sollte man die Hypothese verwerfen.

Den Fehler 2. Art kann man nun mit Hilfe des Rechners graphisch darstellen:

Mit der TRACE-Funktionkann man auf dem Graphen entlang fahren und erkennen, dass die Wahrscheinlichkeit für einen Fehler 2. Art erst dann kleiner ist als z.B. 10%, wenn die wahre Wahrscheinlichkeit kleiner ist als 0,193 oder größer ist als 0,422; anderenfalls ist die Wahrscheinlichkeit für einen Fehler 2. Art nicht unbeträchtlich.

Die Anzahl der Studenten die am Mittwoch feiern waren, liegt also mit 95%iger Wahrscheinlichkeit zwischen 469 und 517 liegen.


Rolle der Technologie TI-Nspire CAS

Der TI-Nspire hilft den SuS das Thema Hypothesentests einzuführen, indem sie Binomialverteilungen berechnen und logisch Intervalle abschätzen bzw. ablesen können. Der TI-Nspire bietet hiermit eine schulgerechte Einführung auch ohne Sigmawerte oder z-Tabellen.