Signifikanztest für binomialverteilte Zufallsgrößen/Aufbau und Durchführung eines Signifikanztests: Unterschied zwischen den Versionen

Aus ZUM-Unterrichten
KKeine Bearbeitungszusammenfassung
Markierung: 2017-Quelltext-Bearbeitung
KKeine Bearbeitungszusammenfassung
Markierung: 2017-Quelltext-Bearbeitung
Zeile 31: Zeile 31:
<div class="lueckentext-quiz">
<div class="lueckentext-quiz">
4. Schritt: Entscheidungsregel angeben <br>
4. Schritt: Entscheidungsregel angeben <br>
In diesem Schritt wird der Verwerfungsbereich für die Zufallsvariable X angegeben. Der Verwerfungsbereich ist der Bereich, der in deiner Skizze markiert ist. Es ist also der Bereich, in dem man aussagen kann, dass mit einer großen statistischen Sicherheit <math>p_0</math> gesunken bzw. gestiegen ist und die Nullhypothese verworfen wird. Der Verwerfungsbereich wird durch den kritischer Wert k festgelegt, bis zu diesem Wert  k (linksseitiger Test) beziehungsweise ab diesem Wert k (rechtsseitiger Test) wird die Nullhypothese <math>H_0</math> verworfen. <br>
In diesem Schritt wird der Verwerfungsbereich für die Zufallsvariable X angegeben. Der Verwerfungsbereich ist der Bereich, der in deiner Skizze markiert ist. Es ist also der Bereich, in dem man aussagen kann, dass mit einer großen statistischen Sicherheit <math>p_0</math> gesunken bzw. gestiegen ist. In diesem Bereich wird also die Nullhypothese <math>H_0</math> verworfen. Der Verwerfungsbereich wird durch den kritischer Wert k festgelegt, bis zu diesem Wert  k (linksseitiger Test) beziehungsweise ab diesem Wert k (rechtsseitiger Test) wird die Nullhypothese <math>H_0</math> verworfen. <br>


Hinweis zur Ermittlung des kritischen Wertes k:  
Hinweis zur Ermittlung des kritischen Wertes k:  

Version vom 9. März 2020, 12:56 Uhr


Die Grundidee vom Signifikanztest hast du bereits verstanden. Auf dieser Seite lernst du nun den Aufbau und die Begrifflichkeiten eines Signifikanztests kennen.

Ein Signifikanztest besteht aus vier Schritten.

Vorüberlegung und Schritte .png

Im Folgenden werden die einzelnen Schritte ausführlich beschrieben. Lies dir die Beschreibungen aufmerksam durch, im Anschluss gibt es zwei Übungen, in denen du eigenständig einen Signifikanztest durchführst.

Vorüberlegung:
Skizziere die Binomialverteilung für die Stichprobe mit der bisher geltenden Wahrscheinlichkeit . Kläre die Frage, ob durch bestimmte Einflüsse vermutet wird, dass die bisherige Wahrscheinlichkeit gesunken bzw. gestiegen ist. Falls die Vermutung vorliegt, dass die Wahrscheinlichkeit gesunken ist, liegt ein linksseitiger Test vor, so markiere den linken Rand der Binomialverteilung. Liegt der Verdacht vor, dass die Wahrscheinlichkeit gestiegen ist, so handelt es sich um einen rechtsseitigen Test und es ist der rechte Rand der Verteilung zu markieren.

1. Schritt: Wahl der Nullhypothese  und der Gegenhypothese
Die Nullhypothese beschreibt die Wahrscheinlichkeit , die bisher für die Grundgesamtheit galt: . Durch bestimmte Einflüsse wird vermutet, dass gesunken bzw. gestiegen ist. Diese Vermutung wird durch die Gegenhypothese ausgedrückt. lautet also entweder oder . Das Ziel des Signifikanztests ist es, die Nullhypothese zu verwerfen. Kann die Nullhypothese verworfen werden, so ist mit einer großen statistischen Sicherheit gezeigt, dass die Gegenhypothese gilt.

2. Schritt: Festlegen des Stichprobenumfangs n und des Signifikanzniveaus
Der Stichprobenumfang n und das Signifikanzniveau sind meistens in der Aufgabenstellung angegeben. Diese Größen musst du also einfach nur aus dem Aufgabentext herausschreiben. Das Signifikanzniveau legt die Irrtumswahrscheinlichkeit fest, eine Nullhypothese fälschlicherweise zu verwerfen. Die Höhe des Signifikanzniveaus legt der Auftragsgeber vor der Durchführung des Tests fest. Ein üblicher Wert ist Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \alpha=5%} . Manchmal wird aber auch ein strenges Niveau von Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \alpha=1%} gewählt.

3. Schritt: Definition der Zufallsvariable X und angeben der Verteilung wenn  stimmt
Die Zufallsvariable X der zugrundeliegenden Verteilung (also bei uns immer die Binomialverteilung) muss definiert werden. Zudem muss noch die konkrete Verteilung angegeben werden (die Verteilung deiner Skizze), also die Verteilung der Nullhypothese .

4. Schritt: Entscheidungsregel angeben
In diesem Schritt wird der Verwerfungsbereich für die Zufallsvariable X angegeben. Der Verwerfungsbereich ist der Bereich, der in deiner Skizze markiert ist. Es ist also der Bereich, in dem man aussagen kann, dass mit einer großen statistischen Sicherheit gesunken bzw. gestiegen ist. In diesem Bereich wird also die Nullhypothese verworfen. Der Verwerfungsbereich wird durch den kritischer Wert k festgelegt, bis zu diesem Wert k (linksseitiger Test) beziehungsweise ab diesem Wert k (rechtsseitiger Test) wird die Nullhypothese verworfen.

Hinweis zur Ermittlung des kritischen Wertes k:

Linksseitiger Test:

Zur Bestimmung des kritischen Wertes k erstellt man eine Tabelle mit den kumulierten Wahrscheinlichkeiten der Binomialverteilung. Der kritische k-Wert ist der Wert, bei dem die kumulierte Wahrscheinlichkeit gerade noch kleiner als das Signifikanzniveau ist. Bis zu diesem Wert wird die Nullhypothese verworfen.

Rechtsseitiger Test:
Mindestwahrscheinlichkeiten werden über die Gegenwahrscheinlichkeit berechnet. Es folgt . Durch Umformen der Gleichung erhält man Durch Erstellen einer Tabelle mit den kumulierten Wahrscheinlichkeiten für die Binomialverteilung kann der k-Wert abgelesen werden, bei dem die kumulierte Wahrscheinlichkeit zum ersten Mal über 1- liegt. Dies ist der kritische Wert k-1. Diesen Wert rechnet man dann noch plus 1 und erhält somit den kritischen Wert. Ab diesem kritischen Wert wird die Nullhypothese verworfen.

Liegt das Stichprobenergebnis im Verwerfungsbereich, so kann die Nullhypothese zugunsten der Gegenhypothese verworfen werden. Die maximale Irrtumswahrscheinlichkeit für diese Schlussfolgerung ist kleiner als das Signifikanzniveau . Liegt das Stichprobenergebnis nicht im Verwerfungsbereich kann die Nullhypothese nicht zugunsten von verworfen werden. Es ist keine statistische Aussage zur wahren Verteilung möglich.

Versuche jetzt im Folgenden, eigenständig einen Signifikanztest durchzuführen! Hast du Probleme bei einzelnen Schritten, so lies dir die Informationen oben nochmal genau durch!

Übung 1

Eine Partei sieht den Klimawandel nicht als Bedrohung an. Diese Partei hat ihre Argumente gegen die Bedrohung des Klimawandels im Jahr 2019 in vielen Debatten ausführlich erläutert. Die Partei interessiert sich, ob daher der Anteil der Menschen, die den Klimawandel als Bedrohung ansehen im Vergleich zu 2019, wo der Wert bei 71% lag, gesunken ist. Sie beschließt in einer Umfrage zufällig 1000 Menschen zu befragen und das Ergebnis anschließend mit einem Signifikanztest zu beurteilen. Das Signifikanzniveau legen sie auf 5% fest. Führe einen passenden Signifikanztest durch.

Kohlekraft.jpg



Vorüberlegung: Skizze zeichnen

Skizziere die Binomialverteilung für den Fall, dass immer noch 71% der Menschen in Deutschland sich durch den Klimawandel bedroht fühlen.
Markiere in der Skizze den Bereich, in dem die Partei mit einer großen statistischen Sicherheit zeigen kann, dass der Anteil gesunken ist.
Um welche Art von Test handelt es sich?

NeuDrei.png

Die Partei hat die Vermutung, dass die bisherige Wahrscheinlichkeit gesunken ist, daher liegt ein linksseitiger Test vor.

1. Schritt: Wahl der Nullhypothese und der Gegenhypothese

Vermutet die Partei, dass gestiegen oder gesunken ist? Wähle dies als Gegenhypothese .
und

2. Schritt: Festlegen des Stichprobenumfangs n und des Signifikanzniveaus

n=1000 und Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \alpha=5%}

3. Schritt: Definition der Zufallsvaraible X und angeben der Verteilung wenn stimmt

X ist die Anzahl der 1000 Befragten, die den Klimawandel als Bedrohung ansehen.

X ist -verteilt


4. Schritt: Entscheidungsregel angeben

Suche den kritischen Wert, für den die kumulierte Wahrscheinlichkeit gerade noch kleiner gleich 5% ist. Erstelle dafür eine Tabelle mit den kumulierten Wahrscheinlichkeiten in deinem Taschenrechner.(Hinweis: Bei den meisten Taschenrechnern gibst du dafür die Funktion binomcdf(1000, 0.71, X) ein.)

Linksseitiger TEST.png
Durch Ablesen der Tabelle erhalten wir den kritischen Wert 685. Bis zu diesem Wert wird die Nullhypothese abgelehnt. Es ergibt sich folgender Verwerfungsbereich:{0, ...685}

In der Umfrage kommt raus, dass sich 750 Menschen von den 1000 Befragten durch den Klimawandel bedroht fühlen. Was kann die Partei mit diesem Ergebnis aussagen?

Da das Ergebnis nicht im Verwerfungsbereich liegt, kann keine Aussage getroffen werden, da auch andere Verteilungen mit anderen Wahrscheinlichkeiten zu Grunde liegen könnten.


Übung 2

Eine Umweltgruppe will raus finden, ob durch die hohe Öffentlichkeit des Klimawandel-Themas 2019 - unter anderem auch ausgelöst durch die Fridays For Future Demos - der Anteil der Menschen in Deutschland, die den Klimawandel als Bedrohung ansehen im Vergleich zu 2019, wo der Wert bei 71% lag, gestiegen ist. Sie beschließt, in einer Umfrage zufällig 1000 Menschen zu befragen und das Ergebnis anschließend mit einem Signifikanztest zu beurteilen. Das Signifikanzniveau legen sie auf 5% fest. Führe einen passenden Signifikanztest durch.

Vorüberlegung : Skizze zeichnen

Skizziere die Binomialverteilung für den Fall, dass immer noch 71% der Menschen in Deutschland sich durch den Klimawandel bedroht fühlen. Markiere in der Skizze den Bereich, in dem die Umweltgruppe mit einer großen statistischen Sicherheit zeigen kann, dass der Anteil gestiegen ist.
Um welche Art von Test handelt es sich?

NeuVier.png

Da der Verwerfungsbereich im rechten Rand der Binomialverteilung liegt, handelt es sich um einen rechtsseitigen Test.

1. Schritt: Wahl der Nullhypothese und der Gegenhypothese

Vermutet die Umweltgruppe, dass gestiegen oder gesunken ist? Wähle dies als Gegenhypothese .
und

2. Schritt: Festlegen des Stichprobenumfangs n und des Signifikanzniveaus

n=10000 und Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \alpha=5%}

3. Schritt: Definition der Zufallsvariable X und angeben der Verteilung wenn stimmt

X ist die Anzahl der 1000 Befragten, die den Klimawandel als Bedrohung ansehen.

X ist -verteilt

4. Schritt: Entscheidungsregel angeben

Gesucht ist der Wert, bei dem die kumulierte Wahrscheinlichkeit für X mindestens dem kritische Wert sein soll, und diese Wahrscheinlichkeit soll kleiner gleich 5% sein.(Hinweis: Die Tabelle für die kumulierten Wahrscheinlichkeiten erstellst du mit den meisten Taschenrechnern über die Funktion binomcdf(1000, 0.71, X))
Erinnere dich daran, wie du Mindestwahrscheinlichkeiten berechnen kannst.

Unbenannt.png
Mindestwahrscheinlichkeiten werden über die Gegenwahrscheinlichkeit berechnet, es folgt . Durch Umformen der Gleichung erhält man . Man liest also den Wert ab, bei dem die kumulierte Wahrscheinlichkeit zum ersten mal größer gleich 0,95 ist. In diesem Fall 733. Da dies der kritische Wert minus 1 ist, rechnet man noch plus 1 und erhält somit den kritischen Wert, in dem Fall 734. Es ergibt sich folgender Verwerfungsbereich: {734,...1000}.

In der Umfrage kommt raus, dass 748 Menschen von den 1000 Befragten sich durch den Klimawandel bedroht fühlen. Wie können die Schüler*innen dieses Ergebnis interpretieren?

Da das Ergebnis im Verwerfungsbereich liegt, kann mit einer Irrtumswahrscheinlichkeit von 5% davon ausgegangen werden, dass der Anteil der Menschen, die den Klimawandel als Bedrohung ansehen im Vergleich zu 2019 gestiegen ist.

Zweiseitiger Signifikanztest:
Neben dem links- und rechtsseitigen Test gibt es auch noch den zweiseitigen Test. Bei dieser Art des Tests will der Auftragsgeber zeigen, dass eine Aussage falsch ist. Der Auftragsgeber weiß allerdings noch nicht, ob der tatsächliche Wert nach links oder rechts abweicht. Die Durchführung des Tests erfolgt sehr ähnlich zum links- und rechtsseitigen Test, aber mit folgenden Unterschieden:
1.) Die Gegenhypothese ist die Gegenaussage zur Nullhypothese .
2.) Das Signifikanzniveau wird halbiert und auf beide Ränder der Binomialverteilung aufgeteilt. Der Verwerfungsbereich besteht somit aus der Vereinigung von zwei Intervallen.


Führe in der nächsten Übung einen zweiseitigen Signifikanztest durch.

Übung 3

2019 wurde veröffentlicht, dass sich 71% der Menschen in Deutschland durch den Klimawandel bedroht fühlen. Journalisten einer Zeitung hinterfragen diesen Wert. Sie wollen also diesen Wert mit einem zweiseitigen Signifikanztest überprüfen. Ihnen geht es hierbei nur um den Wahrheitsgehalt, aber nicht ob der Wert größer oder kleiner ist. Sie beschließen zufällig 1000 Menschen zu befragen. Das Signifikanzniveau legen sie auf 10% fest. Führe den zweiseitigen Signifikanztest durch.

Vorüberlegung : Skizze zeichnen

Skizziere die Binomialverteilung für den Fall, dass immer noch 71% der Menschen in Deutschland sich durch den Klimawandel bedroht fühlen. Markiere in der Skizze den Bereich rot, in dem die Journalisten mit einer großen statistischen Sicherheit zeigen können, dass der Anteil gestiegen bzw. gesunken ist.
Um welche Art von Test handelt es sich?

Zweiseitigertest.png

Da der Verwerfungsbereich an beiden Rändern der Binomialverteilung liegt, handelt es sich um einen zweiseitigen Test.

1. Schritt: Wahl der Nullhypothese und der Gegenhypothese

Lies dir die Informationen zu dem zweiseitigen Test nochmal durch.
und

2. Schritt: Festlegen des Stichprobenumfangs n und des Signifikanzniveaus

n=1000 und Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \alpha=10%}

3. Schritt: Definition der Zufallsvariable X und angeben der Verteilung wenn stimmt

X ist die Anzahl der 1000 Befragten, die den Klimawandel als Bedrohung ansehen.

X ist -verteilt

4. Schritt: Entscheidungsregel angeben

Berechne zwei kritische Werte analog zum links- und rechtsseitigen Test. Teile dafür das festgelegte Signifikanzniveau auf beide Ränder auf.

1.) Aus Ablesen in der Tabelle erhält man den kritischen Wert 685.
2.) Aus Ablesen in der Tabelle erhält man den kritischen Wert 734.

Somit ergibt sich folgender Verwerfungsbereich: Verwerfungsbereich: {0,..685}{734, ..., 1000}.

In der Umfrage kommt raus, dass sich 745 Menschen von den 1000 Befragten durch den Klimawandel bedroht fühlen. Wie können die Journalisten dieses Ergebnis interpretieren?

Da das Ergebnis im Verwerfungsbereich liegt, kann mit einer großen statistischen Sicherheit gesagt werden, dass der Anteil, der Menschen, die den Klimawandel als Bedrohung sehen, im Vergleich zu 2019 gestiegen ist.