Einführung in den Umgang mit Konfidenzintervallen

aus ZUM-Wiki, dem Wiki für Lehr- und Lerninhalte auf ZUM.de
Wechseln zu: Navigation, Suche

Inhaltsverzeichnis

Motivation

Um Daten aus einer großen Masse zu erheben, greifen Forscherinnen und Forscher oft auf Stichproben zurück. Nun ist die Wahrscheinlichkeit, dass die erhobenen Daten aus eben dieser Stichprobe genau mit den tatsächlichen Daten der Grundgesamtheit übereinstimmen, eher gering. Das Konfidenzintervall gibt uns hierbei eine Bandbreite an, in der sich der tatsächliche Wert in der Grundgesamtheit mit einer gewissen Wahrscheinlichkeit bewegt.

Das Intervall berechnet sich durch das Ergebnis der Stichprobe \pm r-fachen Standardfehlern und gilt jeweils für eine p%-ige Wahrscheinlichkeit. Der Faktor r wird dabei für jedes p \left( =100\alpha\right ) mit Hilfe der Normalverteilung berechnet. Hierbei wird davon ausgegangen, dass sich die Mittelwerte der Stichproben nach einem Verteilungsmodell, eben ähnlich der Normalverteilung, systematisch verhalten.

Zur Berechnung benutzen wir:

r= \Phi ^{-1} \left( \frac{1+\alpha}{2}\right),

wobei wir den Wert von \Phi ^{-1}aus der Tabelle der Kumulativen Normalverteilung ablesen können.

Interessieren wir uns beispielsweise für ein Intervall, in dem mit 95-prozentiger Wahrscheinlichkeit der wahre Wert der Grundgesamtheit liegt, wird der Standardfehler mit 1,96 multipliziert.

Theoretischer Hintergrund

Sei ein Stichprobenraum \Chi, ein Parameterbereich \theta und eine Familie P_\vartheta mit \vartheta \in \theta gegeben und sei g\left( \vartheta \right) zu schätzen. Ist C\left( x\right) mit x\in \Chi eine Familie von Teilmengen des Wertebereichs g\left( \theta \right) und gilt für ein gegebenes \alpha \gneq0:


P_\vartheta(\lbrace x\in\Chi:g(\vartheta)\in C(x)\rbrace)\geq 1-\alpha,


so heißt C\left( x\right) Konfidenzbereich für g(\vartheta) zum Konfidenzniveau 1-\alpha. Ist g\left( \theta\right) ein Intervall und C\left(x\right) ein Teilintervall, so heißt C\left(x\right) Konfidenzintervall.

Aufgaben

Welche Partei würden Sie wählen.jpg

x \widehat{=}Wähler von der gefragten Partei in der Stichprobe

n=402 \widehat{=}Umfang der Stichprobe

c=95% \widehat{=}Konfidenzniveau

\hat p =\frac{x}{402} \widehat{=}bekannter Wähleranteil von gefragter Partei in der Stichprobe

e \widehat{=}Fehlertoleranz/Schwankungsbreite

Stift.gif   Aufgabe 1

Berechnen Sie das Konfidenzintervall für Partei A mit Hilfe des TI-Nspire. Was sagen die angezeigten Parameter aus?

Stift.gif   Aufgabe 2

Stellen Sie die Fehlertoleranz und die untere und obere Intervallgrenze grafisch dar. Interpretieren Sie die Grafik. Wie lässt sich hier das Konfidenzintervall für Partei A ablesen? Versuchen Sie auch für die übrigen Parteien die Konfidenzintervalle abzulesen. Waren die Vorhersagen der Hochrechnungen richtig?

Information icon.svg Lösung 1
  • Im Calculator findet man den Punkt "Konfidenzintervalle". Hier wählt man das 1-Prop z-Intervall. Es öffnet sich folgendes Fenster:
  • Hier werden für x die Anzahl der Wähler der zu untersuchenden Partei und für n der Stichprobenumfang eingetragen. x muss dazu aus dem Wähleranteil und der Stichprobenzahl berechnet werden. Es gilt: \hat p = \frac{x}{n}
  • Ergebnisfenster


Information icon.svg Lösung 2
  • Um die Grafik zu erhalten, definiert man sich zunächst die gesuchten Funktionen im Calculator. Dazu wird die Schwankungsbreite e\left ( n, p\right )und der zugehörige Parameter r wie folgt definiert:
  • Nun definieren wir noch die beiden Funktionen der Intervallgrenzen. (Erinnerung: Intervall = Stichprobenergebnis \pm Schwankungsbreite
  • Nun öffnen wir ein neues Fenster, um die Funktionen zeichnen zu lassen. Dazu werden nacheinander die Funktionen e\left( n,p \right ), piu\left( n,p\right) und pio\left( n,p\right) eingegeben


Folgende Grafik sollte als Ergebnis angezeigt werden:


Bezug zum Lehrplan

Idee des Messens: Zunächst lässt sich das Thema der Konfidenzintervalle unter dem Aspekt des Messens in der Lehrplan einordnen. Hierbei ist das Messen von Datenmengen gemeint, deren Eigenschaften und Aussagen erfasst werden sollen. Konkret wird das Ziel verfolgt, dass Daten aus Stichproben erhoben werden und mit eventuellen Fehlern gerechnet werden muss. Durch das Umgehen mit Konfidenzintervallen wird eben diese Fehlerhaftigkeit und die Grenzen des Messens verdeutlicht.

Idee der Wahrscheinlichkeit: Ein weiterer Aspekt im Lehrplan stellt die Idee der Wahrscheinlichkeit dar. Durch Überlegungen, Stichproben und Schätzung sollen hier Wahrscheinlichkeiten allgemeinerer Aussagen angegeben werden.

Didaktischer Kommentar

Konfidenzintervalle eigenen sich in der Schule besonders dazu den SuS eine Vorstellung von Hochrechnungen zu verschaffen. Dabei lernen sie aus Stichprobendaten auf tatsächliche Daten der Gesamtheit oder einer größeren Teilmenge zu schließen. Anwendungsbezogen eignen sich hier beispielsweise Wahlprognosen. Es lassen sich aber auch noch weitere sinnvolle Alltagsbezüge herstellen, für die eine Berechnung von Konfidenzintervallen interessant sind. Im Gesamtkontext der Stochastik gibt die Thematik den SuS einen sinnvollen Umgang mit Wahrscheinlichkeiten. Sie lernen mit Fehlertermen umzugehen und die erhobenen Daten zu interpretieren.

Um ein möglichst kleines Konfidenzintervall zu erhalten, benötigt man eine möglichst große Datenmenge der Stichprobe. Hierfür ist der Einsatz eines Computerprogrammes von großem Nutzen, wenn nicht sogar unumgänglich. Auch für weitere Berechnungen ist hier der Computereinsatz durchaus sinnvoll.

Literatur

  • Krengel, Ulrich: Einführung in die Wahrscheinlichkeitstheorie und Statistik, Vieweg und Teubner Verlag, 2005
  • Wolpers, Hans: Mathematikunterricht in der Sekundarstufe II. Bd. 3: Didaktik der Stochastik, Vieweg+Teubner Verlag, 2002