Daten erheben und auswerten

aus ZUM-Wiki, dem Wiki für Lehr- und Lerninhalte auf ZUM.de
Wechseln zu: Navigation, Suche

Im Folgenden ist eine Einheit zu finden, welche sich mit der Einführung der beschreibenden Statistik beschäftigt.

Inhaltsverzeichnis

Lehrplan

Der Lehrplan für das Gymnasium sieht die Thematik folgendermaßen vor: Die Schülerinnen und Schüler sollen...

  • endliche Dezimalzahlen an der Zahlengerade darstellen, adäquat runden und die Grundrechenarten ausführen
  • einfache Bruchteile auf verschiedene Weise darstellen und diese als Verhältnisse deuten
  • das Grundprinzip des Kürzens und Erweiterns von Brüchen nutzen
  • bestimmen Teiler und Vielfache natürlicher Zahlen finden
  • Teilbarkeitsregeln für 2, 3, 5 und 10 anwenden
  • Dezimalzahlen und Prozentzahlen als andere Darstellungsform der Brüche deuten
  • Umwandlungen zwischen Dezimal-, Bruch- und Prozentzahlen durchführen
  • Daten erheben und diese in Ur- und Strichlisten zusammenfassen
  • relative Häufigkeiten, arithmetisches Mittel und Median bestimmen
  • Häufigkeitstabellen aufstellen und diese mithilfe von Säulen- und Kreisdiagrammen veranschaulichen
  • statistische Darstellungenlesen und interpretieren

Eine Klassenbefragung durchführen und auswerten

In dieser Einheit ist es vorgesehen, dass SuS eine Klassenbefragung durchführen und auch auswerten können. Hierbei sollen die Daten in Form von Kreis- und Säulendiagrammen dargestellt und die relativen Häufigkeiten, das arithmetische Mittel und der Median bestimmt werden.

Absolute und relative Häufigkeit

Die Urliste ist im Bereich der Statistik das direkte Ergebnis einer Datenerhebung, also die ursprüngliche Aufzeichnung der Beobachtungs- oder Messwerte. Die absolute Häufigkeit ist das Ergebnis einer einfachen Zählung von Objekten oder Ereignissen (besser Elementarereignissen). Sie gibt an, wie viele Elemente mit dem gleichen interessierenden Merkmal gezählt wurden. Die relative Häufigkeit gibt...

  • den Anteil der Objekte mit dem gleichen interessierenden Merkmal an einer Grundgesamtheit an
  • den Anteil der Versuche eines Zufallsexperiments, bei dem ein bestimmtes Ereignis eingetreten ist, an.

Arithmetisches Mittel

Das arithmetische Mittel (auch Durchschnitt) ist ein Mittelwert, der als Quotient aus der Summe aller beobachteten Werte und der Anzahl der Werte definiert ist:

 \bar{x}_{\mathrm{arithm}} = \frac{1}{n} \sum_{i=1}^n{x_i} = \frac{x_1 + x_2 + \cdots + x_n}{n}

Median

Median (oder Zentralwert) bezeichnet eine Grenze zwischen zwei Hälften. In der Statistik halbiert der Median eine sortierte Verteilung. Gegenüber dem arithmetischen Mittel hat der Median den Vorteil, robust gegenüber Ausreißern (extrem abweichenden Werten) zu sein.

Der Median \tilde x einer geordneten Stichprobe (x_1, x_2, \dots, x_n) von n Messwerten ist dann also

\tilde x =\begin{cases}
  x_\frac{n+1}{2}                                    & n\text{ ungerade}\\
  \frac 12\left(x_{\frac n2} + x_{\frac n2+1}\right) & n \text{ gerade.}
\end{cases}

Säulendiagramm

Das Säulendiagramm ist einer der am häufigsten verwendeten Diagrammtypen. Es veranschaulicht durch auf der x-Achse senkrechtstehende Rechtecke die Ausprägung von Messwerten.

Kreisdiagramm

Ein Kreisdiagramm ist eine Darstellungsform für Teilwerte eines Ganzen als Teile eines Kreises. Das Kreisdiagramm ist kreisförmig und in mehrere Kreissektoren eingeteilt, wobei jeder Kreissektor einen Teilwert und der Kreis somit die Summe der Teilwerte (das Ganze) darstellt. Kreisdiagramme eignen sich besonders für die Darstellung von Verteilungen und Anteilen. \mathrm{Winkel} =\frac{360^\circ \cdot \mathrm{Teilwert}}{\mathrm{Gesamtwert}}

Vorgehensweise bei einer statistischen Erhebung

  • Planung: Zuerst wählt man eine möglichst interessante und lebensnahe Frage aus. Danach erarbeitet man, wie und was man zur Beantwortung dieser Frage sinnvoll zählen kann und vereinbart die Formalitäten der Datenerhebung. Dies sind nicht nur Vereinbarungen, was gezählt werden soll, sondern auch auch zum Erhebungsverfahren, also zum Beispiel: wie viele Gruppen sollen zählen; wie lange und wo soll gezählt werden; wie viele und welche Personen will man befragen usw.
  • Datenerfassung: Man führt die Befragung durch und legt dabei eine Urliste an, um die Anzahl festzustellen.
  • Datenaufbereitung und Datenauswertung: Die erhobenen Daten werden in Tabellen zusammengefasst und in Diagrammen dargestellt. Es können Anteile berechnet werden. Es wird eine Antwort auf die eingangs gestellte Frage gegeben.
  • Ergebisse und mögliche Folgerungen: Die Daten können weitergereicht werden, um evtl. erkannte Probleme zu beheben.

Häufigkeitstabellen und Histogramme

Häufigkeitstabellen

In einer Häufigkeitstabelle können sowohl relative als auch absolute Häufigkeiten eines Merkmals zusammengefasst werden. Das genaue Aussehen und die Komplexität dieser Tabellen richtet sich dabei nach der Fragestellung. In der fünften Klasse, für welche die Grundüberlegungen dieses Artikels gelten, wird allerdings nur die relative Häufigkeit behandelt.

Eine einfache Häufigkeitstabelle mit absoluten Häufigkeiten entsteht bereits aus der Zusammenfassung (dem Auszählen) einer Urliste.

Beispiel: Stimmen bei der Klassensprecherwahl

Name Stimmen
Kai 7
Sophie 10
Hilde 9

Sowohl die relative als auch die absolute Häufigkeit lässt sich in einem Säulen- oder in einem Kreisdiagrammen darstellen.

Mit dem TI-Nspire CAS hat man zwei Möglichkeiten, eine Häufigkeitstabelle zu erstellen.

Erste Möglichkeit

In der ersten Möglichkeit beginnt man mit einer Urliste. Man öffnet dazu die Applikation "List & Spreadsheets". In der Spalte A werden nun alle Ereignisse eingetragen; um mit diesen Daten später weiterarbeiten zu können, muss man die Spalte in der obersten Zeile beschriften. In dem oben genannten Beispiel wird die Zeile mit "Stimmen" überschrieben und es wird der Name der Person, für die eine Stimme abgegeben wurde, jeweils einmal pro Stimme eingetragen. Man setzt dazu die Namen in Anführungszeichen und bestätigt mit "Enter". Da eine Auszählung nur aus der Spalte A erfolgen kann, muss man alles nacheinander untereinander eintragen. Will man mehrere gleiche Benennungen nacheinander eintragen, so bewegt man den Curser hinter das schließende Anführungszeichen, öffnet "Menu", geht zu "Daten" und dann weiter auf "Nach unten ausfüllen".

Nun vergrößert man den makierten Bereich so weit, wie man Einträge dieser Art haben will und bestätigt mit "Enter".

Nachdem alle benötigten Ereignisse eingetragen wurden, öffnet man in dieser Datei "Home" und dort "Data & Statistics". Es erscheint eine sogenannte Falldarstellung, in welcher jeder einzelne Punkt mit seinen Angaben zu sehen ist.

Man klickt nun auf den rechten oder den unteren Rand und bestätigt die Variable, also die Überschrift der Spalte A mit "Enter". Die einzelnen Zuordnungen sortieren sich automatisch. In dem Beispiel erscheinen nun die Stimmen für die einzelnen Kandidaten geordnet.

Aus dieser Darstellung kann man nun wie man wünscht ein Säulen- oder Kreisdiagramm machen, man wählt "Menu" und dort die Unterpunkte "Plot-Typen" und "Balkendiagramm" oder "Tortendiagramm" und eine Verteilung der relativen Häufigkeiten erscheint.

Zweite Möglichkeit

Die zweite Möglichkeit beginnt mit einer bereits ausgezählten Häufigkeitstabelle. Man trägt in die eine Spalte die Kategorien ein, für welche die Häufigkeiten erhoben wurden, und in die nebenstehende Spalte die Häufigkeiten. Man darf dabei nicht vergessen die Spalten in der obersten Zeile zu beschriften, da man sie sonst später nicht benennen kann. In dem Klassensprecherbeispiel trägt man in eine Zeile die Namen und in die zweite die Stimmen ein.

Danach wählt man unter "Menu" die Unterpunkte "Daten" und "Häufigkeitsplott". Es erscheint ein Dialogfeld, in welchem man nun die Spalte für die Daten und die Spalte für die Häufigkeiten auswählen kann. Innerhalb dieses Dialogfeldes bewegt man sich mit den Pfeiltasten für rechts und links von einer Angaben zur nächsten und mit den Pfeiltasten für oben und unten kann man verschiedene Optionen aufrufen. Im Beispiel sind die Namen die Datenliste und die Stimmen die Häufigkeit.

Es erscheint sofort ein Balkendiagramm, welches geteilt auf der ersten Seite oder auf einer neuen geöffnet werden kann. Dies lässt sich wieder unter "Menu" "Tortendiagramm" in ein Kreisdiagramm umwandeln.

Histogramme

Ein Histogramm (von griechisch histos = Gewebe, Netz, Webstuhl und gramma = Darstellung, Aufzeichnung) dient der graphischen Darstellung der Häufigkeitsverteilung von Messwerten. Im Gegensatz zum Balken- bzw. Säulendiagramm (engl. bar chart) werden die Häufigkeiten beim Histogramm nicht durch die Höhe von Balken, sondern durch die Fläche der Balken repräsentiert. Anwendung finden Histogramme in der beschreibenden Statistik. Man verwendet Histogramme dann,

  • wenn man vermutet, dass mehrere Faktoren einen Prozess beeinflussen, und man diese nachweisen will
  • wenn man sinnvolle Spezifikationsgrenzen für einen Prozess definieren möchte
  • wenn man den tatsächlichen Verlauf der Häufigkeitsverteilung sehen möchte und nicht nur Einzeldaten, wie den Mittelwert und die Standardabweichung.

Statistische Darstellungen manipulieren

Zitate

  • „Vertraue keiner Statistik, die du nicht selbst gefälscht hast!
  • “Statistik ist die Kunst mit richtigen Zahlen etwas Falsches zu beweisen“

Definition

Nach F. Ferschel ist Statistik das Bestreben, die Dinge so zu sehen, wie sie wirklich sind. Tatsächlich werden statistische Darstellungen aber häufig genutzt, um zu manipulieren.

Unter Manipulation (lat. für Handgriff, Kunstbegriff) wird die absichtliche Umfälschung von Informationen bzw. die gezielte und verdeckte Beeinflussung und das bewusste Hervorrufen von Fehldeutungen verstanden.

Bei der Manipulation statistischer Darstellungen geht es darum, dass durch die Art der grafischen Darstellung ein Diagramm dazu verleiten kann, die Analyse des Betrachters in eine bestimmte Richtung zu lenken, ohne dass dieser es merkt.

Manipulationsmöglichkeiten bei statistischen Darstellungen

z.B. durch

  • „falsche“ Wahl der Einheiten in der graphischen Darstellung
  • Veränderung der Achsen (Stauchen und Strecken ganzer Achsen oder auch nur Achsenabschnitte; Beschneiden der Ordinate)
  • die Auswahl eines bestimmten Zeitabschnitts
  • die Wahl einer „unpassenden“ Bezugsgröße
  • fehlende Sachinformationen bei Tabellen und Graphiken (z.B. Prozentangaben ohne Nennung der Bezugsgröße)
  • „falsche Wahl“ des Mittelwertes hinsichtlich der Merkmalsart oder des Sachproblems
  • das Nichtberücksichtigen von „Ausreißern“, ohne dies anzumerken oder zu begründen
  • das Erstellen falscher Graphiken durch falsches Verhältnis von Längen und Flächen und Volumina (von Säulen und Balken, Kreisdiagrammen, Piktogrammen)
  • die Einteilung der Daten in nicht geeignete, d.h. nicht sachorientierte Klassen (Gruppieren von Daten)
  • das Einfügen von Grafikelementen (z.B. Pfeile, die einen Anstieg oder Abfall noch stärker verdeutlichen sollen)

Beispiel zur Manipulation von statistischen Darstellungen

Diagrammtypen: links

Quelle: http://www.bissantz.de/pub/Luegen_mit_Statistiken.pdf

Schein: Der Hausmüll pro Kopf scheint in Deutschland rasant angestiegen und dann wieder gesunken zu sein.

Realität:

  • die jährliche Hausmüllmenge pro Kopf ist 1997 auf den Wert von 443 Kilogramm gestiegen. Das sind 3 % mehr als Vorjahr. In den 3 darauf folgenden Jahren ist die Hausmüllmenge pro Kopf jeweils um 6 Kilogramm bzw. um 1 % gesunken
  • die Werte lassen die Vorstellung eines leichten "Hügels" entstehen, die Grafik zeigt jedoch eine dramatische Steilkurve

Was ist hier also geschehen?

  • Die Kurve wurde vertikal gestreckt und horizontal gestaucht, so dass sich aus dem „Werteflachland“ ein dramatisches „Wertegebirge“ erhoben hat (Ergebnis: Höhenzunahme bzw. graphisch dargestellte Wertzunahme: 58%)
  • Die Ordinate wird abgeschnitten, ohne dass darauf hingewiesen wird, bzw. ganz weggelassen

Welchen Linienverlauf müsste uns die Graphik ohne Manipulation zeigen?

Diagrammtypen: links

Quelle: http://www.bissantz.de/pub/Luegen_mit_Statistiken.pdf

In Wahrheit bleibt die durchschnittliche Hausmüllmenge pro Kopf nahezu auf gleichem Niveau (Stagnation!)

Manipulationsmöglichkeiten mit dem TI-Nspire CAS

Das Spektrum an Manipulationsmöglichkeiten bei statistischen Darstellungen ist breit. Eine Manipulationsvariante, die in der 5. Klasse thematisiert werden sollte, ist die Veränderung der Ordinate durch Stauchen/Strecken und Beschneiden.

Fortführung des Beispiels „Stimmen bei der Klassensprecherwahl“. Zur Betonung des „Stimmenvorsprung“ von Sophie gegenüber Hilde, können folgende Veränderungen vorgenommen werden:

Zunächst einmal sollte eine neue Häufigkeitstabelle ohne den Eintrag zu Kai erstellt werden.

Im zweiten Schritt werden neue Fenstereinstellungen für die Graphik in "Data & Statistics" festgelegt. Dazu wählt man „Menü“, „Fenster/Zoomen“ und „Fensterparameter“ und gibt hier die gewünschten Werte ein.

Im Ergebnis liegen die Wertepunkte von Hilde und Sophie weit auseinender. Wenn man sich jetzt noch die y-Achse wegdenken würde, sähe es so aus, als ob Sophie dreimal so viele Stimmen erhalten hätte wie Hilde.

Grafiken im Deutschunterricht

Siehe auch