Daten erheben und auswerten

aus ZUM-Wiki, dem Wiki für Lehr- und Lerninhalte auf ZUM.de
Wechseln zu: Navigation, Suche

Inhaltsverzeichnis

Einleitung

Im Folgenden ist eine Einheit zu finden, welche sich mit der Einführung der beschreibenden Statistik in der Jahrgangsstufe 6 beschäftigt.

Lehrplan

Der Lehrplan für das Gymnasium sieht die Thematik folgendermaßen vor: Arithmetik/Algebra und Stochastik sind in den inhaltsbezogenen Kompetenzen vorgesehen. Die Schülerinnen und Schüler...

  • stellen endliche Dezimalzahlen an der Zahlengerade dar, runden sie und führen Grundrechenarten aus
  • stellen einfache Bruchteile auf verschiedene Weise dar und deuten sie als Verhältnisse
  • nutzen das Grundprinzip des Kürzens und Erweiterns von Brüchen
  • bestimmen Teiler und Vielfache natürlicher Zahlen
  • wenden Teilbarkeitsregeln für 2, 3, 5 und 10 an
  • deuten Dezimalzahlen und Prozentzahlen als andere Darstellungsform der Brüche
  • führen Umwandlungen zwischen Dezimal-, Bruch- und Prozentzahlen durch
  • erheben Daten und fassen sie in Ur- und Strichlisten zusammen
  • bestimmen rel. Häufigkeiten,arithmetisches Mittel und Median
  • stellen Häufigkeitstabellen zusammen und veranschaulichen diese mithilfe von Säulen- und Kreisdiagrammen
  • lesen und interpretieren statistische Darstellungen

Eine Klassenbefragung durchführen und auswerten

In dieser Einheit ist es vorgesehen, dass SuS selber eine Klassenbefragung durchführen und auch auswerten können. Hierbei ist vorgesehen, die Daten in Form von Kreis- und Säulendiagrammen darzustellen. Ferner sollen die relativen Häufigkeiten, das arithmetische Mittel und der Median bestimmt werden.

Dazu zunächst einmal die fachlichen Inhalte, welche noch für Schülerinnen und Schüler der Unterstufe aufbereitet werden müssen, da sie in ihrer Darstellungsweise zu abstrakt sind.

relative Häufigkeit

Die Urliste ist im Bereich der Statistik das direkte Ergebnis einer Datenerhebung, also die ursprüngliche Aufzeichnung der Beobachtungs- oder Messwerte. Die absolute Häufigkeit ist das Ergebnis einer einfachen Zählung von Objekten oder Ereignissen (besser Elementarereignissen). Sie gibt an, wie viele Elemente mit dem gleichen interessierenden Merkmal gezählt wurden. Die relative Häufigkeit gibt...

  • den Anteil der Objekte mit dem gleichen interessierenden Merkmal an einer Grundgesamtheit an
  • den Anteil der Versuche eines Zufallsexperiments, bei dem ein bestimmtes Ereignis eingetreten ist an.

relative Häufigkeit={absolute Häufigkeit}/{Umfang der Erhebung}

arithmetisches Mittel

Das arithmetische Mittel (auch Durchschnitt) ist ein Mittelwert, der als Quotient aus der Summe aller beobachteten Werte und der Anzahl der Werte definiert ist:

 \bar{x}_{\mathrm{arithm}} = \frac{1}{n} \sum_{i=1}^n{x_i} = \frac{x_1 + x_2 + \cdots + x_n}{n}

Median

Median (oder Zentralwert) bezeichnet eine Grenze zwischen zwei Hälften. In der Statistik halbiert der Median eine sortierte Verteilung. Gegenüber dem arithmetischen Mittel hat der Median den Vorteil, robuster gegenüber Ausreißern (extrem abweichenden Werten) zu sein.

Der Median \tilde x einer geordneten Stichprobe (x_1, x_2, \dots, x_n) von n Messwerten ist dann also

\tilde x =\begin{cases}
  x_\frac{n+1}{2}                                    & n\text{ ungerade}\\
  \frac 12\left(x_{\frac n2} + x_{\frac n2+1}\right) & n \text{ gerade.}
\end{cases}

Säulendiagramm

Das Säulendiagramm ist einer der am häufigsten verwendeten Diagrammtypen. Es veranschaulicht durch auf der x-Achse senkrecht stehende Rechtecke die Ausprägung von Messwerten.

Kreisdiagramm

Ein Kreisdiagramm ist eine Darstellungsform für Teilwerte eines Ganzen als Teile eines Kreises. Das Kreisdiagramm ist kreisförmig und in mehrere Kreissektoren eingeteilt, wobei jeder Kreissektor einen Teilwert und der Kreis somit die Summe der Teilwerte (das Ganze) darstellt. Kreisdiagramme eignen sich besonders für die Darstellung von Verteilungen und Anteilen. \mathrm{Winkel} =\frac{360^\circ \cdot \mathrm{Teilwert}}{\mathrm{Gesamtwert}}

Beispieldiagramme

Diese Diagramme stellen die Stellung im Beruf dar.

Quelle: http://stirner.wiwi.hu-berlin.de/mediawiki/mmstat_de/images/6/64/STAT-Anim-Kreisdiagramm.gif

Vorgehensweise bei einer statistischen Erhebung

  • Planung: Zuerst wählt man eine möglichst interessante und lebensnahe Frage aus. Danach erarbeitet man, wie und was man zur Beantwortung dieser Frage sinnvoll zählen kann und vereinbart die Formalitäten der Datenerhebung. Dies sind nicht nur Vereinbarungen was gezählt werden soll, sondern auch auch Vereinbarungen zum Erhebungsverfahren, also zum Beispiel: wie viele Gruppen sollen zählen; wie lange und wo soll gezählt werden; wie viele und welche Personen will man befragen usw.
  • Datenerfassung: Man führt die Befragung durch und legt dabei eine Urliste an, um die Anzahl festzustellen.
  • Datenaufbereitung und Datenauswertung: Die erhobenen Daten werden in Tabellen zusammengefasst und in Diagrammen dargestellt. Es können Anteile berechnet werden. Es wird eine Antwort auf die eingangs gestellte Frage gegeben.
  • Ergebisse und mögliche Folgerungen: Die Daten können weitergereicht werden um evtl. erkannte Probleme zu beheben.

Häufigkeitstabellen und Histogramme

Häufigkeitstabellen

In einer Häufigkeitstabelle können sowohl relative als auch absolute Häufigkeiten eines Merkmals zusammengefasst werden. Das genaue Aussehen und die Komplexität dieser Tabellen richtet sich dabei nach der Fragestellung. In der fünften Klasse, für welche die Grundüberlegungen dieses Artikels gelten, wird allerdings nur die relative Häufigkeit behandelt.

Eine einfache Häufigkeitstabelle mit absoluten Häufigkeiten entsteht bereits aus der Zusammenfassung (dem Auszählen) einer Urliste.

Beispiel: Stimmen bei der Klassensprecherwahl

Name Stimmen
Kai 7
Sophie 10
Hilde 9

Sowohl die relative, als auch die absolute Häufigkeit lässt sich in einem Säulen- oder in einem Kreisdiagrammen darstellen.

Mit dem TI-Nspire CAS hat man zwei Möglichkeiten eine Häufigkeitstabelle zu erstellen. In der ersten Möglichkeit beginnt man mit einer Urleiste. Man öffnet dazu "3: List & Spreadsheets". In der Spalte A werden nun alle Ereignisse eingetragen. In dem oben genannten Beispiel, die Name der Person für die gestimmt wurde, jeweils einmal pro Stimme. Man setzt dazu die Namen in Anführungszeichen und bestätigt mit "Enter". Da eine Auszählung nur aus der Spalte A erfolgen kann, muss man alles nacheinander untereinander eintragen. Will man gleich mehrere gleiche Benennungen nacheinander eintragen, so bewegt man den Curser hinter das schließende Anführungszeichen, öffnet "Menu", geht zu "3: Daten" und dann weiter auf "3: Nach unten ausfüllen".

Häufigkeitstabelle.jpg

Nun vergrößert man den makierten Bereich so weit, wie man Einträge dieser Art haben will und bestätigt mit "Enter. Nachdem alle benötigten Ereignisse eingetragen wurden, öffnet man in dieser Datei "Home" und dort "5: Data & Statistics". Es erscheint ein sogenannte Falldarstellung, in welcher jeder einzelne Punkt mit seinen Angaben zu sehen ist.

Falldarstellung.jpg

Man klickt nun auf den rechten oder unteren Rand und bestätigt die Variable, also die Überschrift der Spalte A mit "Enter". Die einzelnen Zuordnungen sortieren sich automatisch. In dem Beispiel erscheinen nun die Stimmen für die einzelnen Kandidaten geordnet.

PunktdiagrammHäufigkeit.jpg

Aus dieser Darstellung kann man nun wie man wünscht ein Säulen- oder Kreisdiagramm machen, man wählt "Menu" und dort "1: Plot-Typen" und "8: Balkendiagramm" oder "9: Tortendiagramm" und eine Verteilung der relativen Häufigkeiten erscheint.

BalkendiagrammKlassenspr.jpg


Die zweite Möglichkeit beginnt mit einer bereits ausgezählten Urliste. Man trägt nun in die eine Spalte die Kategorien ein, für welche die Häufigkeiten erhoben wurden, und in die andere Spalte die Häufigkeiten. Man darf dabei nicht vergessen die Spalten in der obersten Zeile zu beschriften, da man sie sonst nicht benennen kann. In dem Klassensprecherbeispiel trägt man in eine Zeile die Namen und in die zweite die Stimmen ein.

AusgezählteHäufigkeitstabelleKlassenspr.jpg

Danach wählt man unter "Menu" "3: Daten" und "5: Häufigkeitsplott". Es erscheint ein Dialogfeld in welchem man nun die Spalte für die Daten und die Spalte für die Häufigkeiten auswählen kann. Innerhalb dieses Dialogfeldes bewegt man sich mit den Pfeiltasten für rechts und links von einer Angaben zur nächsten und mit den Pfeiltasten für oben und unten kann man verschiedene Optionen aufrufen. Im Beispiel sind die Namen die Datenliste und die Stimmen die Häufigkeit.

HäufigkeitsplotKlassenspr.jpg

Es erscheint sofort ein Balkendiagramm, welches geteilt auf der ersten Seite oder auf einer neuen geöffnet werden kann. Dies lässt sich wieder unter "Menu" "9:Tortendiagramm" in ein Kreisdiagramm umwandeln.

Histogramme

Ein Histogramm (von griechisch histos = Gewebe, Netz, Webstuhl und gramma = Darstellung, Aufzeichnung) dient der graphischen Darstellung der Häufigkeitsverteilung von Messwerten. Im Gegensatz zum Balken- bzw. Säulendiagramm (engl. bar chart) werden die Häufigkeiten beim Histogramm nicht durch die Höhe von Balken, sondern durch die Fläche der Balken repräsentiert. Anwendung finden Histogramme in der beschreibenden Statistik. Man verwendet Histogramme dann,

  • wenn man vermutet, dass mehrere Faktoren einen Prozess beeinflussen, und man diese nachweisen will
  • wenn man sinnvolle Spezifikationsgrenzen für einen Prozess definieren möchte
  • wenn man den tatsächlichen Verlauf der Häufigkeitsverteilung sehen möchte und nicht nur Einzeldaten, wie den Mittelwert und die Standardabweichung.

gelungens Beispiel zur Unfallhäufigkeit von Kleinkindern von der Uni-Göttingen

Statistische Darstellungen manipulieren

Zitate

  • „Vertraue keiner Statistik, die du nicht selbst gefälscht hast!
  • “Statistik ist die Kunst mit richtigen Zahlen etwas Falsches zu beweisen“


Definition

Nach F. Ferschel ist Statistik das Bestreben, die Dinge so zu sehen, wie sie wirklich sind. Tatsächlich werden statistische Darstellungen aber häufig genutzt, um zu manipulieren.

Unter Manipulation (lat. für Handgriff, Kunstbegriff) wird die absichtliche Umfälschung von Informationen bzw. die gezielte und verdeckte Beeinflussung und das bewusste Hervorrufen von Fehldeutungen verstanden.

Bei der Manipulation statistischer Darstellungen geht es darum, dass durch die Art der grafischen Darstellung ein Diagramm dazu verleiten kann, die Analyse des Betrachters in eine bestimmte Richtung zu lenken, ohne dass dieser es merkt.


Notwendige Voraussetzungen, um Manipulationsmöglichkeiten statistischer Darstellungen erkennen zu können

  • hinreichende Kenntnisse über Begriffe und Methoden der deskriptiven Statistik


Manipulationsmöglichkeiten bei statistischen Darstellungen

z.B. durch

  • „falsche“ Wahl der Einheiten in der graphischen Darstellung
  • Veränderung der Achsen (Stauchen und Strecken ganzer Achsen oder auch nur Achsenabschnitte; Beschneiden der Ordinate)
  • die Auswahl eines bestimmten Zeitabschnitts
  • die Wahl einer „unpassenden“ Bezugsgröße
  • fehlende Sachinformationen bei Tabellen und Graphiken (z.B. Prozentangaben ohne Nennung der Bezugsgröße)
  • „falsche Wahl“ des Mittelwertes hinsichtlich der Merkmalsart oder des Sachproblems
  • das Nichtberücksichtigen von „Ausreißern“, ohne dies anzumerken oder zu begründen
  • das Erstellen falscher Graphiken durch falsches Verhältnis von Längen und Flächen und Volumina (von Säulen und Balken, Kreisdiagrammen, Piktogrammen)
  • die Einteilung der Daten in nicht geeignete, d.h. nicht Sachorientierte Klassen (Gruppieren von Daten)
  • das Einfügen von Grafikelementen (z.B. Pfeile, die einen Anstieg oder Abfall noch stärker verdeutlichen sollen)


Beispiel zur Manipulation von statistischen Darstellungen

Beispiel: Hausmüll pro Kopf

Diagrammtypen: links

Quelle: http://www.bissantz.de/pub/Luegen_mit_Statistiken.pdf

Schein: Der Hausmüll pro Kopf scheint in Deutschland rasant angestiegen und dann wieder gesunken zu sein.

Realität:

  • die jährliche Hausmüllmenge pro Kopf ist 1997 auf den Wert von 443 Kilogramm gestiegen. Das sind 3 % mehr als Vorjahr. In den 3 darauf folgenden Jahren ist die Hausmüllmenge pro Kopf jeweils um 6 Kilogramm bzw. um 1 % gesunken
  • die Werte lassen die Vorstellung eines leichten "Hügels" entstehen, die Grafik zeigt jedoch eine dramatische Steilkurve


Was ist hier also geschehen?

  • Die Kurve wurde vertikal gestreckt und horizontal gestaucht, so dass sich aus dem „Werteflachland“ ein dramatisches „Wertegebirge“ erhoben hat (Ergebnis: Höhenzunahme bzw. graphisch dargestellte Wertzunahme: 58%)
  • Die Ordinate wird abgeschnitten, ohne dass darauf hingewiesen wird, bzw. ganz weggelassen


Welchen Linienverlauf müsste uns die Graphik ohne Manipulation zeigen?

Diagrammtypen: links

Quelle: http://www.bissantz.de/pub/Luegen_mit_Statistiken.pdf

In Wahrheit bleibt die durchschnittliche Hausmüllmenge pro Kopf nahezu auf gleichem Niveau (Stagnation!)

Manipulationsmöglichkeiten mit dem TI-nspire CAS

Das Spektrum an Manipulationsmöglichkeiten bei statistischen Darstellungen ist breit. Eine Manipulationsvariante, die in der 5. Klasse thematisiert werden sollte, ist die Veränderung der Ordinate durch Stauchen/Strecken und Beschneiden.

Fortführung des Beispiels „Stimmen bei der Klassensprecherwahl“. Zur Betonung des „Stimmenvorsprung“ von Sophie gegenüber Hilde, können folgende Veränderungen vorgenommen werden:

Zunächst einmal sollte eine neue Häufigkeitstabelle ohne den Eintrag zu Kai erstellt werden.


Tabelle2.jpg

links275px


Im zweiten Schritt werden neue Fenstereinstellungen für die Graphik in "Data & Statistics" festgelegt. Dazu wählt man „Menü“, „5: Fenster/Zoomen“ und „1: Fensterparameter“ und gibt hier die gewünschten Werte ein.

Im Ergebnis liegen die Wertepunkte von Hilde und Sophie weit auseinender. Wenn man sich jetzt noch die y-Achse wegdenken würde, sähe es so aus, als ob Sophie dreimal so viele Stimmen erhalten hätte wie Hilde.


links275px

Aufgaben

  • Wir erstellen nun eine Urliste, indem wir eine statistische Erhebung durchführen zum Thema: "Die Schuhgrößen in unserem Kurs!"
  • Stelle diese Urliste tabellarisch in ´List & Spreadsheets´ dar, indem du sie in die Tabellenkalkulation überträgst.
  • Stelle nun die Daten grafisch dar; welche Diagrammtypen machen hier einen Sinn? Probiere aus!
Zu der Erstellung der Diagramme: Wenn die Tabelle erstellt ist, kann man mit Menu, Daten, Schnellgraph ein Diagramm erstellen. Unter Menu, Plottyp, Balken- oder Tortendiagramm kannst du die Darstellungsform wählen.
Versuche nun, das Diagramm noch über ´Data & Statistics´ zu erzeugen. Bietet eine der beiden Vorgehensweise Vorteile?
(Achte dabei darauf, dass jedes Ereignis in einer Extra-Zeile steht und immer in "_" geschrieben wird, wenn du ein Diagramm mit Hilfe von ´Data & Statistics´ erstellen möchtest.)
  • Berechne die verschiedenen Mittelwerte, was fällt dir auf?
  • Hier ist nun eine Häufigkeitstabelle. Übernimm diese und erstelle ein Histogramm.
  • Kann man diese Darstellung manipulieren?

Siehe auch