Beschreibende Statistik/Klassenbildung und Beschreibende Statistik/Graphische Darstellung: Unterschied zwischen den Seiten

Aus ZUM-Unterrichten
< Beschreibende Statistik(Unterschied zwischen Seiten)
main>Matthias Scharwies
K (Matthias Scharwies verschob Seite Höhere Berufsfachschule für Wirtschaft und Verwaltung/Mathematik/Beschreibende Statistik/Grundbegriffe der beschreibenden Statistik/Klassenbildung nach [[Beschreibende Statistik/Grundbegriffe der beschreibenden S…)
 
main>Matthias Scharwies
Keine Bearbeitungszusammenfassung
 
Zeile 1: Zeile 1:
{{Navigation/Lernpfad|
Will man mithilfe der Daten einer statistischen Erhebung eine Aussage unterstützen, so bieten sich graphische Darstellungen an. Der Betrachter kann die Daten schnell erfassen und die Aussage bleibt viel leichter im Gedächtnis.
<u>'''Lernziele:'''</u>
* Sie kennen die Definitionen (und mathematischen Bezeichnungen) der Begriffe
** Klassenanzahl,
** Spannweite und
** Klassenbreite.
* Sie können entscheiden, ob vorliegende Daten zu klassieren sind, um sie aussagekräftig darzustellen.
* Sie können
** Klassenanzahlen,
** die Spannweite und
** Klassenbreiten im Sachzusammenhang berechnen.
* Sie kennen den Unterschied zwischen
** Klassen mit gleicher Klassenbreite und
** Klassen mit unterschiedlicher Klassenbreite.
* Sie können situativ entscheiden, welche Art von Klassenbildung für die Lösung einer Aufgabe geeignet ist.


Sie kennen das alles schon? Dann geht es hier direkt zu den Übungen [[Datei:Pfeil 2.gif]] &nbsp; [[../Übungen Klassenbildung|Übungen]]
Allerdings sind dabei - wie immer - einige wichtige Grundsätze zu beachten. Ansonsten sind auch optisch schöne graphische Darstellungen wenig aussagekräftig.


Ansonsten sind Sie hier richtig.
Der erste Abschnitt befasst sich mit Grundlagen zur Erstellung von Diagrammen.
}}


Man kann jede Art von Merkmalen klassieren. Das geht sogar bei qualitativen Merkmalen mit einer Nominalskala.
* [[#Grundlegendes zu Diagrammen|Grundlegendes zu Diagrammen]]
* [[Beschreibende Statistik/Graphische Darstellung/Säulendiagramm|Säulendiagramm]]
** [[/Übungen Säulendiagramm|Übungen Säulendiagramm]]
* [[Beschreibende Statistik/Graphische Darstellung/Balkendiagramm|Balkendiagramm]]
** [[/Übungen Balkendiagramm|Übungen Balkendiagramm]]
* [[Beschreibende Statistik/Graphische Darstellung/Kreisdiagramm|Kreisdiagramm]]
* [[Beschreibende Statistik/Graphische Darstellung/Punktwolke |Punktwolke ]]
|| [[/Übungen Punktwolke |Übungen Punktwolke ]]
* [[Beschreibende Statistik/Graphische Darstellung/Auswahl des passenden Diagramms |Auswahl des passenden Diagramms ]]


<!-- Beispiel Merkmal Lieblingsfarbe -->
== Grundlegendes zu Diagrammen ==
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
<u>'''Lernziele:'''</u>
|<u>'''Beispiel Merkmal Lieblingsfarbe'''</u>
* Sie wissen, dass eine gute graphische Darstellung
|-
** eine Titel,
| Sind zum Beispiel die Farben hellgelb, gelb, sonnengelb, rot, grün, hellblau, mittelblau, himmelblau und dunkelblau unter den Merkmalsausprägungen, so könnte man die Klassen
** eine Legende,
 
** beschriftete und
: "'''gelb'''" mit den Merkmalsausprägungen hellgelb, gelb und sonnengelb,
** skalierte Achsen hat.
* Sie erkennen, ob ein Diagramm diesen Regeln genügt.
* Sie können diese Regeln benennen.
}}


: "'''blau'''" mit den Merkmalsausprägungen hellblau, mittelblau, himmelblau und dunkelblau ,
Mit Diagrammen lassen sich Häufigkeiten in verschiedener Art und Weise veranschaulichen. Jede nach Art des Merkmals und den zugehörigen Merkmalsausprägungen eignen sich manche Darstellungsformen besonders gut - oder eben nicht wirklich gut.


: "'''Andere'''" mit den verbliebenden Merkmalsausprägungen bilden.
<!-- Beispiel -->
 
Dies wird auch bei der Auswertung von Wahlergebnissen im Fernsehen gemacht, die kleineren, nicht so wichtigen Parteien werden unter "Andere" zusammengefasst.
|}
<!-- Ende Beispiel Merkmal Lieblingsfarbe -->
 
Bei qualitativen Merkmalen mit einer Ordinalskala wird man immer darauf achten, dass aufeinander folgende Merkmalsausprägungen zusammengefasst werden.
 
<!-- Beispiel Merkmal Note Mathematikarbeit -->
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
|<u>'''Beispiel Merkmal Note Mathematikarbeit'''</u>
! align=left|Beispiel Wohnorte der Oberstufenschüler
|-
|-
| Betrachtet man die Noten der letzten Mathematikarbeit, so könnte man die Klassen
|
: "'''Leistungsträger'''" für die Merkmalsausprägungen "sehr gut" und "gut",
Liegen die Daten als tabellarische Häufigkeitsverteilung vor, so lassen sich die Informationen zwar gut erkennen, bleiben aber schwer im Gedächtnis.
: "'''Mittelfeld'''" für die Merkmalsausprägungen "befriedigend" und "ausreichend" und
: "'''Blauer Brief'''" für die Merkmalsausprägungen "mangelhaft" und "ungenügend" bilden,
 
um eine knappe Übersicht über die Lerngruppe zu erhalten.
|}
<!-- Ende Beispiel Merkmal Note Mathematikarbeit -->
 
Im Folgenden werden aber nur noch quantitative Merkmale betrachtet.
 
Nicht immer macht es Sinn, alle verschiedenen  Merkmalsausprägungen einzeln zu betrachten. Bei quantitativen Merkmalen fasst man oft verschiedene Merkmalsausprägungen zu Klassen zusammen.
 
<!-- Beispiel Körpergröße (in cm) -->
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
|colspan="8" |<u>'''Beispiel Körpergröße (in cm)'''</u>
 
Betrachtet man zum Beispiel die Körpergröße (in cm) der Schüler und Schülerinnen der Klasse HHU5 am Berufskolleg Hattingen (Schuljahr 2012/2013):
 
<!-- Tabelle Körpergröße HHU5 -->
<div style="float:left; margin-right:1em;">
{| class="wikitable"
|+ Urliste
! colspan="5"| Körpergröße in cm
|-
|-
| 170 || 178 || 174 || 188 || 168
! align=left|Tabellarische Darstellung
|-
|-
| 191 || 169 || 159 || 199 || 200
|
[[Datei:1 Daten.PNG|300px|tabellarische Häufigkeitsverteilung]]
 
Für den Leser sollte man die Daten als Diagramm aufbereiten. Dies gelingt nicht immer:
|-
|-
| 177 || 178 || 200 || 193 || 169
! align=left|Schlechte graphische Darstellung
|-
|-
| 151 || 185 || 191 || 165 || 158
|
|-
[[Datei:2 schlechte Darstellung.PNG|300px|Diagramm ohne Aussagekraft]]
| 185 || 188 || 194 || 180 || 170
|}
</div>
<!--  Ende Tabelle Körpergröße HHU5 -->


Leider hat wurden hier Titel und Legende vergessen, so dass man als unbedarfter Betrachter gar nicht weiß, was hier dargestellt werden soll. Bleibt auch die Frage, ob ein Kreisdiagramm mit so vielen Segmenten der passende Diagrammtyp ist.


 
Das geht wirklich besser.
Wenn man hier die verschiedenen Merkmalsausprägungen mit ihren absoluten und relativen Häufigkeiten erfasst, ist noch nicht wirklich etwas gewonnen, da es 18 verschiedene Merkmalsausprägungen gibt, von denen sieben die absolute Häufigkeit 2 und alle anderen die absolute Häufigkeit 1 haben. (Der geneigte Leser mag das selber nachrechnen.)
|-
 
! Aussagekräftige graphische Darstellung
Man könnte zum Beispiel die Frage "Wie viele Schüler sind größer als 175 cm und höchstens 183 cm? stellen.
 
Dann ist es sinnvoll, eine absolute Häufigkeitsverteilung mit drei verschiedenen Klassen zu bilden. Jede Klasse hat eine untere und eine obere Grenze. Wichtig ist, dass sich die Klassen nicht überschneiden, damit jeder Beobachtungswert nur genau zu einer Klasse gehört.
|-
|-
|
|
<u>'''Klasseneinteilung:'''</u>
[[Datei:3 gutes Diagramm.PNG|400px|Gutes Diagramm]]
 
Klasse <math>k_1</math>:
:vom kleinsten Wert <math>x_{Min}</math> (hier: 151 cm) bis zu 175 cm einschließlich
:: mathematische Kurzschreibweise: <math>[151;175]=]150;175]</math>
Klasse <math>k_2</math>:  
: von über 175 cm  bis zu 183 cm einschließlich
:: mathematische Kurzschreibweise: <math>]175;183]</math>
Klasse <math>k_3</math>:
:von über 183 cm bis zum größten Wert <math>x_{Max}</math> (hier 200 cm) einschließlich
:: mathematische Kurzschreibweise: <math>]183;200]</math>
 
<u>'''Häufigkeitsverteilung bestimmen:'''</u>


Jetzt kann man die absolute Häufigkeit <math>H(k_i)</math> zu jeder Klasse <math>k_i</math> bestimmen, indem man alle Beobachtungswerte zählt, die im Intervall der Klasse <math>k_i</math> liegen.
Hier kann der Betrachter den Inhalt und die Aussage sofort erfassen. Alle Beschriftungen sind vorhanden und aussagekräftig.
Dann lässt sich auch die relative Häufigkeit <math>h(k_i)</math> zu jeder Klasse <math>k_i</math> bestimmen, indem man den Anteil aller Beobachtungswerte am Stichprobenumfang <math>n</math>, die im Intervall der Klasse <math>k_i</math> liegen, berechnet.


<!-- Tabelle Klassierte Körpergröße HHU5 -->
<div style="float:left; margin-right:1em;">
{| class="wikitable"
|-
! colspan="5" | Klassierte Körpergrößen HHU5 2012/2013
|-
| <math>k_i</math> || <math>150 < a_i \le 175</math> || <math>175 < a_i \le 183</math> || <math>183 < a_i \le 200</math> || '''Summe'''
|-
| <math>H(k_i)</math> || <math>10</math> || <math>4</math> || <math>11</math> || <math>25</math>
|-
| <math>h(k_i)</math> || <math>\frac{2}{5}=40 %</math> || <math>\frac{4}{25}=16 %</math> || <math>\frac{11}{25}=44 %</math> || <math>100 %</math>
|}
|}
</div>
<!-- Ende Beispiel -->
<!-- Ende Klassierte Tabelle Körpergröße HHU5 -->
|-
|
<u>'''Interpretation:'''</u>


Es sind also nicht nur vier Schüler größer als 175 cm und höchstens 183 cm. Es sieht so aus, als wären die Schüler der Klasse entweder klein oder groß, weil die Klasse in der Mitte so selten vertreten ist.
Um die Aussagekraft und Leserlichkeit einer Graphik zu gewährleisten sind einige grundlegende Regeln zu beachten.
<br />


Stimmt das denn?
<!-- Gute Graphiken -->
<br />
{{Merke|
Gute Graphiken haben
* eine sprechende Überschrift (Titel),
* beschriftete und
* skalierte Achsen,
* beschriftete Segmente oder eine Legende.


Hier ist es hilfreich, sich mit den Klassenbreiten zu beschäftigen.
Wenn nötig, werden Werte zu den einzelnen Segmenten (Merkmalsausprägungen) angegeben.
<br />
}}
<!-- Ende Gute Graphiken -->


<u>'''Klassenbreiten bestimmen:'''</u>
Kommen wir zurück zur Eisdiele „Rabe“. Die absoluten und relativen Häufigkeiten der einzelnen Merkmale haben wir schon bestimmt. Diese wollen wir nun graphisch veranschaulichen, um dem Inhaber die wichtigsten Informationen möglichst gut zugänglich zu machen.
<br />


Die gewählten Klassen <math>k_i</math> sind unterschiedlich breit. Die Breite <math>b_i</math> einer Klasse <math>k_i</math> errechnet man, indem man die untere Grenze <math>uG_i</math> von der oberen Grenze <math>oG_i</math> subtrahiert.
Aber wie bereitet man die einzelnen Merkmale besonders aussagekräftig auf?


<!-- Tabelle Klassenbreiten -->
{{Navigation/Lernpfad|
<div style="float:left; margin-right:1em;">
{| class="wikitable"
|-
! Klasse <math>k_i</math> !! untere Grenze <math>uG_i</math> !! obere Grenze <math>oG_i</math> !! Klassenbreite <math>b_i</math>
|-
| <math>k_1</math> || <math>150</math> || <math>175</math> || <math>175-150=25</math>
|-
| <math>k_2</math> || <math>175</math> || <math>183</math> || <math>183-175=8</math>
|-
| <math>k_3</math> || <math>183</math> || <math>200</math> || <math>200-183=17</math>
|}
</div>
<!--  Ende Klassenbreiten -->
|-
|
Jetzt sieht man, dass die mittlere Klasse auch viel schmaler ist, als die beiden anderen Klassen. Die Klassenbreite hat aber Einfluss auf die Häufigkeit, mit der die Beobachtungswerte in der Klasse liegen. Deshalb wählt man in der Regel Klassen mit gleicher Klassenbreite. Nur in Ausnahmefällen machen Klassen mit unterschiedlichen Klassenbreiten Sinn. Ganz besonders gut geeignet sind unterschiedliche Klassenbreiten, wenn man schon vorher weiß, welche Aussage man mit den Daten unterstützen möchte.


Auch die obige Fragestellung hätte man prima mit gleich breiten Klassen lösen können. Dabei beginnt man dann mit dem aus der Frage vorgegebenen Intervall und bildet alle nötigen Klassen darunter und darüber mit Klassenbreite 8 cm so, dass man auch den kleinsten und den größten Beobachtungswert einer Klasse zuordnen kann.
Sie haben in Ihrem Regelheft ein neues Kapitel '''Graphische Darstellungen''' begonnen und mit dem ersten Merksatz gefüllt.


Das sieht dann so aus:
== Übungen ==
<!-- Tabelle Klassierte Körpergröße HHU5 -->
<div style="float:left; margin-right:1em;">
{| class="wikitable"
|-
! colspan="4" | Klassierte Körpergrößen HHU5 2012/2013
|-
! Klasse <math>k_i</math> !! Intervall !! <math>H(k_i)</math> || <math>h(k_i)</math>
|-
| <math>k_1</math> || <math>143 < a_i \le 151</math> || <math>1</math> || <math>\frac{1}{25}=4 %</math>
|-
| <math>k_2</math> || <math>151 < a_i \le 159</math> || <math>2</math> || <math>\frac{2}{25}=8 %</math>
|-
| <math>k_3</math> || <math>159 < a_i \le 167</math> || <math>1</math> || <math>\frac{1}{25}=4 %</math>
|-
| <math>k_4</math> || <math>167 < a_i \le 175</math> || <math>6</math> || <math>\frac{6}{25}=24 %</math>
|-
| <math>k_5</math> || <math>175 < a_i \le 183</math> || <math>4</math> || <math>\frac{4}{25}=16 %</math>
|-
| <math>k_6</math> || <math>183 < a_i \le 191</math> || <math>6</math> || <math>\frac{6}{25}=24 %</math>
|-
| <math>k_7</math> || <math>191 < a_i \le 199</math> || <math>3</math> || <math>\frac{3}{25}=12 %</math>
|-
| <math>k_8</math> || <math>199 < a_i \le 207</math> || <math>2</math> || <math>\frac{2}{25}=8 %</math>
|-
! colspan="2"| Summe !! <math>25</math> !! <math>100%</math>
|}
</div>
<!--  Ende Klassierte Tabelle Körpergröße HHU5 -->
|-
| <u>'''Interpretation''':</u>
|-
|
Man kann leicht erkennen, dass es - unter Berücksichtigung der Klassenbreite - nur zwei Klassen gibt, in denen sich mehr Beobachtungswerte befinden. So erhält  man also ein ganz anderes Bild der Verteilung.
|}
<!-- Beispiel Körpergröße (in cm) -->


{{Aufgabe|Ordnen Sie die richtigen Begriffe zu.}}


<!-- Merke Klassen -->
<iframe src="//LearningApps.org/watch?v=pdd5rzbh101" style="border:0px;width:100%;height:500px" webkitallowfullscreen="true" mozallowfullscreen="true"></iframe>
{{Merke-M||1=
Wenn bei einer umfangreichen Stichprobe sehr viele unterschiedliche Merkmalsausprägungen auftreten, so bietet es sich an, ähnliche Werte in sogenannte <span style="background:yellow">'''Klassen <math>k_i</math>'''</span> der <span style="background:yellow">(Klassen-)Breite <math>b_i</math></span> zusammenzufassen.
}}
}}
<!-- Ende Merke Klassen -->


Man unterscheidet zwei Arten von Klassenbildungen:
{{Aufgabe|
*: Klassen mit gleicher Klassenbreite <math>b_i=b</math>
Was ist bei der graphischen Aufbereitung immer zu beachten?
*: Klassen mit unterschiedlicher Klassenbreite <math>b_i</math>
}}


Übrigens eignen sich Klassen mit unterschiedlicher Klassenbreite hervorragend, um Daten so aufzubereiten, dass sie die gewünschte Aussage (hier entweder eine Klasse mit besonders großen Schülern oder mit besonders kleinen Schülern) gut unterstützen. Hier gilt der allseits beliebte Spruch: "Traue keiner Statistik, die du nicht selbst gefälscht hast."
{{Lösung versteckt|
Gute Graphiken haben
* eine sprechende Überschrift (Titel),  
* beschriftete und
* skalierte Achsen,  
* beschriftete Segmente oder eine Legende.  


{{Aufgabe-M|
Wenn nötig, werden Werte zu den einzelnen Segmenten (Merkmalsausprägungen) angegeben.
 
}}
Sie haben Ihr Regelheft mit dem sechsten Merksatz gefüllt.


Hier geht's weiter.  [[Datei:Pfeil 2.gif]] &nbsp; [[/Klassen mit gleicher Klassenbreite|Klassen mit gleicher Klassenbreite]]


[[../../Lernpfad zur Beschreibenden Statistik|zurück zur Startseite des Lernpfad]]
}}




{{Fortsetzung|weiter=Säulendiagramm|weiterlink=Beschreibende_Statistik/Graphische_Darstellung/Säulendiagramm}}


{{SORTIERUNG:{{SUBPAGENAME}}}}
{{Beschreibende Statistik}}
[[Kategorie:Höhere Berufsfachschule für Wirtschaft und Verwaltung Grundbegriffe der beschreibenden Statistik]]

Version vom 15. April 2019, 09:16 Uhr

Will man mithilfe der Daten einer statistischen Erhebung eine Aussage unterstützen, so bieten sich graphische Darstellungen an. Der Betrachter kann die Daten schnell erfassen und die Aussage bleibt viel leichter im Gedächtnis.

Allerdings sind dabei - wie immer - einige wichtige Grundsätze zu beachten. Ansonsten sind auch optisch schöne graphische Darstellungen wenig aussagekräftig.

Der erste Abschnitt befasst sich mit Grundlagen zur Erstellung von Diagrammen.

|| Übungen Punktwolke

Grundlegendes zu Diagrammen

Lernziele:

  • Sie wissen, dass eine gute graphische Darstellung
    • eine Titel,
    • eine Legende,
    • beschriftete und
    • skalierte Achsen hat.
  • Sie erkennen, ob ein Diagramm diesen Regeln genügt.
  • Sie können diese Regeln benennen.

}}

Mit Diagrammen lassen sich Häufigkeiten in verschiedener Art und Weise veranschaulichen. Jede nach Art des Merkmals und den zugehörigen Merkmalsausprägungen eignen sich manche Darstellungsformen besonders gut - oder eben nicht wirklich gut.

Beispiel Wohnorte der Oberstufenschüler

Liegen die Daten als tabellarische Häufigkeitsverteilung vor, so lassen sich die Informationen zwar gut erkennen, bleiben aber schwer im Gedächtnis.

Tabellarische Darstellung

tabellarische Häufigkeitsverteilung

Für den Leser sollte man die Daten als Diagramm aufbereiten. Dies gelingt nicht immer:

Schlechte graphische Darstellung

Diagramm ohne Aussagekraft

Leider hat wurden hier Titel und Legende vergessen, so dass man als unbedarfter Betrachter gar nicht weiß, was hier dargestellt werden soll. Bleibt auch die Frage, ob ein Kreisdiagramm mit so vielen Segmenten der passende Diagrammtyp ist.

Das geht wirklich besser.

Aussagekräftige graphische Darstellung

Gutes Diagramm

Hier kann der Betrachter den Inhalt und die Aussage sofort erfassen. Alle Beschriftungen sind vorhanden und aussagekräftig.

Um die Aussagekraft und Leserlichkeit einer Graphik zu gewährleisten sind einige grundlegende Regeln zu beachten.


Merke

Gute Graphiken haben

  • eine sprechende Überschrift (Titel),
  • beschriftete und
  • skalierte Achsen,
  • beschriftete Segmente oder eine Legende.

Wenn nötig, werden Werte zu den einzelnen Segmenten (Merkmalsausprägungen) angegeben.


Kommen wir zurück zur Eisdiele „Rabe“. Die absoluten und relativen Häufigkeiten der einzelnen Merkmale haben wir schon bestimmt. Diese wollen wir nun graphisch veranschaulichen, um dem Inhaber die wichtigsten Informationen möglichst gut zugänglich zu machen.

Aber wie bereitet man die einzelnen Merkmale besonders aussagekräftig auf?

Vorlage:Navigation/Lernpfad


Aufgabe

Was ist bei der graphischen Aufbereitung immer zu beachten?

Gute Graphiken haben

  • eine sprechende Überschrift (Titel),
  • beschriftete und
  • skalierte Achsen,
  • beschriftete Segmente oder eine Legende.

Wenn nötig, werden Werte zu den einzelnen Segmenten (Merkmalsausprägungen) angegeben.




Lernpfad Beschreibende Statistik

  1. Grundbegriffe
  2. Graphische Darstellungen von Häufigkeitsverteilungen
  3. Lagemaße
    (arithmetisches Mittel, Modus, Median)
  4. Streuungsmaße
    (mittlere absolute Abweichung, mittlere quadratische Abweichung, Standardabweichung)
  5. Einsatz des Taschenrechners
    (Bedienung Casio fx-991DE PLUS)