Beschreibende Statistik/Qualitative und Quantitative Merkmale, Skalen und Beschreibende Statistik/Klassenbildung: Unterschied zwischen den Seiten

Aus ZUM-Unterrichten
< Beschreibende Statistik(Unterschied zwischen Seiten)
(Schreibweise Merkebox 1 berichtigt)
Markierung: 2017-Quelltext-Bearbeitung
 
Keine Bearbeitungszusammenfassung
Markierung: 2017-Quelltext-Bearbeitung
 
Zeile 1: Zeile 1:
'''Lernziele:'''
'''Lernziele:'''


*Sie kennen die Definitionen (und mathematischen Bezeichnungen) der Begriffe
*Sie kennen die Definitionen (und mathematischen Bezeichnungen) der Begriffe
**quantitatives Merkmal
**Klassenanzahl,
***metrisch diskrete Skala und
**Spannweite und
***metrisch stetige Skala,
**Klassenbreite.
**qualitatives Merkmal
*Sie können entscheiden, ob vorliegende Daten zu klassieren sind, um sie aussagekräftig darzustellen.
***Ordinalskala und
*Sie können
***Nominalskala.
**Klassenanzahlen,
*Sie können die Begriffe
**die Spannweite und
**quantitatives Merkmal mit metrisch diskreter Skala,
**Klassenbreiten im Sachzusammenhang berechnen.
**quantitatives Merkmal mit metrisch stetiger Skala,
*Sie kennen den Unterschied zwischen
**qualitatives Merkmal mit Ordinalskala
**Klassen mit gleicher Klassenbreite und
**qualitatives Merkmal mit Nominalskala
**Klassen mit unterschiedlicher Klassenbreite.
*Sie können situativ entscheiden, welche Art von Klassenbildung für die Lösung einer Aufgabe geeignet ist.


:::im Sachzusammenhang erkennen und zuordnen.
Sie kennen das alles schon? Dann geht es hier direkt zu den Übungen [[Datei:Pfeil 2.gif]] &nbsp; [[#Übungen |Übungen]]


Sie kennen das alles schon? Dann geht es hier direkt zu den Übungen [[Datei:Pfeil 2.gif]] &nbsp; [[#Übungen|Übungen]]
Man kann jede Art von Merkmalen klassieren. Das geht sogar bei qualitativen Merkmalen mit einer Nominalskala.  


Ansonsten sind Sie hier richtig.
===Beispiel Merkmal Lieblingsfarbe===
Sind zum Beispiel die Farben hellgelb, gelb, sonnengelb, rot, grün, hellblau, mittelblau, himmelblau und dunkelblau unter den Merkmalsausprägungen, so könnte man die Klassen


Um die statistische Erhebung auswerten zu können, müssen Merkmale mit ihren Merkmalsausprägungen weiter unterschieden werden.Man unterscheidet zwischen
:"'''gelb'''" mit den Merkmalsausprägungen hellgelb, gelb und sonnengelb,


::'''qualitativen''' und
:"'''blau'''" mit den Merkmalsausprägungen hellblau, mittelblau, himmelblau und dunkelblau ,
::'''quantitativen''' Merkmalen.


;Quantitative Merkmale
:"'''Andere'''" mit den verbliebenden Merkmalsausprägungen bilden.


Bei quantitativen Merkmalen lassen sich die Merkmalsausprägungen durch
Dies wird auch bei der Auswertung von Wahlergebnissen im Fernsehen gemacht, die kleineren, nicht so wichtigen Parteien werden unter "Andere" zusammengefasst.


::Zahlen oder
<!-- Ende Beispiel Merkmal Lieblingsfarbe -->
::Größenwerte


ausdrücken und in einer '''metrischen Skala''' anordnen. Mit quantitativen Merkmalen sollten einfache Rechenoperationen sinnvoll möglich sein.
Bei qualitativen Merkmalen mit einer Ordinalskala wird man immer darauf achten, dass aufeinander folgende Merkmalsausprägungen zusammengefasst werden.


Eine metrische Skala wird noch nach Art der vorkommenden Zahlen oder Größenwerte unterscheiden. Man nennt eine metrische Skala ''' metrisch diskret''', wenn nur ganze Zahlen (z. B. Personen) als Merkmalsausprägungen zugelassen sind. Können auch Dezimalzahlen als Merkmalsausprägung vorkommen, so nennt man die Skala '''metrisch stetig''' (alle Zahlen, z. B. Temperatur, Gewicht).
===Beispiel Merkmal Note Mathematikarbeit===
Betrachtet man die Noten der letzten Mathematikarbeit, so könnte man die Klassen


;Qualitative Merkmale
:"'''Leistungsträger'''" für die Merkmalsausprägungen "sehr gut" und "gut",
:"'''Mittelfeld'''" für die Merkmalsausprägungen "befriedigend" und "ausreichend" und
:"'''Blauer Brief'''" für die Merkmalsausprägungen "mangelhaft" und "ungenügend" bilden,


Qualitative Merkmale sind entweder Texte oder Zahlwerte, mit denen man aber keine sinnvollen Rechnungen ausführen kann.  
um eine knappe Übersicht über die Lerngruppe zu erhalten.


Sie werden noch einmal unterschieden in solche, bei denen die Merkmalsausprägungen in eine natürliche Reihenfolge ('''ordinale Skala''') gebracht werden können, und in jene, bei denen die Merkmalsausprägungen nicht abgestuft werden können ('''nominale Skala''').
<!-- Ende Beispiel Merkmal Note Mathematikarbeit -->


<!-- Beispiel quantitativ und qualitativ -->
Im Folgenden werden aber nur noch quantitative Merkmale betrachtet.
{| style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
 
| colspan="8" |<u>'''Beispiele:'''</u>
Nicht immer macht es Sinn, alle verschiedenen  Merkmalsausprägungen einzeln zu betrachten. Bei quantitativen Merkmalen fasst man oft verschiedene Merkmalsausprägungen zu Klassen zusammen.
#Das Merkmal "Lieblingsfarbe" kann verschiedene Merkmalsausprägungen annehmen, z. B. rot, blau, gelb, grün, ... Es handelt sich um ein qualitatives Merkmal und die verschiedenen Farben lassen sich nicht in eine natürliche Reihenfolge bringen, also handelt es sich bei der zugehörigen Skala um eine Nominalskala.
 
#Das Merkmal "Interesse am Fach Deutsch" kann die Merkmalsausprägungen "hoch", "eher hoch", "eher gering" und "gering" annehmen. Auch hier handelt es sich um ein qualitatives Merkmal, aber diesmal mit Ordinalskala, da die einzelnen Merkmalsausprägungen in eine natürliche Reihenfolge gebracht werden können.
===Beispiel Körpergröße (in cm)===
#Das Merkmal "Anzahl der Tische im Klassenraum" ist ein quantitatives Merkmal mit metrisch diskreter Skala, da es keine halben Tische gibt.
 
#Das Merkmal "Körpergröße in m" ist ein quantitatives Merkmal mit metrisch stetiger Skala, da auch Größen wie 1,88 m erfasst werden müssen.
<!-- Tabelle Körpergröße HHU5 -->
#Besonders schwierig ist es die Ausprägungen des Merkmals "Note in Mathematik" genau einzuordnen. Man könnte meinen, es handele sich um ein quantitatives Merkmal, da ja jeder Lehrer z. B. die Durchschnittsnote, die in der letzten Klassenarbeit erzielt wurde, an die Tafel schreibt, also mit den Noten rechnet. Das hat sich so eingebürgert und funktioniert auch irgendwie, ist aber mathematisch eher fragwürdig. Denn gut und sehr gut ergibt nicht befriedigend, oder? Anders bei der Anzahl von Stühlen: hat man einen Stuhl und stellt noch zwei dazu, dann hat man insgesamt drei Stühle. <br>Also handelt es sich bei dem Merkmal "Note in Mathematik" um ein qualitatives Merkmal mit Ordinalskala, da die verschiedenen Merkmalsausprägungen einer natürlichen Ordnung genügen.
<div style="float:right; margin-left:1em;">
{| class="wikitable"  
|+Urliste
! colspan="5" |Körpergröße in cm
|-
|170||178||174||188||168
|-
|191||169||159||199||200
|-
|177||178||200||193||169
|-
|151||185||191||165||158
|-
|185||188||194||180||170
|}
|}
<!-- Beispiel quantitativ und qualitativ -->
</div>
<!-- Ende Tabelle Körpergröße HHU5 -->
Betrachtet man zum Beispiel die Körpergröße (in cm) der Schüler und Schülerinnen der Klasse HHU5 am Berufskolleg Hattingen (Schuljahr 2012/2013):


<!-- Graphik Übersicht Merkmale -->
[[Datei:Uebersicht Merkmale.PNG|ohne]]
<!-- Ende Graphik Übersicht Merkmale -->
<br />
<br />
<!--
<!-- Merke Merkmalsausprägungen -->
{{Box|1=Merke|2=Man unterscheidet in
* <span style="background:yellow">quantitative Merkmale</span>, deren Merkmalsausprägungen aus Zahlen oder Größenwerten bestehen
** mit <span style="background:yellow">metrisch diskreter Skala</span> (nur ganze Zahlen)
** mit <span style="background:yellow">metrisch stetiger Skala</span> (alle Kommazahlen)
* <span style="background:yellow">qualitative Merkmale</span>, deren Merkmalausprägungen in Textform oder als Zahlwerte (ohne mögliche sinnvolle Rechenoperationen) gegeben sind
** mit <span style="background:yellow">Ordinalskala</span> (die Merkmalsausprägungen lassen sich in eine natürliche Reihenfolge bringen)
** mit <span style="background:yellow">Nominalskala</span> (die Merkmalsausprägungen haben keine Wertigkeit)|3=Merksatz}}
<!-- Ende Merke Merkmalsausprägungen -->


[[Datei:Umfrage Eisdiele Urliste.PNG|rechts|Einführung Merkmale und Merkmalsausprägungen]]
<!-- Einführungsbeispiel Teil 4 -->
{| style="color: black; background-color: #FFFAFA;border-left:solid 2px #CD0000;border-right:solid 2px #CD0000;border-top:solid 2px #CD0000;border-bottom:solid 2px #CD0000;font-size:100%;font-size:100%;"
| colspan="4" |
<u>'''Einführungsbeispiel - Teil 4'''<br /></u>


Jetzt werden die Merkmale "Alter", "Geschlecht", "Lieblingseissorte" und "Durchschnittliche Anzahl an Eiskugeln" im Hinblick auf ihre Art und die zugehörige Skala untersucht:
Wenn man hier die verschiedenen Merkmalsausprägungen mit ihren absoluten und relativen Häufigkeiten erfasst, ist noch nicht wirklich etwas gewonnen, da es 18 verschiedene Merkmalsausprägungen gibt, von denen sieben die absolute Häufigkeit 2 und alle anderen die absolute Häufigkeit 1 haben. (Der geneigte Leser mag das selber nachrechnen.)
 
Man könnte zum Beispiel die Frage "Wie viele Schüler sind größer als 175 cm und höchstens 183 cm? stellen.
 
Dann ist es sinnvoll, eine absolute Häufigkeitsverteilung mit drei verschiedenen Klassen zu bilden. Jede Klasse hat eine untere und eine obere Grenze. Wichtig ist, dass sich die Klassen nicht überschneiden, damit jeder Beobachtungswert nur genau zu einer Klasse gehört.
 
==Klasseneinteilung==
 
Klasse <math>k_1</math>:
 
:vom kleinsten Wert <math>x_{Min}</math> (hier: 151 cm) bis zu 175 cm einschließlich
::mathematische Kurzschreibweise: <math>[151;175]=]150;175]</math>
 
Klasse <math>k_2</math>:
 
:von über 175 cm  bis zu 183 cm einschließlich
::mathematische Kurzschreibweise: <math>]175;183]</math>
 
Klasse <math>k_3</math>:
 
:von über 183 cm bis zum größten Wert <math>x_{Max}</math> (hier 200 cm) einschließlich
::mathematische Kurzschreibweise: <math>]183;200]</math>
 
===Häufigkeitsverteilung bestimmen===
 
Jetzt kann man die absolute Häufigkeit <math>H(k_i)</math> zu jeder Klasse <math>k_i</math> bestimmen, indem man alle Beobachtungswerte zählt, die im Intervall der Klasse <math>k_i</math> liegen.
Dann lässt sich auch die relative Häufigkeit <math>h(k_i)</math> zu jeder Klasse <math>k_i</math> bestimmen, indem man den Anteil aller Beobachtungswerte am Stichprobenumfang <math>n</math>, die im Intervall der Klasse <math>k_i</math> liegen, berechnet.
 
<!-- Tabelle Klassierte Körpergröße HHU5 -->
<div style="float:left; margin-right:1em;">
{| class="wikitable"  
|-
|-
<!-- Tabelle Merkmal, Merkmalsausprägung -->
! colspan="5" |Klassierte Körpergrößen HHU5 2012/2013
! style="text-align:left;" |Merkmal!! style="text-align:left;" |Merkmalsausprägungen!! style="text-align:left;" |Art des Merkmals!! style="text-align:left;" |Skala
|-
|-
|Alter||0; 1; 2;...;100||quantitativ||metrisch diskrete Skala
|<math>k_i</math>||<math>150 < a_i \le 175</math>||<math>175 < a_i \le 183</math>||<math>183 < a_i \le 200</math>||'''Summe'''
|-
|-
|Geschlecht||m, w||qualitativ||Nominalskala
|<math>H(k_i)</math>||<math>10</math>||<math>4</math>||<math>11</math>||<math>25</math>
|-
|-
|Qualität der Eisdiele||sehr gut, gut, befriedigend, ausreichend, mangelhaft, ungenügend||qualitativ||Ordinalskala
|<math>h(k_i)</math>||<math>\frac{2}{5}=40 %</math>||<math>\frac{4}{25}=16 %</math>||<math>\frac{11}{25}=44 %</math>||<math>100 %</math>
|}
 
<!--  Ende Klassierte Tabelle Körpergröße HHU5 -->
</div>
 
===Interpretation===
 
Es sind also nicht nur vier Schüler größer als 175 cm und höchstens 183 cm. Es sieht so aus, als wären die Schüler der Klasse entweder klein oder groß, weil die Klasse in der Mitte so selten vertreten ist.
<br />
 
Stimmt das denn?
 
Hier ist es hilfreich, sich mit den Klassenbreiten zu beschäftigen.
 
 
 
 
===Klassenbreiten bestimmen===
Die gewählten Klassen <math>k_i</math> sind unterschiedlich breit. Die Breite <math>b_i</math> einer Klasse <math>k_i</math> errechnet man, indem man die untere Grenze <math>uG_i</math> von der oberen Grenze <math>oG_i</math> subtrahiert.
 
<!-- Tabelle Klassenbreiten -->
<div style="float:left; margin-right:1em;">
{| class="wikitable"
|-
|-
|Lieblingseis
!Klasse <math>k_i</math>!!untere Grenze <math>uG_i</math>!!obere Grenze <math>oG_i</math>!!Klassenbreite <math>b_i</math>
||Himbeere, Vanille, Erdbeere, Pfefferminz, Schokolade, Zitrone, Mango, Jogurt, Nuss||qualitativ||Nominalskala
|-
|-
|Durchschnittliche Anzahl der gegessenen Eiskugeln||1, 2, 3, 4, 5||quantitativ||metrisch diskrete Skala
|<math>k_1</math>||<math>150</math>||<math>175</math>||<math>175-150=25</math>
|-
|-
<!-- Ende Tabelle Merkmal, Merkmalsausprägung -->
|<math>k_2</math>||<math>175</math>||<math>183</math>||<math>183-175=8</math>
| colspan="4" |
|-
Betrachtet man das Merkmal "Geschlecht" so lauten die ersten Beobachtungswerte
|<math>k_3</math>||<math>183</math>||<math>200</math>||<math>200-183=17</math>
|}
</div>
<!-- Ende Klassenbreiten -->
<br>


::<math>a_1=w; a_2=w; a_3=w; a_4=w; a_5=m;</math> ...
Jetzt sieht man, dass die mittlere Klasse auch viel schmaler ist, als die beiden anderen Klassen. Die Klassenbreite hat aber Einfluss auf die Häufigkeit, mit der die Beobachtungswerte in der Klasse liegen. Deshalb wählt man in der Regel Klassen mit gleicher Klassenbreite. Nur in Ausnahmefällen machen Klassen mit unterschiedlichen Klassenbreiten Sinn. Ganz besonders gut geeignet sind unterschiedliche Klassenbreiten, wenn man schon vorher weiß, welche Aussage man mit den Daten unterstützen möchte.


Es gibt <math>n=30</math> Beobachtungswerte <math>a_i</math>, aber nur zwei verschiedene Merkmalsausprägungen <math>x_i</math>. Jetzt legt man (beliebig) fest:
Auch die obige Fragestellung hätte man prima mit gleich breiten Klassen lösen können. Dabei beginnt man dann mit dem aus der Frage vorgegebenen Intervall und bildet alle nötigen Klassen darunter und darüber mit Klassenbreite 8 cm so, dass man auch den kleinsten und den größten Beobachtungswert einer Klasse zuordnen kann.


::<math>x_1=m</math> und <math>x_2=w</math>
Das sieht dann so aus:
<!-- Tabelle Klassierte Körpergröße HHU5 -->
<div style="float:left; margin-right:1em;">
{| class="wikitable"
|-
! colspan="4" |Klassierte Körpergrößen HHU5 2012/2013
|-
!Klasse <math>k_i</math>!!Intervall!!<math>H(k_i)</math>||<math>h(k_i)</math>
|-
|<math>k_1</math>||<math>143 < a_i \le 151</math>||<math>1</math>||<math>\frac{1}{25}=4 %</math>
|-
|<math>k_2</math>||<math>151 < a_i \le 159</math>||<math>2</math>||<math>\frac{2}{25}=8 %</math>
|-
|<math>k_3</math>||<math>159 < a_i \le 167</math>||<math>1</math>||<math>\frac{1}{25}=4 %</math>
|-
|<math>k_4</math>||<math>167 < a_i \le 175</math>||<math>6</math>||<math>\frac{6}{25}=24 %</math>
|-
|<math>k_5</math>||<math>175 < a_i \le 183</math>||<math>4</math>||<math>\frac{4}{25}=16 %</math>
|-
|<math>k_6</math>||<math>183 < a_i \le 191</math>||<math>6</math>||<math>\frac{6}{25}=24 %</math>
|-
|<math>k_7</math>||<math>191 < a_i \le 199</math>||<math>3</math>||<math>\frac{3}{25}=12 %</math>
|-
|<math>k_8</math>||<math>199 < a_i \le 207</math>||<math>2</math>||<math>\frac{2}{25}=8 %</math>
|-
! colspan="2" |Summe!!<math>25</math>!!<math>100%</math>
|}
|}
<!-- Ende Einführungsbeispiel Teil 4 -->
</div>
<!-- Ende Klassierte Tabelle Körpergröße HHU5 -->
<br>
 
===Interpretation===
Man kann leicht erkennen, dass es - unter Berücksichtigung der Klassenbreite - nur zwei Klassen gibt, in denen sich mehr Beobachtungswerte befinden. So erhält  man also ein ganz anderes Bild der Verteilung.
 
<!-- Beispiel Körpergröße (in cm) -->


{{Aufgabe|
{{Box|1=Merke|2=Wenn bei einer umfangreichen Stichprobe sehr viele unterschiedliche Merkmalsausprägungen auftreten, so bietet es sich an, ähnliche Werte in sogenannte <span style="background:yellow">'''Klassen <math>k_i</math>'''</span> der <span style="background:yellow">(Klassen-)Breite <math>b_i</math></span> zusammenzufassen.|3=Merksatz}}
Sie haben Ihr Regelheft mit dem dritten Merksatz gefüllt.
<!-- Ende Merke Klassen -->
}}


==Übungen==
Man unterscheidet zwei Arten von Klassenbildungen:
{{Aufgabe|
Testen Sie Ihr Wissen und lösen Sie das Quiz. Die folgenden Aufgaben können auch mehrere richtige Antworten enthalten! }}


<div class="multiplechoice-quiz">
*:Klassen mit gleicher Klassenbreite <math>b_i=b</math>
Handelt es sich um ein qualitatives Merkmal mit Ordinalskala? (Noten in einer Klassenarbeit) (Interesse an Fußball) (!Haustier) (!Wunschtitel)(!Geschlecht) (!Hobby) (!Lieblingsfarbe) (!Beruf) (!Familienstand) (!Konfession) (!Alter in Jahren) (!Gehalt) (!Schuhgröße) (!Anzahl Sitzplätze)
*:Klassen mit unterschiedlicher Klassenbreite <math>b_i</math>


Handelt es sich um ein qualitatives Merkmal mit Nominalskala? (Haustier) (Wunschtitel)(Geschlecht) (Hobby) (Lieblingsfarbe) (Beruf) (Konfession) (!Noten in einer Klassenarbeit) (!Interesse an Fußball) (!Alter in Jahren) (!Gehalt) (!Schuhgröße) (!Anzahl Sitzplätze) (!Fruchtsaftgehalt von Apfelsaft)  
Übrigens eignen sich Klassen mit unterschiedlicher Klassenbreite hervorragend, um Daten so aufzubereiten, dass sie die gewünschte Aussage (hier entweder eine Klasse mit besonders großen Schülern oder mit besonders kleinen Schülern) gut unterstützen. Hier gilt der allseits beliebte Spruch: "Traue keiner Statistik, die du nicht selbst gefälscht hast."


Handelt es sich um ein quantitatives Merkmal mit metrisch diskreten Skala?  (Alter in Jahren) (Gehalt in vollen EUR)  (Anzahl Sitzplätze) (!Noten in einer Klassenarbeit) (!Interesse an Fußball)  (!Lieblingsfarbe) (!Beruf) (!Familienstand) (!Konfession) (!Fruchtsaftgehalt von Apfelsaft) (!Sehstärke in Dioptrien) (!Reisegeschwindigkeit bei Flugzeugen) (!Temperatur in Grad Celsius) (!Wasserpegel der Ruhr in Hattingen)
{{Aufgabe|
Sie haben Ihr Regelheft mit dem sechsten Merksatz gefüllt.
}}


Handelt es sich um ein quantitatives Merkmal mit metrisch stetigen Skala? (Fruchtsaftgehalt von Apfelsaft) (Sehstärke in Dioptrien) (Reisegeschwindigkeit bei Flugzeugen) (Temperatur in Grad Celsius) (Wasserpegel der Ruhr in Hattingen) (!Noten in einer Klassenarbeit) (!Interesse an Fußball) (!Haustier) (!Wunschtitel)(!Geschlecht) (!Hobby) (!Lieblingsfarbe) (!Beruf) (!Familienstand) (!Konfession) (!Alter in Jahren) (!Gehalt in vollen EUR) (!Anzahl Sitzplätze)
{{Fortsetzung|weiter=Klassen mit gleicher Klassenbreite|weiterlink=Beschreibende Statistik/Klassenbildung/Klassen mit gleicher Klassenbreite}}
</div>


'''Ordnen Sie die Begriffe unten den richtigen Oberbegriffen zu.'''
==Übungen==
'''Ordnen Sie die mathematischen Bezeichnungen und Formeln richtig zu.'''
<div class="zuordnungs-quiz">
<div class="zuordnungs-quiz">
{|  
{|  
|Qualitative Merkmale||Haarfarbe||Schulform||Familienstand||Lieblingsessen||Hobby||Autofarbe||Augenfarbe||Konfession||Berufswunsch||Staatsangehörigkeit
|Klassen||<math>k_i</math>||haben eine obere Grenze||haben eine untere Grenze
|-
|Klassenbreite||<math>b_i</math>||Spannweite geteilt durch Klassenanzahl||<math>\frac{R}{k}</math>||<math>b</math>
|-
|Spannweite||<math>R</math>||<math>x_{Max}-x_{Min}</math>||Differenz aus größter und kleinster Merkmalsausprägung
|-
|Klassenanzahl||<math>k</math>||<math>\sqrt{n}</math>||Wurzel aus dem Stichprobenumfang
|-
|-
|Quantitative Merkmale||Alter||Größe||Schuhgröße||Bruttoeinkommen||Preis einer Ware||Kinderzahl||Geburtsjahr||Füllmenge
|größte Merkmalsausprägung||<math>x_{Max}</math>
|-
|kleinste Merkmalsausprägung||<math>x_{Min}</math>
|}
|}
</div>
</div>


{{Fortsetzung|weiter=Absolute und Relative Häufigkeiten|weiterlink=Beschreibende Statistik/Absolute und Relative Häufigkeiten}}


{{Aufgabe|Die PurFrucht Gmbh stellt auch Orangensaft her. Ein neuer Lieferant behauptet, dass sich aus einer 250 g schweren Orange 50 ml Saft herauspressen lässt. Eine Überprüfung von gleich schweren Orangen lieferte diese Ergebnisse [ml]:
<pre>
52,5; 51,7; 52,3; 50,9; 48,8; 51,4; 48,3;
52,2; 51,4; 50,7; 50,8; 52,0; 48,4; 50,0;
51,4; 49,1; 47,5; 51,5; 48,7; 51,3; 47,9;
49,5; 49,9; 50,1; 50,2; 52,4; 52,0; 50,1;
49,9; 51,9; 48,7; 51,4; 52,4; 47,9; 51,0;
48,9; 50,2; 48,0; 51,5; 49,8; 49,1; 48,4;
51,7; 51,1; 51,2; 51,5; 48,3; 51,5; 51,1
</pre>
Klassieren Sie die Daten und stellen Sie die absoluten und relativen Häufigkeitsverteilung auf und geben Sie an, was in diesem Fall Merkmalsträger, Merkmal und Merkmalsausprägung ist.
Entscheiden Sie begründet, ob der Lieferant vertrauenswürdig ist.
}}
{{Aufgabe|
Sie haben die Aufgaben erfolgreich gelöst?
Hier geht's weiter.  [[Datei:Pfeil 2.gif]] &nbsp; [[../../Lernpfad zur Beschreibenden Statistik|Startseite des Lernpfads]]
}}
{{Fortsetzung|weiter=Klassen mit gleicher Klassenbreite|weiterlink=Beschreibende Statistik/Klassenbildung/Klassen mit gleicher Klassenbreite}}


{{Beschreibende Statistik}}
{{Beschreibende Statistik}}

Aktuelle Version vom 14. Oktober 2022, 06:29 Uhr

Lernziele:

  • Sie kennen die Definitionen (und mathematischen Bezeichnungen) der Begriffe
    • Klassenanzahl,
    • Spannweite und
    • Klassenbreite.
  • Sie können entscheiden, ob vorliegende Daten zu klassieren sind, um sie aussagekräftig darzustellen.
  • Sie können
    • Klassenanzahlen,
    • die Spannweite und
    • Klassenbreiten im Sachzusammenhang berechnen.
  • Sie kennen den Unterschied zwischen
    • Klassen mit gleicher Klassenbreite und
    • Klassen mit unterschiedlicher Klassenbreite.
  • Sie können situativ entscheiden, welche Art von Klassenbildung für die Lösung einer Aufgabe geeignet ist.

Sie kennen das alles schon? Dann geht es hier direkt zu den Übungen Pfeil 2.gif   Übungen

Man kann jede Art von Merkmalen klassieren. Das geht sogar bei qualitativen Merkmalen mit einer Nominalskala.

Beispiel Merkmal Lieblingsfarbe

Sind zum Beispiel die Farben hellgelb, gelb, sonnengelb, rot, grün, hellblau, mittelblau, himmelblau und dunkelblau unter den Merkmalsausprägungen, so könnte man die Klassen

"gelb" mit den Merkmalsausprägungen hellgelb, gelb und sonnengelb,
"blau" mit den Merkmalsausprägungen hellblau, mittelblau, himmelblau und dunkelblau ,
"Andere" mit den verbliebenden Merkmalsausprägungen bilden.

Dies wird auch bei der Auswertung von Wahlergebnissen im Fernsehen gemacht, die kleineren, nicht so wichtigen Parteien werden unter "Andere" zusammengefasst.


Bei qualitativen Merkmalen mit einer Ordinalskala wird man immer darauf achten, dass aufeinander folgende Merkmalsausprägungen zusammengefasst werden.

Beispiel Merkmal Note Mathematikarbeit

Betrachtet man die Noten der letzten Mathematikarbeit, so könnte man die Klassen

"Leistungsträger" für die Merkmalsausprägungen "sehr gut" und "gut",
"Mittelfeld" für die Merkmalsausprägungen "befriedigend" und "ausreichend" und
"Blauer Brief" für die Merkmalsausprägungen "mangelhaft" und "ungenügend" bilden,

um eine knappe Übersicht über die Lerngruppe zu erhalten.


Im Folgenden werden aber nur noch quantitative Merkmale betrachtet.

Nicht immer macht es Sinn, alle verschiedenen Merkmalsausprägungen einzeln zu betrachten. Bei quantitativen Merkmalen fasst man oft verschiedene Merkmalsausprägungen zu Klassen zusammen.

Beispiel Körpergröße (in cm)

Urliste
Körpergröße in cm
170 178 174 188 168
191 169 159 199 200
177 178 200 193 169
151 185 191 165 158
185 188 194 180 170

Betrachtet man zum Beispiel die Körpergröße (in cm) der Schüler und Schülerinnen der Klasse HHU5 am Berufskolleg Hattingen (Schuljahr 2012/2013):


Wenn man hier die verschiedenen Merkmalsausprägungen mit ihren absoluten und relativen Häufigkeiten erfasst, ist noch nicht wirklich etwas gewonnen, da es 18 verschiedene Merkmalsausprägungen gibt, von denen sieben die absolute Häufigkeit 2 und alle anderen die absolute Häufigkeit 1 haben. (Der geneigte Leser mag das selber nachrechnen.)

Man könnte zum Beispiel die Frage "Wie viele Schüler sind größer als 175 cm und höchstens 183 cm? stellen.

Dann ist es sinnvoll, eine absolute Häufigkeitsverteilung mit drei verschiedenen Klassen zu bilden. Jede Klasse hat eine untere und eine obere Grenze. Wichtig ist, dass sich die Klassen nicht überschneiden, damit jeder Beobachtungswert nur genau zu einer Klasse gehört.

Klasseneinteilung

Klasse :

vom kleinsten Wert (hier: 151 cm) bis zu 175 cm einschließlich
mathematische Kurzschreibweise:

Klasse :

von über 175 cm bis zu 183 cm einschließlich
mathematische Kurzschreibweise:

Klasse :

von über 183 cm bis zum größten Wert (hier 200 cm) einschließlich
mathematische Kurzschreibweise:

Häufigkeitsverteilung bestimmen

Jetzt kann man die absolute Häufigkeit zu jeder Klasse bestimmen, indem man alle Beobachtungswerte zählt, die im Intervall der Klasse liegen. Dann lässt sich auch die relative Häufigkeit zu jeder Klasse bestimmen, indem man den Anteil aller Beobachtungswerte am Stichprobenumfang , die im Intervall der Klasse liegen, berechnet.

Klassierte Körpergrößen HHU5 2012/2013
Summe
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{2}{5}=40 %} Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{4}{25}=16 %} Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{11}{25}=44 %} Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 100 %}

Interpretation

Es sind also nicht nur vier Schüler größer als 175 cm und höchstens 183 cm. Es sieht so aus, als wären die Schüler der Klasse entweder klein oder groß, weil die Klasse in der Mitte so selten vertreten ist.

Stimmt das denn?

Hier ist es hilfreich, sich mit den Klassenbreiten zu beschäftigen.



Klassenbreiten bestimmen

Die gewählten Klassen sind unterschiedlich breit. Die Breite einer Klasse errechnet man, indem man die untere Grenze von der oberen Grenze subtrahiert.

Klasse untere Grenze obere Grenze Klassenbreite


Jetzt sieht man, dass die mittlere Klasse auch viel schmaler ist, als die beiden anderen Klassen. Die Klassenbreite hat aber Einfluss auf die Häufigkeit, mit der die Beobachtungswerte in der Klasse liegen. Deshalb wählt man in der Regel Klassen mit gleicher Klassenbreite. Nur in Ausnahmefällen machen Klassen mit unterschiedlichen Klassenbreiten Sinn. Ganz besonders gut geeignet sind unterschiedliche Klassenbreiten, wenn man schon vorher weiß, welche Aussage man mit den Daten unterstützen möchte.

Auch die obige Fragestellung hätte man prima mit gleich breiten Klassen lösen können. Dabei beginnt man dann mit dem aus der Frage vorgegebenen Intervall und bildet alle nötigen Klassen darunter und darüber mit Klassenbreite 8 cm so, dass man auch den kleinsten und den größten Beobachtungswert einer Klasse zuordnen kann.

Das sieht dann so aus:

Klassierte Körpergrößen HHU5 2012/2013
Klasse Intervall
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{1}{25}=4 %}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{2}{25}=8 %}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{1}{25}=4 %}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{6}{25}=24 %}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{4}{25}=16 %}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{6}{25}=24 %}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{3}{25}=12 %}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{2}{25}=8 %}
Summe Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 100%}


Interpretation

Man kann leicht erkennen, dass es - unter Berücksichtigung der Klassenbreite - nur zwei Klassen gibt, in denen sich mehr Beobachtungswerte befinden. So erhält man also ein ganz anderes Bild der Verteilung.


Merke
Wenn bei einer umfangreichen Stichprobe sehr viele unterschiedliche Merkmalsausprägungen auftreten, so bietet es sich an, ähnliche Werte in sogenannte Klassen der (Klassen-)Breite zusammenzufassen.

Man unterscheidet zwei Arten von Klassenbildungen:

  • Klassen mit gleicher Klassenbreite
    Klassen mit unterschiedlicher Klassenbreite

Übrigens eignen sich Klassen mit unterschiedlicher Klassenbreite hervorragend, um Daten so aufzubereiten, dass sie die gewünschte Aussage (hier entweder eine Klasse mit besonders großen Schülern oder mit besonders kleinen Schülern) gut unterstützen. Hier gilt der allseits beliebte Spruch: "Traue keiner Statistik, die du nicht selbst gefälscht hast."


Aufgabe

Sie haben Ihr Regelheft mit dem sechsten Merksatz gefüllt.

Übungen

Ordnen Sie die mathematischen Bezeichnungen und Formeln richtig zu.

Klassen haben eine obere Grenze haben eine untere Grenze
Klassenbreite Spannweite geteilt durch Klassenanzahl
Spannweite Differenz aus größter und kleinster Merkmalsausprägung
Klassenanzahl Wurzel aus dem Stichprobenumfang
größte Merkmalsausprägung
kleinste Merkmalsausprägung


Aufgabe

Die PurFrucht Gmbh stellt auch Orangensaft her. Ein neuer Lieferant behauptet, dass sich aus einer 250 g schweren Orange 50 ml Saft herauspressen lässt. Eine Überprüfung von gleich schweren Orangen lieferte diese Ergebnisse [ml]:

52,5;	51,7;	52,3;	50,9;	48,8;	51,4;	48,3;
52,2;	51,4;	50,7;	50,8;	52,0;	48,4;	50,0;
51,4;	49,1;	47,5;	51,5;	48,7;	51,3;	47,9;
49,5;	49,9;	50,1;	50,2;	52,4;	52,0;	50,1;
49,9;	51,9;	48,7;	51,4;	52,4;	47,9;	51,0;
48,9;	50,2;	48,0;	51,5;	49,8;	49,1;	48,4;
51,7;	51,1;	51,2;	51,5;	48,3;	51,5;	51,1

Klassieren Sie die Daten und stellen Sie die absoluten und relativen Häufigkeitsverteilung auf und geben Sie an, was in diesem Fall Merkmalsträger, Merkmal und Merkmalsausprägung ist.

Entscheiden Sie begründet, ob der Lieferant vertrauenswürdig ist.


Aufgabe

Sie haben die Aufgaben erfolgreich gelöst?

Hier geht's weiter. Pfeil 2.gif   [[../../Lernpfad zur Beschreibenden Statistik|Startseite des Lernpfads]]


Estatística ícone.svg

Lernpfad Beschreibende Statistik

  1. Grundbegriffe
  2. Graphische Darstellungen von Häufigkeitsverteilungen
  3. Lagemaße
    (arithmetisches Mittel, Modus, Median)
  4. Streuungsmaße
    (mittlere absolute Abweichung, mittlere quadratische Abweichung, Standardabweichung)
  5. Einsatz des Taschenrechners
    (Bedienung Casio fx-991DE PLUS)