Beschreibende Statistik/Klassenbildung und Beschreibende Statistik/Klassenbildung/Klassen mit gleicher Klassenbreite: Unterschied zwischen den Seiten

Aus ZUM-Unterrichten
< Beschreibende Statistik(Unterschied zwischen Seiten)
Keine Bearbeitungszusammenfassung
Markierung: 2017-Quelltext-Bearbeitung
 
(Wurzel n in der Tabelle berichtigt)
Markierung: 2017-Quelltext-Bearbeitung
 
Zeile 1: Zeile 1:
'''Lernziele:'''
Für die <span style="background:yellow">Anzahl der Klassen</span> gilt die folgende Regel, <br />
wobei <math>n</math> der Stichprobenumfang ist:  


*Sie kennen die Definitionen (und mathematischen Bezeichnungen) der Begriffe
::<math>k \approx \sqrt{n}</math>
**Klassenanzahl,
**Spannweite und
**Klassenbreite.
*Sie können entscheiden, ob vorliegende Daten zu klassieren sind, um sie aussagekräftig darzustellen.
*Sie können
**Klassenanzahlen,
**die Spannweite und
**Klassenbreiten im Sachzusammenhang berechnen.
*Sie kennen den Unterschied zwischen
**Klassen mit gleicher Klassenbreite und
**Klassen mit unterschiedlicher Klassenbreite.
*Sie können situativ entscheiden, welche Art von Klassenbildung für die Lösung einer Aufgabe geeignet ist.


Sie kennen das alles schon? Dann geht es hier direkt zu den Übungen [[Datei:Pfeil 2.gif]] &nbsp; [[#Übungen |Übungen]]


Man kann jede Art von Merkmalen klassieren. Das geht sogar bei qualitativen Merkmalen mit einer Nominalskala.
==Fortsetzung Beispiel Körpergröße (in cm)==


===Beispiel Merkmal Lieblingsfarbe===
Im Beispiel ist
Sind zum Beispiel die Farben hellgelb, gelb, sonnengelb, rot, grün, hellblau, mittelblau, himmelblau und dunkelblau unter den Merkmalsausprägungen, so könnte man die Klassen


:"'''gelb'''" mit den Merkmalsausprägungen hellgelb, gelb und sonnengelb,
::<math>n=25</math>.


:"'''blau'''" mit den Merkmalsausprägungen hellblau, mittelblau, himmelblau und dunkelblau ,
Also gilt für die Anzahl der Klassen


:"'''Andere'''" mit den verbliebenden Merkmalsausprägungen bilden.
::<math>k \approx \sqrt{25}=5</math>.


Dies wird auch bei der Auswertung von Wahlergebnissen im Fernsehen gemacht, die kleineren, nicht so wichtigen Parteien werden unter "Andere" zusammengefasst.


<!-- Ende Beispiel Merkmal Lieblingsfarbe -->
Eine Klasse ist ein Teil der <span style="background:yellow">Spannweite <math>R</math></span> (<math>R</math> für Range,dem englischen Begriff für Spannweite), also ein Teil der Differenz zwischen der größten Merkmalsausprägung <math>x_{max}</math> und der kleinsten Merkmalsausprägung <math>x_{min}</math>.
<br />


Bei qualitativen Merkmalen mit einer Ordinalskala wird man immer darauf achten, dass aufeinander folgende Merkmalsausprägungen zusammengefasst werden.
===Fortsetzung Beispiel Körpergröße (in cm)===


===Beispiel Merkmal Note Mathematikarbeit===
Im Beispiel ist 
Betrachtet man die Noten der letzten Mathematikarbeit, so könnte man die Klassen


:"'''Leistungsträger'''" für die Merkmalsausprägungen "sehr gut" und "gut",
::<math>x_{max}=200</math>  und
:"'''Mittelfeld'''" für die Merkmalsausprägungen "befriedigend" und "ausreichend" und
::<math>x_{min}=151</math> ,
:"'''Blauer Brief'''" für die Merkmalsausprägungen "mangelhaft" und "ungenügend" bilden,


um eine knappe Übersicht über die Lerngruppe zu erhalten.
somit gilt für die Spannweite


<!-- Ende Beispiel Merkmal Note Mathematikarbeit -->
::<math>R=x_{max}-x_{min}=200-151=49</math>.


Im Folgenden werden aber nur noch quantitative Merkmale betrachtet.
<!-- Ende Fortsetzung 2 Beispiel Körpergröße (in cm) -->


Nicht immer macht es Sinn, alle verschiedenen  Merkmalsausprägungen einzeln zu betrachten. Bei quantitativen Merkmalen fasst man oft verschiedene Merkmalsausprägungen zu Klassen zusammen.


===Beispiel Körpergröße (in cm)===
Die <span style="background:yellow">Klassenbreite <math>b</math></span> ist der Quotient aus Spannweite und Klassenanzahl.


<!-- Tabelle Körpergröße HHU5 -->
<div style="float:right; margin-left:1em;">
{| class="wikitable"
|+Urliste
! colspan="5" |Körpergröße in cm
|-
|170||178||174||188||168
|-
|191||169||159||199||200
|-
|177||178||200||193||169
|-
|151||185||191||165||158
|-
|185||188||194||180||170
|}
</div>
<!--  Ende Tabelle Körpergröße HHU5 -->
Betrachtet man zum Beispiel die Körpergröße (in cm) der Schüler und Schülerinnen der Klasse HHU5 am Berufskolleg Hattingen (Schuljahr 2012/2013):


===Fortsetzung Beispiel Körpergröße (in cm)===


Im Beispiel ist die Klassenbreite also
<math>b=\frac{Spannweite} {Anzahl der Klassen}=\frac{49} {5}=9,8 \approx 10</math>.
|}
<!-- Ende Fortsetzung 3 Beispiel Körpergröße (in cm) -->
<br />


Wenn man hier die verschiedenen Merkmalsausprägungen mit ihren absoluten und relativen Häufigkeiten erfasst, ist noch nicht wirklich etwas gewonnen, da es 18 verschiedene Merkmalsausprägungen gibt, von denen sieben die absolute Häufigkeit 2 und alle anderen die absolute Häufigkeit 1 haben. (Der geneigte Leser mag das selber nachrechnen.)
Bei der Zuordnung der Merkmalsausprägungen ist darauf zu achten, dass sich die Klassen nicht überschneiden. Sonst könnte es passieren, dass eine Merkmalsausprägung zwei Klassen zugeordnet wird.


Man könnte zum Beispiel die Frage "Wie viele Schüler sind größer als 175 cm und höchstens 183 cm? stellen.
Beachten Sie:
Wählen Sie einen geeigneten Startwert als untere Klassengrenze (die in der Regel nicht zur Klasse gehören sollte) der ersten Klasse, addieren Sie die Klassenbreite um die obere Klassengrenze (diese gehört zur Klasse) zu erhalten.


Dann ist es sinnvoll, eine absolute Häufigkeitsverteilung mit drei verschiedenen Klassen zu bilden. Jede Klasse hat eine untere und eine obere Grenze. Wichtig ist, dass sich die Klassen nicht überschneiden, damit jeder Beobachtungswert nur genau zu einer Klasse gehört.
Die obere Klassengrenze der vorangegangenen Klasse wird die untere Grenze der nächsten Klasse.


==Klasseneinteilung==
Und so fährt man fort, bis alle Klassen definiert sind.
<br />


Klasse <math>k_1</math>:
<!-- Merke Klassen,Klassenanzahl, Spannweite, Klassenbreite -->
{{Merke|Die einzelnen <span style="background:yellow">Klassen</span> bezeichnet man mit <math>k_i</math>, wobei <math>i=</math> <math>1;2;\dots;k-1;k</math> gilt.


:vom kleinsten Wert <math>x_{Min}</math> (hier: 151 cm) bis zu 175 cm einschließlich
<span style="background:yellow">Klassenanzahl</span>:  
::mathematische Kurzschreibweise: <math>[151;175]=]150;175]</math>
:: <math>k \approx \sqrt{n}</math>


Klasse <math>k_2</math>:
<span style="background:yellow">Spannweite</span>:
:: <math>R= x_{max}-x_{min}</math>


:von über 175 cm  bis zu 183 cm einschließlich
<span style="background:yellow">Klassenbreite</span>:  
::mathematische Kurzschreibweise: <math>]175;183]</math>
:: <math>b=\frac{Spannweite}{Anzahl der Klassen}=\frac{R}{k}</math>}}
<!-- Ende Merke Klassenanzahl, Spannweite, Klassenbreite -->


Klasse <math>k_3</math>:


:von über 183 cm bis zum größten Wert <math>x_{Max}</math> (hier 200 cm) einschließlich
===Fortsetzung Beispiel Körpergröße (in cm)===
::mathematische Kurzschreibweise: <math>]183;200]</math>


===Häufigkeitsverteilung bestimmen===
Man bestimmt nun die fünf Klassen der Breite 10 und beachtet dabei, dass die Klassen sich nicht überschneiden dürfen.
 
Dann bestimmt man die absoluten Häufigkeiten der einzelnen  Klassen, dabei werden alle Merkmalsausprägungen gezählt, die zu der jeweiligen Klasse gehören.
Jetzt kann man die absolute Häufigkeit <math>H(k_i)</math> zu jeder Klasse <math>k_i</math> bestimmen, indem man alle Beobachtungswerte zählt, die im Intervall der Klasse <math>k_i</math> liegen.
Dann berechnet man die relativen Häufigkeiten der einzelnen Klassen.
Dann lässt sich auch die relative Häufigkeit <math>h(k_i)</math> zu jeder Klasse <math>k_i</math> bestimmen, indem man den Anteil aller Beobachtungswerte am Stichprobenumfang <math>n</math>, die im Intervall der Klasse <math>k_i</math> liegen, berechnet.


<!-- Tabelle Klassierte Körpergröße HHU5 -->
<!-- Tabelle Klassierte Körpergröße HHU5 -->
Zeile 105: Zeile 78:
{| class="wikitable"  
{| class="wikitable"  
|-
|-
! colspan="5" |Klassierte Körpergrößen HHU5 2012/2013
! colspan="7" |Klassierte Körpergrößen HHU5 2012/2013
|-
|-
|<math>k_i</math>||<math>150 < a_i \le 175</math>||<math>175 < a_i \le 183</math>||<math>183 < a_i \le 200</math>||'''Summe'''
|<math>k_i</math>
||<math>150 < a_i \le 160</math>||<math>160 < a_i \le 170</math>||<math>170 < a_i \le 180</math>||<math>180 < a_i \le 190</math>||<math>190 < a_i \le 200</math>||Summe
|-
|-
|<math>H(k_i)</math>||<math>10</math>||<math>4</math>||<math>11</math>||<math>25</math>
|<math>H(k_i)</math>||3||6||5||4||7||25
|-
|-
|<math>h(k_i)</math>||<math>\frac{2}{5}=40 %</math>||<math>\frac{4}{25}=16 %</math>||<math>\frac{11}{25}=44 %</math>||<math>100 %</math>
|<math>h(k_i)</math>||12 %||24 %||20 %||16 %||28 %||100 %
|}
|}
 
</div>
<!--  Ende Klassierte Tabelle Körpergröße HHU5 -->
<!--  Ende Klassierte Tabelle Körpergröße HHU5 -->
</div>


===Interpretation===


Es sind also nicht nur vier Schüler größer als 175 cm und höchstens 183 cm. Es sieht so aus, als wären die Schüler der Klasse entweder klein oder groß, weil die Klasse in der Mitte so selten vertreten ist.
Diese Darstellung ist zunächst eher objektiv und der Leser der Tabelle wird nicht in die Irre geleitet. Festzuhalten ist, das es sich um eine Klasse mit eher großen Schülern handelt.
<br />
|}
<!-- Ende Fortsetzung 4 Beispiel Körpergröße (in cm) -->


Stimmt das denn?


Hier ist es hilfreich, sich mit den Klassenbreiten zu beschäftigen.
===Einführungsbeispiel - Teil 6.1===


Bei der Umfrage der Eisdiele "Rabe" weist das Merkmal "Alter" sehr viele verschiedene Merkmalsausprägungen (genau 28 verschiedene Merkmalsausprägungen) auf, so dass eine Aufbereitung nach absoluten oder relativen Häufigkeitsverteilungen nicht zu mehr Übersicht beitragen würde. Hier bietet es sich an, Klassen zu bilden, um die Altersstruktur der Kunden besser zu verstehen.


 
<!-- Tabelle Berechnung der notwendigen Größen -->
 
===Klassenbreiten bestimmen===
Die gewählten Klassen <math>k_i</math> sind unterschiedlich breit. Die Breite <math>b_i</math> einer Klasse <math>k_i</math> errechnet man, indem man die untere Grenze <math>uG_i</math> von der oberen Grenze <math>oG_i</math> subtrahiert.
 
<!-- Tabelle Klassenbreiten -->
<div style="float:left; margin-right:1em;">
<div style="float:left; margin-right:1em;">
{| class="wikitable"  
{| class="wikitable"  
! style="text-align:left;" |Größe!! style="text-align:left;" |Formel!! style="text-align:left;" |im Beispiel mit!! style="text-align:left;" |Einsetzen und Berechnen
|-
|-
!Klasse <math>k_i</math>!!untere Grenze <math>uG_i</math>!!obere Grenze <math>oG_i</math>!!Klassenbreite <math>b_i</math>
|Klassenanzahl||<math>k \approx \sqrt{n} </math>||<math>n=30</math>||<math>k \approx \sqrt{30}</math><math>\approx 5,8\approx 6</math>
|-
|-
|<math>k_1</math>||<math>150</math>||<math>175</math>||<math>175-150=25</math>
|Spannweite||<math>R=</math><math>x_{max}-x_{min}</math>||<math>x_{max}=75</math> und <math>x_{min}=4</math>||<math>R=</math><math>75-4=71</math>
|-
|-
|<math>k_2</math>||<math>175</math>||<math>183</math>||<math>183-175=8</math>
|Klassenbreite||<math>b=\frac{R}{k}</math>||<math>R=71</math> und <math>k=6</math>||<math>b=\frac{71}{\sqrt{30}}</math><math> \approx 13</math>
|-
|<math>k_3</math>||<math>183</math>||<math>200</math>||<math>200-183=17</math>
|}
|}
</div>
</div>
<!-- Ende Klassenbreiten -->
<!-- Ende Tabelle Berechnung der notwendigen Größen -->
<br>
|-
|colspan="6" |Jetzt geht es an die '''Klassenbildung''':
 
Legt man fest, dass die '''untere Grenze''' selbst nicht zur Klasse gehört, aber die '''obere Grenze''' der Klasse dazugehört, so hat man sichergestellt, dass die Beobachtungswerte den Klassen eindeutig zugeordnet werden können.
 
Dann wählt man einen '''Startwert''' für die untere Grenze der ersten Klasse <math>k_1</math> und addiert dann für die obere Klassengrenze die Klassenbreite zum Startwert. Die jeweils nächste Klasse hat dann als untere Grenze die obere Grenze der vorangegangenen Klasse.
 
Wählt man den Startwert <math>0</math>, so erhält man die Klassen <math>k_i</math> mit <math>i=1;2;3;4;5;6</math>:
 
::<math>k_1=]0;13], k_2=]13;26], k_3=]26;39],</math>
::<math>k_1=]39;52], k_2=]52;65], k_3=]65;78]</math>


Jetzt sieht man, dass die mittlere Klasse auch viel schmaler ist, als die beiden anderen Klassen. Die Klassenbreite hat aber Einfluss auf die Häufigkeit, mit der die Beobachtungswerte in der Klasse liegen. Deshalb wählt man in der Regel Klassen mit gleicher Klassenbreite. Nur in Ausnahmefällen machen Klassen mit unterschiedlichen Klassenbreiten Sinn. Ganz besonders gut geeignet sind unterschiedliche Klassenbreiten, wenn man schon vorher weiß, welche Aussage man mit den Daten unterstützen möchte.


Auch die obige Fragestellung hätte man prima mit gleich breiten Klassen lösen können. Dabei beginnt man dann mit dem aus der Frage vorgegebenen Intervall und bildet alle nötigen Klassen darunter und darüber mit Klassenbreite 8 cm so, dass man auch den kleinsten und den größten Beobachtungswert einer Klasse zuordnen kann.
===Einführungsbeispiel - Teil 6.2===


Das sieht dann so aus:
Jetzt muss die absolute Häufigkeit ermittelt werden, mit der die Beobachtungswerte in den einzelnen Klassen liegen:
<!-- Tabelle Klassierte Körpergröße HHU5 -->
 
<!-- Tabelle Klassenbildung 1 -->
<div style="float:left; margin-right:1em;">
<div style="float:left; margin-right:1em;">
{| class="wikitable"  
{| class="wikitable"  
! colspan="3" |Klassen!! colspan="3" |Häufigkeiten
|-
|-
! colspan="4" |Klassierte Körpergrößen HHU5 2012/2013
|'''Klasse <math>k_i</math>'''||'''über ... Jahre'''||'''bis zu ... Jahre'''||'''<math>H(k_i)</math>'''||'''<math>h(k_i)</math>'''||'''<math>h(k_i)</math> in Prozent'''
|-
!Klasse <math>k_i</math>!!Intervall!!<math>H(k_i)</math>||<math>h(k_i)</math>
|-
|<math>k_1</math>||<math>143 < a_i \le 151</math>||<math>1</math>||<math>\frac{1}{25}=4 %</math>
|-
|<math>k_2</math>||<math>151 < a_i \le 159</math>||<math>2</math>||<math>\frac{2}{25}=8 %</math>
|-
|-
|<math>k_3</math>||<math>159 < a_i \le 167</math>||<math>1</math>||<math>\frac{1}{25}=4 %</math>
|<math>k_1</math>||<math>0</math>||<math>13</math>||<math>5</math>||<math>\frac{1}{6}</math>||<math>16,7%</math>
|-
|-
|<math>k_4</math>||<math>167 < a_i \le 175</math>||<math>6</math>||<math>\frac{6}{25}=24 %</math>
|<math>k_2</math>||<math>13</math>||<math>26</math>||<math>11</math>||<math>\frac{11}{30}</math>||<math>36,7%</math>
|-
|-
|<math>k_5</math>||<math>175 < a_i \le 183</math>||<math>4</math>||<math>\frac{4}{25}=16 %</math>
|<math>k_3</math>||<math>26</math>||<math>39</math>||<math>4</math>||<math>\frac{2}{15}</math>||<math>13,3%</math>
|-
|-
|<math>k_6</math>||<math>183 < a_i \le 191</math>||<math>6</math>||<math>\frac{6}{25}=24 %</math>
|<math>k_4</math>||<math>39</math>||<math>52</math>||<math>4</math>||<math>\frac{2}{15}</math>||<math>13,3%</math>
|-
|-
|<math>k_7</math>||<math>191 < a_i \le 199</math>||<math>3</math>||<math>\frac{3}{25}=12 %</math>
|<math>k_5</math>||<math>52</math>||<math>65</math>||<math>3</math>||<math>\frac{1}{10}</math>||<math>10,0%</math>
|-
|-
|<math>k_8</math>||<math>199 < a_i \le 207</math>||<math>2</math>||<math>\frac{2}{25}=8 %</math>
|<math>k_6</math>||<math>65</math>||<math>78</math>||<math>3</math>||<math>\frac{1}{10}</math>||<math>10,0%</math>
|-
|-
! colspan="2" |Summe!!<math>25</math>!!<math>100%</math>
! colspan="3" |Summe|| align="left" |<math>100</math>|| align="left" |<math>1</math>|| align="left" |<math>100%</math>
|}
|}
</div>
</div>
<!-- Ende Klassierte Tabelle Körpergröße HHU5 -->
<!-- Ende Tabelle Klassenbildung 1 -->
<br>


===Interpretation===
'''Interpretation'''
Man kann leicht erkennen, dass es - unter Berücksichtigung der Klassenbreite - nur zwei Klassen gibt, in denen sich mehr Beobachtungswerte befinden. So erhält  man also ein ganz anderes Bild der Verteilung.


<!-- Beispiel Körpergröße (in cm) -->
Auffällig ist, dass mehr als ein Drittel aller Kunden zwischen 13 und 26 Jahren alt sind. Der Besitzer der Eisdiele könnte hieraus zum Beispiel ableiten, dass er mehr Angebote für die anderen Altersklassen anbieten sollte, um auch für diese Gruppen attraktiv zu sein und so mehr Umsatz zu erzielen.


{{Box|1=Merke|2=Wenn bei einer umfangreichen Stichprobe sehr viele unterschiedliche Merkmalsausprägungen auftreten, so bietet es sich an, ähnliche Werte in sogenannte <span style="background:yellow">'''Klassen <math>k_i</math>'''</span> der <span style="background:yellow">(Klassen-)Breite <math>b_i</math></span> zusammenzufassen.|3=Merksatz}}
'''Ausblick'''
<!-- Ende Merke Klassen -->


Man unterscheidet zwei Arten von Klassenbildungen:
Selbstverständlich wäre es auch möglich, eine andere Klassenanzahl zu wählen und so zu anderen Ergebnissen zu gelangen. Es ist nicht zwingend, die obigen Formeln für die Klassenanzahl und Klassenbreite zu wählen. Sie bieten aber einen guten Anhaltspunkt für eine erste Auswertung.


*:Klassen mit gleicher Klassenbreite <math>b_i=b</math>
Hier noch eine weitere Auswertung mit 8 Klassen und einer Klassenbreite von 10.
*:Klassen mit unterschiedlicher Klassenbreite <math>b_i</math>


Übrigens eignen sich Klassen mit unterschiedlicher Klassenbreite hervorragend, um Daten so aufzubereiten, dass sie die gewünschte Aussage (hier entweder eine Klasse mit besonders großen Schülern oder mit besonders kleinen Schülern) gut unterstützen. Hier gilt der allseits beliebte Spruch: "Traue keiner Statistik, die du nicht selbst gefälscht hast."


{{Aufgabe|
<!-- Tabelle Klassenbildung 2 -->
Sie haben Ihr Regelheft mit dem sechsten Merksatz gefüllt.
<div style="float:left; margin-right:1em;">
}}
{| class="wikitable"
 
! colspan="3" |Klassen!! colspan="3" |Häufigkeiten
{{Fortsetzung|weiter=Klassen mit gleicher Klassenbreite|weiterlink=Beschreibende Statistik/Klassenbildung/Klassen mit gleicher Klassenbreite}}
|-
 
|'''Klasse <math>k_i</math>'''||'''über ... Jahre'''||'''bis zu ... Jahre'''||'''<math>H(k_i)</math>'''||'''<math>h(k_i)</math>'''||'''<math>h(k_i)</math> in Prozent'''
==Übungen==
|-
'''Ordnen Sie die mathematischen Bezeichnungen und Formeln richtig zu.'''
|<math>k_1</math>||<math>0</math>||<math>10</math>||<math>2</math>||<math>\frac{1}{6}</math>||<math>6,7%</math>
<div class="zuordnungs-quiz">
|-
{|  
|<math>k_2</math>||<math>10</math>||<math>20</math>||<math>10</math>||<math>\frac{1}{3}</math>||<math>33,3%</math>
|Klassen||<math>k_i</math>||haben eine obere Grenze||haben eine untere Grenze
|-
|<math>k_3</math>||<math>20</math>||<math>30</math>||<math>4</math>||<math>\frac{2}{15}</math>||<math>13,3%</math>
|-
|<math>k_4</math>||<math>30</math>||<math>40</math>||<math>5</math>||<math>\frac{1}{6}</math>||<math>16,7%</math>
|-
|-
|Klassenbreite||<math>b_i</math>||Spannweite geteilt durch Klassenanzahl||<math>\frac{R}{k}</math>||<math>b</math>
|<math>k_5</math>||<math>40</math>||<math>50</math>||<math>2</math>||<math>\frac{1}{15}</math>||<math>6,7%</math>
|-
|-
|Spannweite||<math>R</math>||<math>x_{Max}-x_{Min}</math>||Differenz aus größter und kleinster Merkmalsausprägung
|<math>k_6</math>||<math>50</math>||<math>60</math>||<math>3</math>||<math>\frac{1}{10}</math>||<math>10,0%</math>
|-
|-
|Klassenanzahl||<math>k</math>||<math>\sqrt{n}</math>||Wurzel aus dem Stichprobenumfang
|<math>k_7</math>||<math>60</math>||<math>70</math>||<math>3</math>||<math>\frac{1}{10}</math>||<math>10,0%</math>
|-
|-
|größte Merkmalsausprägung||<math>x_{Max}</math>
|<math>k_8</math>||<math>70</math>||<math>80</math>||<math>1</math>||<math>\frac{1}{30}</math>||<math>3,3%</math>
|-
|-
|kleinste Merkmalsausprägung||<math>x_{Min}</math>
! colspan="3" |Summe|| align="left" |<math>100</math>|| align="left" |<math>1</math>|| align="left" |<math>100%</math>
|}
|}
</div>
</div>
<!-- Ende Tabelle Klassenbildung 2 -->


 
<!--  Ende Einführungsbeispiel - Teil 6 -->
{{Aufgabe|Die PurFrucht Gmbh stellt auch Orangensaft her. Ein neuer Lieferant behauptet, dass sich aus einer 250 g schweren Orange 50 ml Saft herauspressen lässt. Eine Überprüfung von gleich schweren Orangen lieferte diese Ergebnisse [ml]:
{{clear}}
<pre>
52,5; 51,7; 52,3; 50,9; 48,8; 51,4; 48,3;
52,2; 51,4; 50,7; 50,8; 52,0; 48,4; 50,0;
51,4; 49,1; 47,5; 51,5; 48,7; 51,3; 47,9;
49,5; 49,9; 50,1; 50,2; 52,4; 52,0; 50,1;
49,9; 51,9; 48,7; 51,4; 52,4; 47,9; 51,0;
48,9; 50,2; 48,0; 51,5; 49,8; 49,1; 48,4;
51,7; 51,1; 51,2; 51,5; 48,3; 51,5; 51,1
</pre>
Klassieren Sie die Daten und stellen Sie die absoluten und relativen Häufigkeitsverteilung auf und geben Sie an, was in diesem Fall Merkmalsträger, Merkmal und Merkmalsausprägung ist.
 
Entscheiden Sie begründet, ob der Lieferant vertrauenswürdig ist.
}}
 
{{Aufgabe|
{{Aufgabe|
Sie haben die Aufgaben erfolgreich gelöst?
Sie haben Ihr Regelheft mit dem siebten Merksatz gefüllt.}}


Hier geht's weiter.  [[Datei:Pfeil 2.gif]] &nbsp; [[../../Lernpfad zur Beschreibenden Statistik|Startseite des Lernpfads]]
{{Fortsetzung|weiter=Klassen mit unterschiedlicher Klassenbreite|weiterlink=Beschreibende Statistik/Klassenbildung/Klassen mit unterschiedlicher Klassenbreite}}
}}


{{Fortsetzung|weiter=Klassen mit gleicher Klassenbreite|weiterlink=Beschreibende Statistik/Klassenbildung/Klassen mit gleicher Klassenbreite}}


{{Beschreibende Statistik}}
{{Beschreibende Statistik}}

Version vom 14. Oktober 2022, 06:38 Uhr

Für die Anzahl der Klassen gilt die folgende Regel,
wobei der Stichprobenumfang ist:


Fortsetzung Beispiel Körpergröße (in cm)

Im Beispiel ist

.

Also gilt für die Anzahl der Klassen

.


Eine Klasse ist ein Teil der Spannweite ( für Range,dem englischen Begriff für Spannweite), also ein Teil der Differenz zwischen der größten Merkmalsausprägung und der kleinsten Merkmalsausprägung .

Fortsetzung Beispiel Körpergröße (in cm)

Im Beispiel ist

und
,

somit gilt für die Spannweite

.


Die Klassenbreite ist der Quotient aus Spannweite und Klassenanzahl.


Fortsetzung Beispiel Körpergröße (in cm)

Im Beispiel ist die Klassenbreite also . |}

Bei der Zuordnung der Merkmalsausprägungen ist darauf zu achten, dass sich die Klassen nicht überschneiden. Sonst könnte es passieren, dass eine Merkmalsausprägung zwei Klassen zugeordnet wird.

Beachten Sie: Wählen Sie einen geeigneten Startwert als untere Klassengrenze (die in der Regel nicht zur Klasse gehören sollte) der ersten Klasse, addieren Sie die Klassenbreite um die obere Klassengrenze (diese gehört zur Klasse) zu erhalten.

Die obere Klassengrenze der vorangegangenen Klasse wird die untere Grenze der nächsten Klasse.

Und so fährt man fort, bis alle Klassen definiert sind.


Merke
{{{1}}}


Fortsetzung Beispiel Körpergröße (in cm)

Man bestimmt nun die fünf Klassen der Breite 10 und beachtet dabei, dass die Klassen sich nicht überschneiden dürfen. Dann bestimmt man die absoluten Häufigkeiten der einzelnen Klassen, dabei werden alle Merkmalsausprägungen gezählt, die zu der jeweiligen Klasse gehören. Dann berechnet man die relativen Häufigkeiten der einzelnen Klassen.

Klassierte Körpergrößen HHU5 2012/2013
Summe
3 6 5 4 7 25
12 % 24 % 20 % 16 % 28 % 100 %


Diese Darstellung ist zunächst eher objektiv und der Leser der Tabelle wird nicht in die Irre geleitet. Festzuhalten ist, das es sich um eine Klasse mit eher großen Schülern handelt. |}


Einführungsbeispiel - Teil 6.1

Bei der Umfrage der Eisdiele "Rabe" weist das Merkmal "Alter" sehr viele verschiedene Merkmalsausprägungen (genau 28 verschiedene Merkmalsausprägungen) auf, so dass eine Aufbereitung nach absoluten oder relativen Häufigkeitsverteilungen nicht zu mehr Übersicht beitragen würde. Hier bietet es sich an, Klassen zu bilden, um die Altersstruktur der Kunden besser zu verstehen.

Größe Formel im Beispiel mit Einsetzen und Berechnen
Klassenanzahl
Spannweite und
Klassenbreite und

|- |colspan="6" |Jetzt geht es an die Klassenbildung:

Legt man fest, dass die untere Grenze selbst nicht zur Klasse gehört, aber die obere Grenze der Klasse dazugehört, so hat man sichergestellt, dass die Beobachtungswerte den Klassen eindeutig zugeordnet werden können.

Dann wählt man einen Startwert für die untere Grenze der ersten Klasse und addiert dann für die obere Klassengrenze die Klassenbreite zum Startwert. Die jeweils nächste Klasse hat dann als untere Grenze die obere Grenze der vorangegangenen Klasse.

Wählt man den Startwert , so erhält man die Klassen mit :


Einführungsbeispiel - Teil 6.2

Jetzt muss die absolute Häufigkeit ermittelt werden, mit der die Beobachtungswerte in den einzelnen Klassen liegen:

Klassen Häufigkeiten
Klasse über ... Jahre bis zu ... Jahre in Prozent
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 16,7%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 36,7%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 13,3%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 13,3%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 10,0%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 10,0%}
Summe Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 100%}

Interpretation

Auffällig ist, dass mehr als ein Drittel aller Kunden zwischen 13 und 26 Jahren alt sind. Der Besitzer der Eisdiele könnte hieraus zum Beispiel ableiten, dass er mehr Angebote für die anderen Altersklassen anbieten sollte, um auch für diese Gruppen attraktiv zu sein und so mehr Umsatz zu erzielen.

Ausblick

Selbstverständlich wäre es auch möglich, eine andere Klassenanzahl zu wählen und so zu anderen Ergebnissen zu gelangen. Es ist nicht zwingend, die obigen Formeln für die Klassenanzahl und Klassenbreite zu wählen. Sie bieten aber einen guten Anhaltspunkt für eine erste Auswertung.

Hier noch eine weitere Auswertung mit 8 Klassen und einer Klassenbreite von 10.


Klassen Häufigkeiten
Klasse über ... Jahre bis zu ... Jahre in Prozent
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 6,7%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 33,3%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 13,3%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 16,7%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 6,7%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 10,0%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 10,0%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 3,3%}
Summe Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 100%}



Aufgabe
Sie haben Ihr Regelheft mit dem siebten Merksatz gefüllt.


Estatística ícone.svg

Lernpfad Beschreibende Statistik

  1. Grundbegriffe
  2. Graphische Darstellungen von Häufigkeitsverteilungen
  3. Lagemaße
    (arithmetisches Mittel, Modus, Median)
  4. Streuungsmaße
    (mittlere absolute Abweichung, mittlere quadratische Abweichung, Standardabweichung)
  5. Einsatz des Taschenrechners
    (Bedienung Casio fx-991DE PLUS)