Beschreibende Statistik/Absolute und Relative Häufigkeiten und Beschreibende Statistik/Klassenbildung: Unterschied zwischen den Seiten

Aus ZUM-Unterrichten
< Beschreibende Statistik(Unterschied zwischen Seiten)
main>Matthias Scharwies
 
main>Nina Krämer
Keine Bearbeitungszusammenfassung
 
Zeile 1: Zeile 1:
{{Navigation/Lernpfad|
Man kann jede Art von Merkmalen klassieren. Das geht sogar bei qualitativen Merkmalen mit einer Nominalskala.  
<u>'''Lernziele:'''</u>
* Sie kennen die Definitionen (und mathematischen Bezeichnungen) der Begriffe
** absolute Häufigkeit und
** relative Häufigkeit einer Merkmalsausprägung.
* Sie können
** die absolute Häufigkeit eines Merkmals und
** die relative Häufigkeit eines Merkmals berechnen.  
* Sie können Beobachtungswerte einer Urliste
** als absolute Häufigkeitsverteilung und
** als relative Häufigkeitsverteilung tabellarisch darstellen.


Sie kennen das alles schon? Dann geht es hier direkt zu den Übungen [[Datei:Pfeil 2.gif]] &nbsp; [[../Übungen Absolute und Relative Häufigkeiten|Übungen]]
<!-- Beispiel Merkmal Lieblingsfarbe -->
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
|<u>'''Beispiel Merkmal Lieblingsfarbe'''</u>
|-
| Sind zum Beispiel die Farben hellgelb, gelb, sonnengelb, rot, grün, hellblau, mittelblau, himmelblau und dunkelblau unter den Merkmalsausprägungen, so könnte man die Klassen
 
: "'''gelb'''" mit den Merkmalsausprägungen hellgelb, gelb und sonnengelb,


Ansonsten sind Sie hier richtig.
: "'''blau'''" mit den Merkmalsausprägungen hellblau, mittelblau, himmelblau und dunkelblau ,
}}


Gerade bei großem Stichprobenumfang ist die Urliste nicht aussagekräftig. Hat man nicht zu viele verschiedene Merkmalsausprägungen, kann man die Häufigkeit festzustellen, mit der ein Merkmal eine bestimmte Ausprägung annimmt. Die Häufigkeit kann in '''absoluten Zahlen''' angegeben werden oder als '''relativer Anteil''' am Umfang der Stichprobe. Denken Sie immer daran, jede Aufbereitung soll die Daten aussagekräftiger machen. Meistens sollen die Daten eine Aussage unterstützen.
: "'''Andere'''" mit den verbliebenden Merkmalsausprägungen bilden.


Gibt es sehr viele verschiedene Merkmalsausprägungen, so müssen die Merkmalsausprägungen zunächst zu Klassen zusammen gefasst werden. Dazu im nächsten Abschnitt mehr.
Dies wird auch bei der Auswertung von Wahlergebnissen im Fernsehen gemacht, die kleineren, nicht so wichtigen Parteien werden unter "Andere" zusammengefasst.
|}
<!-- Ende Beispiel Merkmal Lieblingsfarbe -->


<!-- Beispiel absolute und relative Häufigkeiten -->
Bei qualitativen Merkmalen mit einer Ordinalskala wird man immer darauf achten, dass aufeinander folgende Merkmalsausprägungen zusammengefasst werden.
 
<!-- Beispiel Merkmal Note Mathematikarbeit -->
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
! align=left| <u>Beispiel "Alter der Lerngruppe"</u>:
|<u>'''Beispiel Merkmal Note Mathematikarbeit'''</u>
|-
|-
| Die Urliste zum Merkmal "Alter der Lerngruppe" hat einen Stichprobenumfang von <math>n=20</math> und enthält folgende Beobachtungswerte:
| Betrachtet man die Noten der letzten Mathematikarbeit, so könnte man die Klassen
: "'''Leistungsträger'''" für die Merkmalsausprägungen "sehr gut" und "gut",
: "'''Mittelfeld'''" für die Merkmalsausprägungen "befriedigend" und "ausreichend" und
: "'''Blauer Brief'''" für die Merkmalsausprägungen "mangelhaft" und "ungenügend" bilden,


:: <math>18; 20; 17; 19; 16; 19; 19; 18; 17; 16; 20; 19; 19; 17; 19; 19; 16; 19; 17; 20</math>
um eine knappe Übersicht über die Lerngruppe zu erhalten.
|}
<!-- Ende Beispiel Merkmal Note Mathematikarbeit -->


Das Merkmal "Alter der Lerngruppe" hat <math>k=5</math> Merkmalsausprägungen, nämlich:
Im Folgenden werden aber nur noch quantitative Merkmale betrachtet.


:: <math>16; 17; 18; 19; 20</math>
Nicht immer macht es Sinn, alle verschiedenen  Merkmalsausprägungen einzeln zu betrachten. Bei quantitativen Merkmalen fasst man oft verschiedene Merkmalsausprägungen zu Klassen zusammen.


Jetzt lassen sich die absoluten Häufigkeiten leicht durch abzählen berechnen (ideal sind hier Strichlisten), man erhält:
<!-- Beispiel Körpergröße (in cm) -->
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
|colspan="8" |<u>'''Beispiel Körpergröße (in cm)'''</u>


<!-- Tabelle Auswertung Alter der Lerngruppe nach absoluten Häufigkeiten -->
Betrachtet man zum Beispiel die Körpergröße (in cm) der Schüler und Schülerinnen der Klasse HHU5 am Berufskolleg Hattingen (Schuljahr 2012/2013):
 
<!-- Tabelle Körpergröße HHU5 -->
<div style="float:left; margin-right:1em;">
<div style="float:left; margin-right:1em;">
{| class="wikitable"
{| class="wikitable"  
|+ Urliste
! colspan="5"| Körpergröße in cm
|-
| 170 || 178 || 174 || 188 || 168
|-
| 191 || 169 || 159 || 199 || 200
|-
| 177 || 178 || 200 || 193 || 169
|-
|-
! '''Merkmalsausprägung''' <math>x_i</math> !! <math>16</math> !! <math>17</math> !! <math>18</math> !! <math>19</math> !! <math>20</math> !! Summe
| 151 || 185 || 191 || 165 || 158
|-
|-
| '''absolute Häufigkeit''' <math>h(x_i)</math>|| <math>3</math> || <math>4</math> || <math>2</math> || <math>8</math> || <math>3</math> || <math>20</math>
| 185 || 188 || 194 || 180 || 170
|}
|}
</div>
</div>
<!-- Tabelle Auswertung Alter der Lerngruppe nach absoluten Häufigkeiten -->
<!-- Ende Tabelle Körpergröße HHU5 -->
 
 
 
Wenn man hier die verschiedenen Merkmalsausprägungen mit ihren absoluten und relativen Häufigkeiten erfasst, ist noch nicht wirklich etwas gewonnen, da es 18 verschiedene Merkmalsausprägungen gibt, von denen sieben die absolute Häufigkeit 2 und alle anderen die absolute Häufigkeit 1 haben. (Der geneigte Leser mag das selber nachrechnen.)
 
Man könnte zum Beispiel die Frage "Wie viele Schüler sind größer als 175 cm und höchstens 183 cm? stellen.
 
Dann ist es sinnvoll, eine absolute Häufigkeitsverteilung mit drei verschiedenen Klassen zu bilden. Jede Klasse hat eine untere und eine obere Grenze. Wichtig ist, dass sich die Klassen nicht überschneiden, damit jeder Beobachtungswert nur genau zu einer Klasse gehört.
|-
|-
| Diese Art die Beobachtungswerte zu präsentieren nennt man '''absolute Häufigkeitsverteilung'''.
|
<u>'''Klasseneinteilung:'''</u>


Oft interessieren die genauen Zahlen aber gar nicht, sondern es geht nur um Anteile vom Ganzen. Berechnet man aus der absoluten Häufigkeitsverteilung jetzt die relativen Anteile der Merkmalsausprägungen bezogen auf den Stichprobenumfang, so erhält man die folgende Tabelle:
Klasse <math>k_1</math>:
:vom kleinsten Wert <math>x_{Min}</math> (hier: 151 cm) bis zu 175 cm einschließlich
:: mathematische Kurzschreibweise: <math>[151;175]=]150;175]</math>
Klasse <math>k_2</math>:
: von über 175 cm  bis zu 183 cm einschließlich
:: mathematische Kurzschreibweise: <math>]175;183]</math>
Klasse <math>k_3</math>:
:von über 183 cm bis zum größten Wert <math>x_{Max}</math> (hier 200 cm) einschließlich
:: mathematische Kurzschreibweise: <math>]183;200]</math>


<!-- Tabelle Auswertung Alter der Lerngruppe nach relativen Häufigkeiten -->
<u>'''Häufigkeitsverteilung bestimmen:'''</u>
 
Jetzt kann man die absolute Häufigkeit <math>H(k_i)</math> zu jeder Klasse <math>k_i</math> bestimmen, indem man alle Beobachtungswerte zählt, die im Intervall der Klasse <math>k_i</math> liegen.
Dann lässt sich auch die relative Häufigkeit <math>h(k_i)</math> zu jeder Klasse <math>k_i</math> bestimmen, indem man den Anteil aller Beobachtungswerte am Stichprobenumfang <math>n</math>, die im Intervall der Klasse <math>k_i</math> liegen, berechnet.
 
<!-- Tabelle Klassierte Körpergröße HHU5 -->
<div style="float:left; margin-right:1em;">
<div style="float:left; margin-right:1em;">
{| class="wikitable"
{| class="wikitable"  
|-
! colspan="5" | Klassierte Körpergrößen HHU5 2012/2013
|-
|-
! Merkmalsausprägung <math>x_i</math> !! <math>16</math> !! <math>17</math> !! <math>18</math> !! <math>19</math> !! <math>20</math> !! Summe
| <math>k_i</math> || <math>150 < a_i \le 175</math> || <math>175 < a_i \le 183</math> || <math>183 < a_i \le 200</math> || '''Summe'''
|-
|-
| absolute Häufigkeit <math>h(x_i)</math>|| <math>\frac{3}{20}=</math> || <math>\frac{4}{20}=</math> || <math>\frac{2}{20}=</math> || <math>\frac{8}{20}=</math> || <math>\frac{3}{20}=</math> || <math>1=</math>  
| <math>H(k_i)</math> || <math>10</math> || <math>4</math> || <math>11</math> || <math>25</math>
|-
|-
| oder als Dezimal- oder Prozentzahl || <math>0,15=15%</math> || <math>0,2=20%</math> || <math>0,1=10%</math> || <math>0,4=40%</math> || <math>0,15=15%</math> || <math>100%</math>
| <math>h(k_i)</math> || <math>\frac{2}{5}=40 %</math> || <math>\frac{4}{25}=16 %</math> || <math>\frac{11}{25}=44 %</math> || <math>100 %</math>
|}
|}
<div>
</div>
<!-- Ende Tabelle Auswertung Alter der Lerngruppe nach relativen Häufigkeiten -->
<!-- Ende Klassierte Tabelle Körpergröße HHU5 -->
|-
|-
| Diese Art die Beobachtungswerte zu präsentieren nennt man '''relative Häufigkeitsverteilung'''.
|
<u>'''Interpretation:'''</u>
 
Es sind also nicht nur vier Schüler größer als 175 cm und höchstens 183 cm. Es sieht so aus, als wären die Schüler der Klasse entweder klein oder groß, weil die Klasse in der Mitte so selten vertreten ist.
<br />


Stimmt das denn?
<br />
Hier ist es hilfreich, sich mit den Klassenbreiten zu beschäftigen.
<br />
<u>'''Klassenbreiten bestimmen:'''</u>
<br />
Die gewählten Klassen <math>k_i</math> sind unterschiedlich breit. Die Breite <math>b_i</math> einer Klasse <math>k_i</math> errechnet man, indem man die untere Grenze <math>uG_i</math> von der oberen Grenze <math>oG_i</math> subtrahiert.
<!-- Tabelle Klassenbreiten -->
<div style="float:left; margin-right:1em;">
{| class="wikitable"
|-
! Klasse <math>k_i</math> !! untere Grenze <math>uG_i</math> !! obere Grenze <math>oG_i</math> !! Klassenbreite <math>b_i</math>
|-
| <math>k_1</math> || <math>150</math> || <math>175</math> || <math>175-150=25</math>
|-
| <math>k_2</math> || <math>175</math> || <math>183</math> || <math>183-175=8</math>
|-
| <math>k_3</math> || <math>183</math> || <math>200</math> || <math>200-183=17</math>
|}
</div>
<!--  Ende Klassenbreiten -->
|-
|
Jetzt sieht man, dass die mittlere Klasse auch viel schmaler ist, als die beiden anderen Klassen. Die Klassenbreite hat aber Einfluss auf die Häufigkeit, mit der die Beobachtungswerte in der Klasse liegen. Deshalb wählt man in der Regel Klassen mit gleicher Klassenbreite. Nur in Ausnahmefällen machen Klassen mit unterschiedlichen Klassenbreiten Sinn. Ganz besonders gut geeignet sind unterschiedliche Klassenbreiten, wenn man schon vorher weiß, welche Aussage man mit den Daten unterstützen möchte.


Auch die obige Fragestellung hätte man prima mit gleich breiten Klassen lösen können. Dabei beginnt man dann mit dem aus der Frage vorgegebenen Intervall und bildet alle nötigen Klassen darunter und darüber mit Klassenbreite 8 cm so, dass man auch den kleinsten und den größten Beobachtungswert einer Klasse zuordnen kann.


Will man nicht mit Brüchen arbeiten, so hat es sich bewährt, Dezimalzahlen mit mindestens 3 Nachkommastellen darzustellen oder alternativ Prozentzahlen mit einer Dezimale. Aber oft sind die Darstellung als Bruch zu bevorzugen, weil es dann keine Rundungsdifferenzen gibt.
Das sieht dann so aus:
<!-- Tabelle Klassierte Körpergröße HHU5 -->
<div style="float:left; margin-right:1em;">
{| class="wikitable"
|-
! colspan="4" | Klassierte Körpergrößen HHU5 2012/2013
|-
! Klasse <math>k_i</math> !! Intervall !! <math>H(k_i)</math> || <math>h(k_i)</math>
|-
| <math>k_1</math> || <math>143 < a_i \le 151</math> || <math>1</math> || <math>\frac{1}{25}=4 %</math>
|-
| <math>k_2</math> || <math>151 < a_i \le 159</math> || <math>2</math> || <math>\frac{2}{25}=8 %</math>
|-
| <math>k_3</math> || <math>159 < a_i \le 167</math> || <math>1</math> || <math>\frac{1}{25}=4 %</math>
|-
| <math>k_4</math> || <math>167 < a_i \le 175</math> || <math>6</math> || <math>\frac{6}{25}=24 %</math>
|-
| <math>k_5</math> || <math>175 < a_i \le 183</math> || <math>4</math> || <math>\frac{4}{25}=16 %</math>
|-
| <math>k_6</math> || <math>183 < a_i \le 191</math> || <math>6</math> || <math>\frac{6}{25}=24 %</math>
|-
| <math>k_7</math> || <math>191 < a_i \le 199</math> || <math>3</math> || <math>\frac{3}{25}=12 %</math>
|-
| <math>k_8</math> || <math>199 < a_i \le 207</math> || <math>2</math> || <math>\frac{2}{25}=8 %</math>
|-
! colspan="2"| Summe !! <math>25</math> !! <math>100%</math>
|}
</div>
<!--  Ende Klassierte Tabelle Körpergröße HHU5 -->
|-
| <u>'''Interpretation''':</u>
|-
|
Man kann leicht erkennen, dass es - unter Berücksichtigung der Klassenbreite - nur zwei Klassen gibt, in denen sich mehr Beobachtungswerte befinden. So erhält  man also ein ganz anderes Bild der Verteilung.
|}
|}
<!-- Ende Beispiel absolute und relative Häufigkeiten -->
<!-- Beispiel Körpergröße (in cm) -->




<!-- Definition absolute und relative Häufigkeiten -->
<!-- Merke Klassen -->
{{Merke-M||1=
{{Merke-M||1=
Die <span style="background:yellow">'''absolute Häufigkeit'''</span> <math>H(x_i)</math> gibt die Anzahl aller Merkmalsträger mit dieser Merkmalsausprägung <math>x_i</math> an.  
Wenn bei einer umfangreichen Stichprobe sehr viele unterschiedliche Merkmalsausprägungen auftreten, so bietet es sich an, ähnliche Werte in sogenannte <span style="background:yellow">'''Klassen <math>k_i</math>'''</span> der <span style="background:yellow">(Klassen-)Breite <math>b_i</math></span> zusammenzufassen.
}}
<!-- Ende Merke Klassen -->
 
Man unterscheidet zwei Arten von Klassenbildungen:
*: Klassen mit gleicher Klassenbreite <math>b_i=b</math>
*: Klassen mit unterschiedlicher Klassenbreite <math>b_i</math>
 
Übrigens eignen sich Klassen mit unterschiedlicher Klassenbreite hervorragend, um Daten so aufzubereiten, dass sie die gewünschte Aussage (hier entweder eine Klasse mit besonders großen Schülern oder mit besonders kleinen Schülern) gut unterstützen. Hier gilt der allseits beliebte Spruch: "Traue keiner Statistik, die du nicht selbst gefälscht hast."
 
Hier geht's weiter zu [[/Klassen mit gleicher Klassenbreite|Klassen mit gleicher Klassenbreite]]
 
 
===== Klassen mit gleicher Klassenbreite =====
Für die <span style="background:yellow">Anzahl der Klassen</span> gilt die folgende Regel, <br />
wobei <math>n</math> der Stichprobenumfang ist:
:: <math>k \approx \sqrt{n}</math>
<br />
 
<!-- Fortsetzung 1 Beispiel Körpergröße (in cm) -->
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
|colspan="8" |<u>'''Fortsetzung Beispiel Körpergröße (in cm)'''</u>
 
Im Beispiel ist
:: <math>n=25</math>.
 
Also gilt für die Anzahl der Klassen
:: <math>k \approx \sqrt{25}=5</math>.
|}
<!-- Ende Fortsetzung 1 Beispiel Körpergröße (in cm) -->
<br />
 
Eine Klasse ist ein Teil der <span style="background:yellow">Spannweite <math>R</math></span> (<math>R</math> für Range,dem englischen Begriff für Spannweite), also ein Teil der Differenz zwischen der größten Merkmalsausprägung <math>x_{max}</math> und der kleinsten Merkmalsausprägung <math>x_{min}</math>.
<br />
 
<!-- Fortsetzung 2 Beispiel Körpergröße (in cm) -->
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
|colspan="8" |<u>'''Fortsetzung Beispiel Körpergröße (in cm)'''</u>
 
Im Beispiel ist 
:: <math>x_{max}=200</math>  und
:: <math>x_{min}=151</math> ,
somit gilt für die Spannweite
:: <math>R=x_{max}-x_{min}=200-151=49</math>.
|}
<!-- Ende Fortsetzung 2 Beispiel Körpergröße (in cm) -->
<br />
 
Die <span style="background:yellow">Klassenbreite <math>b</math></span> ist der Quotient aus Spannweite und Klassenanzahl.
<br />
 
<!-- Fortsetzung 3 Beispiel Körpergröße (in cm) -->
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
|colspan="8" |<u>'''Fortsetzung Beispiel Körpergröße (in cm)'''</u>
 
Im Beispiel ist die Klassenbreite also
<math>b=\frac{Spannweite} {Anzahl der Klassen}=\frac{49} {5}=9,8 \approx 10</math>.
|}
<!-- Ende Fortsetzung 3 Beispiel Körpergröße (in cm) -->
<br />


Statt <math>H(x_i)</math> schreibt man auch kurz <math>H_i</math>.
Bei der Zuordnung der Merkmalsausprägungen ist darauf zu achten, dass sich die Klassen nicht überschneiden. Sonst könnte es passieren, dass eine Merkmalsausprägung zwei Klassen zugeordnet wird.


Die <span style="background:yellow">'''relative Häufigkeit'''</span> <math>h(x_i)=\frac{H(x_i)} {n}</math> gibt den Anteil aller Merkmalsträger mit dieser Merkmalsausprägung <math>x_i</math> bezogen auf den Stichprobenumfang <math>n</math> an.  
Beachten Sie:
Wählen Sie einen geeigneten Startwert als untere Klassengrenze (die in der Regel nicht zur Klasse gehören sollte) der ersten Klasse, addieren Sie die Klassenbreite um die obere Klassengrenze (diese gehört zur Klasse) zu erhalten.


Statt <math>h(x_i)</math> schreibt man auch kurz <math>h_i</math>.
Die obere Klassengrenze der vorangegangenen Klasse wird die untere Grenze der nächsten Klasse.
}}
<!-- Ende Definition absolute und relative Häufigkeiten -->


Und so fährt man fort, bis alle Klassen definiert sind.
<br />


<!-- Merksatz absolute und relative Häufigkeiten -->
<!-- Merke Klassen,Klassenanzahl, Spannweite, Klassenbreite -->
<!-- Merke -->
{{Merke-M||1=
{{Merke-M||1=
Die Summe der absoluten Häufigkeiten ist immer gleich der Anzahl aller Merkmalsträger, also gleich dem Stichprobenumfang.
Die einzelnen <span style="background:yellow">Klassen</span> bezeichnet man mit <math>k_i</math>, wobei <math>i=</math> <math>1;2;\dots;k-1;k</math> gilt.


Mathematische Kurzschreibweise:
<span style="background:yellow">Klassenanzahl</span>:
:: <math>k \approx \sqrt{n}</math>


:: <math>\sum_{i=1}^k H(x_i)=n</math> oder noch kürzer <math>\sum_{i=1}^k H_i=n</math>,
<span style="background:yellow">Spannweite</span>:
:: <math>R= x_{max}-x_{min}</math>


wobei <math>k</math> die Anzahl der Merkmalsausprägungen und <math>n</math> den Stichprobenumfang bezeichnen.
<span style="background:yellow">Klassenbreite</span>:
:: <math>b=\frac{Spannweite}{Anzahl der Klassen}=\frac{R}{k}</math>


Eine Darstellung der Merkmalsausprägungen mit absoluten Häufigkeiten nennt man <span style="background:yellow">'''absolute Häufigkeitsverteilung'''</span>.
}}
<!-- Ende Merke Klassenanzahl, Spannweite, Klassenbreite -->
<br />


Die Summe der relativen Häufigkeiten ist immer gleich 1, also 100 %.
<!-- Fortsetzung 4 Beispiel Körpergröße (in cm) -->
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
|colspan="8" |<u>'''Fortsetzung Beispiel Körpergröße (in cm)'''</u>


Mathematische Kurzschreibweise:
Man bestimmt nun die fünf Klassen der Breite 10 und beachtet dabei, dass die Klassen sich nicht überschneiden dürfen.
Dann bestimmt man die absoluten Häufigkeiten der einzelnen  Klassen, dabei werden alle Merkmalsausprägungen gezählt, die zu der jeweiligen Klasse gehören.
Dann berechnet man die relativen Häufigkeiten der einzelnen Klassen.


:: <math>\sum_{i=1}^k h(x_i)=1</math> oder noch kürzer <math>\sum_{i=1}^k h_i=1</math>,
<!-- Tabelle Klassierte Körpergröße HHU5 -->
<div style="float:left; margin-right:1em;">
{| class="wikitable"
|-
! colspan="7" | Klassierte Körpergrößen HHU5 2012/2013
|-
| <math>k_i</math>
|| <math>150 < a_i \le 160</math> || <math>160 < a_i \le 170</math> || <math>170 < a_i \le 180</math> || <math>180 < a_i \le 190</math> || <math>190 < a_i \le 200</math> || Summe
|-
| <math>H(k_i)</math> || 3 || 6 || 5 || 4 || 7 || 25
|-
| <math>h(k_i)</math> || 12 % || 24 % || 20 % || 16 % || 28 % || 100 %
|}
</div>
<!--  Ende Klassierte Tabelle Körpergröße HHU5 -->
|-
| colspan="7"|


wobei <math>k</math> die Anzahl der Merkmalsausprägungen und <math>n</math> den Stichprobenumfang bezeichnen.
Diese Darstellung ist zunächst eher objektiv und der Leser der Tabelle wird nicht in die Irre geleitet. Festzuhalten ist, das es sich um eine Klasse mit eher großen Schülern handelt.
|}
<!-- Ende Fortsetzung 4 Beispiel Körpergröße (in cm) -->


Eine Darstellung der Merkmalsausprägungen mit relativen Häufigkeiten nennt man <span style="background:yellow">'''relative Häufigkeitsverteilung'''</span>.
}}
<!-- Ende Merksatz absolute und relative Häufigkeiten -->




<!-- Einführungsbeispiel - Teil 6 -->
[[Datei:Umfrage Eisdiele Urliste.PNG|rechts|Einführung Merkmale und Merkmalsausprägungen]]
[[Datei:Umfrage Eisdiele Urliste.PNG|rechts|Einführung Merkmale und Merkmalsausprägungen]]
<!-- Einführungsbeispiel Teil 5 -->
{|style="color: black; background-color: #FFFAFA;border-left:solid 2px #CD0000;border-right:solid 2px #CD0000;border-top:solid 2px #CD0000;border-bottom:solid 2px #CD0000;font-size:100%;font-size:100%;"
{|style="color: black; background-color: #FFFAFA;border-left:solid 2px #CD0000;border-right:solid 2px #CD0000;border-top:solid 2px #CD0000;border-bottom:solid 2px #CD0000;font-size:100%;font-size:100%;"
|colspan="4" |
|colspan="4" |
<u>'''Einführungsbeispiel - Teil 5'''<br /></u>
<u>'''Einführungsbeispiel - Teil 6.1'''<br /></u>
 
Bei der Umfrage der Eisdiele "Rabe" weist das Merkmal "Alter" sehr viele verschiedene Merkmalsausprägungen (genau 28 verschiedene Merkmalsausprägungen) auf, so dass eine Aufbereitung nach absoluten oder relativen Häufigkeitsverteilungen nicht zu mehr Übersicht beitragen würde. Hier bietet es sich an, Klassen zu bilden, um die Altersstruktur der Kunden besser zu verstehen.
 
<!-- Tabelle Berechnung der notwendigen Größen -->
<div style="float:left; margin-right:1em;">
{| class="wikitable"
! style="text-align:left;" | Größe !! style="text-align:left;" | Formel !! style="text-align:left;" | im Beispiel mit !! style="text-align:left;" |Einsetzen und Berechnen
|-
| Klassenanzahl || <math>k \approx</math> \sqrt{n}</math> || <math>n=30</math> || <math>k \approx \sqrt{30}</math><math>\approx 5,8\approx 6</math>
|-
| Spannweite || <math>R=</math><math>x_{max}-x_{min}</math> || <math>x_{max}=75</math> und <math>x_{min}=4</math> || <math>R=</math><math>75-4=71</math>
|-
| Klassenbreite || <math>b=\frac{R}{k}</math> || <math>R=71</math> und <math>k=6</math> || <math>b=\frac{71}{\sqrt{30}}</math><math> \approx 13</math>
|}
</div>
<!-- Ende Tabelle Berechnung der notwendigen Größen -->
|-
|colspan="6" |Jetzt geht es an die '''Klassenbildung''':
 
Legt man fest, dass die '''untere Grenze''' selbst nicht zur Klasse gehört, aber die '''obere Grenze''' der Klasse dazugehört, so hat man sichergestellt, dass die Beobachtungswerte den Klassen eindeutig zugeordnet werden können.
 
Dann wählt man einen '''Startwert''' für die untere Grenze der ersten Klasse <math>k_1</math> und addiert dann für die obere Klassengrenze die Klassenbreite zum Startwert. Die jeweils nächste Klasse hat dann als untere Grenze die obere Grenze der vorangegangenen Klasse.


Jetzt kann mit dem nächsten Schritt der Aufbereitung der Umfrage der Eisdiele "Rabe" begonnen werden. Hier soll das Merkmal "Geschlecht" mit absoluten und später mit relativen Häufigkeiten dargestellt werden.
Wählt man den Startwert <math>0</math>, so erhält man die Klassen <math>k_i</math> mit <math>i=1;2;3;4;5;6</math>:
:: <math>k_1=]0;13], k_2=]13;26], k_3=]26;39],</math>
:: <math>k_1=]39;52], k_2=]52;65], k_3=]65;78]</math>
|}


Festgelegt wurde schon <math>x_1=m</math> für männlich und <math>x_2=w</math> für weiblich
<br />
<br />


<!-- Tabelle Auswertung Geschlecht absolute Häufigkeiten -->
<br />
<br />
<br />
<br />
 
 
<!-- Einführungsbeispiel - Teil 6.2 -->
{|style="color: black; background-color: #FFFAFA;border-left:solid 2px #CD0000;border-right:solid 2px #CD0000;border-top:solid 2px #CD0000;border-bottom:solid 2px #CD0000;font-size:100%;font-size:100%;"
|colspan="6" |
<u>'''Einführungsbeispiel - Teil 6.2'''<br /></u>
 
Jetzt muss die absolute Häufigkeit ermittelt werden, mit der die Beobachtungswerte in den einzelnen Klassen liegen:
 
<!-- Tabelle Klassenbildung 1 -->
<div style="float:left; margin-right:1em;">
<div style="float:left; margin-right:1em;">
{| class="wikitable"  
{| class="wikitable"  
| '''Merkmalsausprägung <math>x_i</math>''' || '''männlich''' || '''weiblich''' || '''Summe'''
! colspan="3"| Klassen !! colspan="3"| Häufigkeiten
|-
| '''Klasse <math>k_i</math>'''|| '''über ... Jahre''' || '''bis zu ... Jahre''' || '''<math>H(k_i)</math>''' || '''<math>h(k_i)</math>''' || '''<math>h(k_i)</math> in Prozent'''
|-
|<math>k_1</math> || <math>0</math> || <math>13</math> || <math>5</math> || <math>\frac{1}{6}</math> ||  <math>16,7%</math>
|-
|<math>k_2</math> || <math>13</math> || <math>26</math> || <math>11</math> || <math>\frac{11}{30}</math> || <math>36,7%</math>
|-
|<math>k_3</math> || <math>26</math> || <math>39</math> || <math>4</math> || <math>\frac{2}{15}</math> || <math>13,3%</math>
|-
|<math>k_4</math> || <math>39</math> || <math>52</math> || <math>4</math> || <math>\frac{2}{15}</math> || <math>13,3%</math>
|-
|-
| '''absolute Häufigkeit <math>H(x_i)=H_i</math>||''' <math>12</math> || <math>18</math> || <math>30</math>
|<math>k_5</math> || <math>52</math> || <math>65</math> || <math>3</math> || <math>\frac{1}{10}</math> || <math>10,0%</math>
|-
|<math>k_6</math> || <math>65</math> || <math>78</math> || <math>3</math> || <math>\frac{1}{10}</math> || <math>10,0%</math>
|-
! colspan="3"| Summe || align=left |<math>100</math> || align=left |<math>1</math> || align=left|<math>100%</math>  
|}
|}
<div>
</div>
<!-- Ende Tabelle Klassenbildung 1 -->
|-
|-
<!-- Ende Auswertung Geschlecht absolute Häufigkeiten -->
| colspan="6"| '''Interpretation'''
|colspan="4" |
 
Betrachtet man nun die relative Häufigkeit, so erhält man diese, indem jede absolute Häufigkeit durch den Stichprobenumfang dividiert wird:
Auffällig ist, dass mehr als ein Drittel aller Kunden zwischen 13 und 26 Jahren alt sind. Der Besitzer der Eisdiele könnte hieraus zum Beispiel ableiten, dass er mehr Angebote für die anderen Altersklassen anbieten sollte, um auch für diese Gruppen attraktiv zu sein und so mehr Umsatz zu erzielen.
 
'''Ausblick'''
 
Selbstverständlich wäre es auch möglich, eine andere Klassenanzahl zu wählen und so zu anderen Ergebnissen zu gelangen. Es ist nicht zwingend, die obigen Formeln für die Klassenanzahl und Klassenbreite zu wählen. Sie bieten aber einen guten Anhaltspunkt für eine erste Auswertung.
 
Hier noch eine weitere Auswertung mit 8 Klassen und einer Klassenbreite von 10.
 


<!-- Tabelle Auswertung Geschlecht relative Häufigkeiten -->
<!-- Tabelle Klassenbildung 2 -->
<div style="float:left; margin-right:1em;">
<div style="float:left; margin-right:1em;">
{| class="wikitable"  
{| class="wikitable"  
| '''Merkmalsausprägung <math>x_i</math>''' || '''männlich''' || '''weiblich''' || '''Summe'''
! colspan="3"| Klassen !! colspan="3"| Häufigkeiten
|-
| '''Klasse <math>k_i</math>'''|| '''über ... Jahre''' || '''bis zu ... Jahre''' || '''<math>H(k_i)</math>''' || '''<math>h(k_i)</math>''' || '''<math>h(k_i)</math> in Prozent'''
|-
|<math>k_1</math> || <math>0</math> || <math>10</math> || <math>2</math> || <math>\frac{1}{6}</math> ||  <math>6,7%</math>
|-
|-
| '''relative Häufigkeit <math>h(x_i)=h_i</math>'''|| <math>\frac{12}{30}=0,4=40%</math> || <math>\frac{18}{30}=0,6=60%</math> || <math>1=100%</math>
|<math>k_2</math> || <math>10</math> || <math>20</math> || <math>10</math> || <math>\frac{1}{3}</math> || <math>33,3%</math>
|-
|<math>k_3</math> || <math>20</math> || <math>30</math> || <math>4</math> || <math>\frac{2}{15}</math> || <math>13,3%</math>
|-
|<math>k_4</math> || <math>30</math> || <math>40</math> || <math>5</math> || <math>\frac{1}{6}</math> || <math>16,7%</math>
|-
|<math>k_5</math> || <math>40</math> || <math>50</math> || <math>2</math> || <math>\frac{1}{15}</math> || <math>6,7%</math>
|-
|<math>k_6</math> || <math>50</math> || <math>60</math> || <math>3</math> || <math>\frac{1}{10}</math> || <math>10,0%</math>
|-
|<math>k_7</math> || <math>60</math> || <math>70</math> || <math>3</math> || <math>\frac{1}{10}</math> || <math>10,0%</math>
|-
|<math>k_8</math> || <math>70</math> || <math>80</math> || <math>1</math> || <math>\frac{1}{30}</math> || <math>3,3%</math>
|-
! colspan="3"| Summe || align=left |<math>100</math> || align=left |<math>1</math> || align=left|<math>100%</math>
|}
|}
<div>
</div>
<!-- Ende Auswertung Geschlecht relative Häufigkeiten -->
<!-- Ende Tabelle Klassenbildung 2 -->
|}
|}
<!-- Ende Einführungsbeispiel Teil 5 -->
<!-- Ende Einführungsbeispiel - Teil 6 -->
 
===== Klassen mit beliebiger Klassenbreite =====
<!-- Fortsetzung Beispiel Körpergröße (in cm) -->
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
|colspan="8" |<u>'''Fortsetzung Beispiel Körpergröße (in cm)'''</u>


Nehmen wir nun an, wir wollen jemanden davon überzeugen, dass weniger als ein Viertel aller Schüler dieser Klasse besonders groß sind. Zunächst legen wir fest, was besonders groß bedeuten soll. Unsere Tabelle können wir entnehmen, dass mehr als ein Viertel aller Schüler 191 cm oder größer sind. Somit müssen wir einen Wert über 191 cm wählen und entscheiden uns für 195 cm. Um den Leser zu überzeugen, wählen wir nur zwei Klassen, alle Schüler kleiner als 195 und alle Schüler größer oder gleich 195. Unsere Tabelle bekommt dann folgendes Aussehen:


{{Aufgabe-M|
<!-- Tabelle ungleiche Klassenbreiten Körpergröße HHU5 -->
<div style="float:left; margin-right:1em;">
{| class="wikitable"
|-
! colspan="4" | Klassierte Körpergrößen HHU5 2012/2013 bei unterschiedlicher Klassenbreite
|-
| <math>k_i</math> || <math>150 < a_i \le 195</math>  || <math>195 < a_i \le 200</math> || '''Summe'''
|-
| <math>H(k_i)</math> || <math>22</math> || <math>3</math> || <math>1</math>
|-
| <math>h(k_i)</math> || <math>88 %</math> || <math>12 %</math> || <math>100 %</math>
|}
</div>
<!--  Ende ungleiche Klassenbreiten Tabelle Körpergröße HHU5 -->


Sie haben Ihr Regelheft mit dem vierten und fünften Merksatz gefüllt.
Und so glaubt der geneigte Leser sofort, dass es sich um eine körperlich recht kleine Klasse handelt, da nicht mal ein Achtel aller Schüler größer oder gleich 195 cm sind. Die Aussage wird durch geschickte Wahl der Größe und einer passenden Klassenbildung unterstützt.
|}


Testen Sie Ihr Wissen. [[Datei:Pfeil 2.gif]] &nbsp; [[../Übungen Absolute und Relative Häufigkeiten|Übungen]]
Und noch einmal die Eisdiele "Rabe":
<!-- Einführungsbeispiel - Teil 7 -->
{|style="color: black; background-color: #FFFAFA;border-left:solid 2px #CD0000;border-right:solid 2px #CD0000;border-top:solid 2px #CD0000;border-bottom:solid 2px #CD0000;font-size:100%;font-size:100%;"
|colspan="6" |
<u>'''Einführungsbeispiel - Teil 7'''<br /></u>


Auch bei der Auswertung des Merkmals Alter kann man mit unterschiedlich großen Klassenbreiten arbeiten und versuchen zu interessanten Aussagen zu gelangen.


Wählt man beispielsweise nur zwei Klassen, die erste von 0 - 30 Jahre, die zweite von 30 - 80 Jahre, so erhält man:


[[../../Lernpfad zur Beschreibenden Statistik|zurück zur Startseite des Lernpfad]]
<!-- Tabelle Klassenbildung 1 -->
<div style="float:left; margin-right:1em;">
{| class="wikitable"
! colspan="3"| Klassen !! colspan="3"| Häufigkeiten
|-
| '''Klasse <math>k_i</math>'''|| '''über ... Jahre''' || '''bis zu ... Jahre''' || '''<math>H(k_i)</math>''' || '''<math>h(k_i)</math>''' || '''<math>h(k_i)</math> in Prozent'''
|-
|<math>k_1</math> || <math>0</math> || <math>30</math> || <math>16</math> || <math>\frac{8}{15}</math> ||  <math>53,3%</math>
|-
|<math>k_2</math> || <math>30</math> || <math>80</math> || <math>14</math> || <math>\frac{7}{15}</math> || <math>46,7%</math>
|-
! colspan="3"| Summe || align=left |<math>100</math> || align=left |<math>1</math> || align=left|<math>100%</math>
|}
</div>
<!-- Ende Tabelle Klassenbildung 1 -->
|-
| colspan="6"| '''Interpretation'''
 
Auf den ersten Blick sieht es so aus, als sei die Eisdiele bei jeder Altersgruppe gleich beliebt. Dies ist jedoch nicht so, wie man im Abschnitt Klassen mit gleicher Klassenbreite gut sehen konnte.
 
'''Noch ein Versuch:'''
 
Diesmal wählt man drei Klassen und erhält:
 
<!-- Tabelle Klassenbildung 2 -->
<div style="float:left; margin-right:1em;">
{| class="wikitable"
! colspan="3"| Klassen !! colspan="3"| Häufigkeiten
|-
| '''Klasse <math>k_i</math>'''|| '''über ... Jahre''' || '''bis zu ... Jahre''' || '''<math>H(k_i)</math>''' || '''<math>h(k_i)</math>''' || '''<math>h(k_i)</math> in Prozent'''
|-
|<math>k_1</math> || <math>0</math> || <math>15</math> || <math>7</math> || <math>\frac{7}{30}</math> ||  <math>23,3%</math>
|-
|<math>k_2</math> || <math>15</math> || <math>30</math> || <math>9</math> || <math>\frac{3}{10}</math> || <math>30%</math>
|-
|<math>k_3</math> || <math>30</math> || <math>80</math> || <math>14</math> || <math>\frac{7}{15}</math> || <math>46,7%</math>
|-
! colspan="3"| Summe || align=left |<math>100</math> || align=left |<math>1</math> || align=left|<math>100%</math>
|}
</div>
<!-- Ende Tabelle Klassenbildung 2 -->
|-
| colspan="6"| '''Interpretation'''
 
Hier könnte man auf den ersten Blick folgern, dass die Eisdiele "Rabe" gerade beim älteren Publikum besonders angesagt ist.
|}
<!--  Ende Einführungsbeispiel - Teil 7 -->
 
Bleiben noch zwei Hinweise, die man beachten sollte:
 
<!-- Merke Klassen -->
{{Merke-M||1=
Bei Klassen mit unterschiedlichen Breiten ist jeder Klasse <math>k_i</math> ihre Breite <math>b_i</math> zuzuordnen
 
Vorsicht bei Statistiken mit unterschiedlich breiten Klassen. Hier weiß man nie, was der Autor verstecken will.
}}
}}
<!-- Ende Merke Klassen -->
Hier geht's weiter [[../Übungen Klassierte Daten|Übungen Klassenbildung]]




{{SORTIERUNG:{{SUBPAGENAME}}}}
[[../|zurück zu Grundbegriffe der beschreibenden Statistik]]
[[Kategorie:Höhere Berufsfachschule für Wirtschaft und Verwaltung Grundbegriffe der beschreibenden Statistik]]

Version vom 7. April 2015, 22:02 Uhr

Man kann jede Art von Merkmalen klassieren. Das geht sogar bei qualitativen Merkmalen mit einer Nominalskala.

Beispiel Merkmal Lieblingsfarbe
Sind zum Beispiel die Farben hellgelb, gelb, sonnengelb, rot, grün, hellblau, mittelblau, himmelblau und dunkelblau unter den Merkmalsausprägungen, so könnte man die Klassen
"gelb" mit den Merkmalsausprägungen hellgelb, gelb und sonnengelb,
"blau" mit den Merkmalsausprägungen hellblau, mittelblau, himmelblau und dunkelblau ,
"Andere" mit den verbliebenden Merkmalsausprägungen bilden.

Dies wird auch bei der Auswertung von Wahlergebnissen im Fernsehen gemacht, die kleineren, nicht so wichtigen Parteien werden unter "Andere" zusammengefasst.

Bei qualitativen Merkmalen mit einer Ordinalskala wird man immer darauf achten, dass aufeinander folgende Merkmalsausprägungen zusammengefasst werden.

Beispiel Merkmal Note Mathematikarbeit
Betrachtet man die Noten der letzten Mathematikarbeit, so könnte man die Klassen
"Leistungsträger" für die Merkmalsausprägungen "sehr gut" und "gut",
"Mittelfeld" für die Merkmalsausprägungen "befriedigend" und "ausreichend" und
"Blauer Brief" für die Merkmalsausprägungen "mangelhaft" und "ungenügend" bilden,

um eine knappe Übersicht über die Lerngruppe zu erhalten.

Im Folgenden werden aber nur noch quantitative Merkmale betrachtet.

Nicht immer macht es Sinn, alle verschiedenen Merkmalsausprägungen einzeln zu betrachten. Bei quantitativen Merkmalen fasst man oft verschiedene Merkmalsausprägungen zu Klassen zusammen.

Beispiel Körpergröße (in cm)

Betrachtet man zum Beispiel die Körpergröße (in cm) der Schüler und Schülerinnen der Klasse HHU5 am Berufskolleg Hattingen (Schuljahr 2012/2013):

Urliste
Körpergröße in cm
170 178 174 188 168
191 169 159 199 200
177 178 200 193 169
151 185 191 165 158
185 188 194 180 170


Wenn man hier die verschiedenen Merkmalsausprägungen mit ihren absoluten und relativen Häufigkeiten erfasst, ist noch nicht wirklich etwas gewonnen, da es 18 verschiedene Merkmalsausprägungen gibt, von denen sieben die absolute Häufigkeit 2 und alle anderen die absolute Häufigkeit 1 haben. (Der geneigte Leser mag das selber nachrechnen.)

Man könnte zum Beispiel die Frage "Wie viele Schüler sind größer als 175 cm und höchstens 183 cm? stellen.

Dann ist es sinnvoll, eine absolute Häufigkeitsverteilung mit drei verschiedenen Klassen zu bilden. Jede Klasse hat eine untere und eine obere Grenze. Wichtig ist, dass sich die Klassen nicht überschneiden, damit jeder Beobachtungswert nur genau zu einer Klasse gehört.

Klasseneinteilung:

Klasse :

vom kleinsten Wert (hier: 151 cm) bis zu 175 cm einschließlich
mathematische Kurzschreibweise:

Klasse :

von über 175 cm bis zu 183 cm einschließlich
mathematische Kurzschreibweise:

Klasse :

von über 183 cm bis zum größten Wert (hier 200 cm) einschließlich
mathematische Kurzschreibweise:

Häufigkeitsverteilung bestimmen:

Jetzt kann man die absolute Häufigkeit zu jeder Klasse bestimmen, indem man alle Beobachtungswerte zählt, die im Intervall der Klasse liegen. Dann lässt sich auch die relative Häufigkeit zu jeder Klasse bestimmen, indem man den Anteil aller Beobachtungswerte am Stichprobenumfang , die im Intervall der Klasse liegen, berechnet.

Klassierte Körpergrößen HHU5 2012/2013
Summe
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{2}{5}=40 %} Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{4}{25}=16 %} Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{11}{25}=44 %} Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 100 %}

Interpretation:

Es sind also nicht nur vier Schüler größer als 175 cm und höchstens 183 cm. Es sieht so aus, als wären die Schüler der Klasse entweder klein oder groß, weil die Klasse in der Mitte so selten vertreten ist.

Stimmt das denn?

Hier ist es hilfreich, sich mit den Klassenbreiten zu beschäftigen.

Klassenbreiten bestimmen:

Die gewählten Klassen sind unterschiedlich breit. Die Breite einer Klasse errechnet man, indem man die untere Grenze von der oberen Grenze subtrahiert.

Klasse untere Grenze obere Grenze Klassenbreite

Jetzt sieht man, dass die mittlere Klasse auch viel schmaler ist, als die beiden anderen Klassen. Die Klassenbreite hat aber Einfluss auf die Häufigkeit, mit der die Beobachtungswerte in der Klasse liegen. Deshalb wählt man in der Regel Klassen mit gleicher Klassenbreite. Nur in Ausnahmefällen machen Klassen mit unterschiedlichen Klassenbreiten Sinn. Ganz besonders gut geeignet sind unterschiedliche Klassenbreiten, wenn man schon vorher weiß, welche Aussage man mit den Daten unterstützen möchte.

Auch die obige Fragestellung hätte man prima mit gleich breiten Klassen lösen können. Dabei beginnt man dann mit dem aus der Frage vorgegebenen Intervall und bildet alle nötigen Klassen darunter und darüber mit Klassenbreite 8 cm so, dass man auch den kleinsten und den größten Beobachtungswert einer Klasse zuordnen kann.

Das sieht dann so aus:

Klassierte Körpergrößen HHU5 2012/2013
Klasse Intervall
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{1}{25}=4 %}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{2}{25}=8 %}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{1}{25}=4 %}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{6}{25}=24 %}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{4}{25}=16 %}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{6}{25}=24 %}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{3}{25}=12 %}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{2}{25}=8 %}
Summe Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 100%}
Interpretation:

Man kann leicht erkennen, dass es - unter Berücksichtigung der Klassenbreite - nur zwei Klassen gibt, in denen sich mehr Beobachtungswerte befinden. So erhält man also ein ganz anderes Bild der Verteilung.


Merke
Wenn bei einer umfangreichen Stichprobe sehr viele unterschiedliche Merkmalsausprägungen auftreten, so bietet es sich an, ähnliche Werte in sogenannte Klassen der (Klassen-)Breite zusammenzufassen.


Man unterscheidet zwei Arten von Klassenbildungen:

  • Klassen mit gleicher Klassenbreite
    Klassen mit unterschiedlicher Klassenbreite

Übrigens eignen sich Klassen mit unterschiedlicher Klassenbreite hervorragend, um Daten so aufzubereiten, dass sie die gewünschte Aussage (hier entweder eine Klasse mit besonders großen Schülern oder mit besonders kleinen Schülern) gut unterstützen. Hier gilt der allseits beliebte Spruch: "Traue keiner Statistik, die du nicht selbst gefälscht hast."

Hier geht's weiter zu Klassen mit gleicher Klassenbreite


Klassen mit gleicher Klassenbreite

Für die Anzahl der Klassen gilt die folgende Regel,
wobei der Stichprobenumfang ist:


Fortsetzung Beispiel Körpergröße (in cm)

Im Beispiel ist

.

Also gilt für die Anzahl der Klassen

.


Eine Klasse ist ein Teil der Spannweite ( für Range,dem englischen Begriff für Spannweite), also ein Teil der Differenz zwischen der größten Merkmalsausprägung und der kleinsten Merkmalsausprägung .

Fortsetzung Beispiel Körpergröße (in cm)

Im Beispiel ist

und
,

somit gilt für die Spannweite

.


Die Klassenbreite ist der Quotient aus Spannweite und Klassenanzahl.

Fortsetzung Beispiel Körpergröße (in cm)

Im Beispiel ist die Klassenbreite also .


Bei der Zuordnung der Merkmalsausprägungen ist darauf zu achten, dass sich die Klassen nicht überschneiden. Sonst könnte es passieren, dass eine Merkmalsausprägung zwei Klassen zugeordnet wird.

Beachten Sie: Wählen Sie einen geeigneten Startwert als untere Klassengrenze (die in der Regel nicht zur Klasse gehören sollte) der ersten Klasse, addieren Sie die Klassenbreite um die obere Klassengrenze (diese gehört zur Klasse) zu erhalten.

Die obere Klassengrenze der vorangegangenen Klasse wird die untere Grenze der nächsten Klasse.

Und so fährt man fort, bis alle Klassen definiert sind.


Merke

Die einzelnen Klassen bezeichnet man mit , wobei gilt.

Klassenanzahl:

Spannweite:

Klassenbreite:


Fortsetzung Beispiel Körpergröße (in cm)

Man bestimmt nun die fünf Klassen der Breite 10 und beachtet dabei, dass die Klassen sich nicht überschneiden dürfen. Dann bestimmt man die absoluten Häufigkeiten der einzelnen Klassen, dabei werden alle Merkmalsausprägungen gezählt, die zu der jeweiligen Klasse gehören. Dann berechnet man die relativen Häufigkeiten der einzelnen Klassen.

Klassierte Körpergrößen HHU5 2012/2013
Summe
3 6 5 4 7 25
12 % 24 % 20 % 16 % 28 % 100 %

Diese Darstellung ist zunächst eher objektiv und der Leser der Tabelle wird nicht in die Irre geleitet. Festzuhalten ist, das es sich um eine Klasse mit eher großen Schülern handelt.


Einführung Merkmale und Merkmalsausprägungen

Einführungsbeispiel - Teil 6.1

Bei der Umfrage der Eisdiele "Rabe" weist das Merkmal "Alter" sehr viele verschiedene Merkmalsausprägungen (genau 28 verschiedene Merkmalsausprägungen) auf, so dass eine Aufbereitung nach absoluten oder relativen Häufigkeitsverteilungen nicht zu mehr Übersicht beitragen würde. Hier bietet es sich an, Klassen zu bilden, um die Altersstruktur der Kunden besser zu verstehen.

Größe Formel im Beispiel mit Einsetzen und Berechnen
Klassenanzahl \sqrt{n}</math>
Spannweite und
Klassenbreite und
Jetzt geht es an die Klassenbildung:

Legt man fest, dass die untere Grenze selbst nicht zur Klasse gehört, aber die obere Grenze der Klasse dazugehört, so hat man sichergestellt, dass die Beobachtungswerte den Klassen eindeutig zugeordnet werden können.

Dann wählt man einen Startwert für die untere Grenze der ersten Klasse und addiert dann für die obere Klassengrenze die Klassenbreite zum Startwert. Die jeweils nächste Klasse hat dann als untere Grenze die obere Grenze der vorangegangenen Klasse.

Wählt man den Startwert , so erhält man die Klassen mit :








Einführungsbeispiel - Teil 6.2

Jetzt muss die absolute Häufigkeit ermittelt werden, mit der die Beobachtungswerte in den einzelnen Klassen liegen:

Klassen Häufigkeiten
Klasse über ... Jahre bis zu ... Jahre in Prozent
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 16,7%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 36,7%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 13,3%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 13,3%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 10,0%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 10,0%}
Summe Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 100%}
Interpretation

Auffällig ist, dass mehr als ein Drittel aller Kunden zwischen 13 und 26 Jahren alt sind. Der Besitzer der Eisdiele könnte hieraus zum Beispiel ableiten, dass er mehr Angebote für die anderen Altersklassen anbieten sollte, um auch für diese Gruppen attraktiv zu sein und so mehr Umsatz zu erzielen.

Ausblick

Selbstverständlich wäre es auch möglich, eine andere Klassenanzahl zu wählen und so zu anderen Ergebnissen zu gelangen. Es ist nicht zwingend, die obigen Formeln für die Klassenanzahl und Klassenbreite zu wählen. Sie bieten aber einen guten Anhaltspunkt für eine erste Auswertung.

Hier noch eine weitere Auswertung mit 8 Klassen und einer Klassenbreite von 10.


Klassen Häufigkeiten
Klasse über ... Jahre bis zu ... Jahre in Prozent
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 6,7%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 33,3%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 13,3%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 16,7%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 6,7%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 10,0%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 10,0%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 3,3%}
Summe Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 100%}
Klassen mit beliebiger Klassenbreite
Fortsetzung Beispiel Körpergröße (in cm)

Nehmen wir nun an, wir wollen jemanden davon überzeugen, dass weniger als ein Viertel aller Schüler dieser Klasse besonders groß sind. Zunächst legen wir fest, was besonders groß bedeuten soll. Unsere Tabelle können wir entnehmen, dass mehr als ein Viertel aller Schüler 191 cm oder größer sind. Somit müssen wir einen Wert über 191 cm wählen und entscheiden uns für 195 cm. Um den Leser zu überzeugen, wählen wir nur zwei Klassen, alle Schüler kleiner als 195 und alle Schüler größer oder gleich 195. Unsere Tabelle bekommt dann folgendes Aussehen:

Klassierte Körpergrößen HHU5 2012/2013 bei unterschiedlicher Klassenbreite
Summe
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 88 %} Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 12 %} Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 100 %}

Und so glaubt der geneigte Leser sofort, dass es sich um eine körperlich recht kleine Klasse handelt, da nicht mal ein Achtel aller Schüler größer oder gleich 195 cm sind. Die Aussage wird durch geschickte Wahl der Größe und einer passenden Klassenbildung unterstützt.

Und noch einmal die Eisdiele "Rabe":

Einführungsbeispiel - Teil 7

Auch bei der Auswertung des Merkmals Alter kann man mit unterschiedlich großen Klassenbreiten arbeiten und versuchen zu interessanten Aussagen zu gelangen.

Wählt man beispielsweise nur zwei Klassen, die erste von 0 - 30 Jahre, die zweite von 30 - 80 Jahre, so erhält man:

Klassen Häufigkeiten
Klasse über ... Jahre bis zu ... Jahre in Prozent
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 53,3%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 46,7%}
Summe Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 100%}
Interpretation

Auf den ersten Blick sieht es so aus, als sei die Eisdiele bei jeder Altersgruppe gleich beliebt. Dies ist jedoch nicht so, wie man im Abschnitt Klassen mit gleicher Klassenbreite gut sehen konnte.

Noch ein Versuch:

Diesmal wählt man drei Klassen und erhält:

Klassen Häufigkeiten
Klasse über ... Jahre bis zu ... Jahre in Prozent
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 23,3%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 30%}
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 46,7%}
Summe Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 100%}
Interpretation

Hier könnte man auf den ersten Blick folgern, dass die Eisdiele "Rabe" gerade beim älteren Publikum besonders angesagt ist.

Bleiben noch zwei Hinweise, die man beachten sollte:


Merke

Bei Klassen mit unterschiedlichen Breiten ist jeder Klasse ihre Breite zuzuordnen

Vorsicht bei Statistiken mit unterschiedlich breiten Klassen. Hier weiß man nie, was der Autor verstecken will.


Hier geht's weiter Übungen Klassenbildung


zurück zu Grundbegriffe der beschreibenden Statistik