Lagemaße: Unterschied zwischen den Versionen

aus ZUM-Wiki, dem Wiki für Lehr- und Lerninhalte auf ZUM.de
Wechseln zu: Navigation, Suche
Zeile 1: Zeile 1:
 +
Mithilfe von Lagemaßen wird die Vielzahl der Daten einer Häufigkeitsverteilung auf eine Kennzahl reduziert. Oft ist es gar nicht so wichtig, wie ein Häufigkeitsverteilung im Einzelnen aussieht. Man interessiert sich vielmehr für den mittleren Wert. Die Merkmalsausprägungen gruppieren sich um die Mitte. Ein Lagemaß charakterisiert die Lage einer Verteilung.
 +
 +
{{Mathematik|
 +
Sie lernen hier drei verschiedene '''Lagemaße''' kennen und anwenden:
 +
* das arithmetische Mittel (auch Durchschnitt oder Mittelwert),
 +
* den Modus (auch Modalwert) und
 +
* den Median (auch Zentralwert).
 +
Jedes einzelne dieser Lagemaße kann sinnvoll sein, je nachdem welche Merkmalsart vorliegt und wie die Häufigkeitsverteilung aussieht.
 +
}}
 +
 +
=== Info ===
 +
 +
<!-- Beispiel -->
 +
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
 +
|colspan="11" |<u>'''Einwaage Marmelade'''</u>
 +
 +
Die PurFrucht GmbH produziert Marmelade. Diese wird maschinell in Gläser zu je 500 g abgefüllt. Aufgrund eines Einstellungsfehlers variiert die Einwaage jedoch und eine Stichprobe von 10 Gläsern hat folgendes Ergebnis geliefert:
 +
 +
<!-- Tabelle Einwaage -->
 +
<div style="float:left; margin-right:1em;">
 +
{| class="wikitable"
 +
|-
 +
| colspan="11" | '''Urliste Einwaage'''
 +
|-
 +
| Einwaage in g || 495 || 500 || 495 || 495 || 516 || 495 || 500 || 500 || 498 || 498
 +
|}
 +
<div>
 +
<!--  Ende Einwaage -->
 +
|-
 +
|
 +
Wie gut arbeitet die Maschine? Wie sollten die Einstellungen angepasst werden, um ein besseres Ergebnis zu erzielen?
 +
|}
 +
<!-- Ende Beispiel -->
 +
 +
Welche Information liefern die drei Lagemaße bezogen auf das obige Beispiel?
 +
 +
<!-- Definition Arithmetisches Mittel -->
 +
{{Definition|1=
 +
Das '''arithmetische Mittel''' <math>\bar x</math> ist die Summe aller Beobachtungswerte <math>a_i</math> dividiert durch den Stichprobenumfang <math>n</math>.
 +
 +
Mathematische Kurzschreibweise:
 +
:: <math>\bar x=\frac{1}{n}(a_1+a_2+ \cdots +a_{n-1}+a_n)=\frac{1}{n}\sum_{i=1}^n a_i</math>
 +
}}
 +
<!-- Ende Definition Arithmetisches Mittel -->
 +
<br />
 +
 +
 +
{{Anleitung|Einsatz des  Taschenrechners|
 +
Man kann die Urliste direkt in den Taschenrechner eingeben und das arithmetische Mittel dann bequem berechnen lassen. Eine ausführliche Anleitung gibt es [[../../Einsatz des Taschenrechners/ausführliche Anleitung|hier]].
 +
}}
 +
 +
 +
<!-- Fortsetzung 1 Beispiel -->
 +
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
 +
|<u>'''Fortsetzung Einwaage Marmelade'''</u>
 +
 +
Diese Definition des arithmetischen Mittels liefert:
 +
:: <math>\bar x=\frac{1}{10}(495+500+495+495+516+495+500+500+498+498)=\frac{1}{10}\cdot 5000=500</math>
 +
 +
Das arithmetische Mittel liegt bei 500 g.
 +
|}
 +
<!-- Fortsetzung 1 Beispiel -->
 +
<br />
 +
 +
<!-- Definition Modus -->
 +
{{Definition|1=
 +
Der '''Modus''' <math>x_{Mod}</math> ist der Beobachtungswert, der am häufigsten vorkommt. Es ist also derjenige Wert, der die größte Häufigkeit aufweist.
 +
}}
 +
<br />
 +
 +
<!-- Fortsetzung 2 Beispiel -->
 +
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
 +
|<u>'''Fortsetzung Einwaage Marmelade'''</u>
 +
 +
Um den Modus zu berechnen ist es sinnvoll, die Urliste zu sortieren:
 +
<!-- Tabelle Einwaage sortiert Modus -->
 +
<div style="float:left; margin-right:1em;">
 +
{| class="wikitable"
 +
|-
 +
| colspan="11" | '''sortierte Urliste Einwaage'''
 +
|-
 +
| Einwaage in g || <span style="background:yellow">495</span> || <span style="background:yellow">495</span> || <span style="background:yellow">495</span> || <span style="background:yellow">495</span> || 498 || 498 || 500 || 500 || 500 || 516
 +
|}
 +
<div>
 +
<!--  Ende Einwaage sortiert Modus-->
 +
|
 +
 +
 +
Jetzt lässt sich leicht ablesen:  <math>x_{Mod}=495</math>
 +
|-
 +
|
 +
Der Modus liegt bei 495 g.
 +
|}
 +
<!-- Ende Fortsetzung 2 Beispiel -->
 +
<br />
 +
 +
<!-- Definition Median -->
 +
{{Definition|1=
 +
Der '''Median''' <math>x_{Med}</math> ist der Wert, der in der Mitte steht, wenn alle Beobachtungswerte <math>a_i</math> der Größe nach geordnet sind. Bei gerader Anzahl von Beobachtungswerten ist der Median das arithmetische Mittel der beiden mittleren Werte.
 +
}}
 +
<!-- Ende Definition Median -->
 +
<br />
 +
 +
 +
{{Anleitung|Einsatz des  Taschenrechners|
 +
Man kann die Urliste direkt in den Taschenrechner eingeben und den Median dann bequem berechnen lassen. Eine ausführliche Anleitung gibt es [[../../Einsatz des Taschenrechners/ausführliche Anleitung|hier]].
 +
}}
 +
 +
 +
<!-- Fortsetzung 3 Beispiel -->
 +
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
 +
|colspan="11"| <u>'''Fortsetzung Einwaage Marmelade'''</u>
 +
|-
 +
|
 +
Betrachtet man also die sortierte Urliste, so erkennt man:
 +
 +
<!-- Tabelle Einwaage sortiert Median -->
 +
<div style="float:left; margin-right:1em;">
 +
<!-- Tabelle Einwaage sortiert Median -->
 +
{| class="wikitable"
 +
|-
 +
| colspan="11" | '''sortierte Urliste Einwaage'''
 +
|-
 +
| Einwaage in g || 495 || 495 || 495 || 495 || <span style="background:yellow">498</span> || <span style="background:yellow">498</span> || 500 || 500 || 500 || 516
 +
|}
 +
<div>
 +
<!--  Ende Einwaage sortiert Median -->
 +
 +
| Hier berechnet sich der Median als arithmetisches Mittel der mittleren beiden Werte:
 +
:: <math>x_{Med}=\frac{1}{2}(498+498)=498</math>
 +
|-
 +
|
 +
Der Median liegt bei 498 g.
 +
|}
 +
 +
Nicht immer ist eine Urliste oder eine sortierte Urliste gegeben. Oft sind die Daten auch schon als absolute oder relative Häufigkeitsverteilung aufbereitet. Wie kommt man dann an die verschiedenen Lagemaße?
 +
 +
<!-- Fortsetzung 4 Beispiel -->
 +
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
 +
|colspan="11"| <u>'''Fortsetzung Einwaage Marmelade'''</u>
 +
|-
 +
|
 +
Angenommen, die Daten aus dem obigen Beispiel lägen nur als absolute Häufigkeitsverteilung vor:
 +
 +
<!-- Tabelle Einwaage absolute Häufigkeit-->
 +
<div style="float:left; margin-right:1em;">
 +
{| class="wikitable"
 +
|-
 +
| colspan="6" | '''absolute Häufigkeit Einwaage'''
 +
|-
 +
| Einwaage <math>x_i</math> in g || 495 || 498 || 500 || 516 || Summe
 +
|-
 +
| <math>H(x_i)</math> || 4 || 2 || 3 || 1 || 10
 +
|}
 +
<div>
 +
<!--  Ende Einwaage absolute Häufigkeit-->
 +
|}
 +
<!-- Ende Fortsetzung 4 Beispiel -->
 +
 +
Um das arithmetische Mittel zu berechnen, nutzt man einfach eine zweite mögliche Definition:
 +
 +
<!-- Definition Arithmetisches Mittel absolute Häufigkeitsverteilung -->
 +
{{Definition|1=
 +
Ist eine absolute Häufigkeitsverteilung gegeben, so berechnet man das '''arithmetische Mittel''' <math>\bar x</math> als
 +
:: <math>\bar x=\frac{1}{n}(x_1 \cdot H(x_1)+x_2 \cdot H(x_2)+ \cdots +x_{k-1} \cdot H(x_{k-1})+x_k \cdot H(x_k))=\frac{1}{n}\sum_{i=1}^k x_i \cdot H(x_i)=\frac{1}{n}\sum_{i=1}^k x_i \cdot H_i</math>
 +
wobei <math>k</math> die Anzahl der Merkmalsausprägungen angibt.
 +
}}
 +
<!-- Definition Arithmetisches Mittel absolute Häufigkeitsverteilung -->
 +
 +
 +
{{Anleitung|Einsatz des  Taschenrechners|
 +
Man kann die Häufigkeitsverteilung direkt in den Taschenrechner eingeben und das arithmetische Mittel dann bequem berechnen lassen. Eine ausführliche Anleitung gibt es [[../../Einsatz des Taschenrechners/ausführliche Anleitung|hier]].
 +
}}
 +
 +
 +
<!-- Fortsetzung 5 Beispiel -->
 +
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
 +
|colspan="11"| <u>'''Fortsetzung Einwaage Marmelade'''</u>
 +
|-
 +
| Hier also:
 +
<math>\bar x=\frac{1}{10}(495 \cdot 4+498 \cdot 2+500 \cdot 3+516 \cdot 1)=500</math>
 +
|}
 +
<!-- Ende Fortsetzung 5 Beispiel -->
 +
 +
Der '''Modus''' ist leicht zu finden: Man liest einfach die höchste absolute Häufigkeit ab und die dazugehörende Merkmalsausprägung <math>x_i</math> liefert den Modus <math>x_{Mod}</math>.
 +
 +
<!-- Fortsetzung 6 Beispiel -->
 +
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
 +
|colspan="11"| <u>'''Fortsetzung Einwaage Marmelade'''</u>
 +
|-
 +
|
 +
<!-- Tabelle Einwaage absolute Häufigkeit Modus -->
 +
<div style="float:left; margin-right:1em;">
 +
{| class="wikitable"
 +
|-
 +
| colspan="6" | '''absolute Häufigkeit Einwaage'''
 +
|-
 +
| Einwaage <math>x_i</math> in g || <span style="background:yellow">495</span> || 498 || 500 || 516 || Summe
 +
|-
 +
| <math>H(x_i)</math> || <span style="background:yellow">4</span> || 2 || 3 || 1 || 10
 +
|}
 +
<div>
 +
<!--  Ende Einwaage absolute Häufigkeit Modus -->
 +
|-
 +
|
 +
Der Modus liegt bei <math>x_{Mod}=498</math>.
 +
|}
 +
<!-- Ende Fortsetzung 6 Beispiel -->
 +
 +
Beim Median addiert man die absoluten Häufigkeiten solange auf, bis man zur Mitte des Stichprobenumfangs gelangt ist.
 +
 +
 +
{{Anleitung|Einsatz des  Taschenrechners|
 +
Man kann die Häufigkeitsverteilung direkt in den Taschenrechner eingeben und den Median dann bequem berechnen lassen. Eine ausführliche Anleitung gibt es [[../../Einsatz des Taschenrechners/ausführliche Anleitung|hier]].
 +
}}
 +
 +
 +
<!-- Fortsetzung 7 Beispiel -->
 +
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
 +
|colspan="7"| <u>'''Fortsetzung Einwaage Marmelade'''</u>
 +
 +
Im Beispiel mit <math>n=10</math> sucht man also den 5. und 6. Wert:
 +
 +
<!-- Tabelle Einwaage absolute Häufigkeit Median -->
 +
<div style="float:left; margin-right:1em;">
 +
{| class="wikitable"
 +
|-
 +
| colspan="6" | '''absolute Häufigkeit Einwaage'''
 +
|-
 +
| Einwaage <math>x_i</math> in g || 495 || <span style="background:yellow">498</span> || 500 || 516 || Summe
 +
|-
 +
| <math>H(x_i)</math> || 4 || <span style="background:yellow">2</span> || 3 || 1 || 10
 +
|}
 +
<div>
 +
<!--  Ende Einwaage absolute Häufigkeit Median -->
 +
 +
|
 +
<br />
 +
<br />
 +
<br />
 +
 +
Die erste absolute Häufigkeit ist 4, also kleiner als 5 und 6.
 +
 +
Die nächste ist absolute Häufigkeit ist 2, 4+2=6, also Ziel erreicht.
 +
 +
Die zugehörige Merkmalsausprägung <math>x_2=498</math>:
 +
:: <math>x_{Med}=498</math>.
 +
|-
 +
| colspan="7"| Der Median liegt bei 498 g.
 +
|}
 +
<!-- Ende Fortsetzung 7 Beispiel -->
 +
 +
Bleibt die Frage: Und wie geht das, wenn die Daten nur als relative Häufigkeitsverteilung vorliegen?
 +
 +
<!-- Fortsetzung 8 Beispiel -->
 +
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
 +
|colspan="11"| <u>'''Fortsetzung Einwaage Marmelade'''</u>
 +
<br />
 +
 +
<!-- Tabelle Einwaage relative Häufigkeit-->
 +
<div style="float:left; margin-right:1em;">
 +
{| class="wikitable"
 +
|-
 +
| colspan="6" | '''relative Häufigkeit Einwaage'''
 +
|-
 +
| Einwaage <math>x_i</math> in g || 495 || 498 || 500 || 516 || Summe
 +
|-
 +
| <math>h(x_i)</math> || 40% || 20% || 30% || 10% || 100%
 +
|}
 +
<!--  Ende Einwaage relative Häufigkeit-->
 +
<div>
 +
|}
 +
<!-- Ende Fortsetzung 8 Beispiel -->
 +
 +
Um das arithmetische Mittel zu berechnen, nutzt man einfach die dritte mögliche Definition:
 +
 +
<!-- Definition Arithmetisches Mittel relative Häufigkeitsverteilung -->
 +
{{Definition|1=
 +
Ist eine relative Häufigkeitsverteilung gegeben, so berechnet man das '''arithmetische Mittel''' <math>\bar x</math> als
 +
:: <math>\bar x=x_1 \cdot h(x_1)+x_2 \cdot h(x_2)+ \cdots +x_{k-1} \cdot h(x_{k-1})+x_k \cdot h(x_k)=\sum_{i=1}^k x_i \cdot h(x_i)=\sum_{i=1}^k x_i \cdot h_i</math>
 +
wobei <math>k</math> die Anzahl der Merkmalsausprägungen angibt.
 +
}}
 +
<!-- Definition Arithmetisches Mittel relative Häufigkeitsverteilung -->
 +
 +
<!-- Fortsetzung 9 Beispiel -->
 +
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
 +
|colspan="11"| <u>'''Fortsetzung Einwaage Marmelade'''</u>
 +
 +
Hier also:
 +
<math>\bar x=495 \cdot 40%+498 \cdot 20%+500 \cdot 30%+516 \cdot 10%=500</math>
 +
 +
Das arithmetische Mittel liegt bei 500 g.
 +
|}
 +
<!-- Ende Fortsetzung 9 Beispiel -->
 +
 +
Den '''Modus''' findet man, indem man die höchste relative Häufigkeit nimmt und die dazugehörende Merkmalsausprägung <math>x_i</math> liefert den Modus <math>x_{Mod}</math>.
 +
 +
<!-- Fortsetzung 10 Beispiel -->
 +
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
 +
|colspan="11"| <u>'''Fortsetzung Einwaage Marmelade'''</u>
 +
<br />
 +
 +
<!-- Tabelle Einwaage relative Häufigkeit Modus -->
 +
<div style="float:left; margin-right:1em;">
 +
{| class="wikitable"
 +
|-
 +
| colspan="6" | '''relative Häufigkeit Einwaage'''
 +
|-
 +
| Einwaage <math>x_i</math> in g || <span style="background:yellow">495</span> || 498 || 500 || 516 || Summe
 +
|-
 +
| <math>h(x_i)</math> || <span style="background:yellow">40%</span> || 20% || 30% || 10% || 100%
 +
|}
 +
<div>
 +
<!--  Ende Einwaage relative Häufigkeit Modus -->
 +
|
 +
<math>x_{Mod}=495</math>
 +
|-
 +
|colspan="7"|
 +
 +
 +
Der Modus liegt bei 495 g.
 +
|}
 +
<!-- Ende Fortsetzung 10 Beispiel -->
 +
 +
Beim Median addiert man die relativen Häufigkeiten bis zu 50 % auf und liest die zugehörige Merkmalsausprägung ab.
 +
 +
<!-- Fortsetzung 11 Beispiel -->
 +
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
 +
|  <u>'''Fortsetzung Einwaage Marmelade'''</u>
 +
 +
Im Beispiel:
 +
<!-- Tabelle Einwaage relative Häufigkeit Median -->
 +
<div style="float:left; margin-right:1em;">
 +
{| class="wikitable"
 +
|-
 +
| colspan="6" | '''relative Häufigkeit Einwaage'''
 +
|-
 +
| Einwaage <math>x_i</math> in g || 495 || <span style="background:yellow">498</span> || 500 || 516 || Summe
 +
|-
 +
| <math>h(x_i)</math> || 40% || <span style="background:yellow">20%</span> || 30% || 10% || 100%
 +
|}
 +
<div>
 +
<!--  Ende Einwaage relative Häufigkeit Median -->
 +
 +
Die erste relative Häufigkeit beträgt 40%, also kleiner als 50%.
 +
 +
Die nächste ist absolute Häufigkeit beträgt 20%, 40%+20%=60%, also Ziel erreicht.
 +
 +
Die zugehörige Merkmalsausprägung <math>x_2=498</math> liefert den Median: <math>x_{Med}=498</math>.
 +
 +
 +
Der Median liegt bei 498 g.
 +
 +
'''Interpretation der Ergebnisse:'''
 +
* Das arithmetische Mittel - also die durchschnittliche Einwaage - liegt bei 500 g. Also haben im Mittel alle Gläser eine Einwaage von 500 g.
 +
* Der Modus (also der am häufigsten vorkommende Wert) liegt bei 495 g. Das ist natürlich eher nicht so gut und könnte zu Kundenreklamationen führen. Aber hier ist zu bedenken, dass der Modus als Maß für die Mitte nur bei großem Stichprobenumfang wirklich aussagekräftig ist.
 +
* Der Median liegt bei 498 g. Das ist allerdings kritisch, da somit mehr die Hälfte aller Gläser eine zu geringe Einwaage aufweisen.
 +
|}
 +
<!-- Ende Fortsetzung 11 Beispiel -->
 +
<br />
 +
 +
<!-- Merke-Lagemaße -->
 +
{{Merke-M||1=
 +
Das <span style="background:yellow">'''arithmetische Mittel'''</span> (auch <span style="background:yellow">'''Mittelwert'''</span> oder <span style="background:yellow">'''Durchschnitt'''</span>) berechnet sich bei
 +
: gegebener Urliste als
 +
:: <math>\bar x=\frac{1}{n}(a_1+a_2+ \cdots +a_{n-1}+a_n)=\frac{1}{n}\sum_{i=1}^n a_i</math>
 +
: gegebener absoluter Häufigkeitsverteilung als
 +
:: <math>\bar x=\frac{1}{n}(x_1 \cdot H(x_1)+x_2 \cdot H(x_2)+ \cdots +x_{k-1} \cdot H(x_{k-1})+x_k \cdot H(x_k))=\frac{1}{n}\sum_{i=1}^k x_i \cdot H(x_i)=\frac{1}{n}\sum_{i=1}^k x_i \cdot H_i</math>
 +
: gegebener relativer Häufigkeitsverteilung als
 +
:: <math>\bar x=x_1 \cdot h(x_1)+x_2 \cdot h(x_2)+ \cdots +x_{k-1} \cdot h(x_{k-1})+x_k \cdot h(x_k)=\sum_{i=1}^k x_i \cdot h(x_i)=\sum_{i=1}^k x_i \cdot h_i</math>
 +
Das arithmetische Mittel entspricht nicht immer einer Merkmalsausprägung der Urliste.
 +
 +
Der <span style="background:yellow">'''Modus'''</span> (auch <span style="background:yellow">'''Modalwert'''</span>) <math>x_{Mod}</math> ist
 +
:: bei gegebener Urliste der Beobachtungswert, der am häufigsten vorkommt.
 +
:: bei absoluter oder relativer Häufigkeitsverteilung die Merkmalsausprägung, die am häufigsten vorkommt.
 +
Der Modus muss nicht eindeutig sein, entspricht aber in jedem Fall einer Merkmalsausprägung.
 +
 +
Der <span style="background:yellow">'''Median'''</span> (auch <span style="background:yellow">'''Zentralwert'''</span>) <math>x_{Mod}</math> ist
 +
: der Beobachtungswert <math>a_i</math> in der Mitte der sortierten Urliste bei ungeradem Stichprobenumfang <math>n</math>
 +
: das arithmetische Mittel der mittleren Beobachtungswerte <math>a_{n/2}</math> und <math>a_{n/2 +1}</math> in der Mitte der sortierten Urliste bei geradem Stichprobenumfang <math>n</math>
 +
: bei gegebener absoluter oder relativer Häufigkeitsverteilung durch Addition der Häufigkeiten bis zur Mitte zu ermitteln.
 +
Der Median entspricht nicht in jedem Fall einer Merkmalsausprägung.
 +
}}
 +
 +
== Das passende Lagemaß auswählen==
 +
Lagemaße berechnen ist nicht schwierig, aber welches ist das Richtige?
 +
 +
Diese Frage ist nicht leicht und schon gar nicht einfach zu beantworten.
 +
 +
Der Modus ist toll bei großen Datenmengen. Er ist unempfindlich gegenüber Ausreißern in den Beobachtungswerten und er kann auch bei qualitativen Merkmalen verwendet werden. Außerdem ist sichergestellt, dass der Modus immer auch eine Merkmalsausprägung ist.
 +
 +
Der Median ist auch unempfindlich gegenüber Ausreißern in den Beobachtungswerten. Aber um mit dem Median arbeiten zu können, müssen qualitative Merkmale eine Ordinalskala haben, für qualitative Merkmale mit Nominalskala bleibt nur der Modus. Es kann allerdings passieren, dass der Median einen Wert annimmt, der als Merkmalsausprägung nicht vorkommt.
 +
 +
Das arithmetische Mittel lässt sich nur bei qualitativen Merkmalen anwenden. Leider reagiert das arithmetische Mittel aber sehr empfindlich auf Ausreißer und ist dann wenig aussagekräftig. Auch bei dem arithmetischen Mittel ist es möglich, dass ein Wert ermittelt wird, der als Merkmalsausprägung nicht vorkommt.
 +
 +
Es ist also in jedem einzelnen Fall zu prüfen, welches Lagemaß für das bestimmte Merkmal mit der gegebenen Häufigkeitsverteilung am besten geeignet ist.
 +
<!-- Ende Lagemaße auswählen -->
 +
 +
 +
== Übungen ==
 +
 +
'''Ordnen Sie die mathematischen Bezeichnungen und Formeln richtig zu.'''
 +
<div class="zuordnungs-quiz">
 +
{|
 +
| arithmetisches Mittel || Durchschnitt || Mittelwert || <math>\bar x</math>
 +
|-
 +
| Median || Zentralwert || <math>x_{Med}</math> || der mittlere Wert eines sortierten Urliste
 +
|-
 +
| Modus || <math>x_{Mod}</math> || der häufigste Wert || Modalwert
 +
|}
 +
</div>
 +
 +
<!-- Ende Aufgabe 1 -->
 +
 +
<!-- Aufgabe 2 -->
 +
'''Ordnen Sie die mathematischen Bezeichnungen und Formeln richtig zu, wenn die Daten als ... vorliegen.'''
 +
<div class="zuordnungs-quiz">
 +
{|
 +
| Urliste || <math>\frac{1}{n}(a_1+a_2+ \cdots +a_{n-1}+a_n)</math> || <math>\frac{1}{n}\sum_{i=1}^n a_i</math>
 +
|-
 +
| absolute Häufigkeitsverteilung || <math>\frac{1}{n}(x_1 \cdot H(x_1)+x_2 \cdot H(x_2)+ \cdots +x_{k-1} \cdot H(x_{k-1})+x_k \cdot H(x_k))</math>  || <math>\frac{1}{n}\sum_{i=1}^k x_i \cdot H(x_i)</math> || <math>\frac{1}{n}\sum_{i=1}^k x_i \cdot H_i</math>
 +
|-
 +
| relative Häufigkeitsverteilung || <math>x_1 \cdot h(x_1)+x_2 \cdot h(x_2)+ \cdots +x_{k-1} \cdot h(x_{k-1})+x_k \cdot h(x_k)</math> || <math>\sum_{i=1}^k x_i \cdot h(x_i)</math> || <math>\sum_{i=1}^k x_i \cdot h_i</math>
 +
|}
 +
</div>
 +
 +
<!-- Ende Aufgabe 2 -->
 +
 +
<!-- Aufgabe 3 -->
 +
{{Aufgabe|
 +
Gegeben sind die folgenden Urlisten:
 +
#  5; 7; 8; 7; 10; 10; 7; 6
 +
#  5; 7; 8; 7; 10; 10; 7; 6; 48
 +
#  5; 7; 8; 7; 10; 10; 7; 6; 48; 2
 +
Bestimmen Sie Modus, Median und arithmetisches Mittel für jede der drei Listen.
 +
}}
 +
{{Lösung versteckt|
 +
Die erste Liste sortieren, Stichprobenumfang <math>n=8</math>
 +
:: 5; 6; 7; 7; 7; 8; 10; 10
 +
Modus <math>x_{Mod}=7</math>
 +
Median <math>x_{Med}=\frac{7+7}{2}=7</math>
 +
arithmetisches Mittel <math>\bar x=\frac{5+6+7+7+7+8+10+10}{8}=7,5</math>
 +
 +
Da alle drei Lagemaße nah beieinander liegen, kann man davon ausgehen, dass es hier keine Ausreißer gibt und man jedes als Maß für die Mitte der Verteilung nutzen kann.
 +
 +
Die zweite Liste sortieren, Stichprobenumfang <math>n=9</math>
 +
:: 5; 6; 7; 7; 7; 8; 10; 10; 48
 +
Modus <math>x_{Mod}=7</math>
 +
Median <math>x_{Med}=7</math>
 +
arithmetisches Mittel <math>\bar x=\frac{5+6+7+7+7+8+10+10+48}{9}=12</math>
 +
 +
Bemerkung: Hier sieht man den Einfluß, den der neu dazugekommene Ausreißer 48 auf das arithmetische  Mittel hat. Es ist das Einzige der drei Lagemaße, dass auf den neuen Wert reagiert. Hier ist das arithmetische Mittel nicht geeignet, die Mitte der Verteilung zu beschreiben.
 +
 +
Die dritte Liste sortieren, Stichprobenumfang <math>n=10</math>
 +
:: 2; 5; 6; 7; 7; 7; 8; 10; 10; 48
 +
Modus <math>x_{Mod}=7</math>
 +
Median <math>x_{Med}=\frac{7+7}{2}=7</math>
 +
arithmetisches Mittel <math>\bar x=\frac{5+6+7+7+7+8+10+10+48+2}{10}=11</math>
 +
 +
Bemerkung: Auch hier sieht man den Einfluß, den der neu dazugekommene zweite Ausreißer 2 auf das arithmetische  Mittel hat. Es ist wieder das Einzige der drei Lagemaße, dass auf den neuen Wert reagiert. Hier ist das arithmetische Mittel nicht geeignet, die Mitte der Verteilung zu beschreiben.
 +
}}
 +
<!-- Ende Aufgabe 3 -->
 +
 +
<!-- Aufgabe 4 -->
 +
{{Aufgabe|
 +
Entscheiden Sie.}}
 +
 +
<quiz display="simple">
 +
{Das arithmetische Mittel ist die Summe aller Werte.}
 +
- Ja, das stimmt.
 +
+ Nein, das stimmt nicht.
 +
 +
 +
{Eine Hälfte aller Werte ist immer größer als der Modus.}
 +
+ Nein, das stimmt nicht.
 +
- Ja, das stimmt.
 +
 +
{Das arithmetische Mittel ist der Quotient aus der Summe aller Werte und der Anzahl aller Werte.}
 +
- Nein, das stimmt nicht.
 +
+ Ja, das stimmt.
 +
 +
{Das arithmetische Mittel ist der Quotient aus dem Produkt aller Werte und der Anzahl aller Werte.}
 +
+ Nein, das stimmt nicht.
 +
- Ja, das stimmt.
 +
 +
{Der Median und das arithmetische Mittel sind identisch.}
 +
+ Nein, das stimmt nicht.
 +
- Ja, das stimmt.
 +
 +
{Der Zentralwert und der Median sind identisch.}
 +
- Nein, das stimmt nicht.
 +
+ Ja, das stimmt.
 +
 +
{Der Zentralwert und der Modus sind identisch.}
 +
+ Nein, das stimmt nicht.
 +
- Ja, das stimmt.
 +
 +
{Die Hälfte aller Werte ist kleiner oder genauso groß wie der Median.}
 +
- Nein, das stimmt nicht.
 +
+ Ja, das stimmt.
 +
 +
{Der Modus ist nur für quantitative Merkmale geeignet.}
 +
+ Nein, das stimmt nicht.
 +
- Ja, das stimmt.
 +
 +
{Das arithmetische Mittel ist nur für quantitative Merkmale geeignet.}
 +
- Nein, das stimmt nicht.
 +
+ Ja, das stimmt.
 +
 +
</quiz>
 +
<!-- Ende Aufgabe 4 -->
 +
 +
<!-- Aufgabe 5 -->
 +
{{Aufgabe|
 +
Die Firma Schmidt&Müller GmbH produziert unter anderem Schrauben mit einer Solllänge von 60 mm. In der Qualitätskontrolle werden der laufenden Produktion 20 Schrauben entnommen und die Beobachtungswerte (in mm) notiert:
 +
 +
59,5; 60,5; 60,0; 59,5; 59,5; 61,9; 59,5; 59,8; 60,3; 60,9; 61,5; 61,0; 60,2; 61,2; 60,3; 58,9; 60,8; 59,5; 58,5; 59,2
 +
 +
* Bestimmen Sie das arithmetische Mittel und den Median der Verteilung.
 +
* Vergleichen Sie die beiden Lagemaße.
 +
* Bei der 21. Entnahme wird eine besonders kurze Schraube von 57,0 mm entnommen. Wie beeinflusst diese Schraube arithmetisches Mittel und Median der Verteilung?
 +
}}
 +
 +
{{Lösung versteckt|
 +
Am einfachsten findet man die Lösung durch Einsatz eines Tabellenkalkulationsprogramms.
 +
 +
Die ersten 20 Beobachtungswerte liefern:
 +
Median <math>x_{Med}=60,1</math> mm
 +
arithmetisches Mittel <math>\bar x=60,08</math> mm.
 +
 +
Sowohl der Durchschnitt als auch das Zentrum der Verteilung liegen über dem Sollwert von 60 mm. Der Median ist mit 60,1 mm weiter vom Sollwert entfernt als das arithmetische Mittel von 60,08 mm.
 +
 +
Die ersten 21 Beobachtungswerte liefern:
 +
Median <math>x_{Med}=60</math> mm
 +
arithmetisches Mittel <math>\bar x=59,93</math>
 +
 +
Beide Werte verändern sich nach unten. Der Durchschnitt liegt jetzt unter der Solllänge von 60 mm, das Zentrum der Verteilung liegt genau bei 60 mm.
 +
}}
 +
<!-- Ende Aufgabe 4 -->
 +
 +
<!-- Aufgabe 5 -->
 +
{{Aufgabe|Die Schülerinnen und Schüler des bkh nehmen an einer Befragung teil, in der die Ausstattung und Optik der Schule bewertet werden soll.
 +
 +
Bestimmen Sie jeweils
 +
* das arithmetische Mittel,
 +
* den Median (Zentralwert) und
 +
* den Modus (Modalwert) der Ergebnisse.
 +
Entscheiden Sie begründet, welches Lagemaß die höchste Aussagekraft hat.
 +
}}
 +
 +
a)
 +
{|
 +
| Bewertung der Ausstattung und Optik || Anzahl der Schüler
 +
|-
 +
| 1 (sehr gut) || 43
 +
|-
 +
| 2 (gut) || 22
 +
|-
 +
| 3 (befriedigend) || 15
 +
|-
 +
| 4 (ausreichend) || 36
 +
|-
 +
| 5 (mangelhaft) || 21
 +
|-
 +
|6 (ungenügend) || 24
 +
|}
 +
b)
 +
{|
 +
| Bewertung der Ausstattung und Optik || Anzahl der Schüler
 +
|-
 +
| 1 (sehr gut) || 25
 +
|-
 +
| 2 (gut) || 29
 +
|-
 +
| 3 (befriedigend) || 28
 +
|-
 +
| 4 (ausreichend) || 27
 +
|-
 +
| 5 (mangelhaft) || 28
 +
|-
 +
|6 (ungenügend) || 24
 +
|}
 +
 +
{{Lösung versteckt|
 +
Stichprobenumfang <math>n=161</math>
 +
 +
a)
 +
Modus <math>x_{Mod}=1</math> (sehr gut) (der häufigste Wert)
 +
Median durch summieren der Häufigkeiten bis 81, zugehörige Merkmalsausprägung ablesen <math>x_{Med}=4</math> (ausreichend) (das Zentrum der Verteilung)
 +
Arithmetisches Mittel <math>\bar x=3,261</math> (der Mittelwert oder Durchschnitt der Verteilung)
 +
 +
b)
 +
Modus <math>x_{Mod}=2</math> (gut) (der häufigste Wert)
 +
Median durch summieren der Häufigkeiten bis 81, zugehörige Merkmalsausprägung ablesen <math>x_{Med}=3</math> (befriedigend) (das Zentrum der Verteilung)
 +
Arithmetisches Mittel <math>\bar x=3,472</math> (der Mittelwert oder Durchschnitt der Verteilung)
 +
 +
Der Modus ist nicht so aussagekräftig wie der Median, da der Stichprobenumfang nicht besonders groß ist.
 +
 +
Das arithmetische Mittel kann zwar berechnet werden, aber es kommt selbst als Merkmalsausprägung nicht vor. Hier verhält es sich so ähnlich wie der Durchschnitt aller Noten in einer Klassenarbeit. Das Merkmal ist qualitativ mit Ordinalskala.
 +
}}
 +
<!-- Ende Aufgabe 5 -->
 +
 +
'''Aufgabe 6'''
 +
 +
<iframe src="//LearningApps.org/watch?v=ph64ktzk301" style="border:0px;width:100%;height:500px" webkitallowfullscreen="true" mozallowfullscreen="true"></iframe>
 +
 +
 +
 +
 +
 +
 +
{{Beschreibende Statistik}}
 +
 +
== Lernziele ==
 
Sie kennen die Begriffe
 
Sie kennen die Begriffe
 
* Grundgesamtheit, Stichprobe, Stichprobenumfang,
 
* Grundgesamtheit, Stichprobe, Stichprobenumfang,
Zeile 16: Zeile 630:
 
[[../Grundbegriffe|Grundbegriffe der beschreibenden Statistik]]
 
[[../Grundbegriffe|Grundbegriffe der beschreibenden Statistik]]
  
== Das passende Lagemaß auswählen==
 
Lagemaße berechnen ist nicht schwierig, aber welches ist das Richtige?
 
 
Diese Frage ist nicht leicht und schon gar nicht einfach zu beantworten.
 
 
Der Modus ist toll bei großen Datenmengen. Er ist unempfindlich gegenüber Ausreißern in den Beobachtungswerten und er kann auch bei qualitativen Merkmalen verwendet werden. Außerdem ist sichergestellt, dass der Modus immer auch eine Merkmalsausprägung ist.
 
 
Der Median ist auch unempfindlich gegenüber Ausreißern in den Beobachtungswerten. Aber um mit dem Median arbeiten zu können, müssen qualitative Merkmale eine Ordinalskala haben, für qualitative Merkmale mit Nominalskala bleibt nur der Modus. Es kann allerdings passieren, dass der Median einen Wert annimmt, der als Merkmalsausprägung nicht vorkommt.
 
 
Das arithmetische Mittel lässt sich nur bei qualitativen Merkmalen anwenden. Leider reagiert das arithmetische Mittel aber sehr empfindlich auf Ausreißer und ist dann wenig aussagekräftig. Auch bei dem arithmetischen Mittel ist es möglich, dass ein Wert ermittelt wird, der als Merkmalsausprägung nicht vorkommt.
 
 
Es ist also in jedem einzelnen Fall zu prüfen, welches Lagemaß für das bestimmte Merkmal mit der gegebenen Häufigkeitsverteilung am besten geeignet ist.
 
<!-- Ende Lagemaße auswählen -->
 
  
 
<!-- Beispiele fehlen noch -->
 
<!-- Beispiele fehlen noch -->
 
* [[Beschreibende Statistik/Arithmetisches Mittel, Modus, Median|Arithmetisches Mittel, Modus, Median]]
 
|| [[/Übungen Arithmetisches Mittel, Modus, Median|Übungen Arithmetisches Mittel, Modus, Median]]
 
* [[Beschreibende Statistik/Das passende Lagemaß auswählen|Das passende Lagemaß auswählen]]
 
|| [[/Übungen Das passende Lagemaß auswählen|Übungen Das passende Lagemaß auswählen]]
 
  
  
  
 
{{Beschreibende Statistik}}
 
{{Beschreibende Statistik}}

Version vom 15. April 2019, 12:31 Uhr

Mithilfe von Lagemaßen wird die Vielzahl der Daten einer Häufigkeitsverteilung auf eine Kennzahl reduziert. Oft ist es gar nicht so wichtig, wie ein Häufigkeitsverteilung im Einzelnen aussieht. Man interessiert sich vielmehr für den mittleren Wert. Die Merkmalsausprägungen gruppieren sich um die Mitte. Ein Lagemaß charakterisiert die Lage einer Verteilung.

Sie lernen hier drei verschiedene Lagemaße kennen und anwenden:

  • das arithmetische Mittel (auch Durchschnitt oder Mittelwert),
  • den Modus (auch Modalwert) und
  • den Median (auch Zentralwert).

Jedes einzelne dieser Lagemaße kann sinnvoll sein, je nachdem welche Merkmalsart vorliegt und wie die Häufigkeitsverteilung aussieht.

Inhaltsverzeichnis

Info

Einwaage Marmelade

Die PurFrucht GmbH produziert Marmelade. Diese wird maschinell in Gläser zu je 500 g abgefüllt. Aufgrund eines Einstellungsfehlers variiert die Einwaage jedoch und eine Stichprobe von 10 Gläsern hat folgendes Ergebnis geliefert:

Urliste Einwaage
Einwaage in g 495 500 495 495 516 495 500 500 498 498

Wie gut arbeitet die Maschine? Wie sollten die Einstellungen angepasst werden, um ein besseres Ergebnis zu erzielen?

Welche Information liefern die drei Lagemaße bezogen auf das obige Beispiel?

Definition

Das arithmetische Mittel \bar x ist die Summe aller Beobachtungswerte a_i dividiert durch den Stichprobenumfang n.

Mathematische Kurzschreibweise:

\bar x=\frac{1}{n}(a_1+a_2+ \cdots +a_{n-1}+a_n)=\frac{1}{n}\sum_{i=1}^n a_i



WIE GEHT DAS? Einsatz des Taschenrechners

Man kann die Urliste direkt in den Taschenrechner eingeben und das arithmetische Mittel dann bequem berechnen lassen. Eine ausführliche Anleitung gibt es [[../../Einsatz des Taschenrechners/ausführliche Anleitung|hier]].


Fortsetzung Einwaage Marmelade

Diese Definition des arithmetischen Mittels liefert:

\bar x=\frac{1}{10}(495+500+495+495+516+495+500+500+498+498)=\frac{1}{10}\cdot 5000=500

Das arithmetische Mittel liegt bei 500 g.


Definition

Der Modus x_{Mod} ist der Beobachtungswert, der am häufigsten vorkommt. Es ist also derjenige Wert, der die größte Häufigkeit aufweist.


Fortsetzung Einwaage Marmelade

Um den Modus zu berechnen ist es sinnvoll, die Urliste zu sortieren:

sortierte Urliste Einwaage
Einwaage in g 495 495 495 495 498 498 500 500 500 516


Jetzt lässt sich leicht ablesen: x_{Mod}=495

Der Modus liegt bei 495 g.


Definition

Der Median x_{Med} ist der Wert, der in der Mitte steht, wenn alle Beobachtungswerte a_i der Größe nach geordnet sind. Bei gerader Anzahl von Beobachtungswerten ist der Median das arithmetische Mittel der beiden mittleren Werte.



WIE GEHT DAS? Einsatz des Taschenrechners

Man kann die Urliste direkt in den Taschenrechner eingeben und den Median dann bequem berechnen lassen. Eine ausführliche Anleitung gibt es [[../../Einsatz des Taschenrechners/ausführliche Anleitung|hier]].


Fortsetzung Einwaage Marmelade

Betrachtet man also die sortierte Urliste, so erkennt man:

sortierte Urliste Einwaage
Einwaage in g 495 495 495 495 498 498 500 500 500 516
Hier berechnet sich der Median als arithmetisches Mittel der mittleren beiden Werte:
x_{Med}=\frac{1}{2}(498+498)=498

Der Median liegt bei 498 g.

Nicht immer ist eine Urliste oder eine sortierte Urliste gegeben. Oft sind die Daten auch schon als absolute oder relative Häufigkeitsverteilung aufbereitet. Wie kommt man dann an die verschiedenen Lagemaße?

Fortsetzung Einwaage Marmelade

Angenommen, die Daten aus dem obigen Beispiel lägen nur als absolute Häufigkeitsverteilung vor:

absolute Häufigkeit Einwaage
Einwaage x_i in g 495 498 500 516 Summe
H(x_i) 4 2 3 1 10

Um das arithmetische Mittel zu berechnen, nutzt man einfach eine zweite mögliche Definition:

Definition

Ist eine absolute Häufigkeitsverteilung gegeben, so berechnet man das arithmetische Mittel \bar x als

\bar x=\frac{1}{n}(x_1 \cdot H(x_1)+x_2 \cdot H(x_2)+ \cdots +x_{k-1} \cdot H(x_{k-1})+x_k \cdot H(x_k))=\frac{1}{n}\sum_{i=1}^k x_i \cdot H(x_i)=\frac{1}{n}\sum_{i=1}^k x_i \cdot H_i

wobei k die Anzahl der Merkmalsausprägungen angibt.


WIE GEHT DAS? Einsatz des Taschenrechners

Man kann die Häufigkeitsverteilung direkt in den Taschenrechner eingeben und das arithmetische Mittel dann bequem berechnen lassen. Eine ausführliche Anleitung gibt es [[../../Einsatz des Taschenrechners/ausführliche Anleitung|hier]].


Fortsetzung Einwaage Marmelade
Hier also:

\bar x=\frac{1}{10}(495 \cdot 4+498 \cdot 2+500 \cdot 3+516 \cdot 1)=500

Der Modus ist leicht zu finden: Man liest einfach die höchste absolute Häufigkeit ab und die dazugehörende Merkmalsausprägung x_i liefert den Modus x_{Mod}.

Fortsetzung Einwaage Marmelade
absolute Häufigkeit Einwaage
Einwaage x_i in g 495 498 500 516 Summe
H(x_i) 4 2 3 1 10

Der Modus liegt bei x_{Mod}=498.

Beim Median addiert man die absoluten Häufigkeiten solange auf, bis man zur Mitte des Stichprobenumfangs gelangt ist.


WIE GEHT DAS? Einsatz des Taschenrechners

Man kann die Häufigkeitsverteilung direkt in den Taschenrechner eingeben und den Median dann bequem berechnen lassen. Eine ausführliche Anleitung gibt es [[../../Einsatz des Taschenrechners/ausführliche Anleitung|hier]].


Fortsetzung Einwaage Marmelade

Im Beispiel mit n=10 sucht man also den 5. und 6. Wert:

absolute Häufigkeit Einwaage
Einwaage x_i in g 495 498 500 516 Summe
H(x_i) 4 2 3 1 10




Die erste absolute Häufigkeit ist 4, also kleiner als 5 und 6.

Die nächste ist absolute Häufigkeit ist 2, 4+2=6, also Ziel erreicht.

Die zugehörige Merkmalsausprägung x_2=498:

x_{Med}=498.
Der Median liegt bei 498 g.

Bleibt die Frage: Und wie geht das, wenn die Daten nur als relative Häufigkeitsverteilung vorliegen?

Fortsetzung Einwaage Marmelade


relative Häufigkeit Einwaage
Einwaage x_i in g 495 498 500 516 Summe
h(x_i) 40% 20% 30% 10% 100%

Um das arithmetische Mittel zu berechnen, nutzt man einfach die dritte mögliche Definition:

Definition

Ist eine relative Häufigkeitsverteilung gegeben, so berechnet man das arithmetische Mittel \bar x als

\bar x=x_1 \cdot h(x_1)+x_2 \cdot h(x_2)+ \cdots +x_{k-1} \cdot h(x_{k-1})+x_k \cdot h(x_k)=\sum_{i=1}^k x_i \cdot h(x_i)=\sum_{i=1}^k x_i \cdot h_i

wobei k die Anzahl der Merkmalsausprägungen angibt.

Fortsetzung Einwaage Marmelade

Hier also: \bar x=495 \cdot 40%+498 \cdot 20%+500 \cdot 30%+516 \cdot 10%=500

Das arithmetische Mittel liegt bei 500 g.

Den Modus findet man, indem man die höchste relative Häufigkeit nimmt und die dazugehörende Merkmalsausprägung x_i liefert den Modus x_{Mod}.

Fortsetzung Einwaage Marmelade


relative Häufigkeit Einwaage
Einwaage x_i in g 495 498 500 516 Summe
h(x_i) 40% 20% 30% 10% 100%

x_{Mod}=495


Der Modus liegt bei 495 g.

Beim Median addiert man die relativen Häufigkeiten bis zu 50 % auf und liest die zugehörige Merkmalsausprägung ab.

Fortsetzung Einwaage Marmelade

Im Beispiel:

relative Häufigkeit Einwaage
Einwaage x_i in g 495 498 500 516 Summe
h(x_i) 40% 20% 30% 10% 100%

Die erste relative Häufigkeit beträgt 40%, also kleiner als 50%.

Die nächste ist absolute Häufigkeit beträgt 20%, 40%+20%=60%, also Ziel erreicht.

Die zugehörige Merkmalsausprägung x_2=498 liefert den Median: x_{Med}=498.


Der Median liegt bei 498 g.

Interpretation der Ergebnisse:

  • Das arithmetische Mittel - also die durchschnittliche Einwaage - liegt bei 500 g. Also haben im Mittel alle Gläser eine Einwaage von 500 g.
  • Der Modus (also der am häufigsten vorkommende Wert) liegt bei 495 g. Das ist natürlich eher nicht so gut und könnte zu Kundenreklamationen führen. Aber hier ist zu bedenken, dass der Modus als Maß für die Mitte nur bei großem Stichprobenumfang wirklich aussagekräftig ist.
  • Der Median liegt bei 498 g. Das ist allerdings kritisch, da somit mehr die Hälfte aller Gläser eine zu geringe Einwaage aufweisen.


Maehnrot.jpg
Merke:

Das arithmetische Mittel (auch Mittelwert oder Durchschnitt) berechnet sich bei

gegebener Urliste als
\bar x=\frac{1}{n}(a_1+a_2+ \cdots +a_{n-1}+a_n)=\frac{1}{n}\sum_{i=1}^n a_i
gegebener absoluter Häufigkeitsverteilung als
\bar x=\frac{1}{n}(x_1 \cdot H(x_1)+x_2 \cdot H(x_2)+ \cdots +x_{k-1} \cdot H(x_{k-1})+x_k \cdot H(x_k))=\frac{1}{n}\sum_{i=1}^k x_i \cdot H(x_i)=\frac{1}{n}\sum_{i=1}^k x_i \cdot H_i
gegebener relativer Häufigkeitsverteilung als
\bar x=x_1 \cdot h(x_1)+x_2 \cdot h(x_2)+ \cdots +x_{k-1} \cdot h(x_{k-1})+x_k \cdot h(x_k)=\sum_{i=1}^k x_i \cdot h(x_i)=\sum_{i=1}^k x_i \cdot h_i

Das arithmetische Mittel entspricht nicht immer einer Merkmalsausprägung der Urliste.

Der Modus (auch Modalwert) x_{Mod} ist

bei gegebener Urliste der Beobachtungswert, der am häufigsten vorkommt.
bei absoluter oder relativer Häufigkeitsverteilung die Merkmalsausprägung, die am häufigsten vorkommt.

Der Modus muss nicht eindeutig sein, entspricht aber in jedem Fall einer Merkmalsausprägung.

Der Median (auch Zentralwert) x_{Mod} ist

der Beobachtungswert a_i in der Mitte der sortierten Urliste bei ungeradem Stichprobenumfang n
das arithmetische Mittel der mittleren Beobachtungswerte a_{n/2} und a_{n/2 +1} in der Mitte der sortierten Urliste bei geradem Stichprobenumfang n
bei gegebener absoluter oder relativer Häufigkeitsverteilung durch Addition der Häufigkeiten bis zur Mitte zu ermitteln.

Der Median entspricht nicht in jedem Fall einer Merkmalsausprägung.

Das passende Lagemaß auswählen

Lagemaße berechnen ist nicht schwierig, aber welches ist das Richtige?

Diese Frage ist nicht leicht und schon gar nicht einfach zu beantworten.

Der Modus ist toll bei großen Datenmengen. Er ist unempfindlich gegenüber Ausreißern in den Beobachtungswerten und er kann auch bei qualitativen Merkmalen verwendet werden. Außerdem ist sichergestellt, dass der Modus immer auch eine Merkmalsausprägung ist.

Der Median ist auch unempfindlich gegenüber Ausreißern in den Beobachtungswerten. Aber um mit dem Median arbeiten zu können, müssen qualitative Merkmale eine Ordinalskala haben, für qualitative Merkmale mit Nominalskala bleibt nur der Modus. Es kann allerdings passieren, dass der Median einen Wert annimmt, der als Merkmalsausprägung nicht vorkommt.

Das arithmetische Mittel lässt sich nur bei qualitativen Merkmalen anwenden. Leider reagiert das arithmetische Mittel aber sehr empfindlich auf Ausreißer und ist dann wenig aussagekräftig. Auch bei dem arithmetischen Mittel ist es möglich, dass ein Wert ermittelt wird, der als Merkmalsausprägung nicht vorkommt.

Es ist also in jedem einzelnen Fall zu prüfen, welches Lagemaß für das bestimmte Merkmal mit der gegebenen Häufigkeitsverteilung am besten geeignet ist.


Übungen

Ordnen Sie die mathematischen Bezeichnungen und Formeln richtig zu.

arithmetisches Mittel Durchschnitt Mittelwert \bar x
Median Zentralwert x_{Med} der mittlere Wert eines sortierten Urliste
Modus x_{Mod} der häufigste Wert Modalwert


Ordnen Sie die mathematischen Bezeichnungen und Formeln richtig zu, wenn die Daten als ... vorliegen.

Urliste \frac{1}{n}(a_1+a_2+ \cdots +a_{n-1}+a_n) \frac{1}{n}\sum_{i=1}^n a_i
absolute Häufigkeitsverteilung \frac{1}{n}(x_1 \cdot H(x_1)+x_2 \cdot H(x_2)+ \cdots +x_{k-1} \cdot H(x_{k-1})+x_k \cdot H(x_k)) \frac{1}{n}\sum_{i=1}^k x_i \cdot H(x_i) \frac{1}{n}\sum_{i=1}^k x_i \cdot H_i
relative Häufigkeitsverteilung x_1 \cdot h(x_1)+x_2 \cdot h(x_2)+ \cdots +x_{k-1} \cdot h(x_{k-1})+x_k \cdot h(x_k) \sum_{i=1}^k x_i \cdot h(x_i) \sum_{i=1}^k x_i \cdot h_i


Stift.gif   Aufgabe

Gegeben sind die folgenden Urlisten:

  1. 5; 7; 8; 7; 10; 10; 7; 6
  2. 5; 7; 8; 7; 10; 10; 7; 6; 48
  3. 5; 7; 8; 7; 10; 10; 7; 6; 48; 2

Bestimmen Sie Modus, Median und arithmetisches Mittel für jede der drei Listen.

Die erste Liste sortieren, Stichprobenumfang n=8

5; 6; 7; 7; 7; 8; 10; 10

Modus x_{Mod}=7 Median x_{Med}=\frac{7+7}{2}=7 arithmetisches Mittel \bar x=\frac{5+6+7+7+7+8+10+10}{8}=7,5

Da alle drei Lagemaße nah beieinander liegen, kann man davon ausgehen, dass es hier keine Ausreißer gibt und man jedes als Maß für die Mitte der Verteilung nutzen kann.

Die zweite Liste sortieren, Stichprobenumfang n=9

5; 6; 7; 7; 7; 8; 10; 10; 48

Modus x_{Mod}=7 Median x_{Med}=7 arithmetisches Mittel \bar x=\frac{5+6+7+7+7+8+10+10+48}{9}=12

Bemerkung: Hier sieht man den Einfluß, den der neu dazugekommene Ausreißer 48 auf das arithmetische Mittel hat. Es ist das Einzige der drei Lagemaße, dass auf den neuen Wert reagiert. Hier ist das arithmetische Mittel nicht geeignet, die Mitte der Verteilung zu beschreiben.

Die dritte Liste sortieren, Stichprobenumfang n=10

2; 5; 6; 7; 7; 7; 8; 10; 10; 48

Modus x_{Mod}=7 Median x_{Med}=\frac{7+7}{2}=7 arithmetisches Mittel \bar x=\frac{5+6+7+7+7+8+10+10+48+2}{10}=11

Bemerkung: Auch hier sieht man den Einfluß, den der neu dazugekommene zweite Ausreißer 2 auf das arithmetische Mittel hat. Es ist wieder das Einzige der drei Lagemaße, dass auf den neuen Wert reagiert. Hier ist das arithmetische Mittel nicht geeignet, die Mitte der Verteilung zu beschreiben.

Stift.gif   Aufgabe

Entscheiden Sie.

1. Das arithmetische Mittel ist die Summe aller Werte.

Ja, das stimmt.
Nein, das stimmt nicht.

2. Eine Hälfte aller Werte ist immer größer als der Modus.

Nein, das stimmt nicht.
Ja, das stimmt.

3. Das arithmetische Mittel ist der Quotient aus der Summe aller Werte und der Anzahl aller Werte.

Nein, das stimmt nicht.
Ja, das stimmt.

4. Das arithmetische Mittel ist der Quotient aus dem Produkt aller Werte und der Anzahl aller Werte.

Nein, das stimmt nicht.
Ja, das stimmt.

5. Der Median und das arithmetische Mittel sind identisch.

Nein, das stimmt nicht.
Ja, das stimmt.

6. Der Zentralwert und der Median sind identisch.

Nein, das stimmt nicht.
Ja, das stimmt.

7. Der Zentralwert und der Modus sind identisch.

Nein, das stimmt nicht.
Ja, das stimmt.

8. Die Hälfte aller Werte ist kleiner oder genauso groß wie der Median.

Nein, das stimmt nicht.
Ja, das stimmt.

9. Der Modus ist nur für quantitative Merkmale geeignet.

Nein, das stimmt nicht.
Ja, das stimmt.

10. Das arithmetische Mittel ist nur für quantitative Merkmale geeignet.

Nein, das stimmt nicht.
Ja, das stimmt.

Punkte: 0 / 0


Stift.gif   Aufgabe

Die Firma Schmidt&Müller GmbH produziert unter anderem Schrauben mit einer Solllänge von 60 mm. In der Qualitätskontrolle werden der laufenden Produktion 20 Schrauben entnommen und die Beobachtungswerte (in mm) notiert:

59,5; 60,5; 60,0; 59,5; 59,5; 61,9; 59,5; 59,8; 60,3; 60,9; 61,5; 61,0; 60,2; 61,2; 60,3; 58,9; 60,8; 59,5; 58,5; 59,2

  • Bestimmen Sie das arithmetische Mittel und den Median der Verteilung.
  • Vergleichen Sie die beiden Lagemaße.
  • Bei der 21. Entnahme wird eine besonders kurze Schraube von 57,0 mm entnommen. Wie beeinflusst diese Schraube arithmetisches Mittel und Median der Verteilung?

Am einfachsten findet man die Lösung durch Einsatz eines Tabellenkalkulationsprogramms.

Die ersten 20 Beobachtungswerte liefern: Median x_{Med}=60,1 mm arithmetisches Mittel \bar x=60,08 mm.

Sowohl der Durchschnitt als auch das Zentrum der Verteilung liegen über dem Sollwert von 60 mm. Der Median ist mit 60,1 mm weiter vom Sollwert entfernt als das arithmetische Mittel von 60,08 mm.

Die ersten 21 Beobachtungswerte liefern: Median x_{Med}=60 mm arithmetisches Mittel \bar x=59,93

Beide Werte verändern sich nach unten. Der Durchschnitt liegt jetzt unter der Solllänge von 60 mm, das Zentrum der Verteilung liegt genau bei 60 mm.

Stift.gif   Aufgabe

Die Schülerinnen und Schüler des bkh nehmen an einer Befragung teil, in der die Ausstattung und Optik der Schule bewertet werden soll.

Bestimmen Sie jeweils

  • das arithmetische Mittel,
  • den Median (Zentralwert) und
  • den Modus (Modalwert) der Ergebnisse.

Entscheiden Sie begründet, welches Lagemaß die höchste Aussagekraft hat.

a)

Bewertung der Ausstattung und Optik Anzahl der Schüler
1 (sehr gut) 43
2 (gut) 22
3 (befriedigend) 15
4 (ausreichend) 36
5 (mangelhaft) 21
6 (ungenügend) 24

b)

Bewertung der Ausstattung und Optik Anzahl der Schüler
1 (sehr gut) 25
2 (gut) 29
3 (befriedigend) 28
4 (ausreichend) 27
5 (mangelhaft) 28
6 (ungenügend) 24

Stichprobenumfang n=161

a) Modus x_{Mod}=1 (sehr gut) (der häufigste Wert) Median durch summieren der Häufigkeiten bis 81, zugehörige Merkmalsausprägung ablesen x_{Med}=4 (ausreichend) (das Zentrum der Verteilung) Arithmetisches Mittel \bar x=3,261 (der Mittelwert oder Durchschnitt der Verteilung)

b) Modus x_{Mod}=2 (gut) (der häufigste Wert) Median durch summieren der Häufigkeiten bis 81, zugehörige Merkmalsausprägung ablesen x_{Med}=3 (befriedigend) (das Zentrum der Verteilung) Arithmetisches Mittel \bar x=3,472 (der Mittelwert oder Durchschnitt der Verteilung)

Der Modus ist nicht so aussagekräftig wie der Median, da der Stichprobenumfang nicht besonders groß ist.

Das arithmetische Mittel kann zwar berechnet werden, aber es kommt selbst als Merkmalsausprägung nicht vor. Hier verhält es sich so ähnlich wie der Durchschnitt aller Noten in einer Klassenarbeit. Das Merkmal ist qualitativ mit Ordinalskala.

Aufgabe 6




Vorlage:Beschreibende Statistik

Lernziele

Sie kennen die Begriffe

  • Grundgesamtheit, Stichprobe, Stichprobenumfang,
  • Merkmal, Merkmalsausprägung, Beobachtungswert, Urliste, Merkmalsträger,
  • arithmetisches Mittel, Modus, Median,
  • absolute und relative Häufigkeitsverteilung,
  • Klassen, Klassenanzahl, Spannweite und Klassenbreite.

Sie können

  • diesen Begriffen die mathematischen Bezeichnungen zuordnen und
  • sie im Sachkontext richtig anwenden.

Sie können zu gegebenen Daten

  • eine passende graphische Darstellung auswählen und
  • die Daten graphisch aussagekräftig aufbereiten.

Sollten Sie unsicher sein, so finden Sie alle nötigen Informationen hier:

Grundbegriffe der beschreibenden Statistik



Vorlage:Beschreibende Statistik