Modus (Statistik)

Dieser Artikel beschreibt die Kennzahl von Stichproben. Für den Modus einer Wahrscheinlichkeitsverteilung siehe Modus (Stochastik), weitere Bedeutungen sind unter Modus zu finden.

Der Modus, auch Modalwert genannt,[1] ist ein Lageparameter in der deskriptiven Statistik. Er ist definiert als der häufigste Wert, der in der Stichprobe vorkommt. Werden beispielsweise Klausurnoten einer Schulklasse erhoben, so entspricht der Modus der (den) Note(n), die am häufigsten vergeben wurde(n).

Im Gegensatz zu anderen Lagemaßen hat der Modus den Vorteil, dass er immer existiert. Er ist jedoch im Allgemeinen nicht eindeutig.

Definition

Jede Merkmalsausprägung, die in einer Stichprobe am häufigsten vorkommt, heißt ein Modus der Stichprobe.[2] Damit ist ein Modus genau ein Gipfel der entsprechenden Häufigkeitsverteilung.[3] Ein Modus kommt also nicht seltener vor als irgendeine Ausprägung desselben Merkmals.

Als Notationen für den Modus finden sich meist D {\displaystyle D} oder x ¯ M {\displaystyle {\overline {x}}_{M}} .

Beispiele

Nominalskala

Gegeben sei die Stichprobe

( Zebra , Elefant , Giraffe , Zebra , Giraffe , Antilope ) {\displaystyle ({\text{Zebra}},{\text{Elefant}},{\text{Giraffe}},{\text{Zebra}},{\text{Giraffe}},{\text{Antilope}})}

Es treten die Merkmalsausprägungen Zebra , Elefant , Giraffe {\displaystyle {\text{Zebra}},{\text{Elefant}},{\text{Giraffe}}} und Antilope {\displaystyle {\text{Antilope}}} auf. Dabei tritt Antilope {\displaystyle {\text{Antilope}}} einmal auf, ebenso Elefant {\displaystyle {\text{Elefant}}} . Sowohl Zebra {\displaystyle {\text{Zebra}}} als auch Giraffe {\displaystyle {\text{Giraffe}}} treten zweimal auf. Des Weiteren gibt es kein Merkmal, das dreimal oder öfter auftritt. Also ergeben sich als Modi

D 1 = Zebra {\displaystyle D_{1}={\text{Zebra}}}

und

D 2 = Giraffe {\displaystyle D_{2}={\text{Giraffe}}} .

Ordinalskala

Bei einer Klassenarbeit wurden die Noten

( befriedigend , sehr gut , befriedigend , gut , gut , ausreichend , mangelhaft , ungenuegend , gut ) {\displaystyle ({\text{befriedigend}},\;{\text{sehr gut}},\;{\text{befriedigend}},\;{\text{gut}},\;{\text{gut}},\;{\text{ausreichend}},\;{\text{mangelhaft}},\;{\text{ungenuegend}},\;{\text{gut}})}

vergeben. Die Noten sehr gut , ausreichend , mangelhaft {\displaystyle {\text{sehr gut}},\;{\text{ausreichend}},\;{\text{mangelhaft}}} und ungenuegend {\displaystyle {\text{ungenuegend}}} wurden je einmal vergeben, die Note befriedigend {\displaystyle {\text{befriedigend}}} zweimal und die Note gut {\displaystyle {\text{gut}}} dreimal. Keine Note wurde mindestens viermal vergeben, also ist der Modus

D = gut {\displaystyle D={\text{gut}}} .

Kardinalskala

Unklassierte Daten

Betrachtet man die Stichprobe

( 1 , 1 , 1 , 2 , 10 , 11 , 12 , 67 , 72 ) {\displaystyle (1,1,1,2,10,11,12,67,72)} ,

so kommen alle Werte bis auf die 1 {\displaystyle 1} nur je einmal vor, die 1 {\displaystyle 1} jedoch dreimal. Also ist der Modus

D = 1 {\displaystyle D=1} .

Klassierte Daten

Liegen die Daten klassiert vor, dann gibt es zwei Möglichkeiten den Modus zu bestimmen.

  1. Grobberechnung:
    • Bestimmung der Modalklasse M {\displaystyle M} anhand Häufigkeitsdichten f i {\displaystyle f_{i}} (Häufigkeitsdichte = Relative Häufigkeit / Klassenbreite)
    • Klassenmitte der Modalklasse
  2. Feinberechnung:
    • Bestimmung der Modalklasse M {\displaystyle M} anhand Häufigkeitsdichten f i {\displaystyle f_{i}}
    • D = x M u + f M f M 1 2 f M f M 1 f M + 1 ( x M o x M u ) {\displaystyle D=x_{M}^{u}+{\frac {f_{M}-f_{M-1}}{2\,f_{M}-f_{M-1}-f_{M+1}}}(x_{M}^{o}-x_{M}^{u})}
      mit x M u {\displaystyle x_{M}^{u}} als untere und x M o {\displaystyle x_{M}^{o}} als obere Klassengrenze der Modalklasse. Fällt die Modalklasse auf die erste oder letzte Klasse, dann werden f M 1 {\displaystyle f_{M-1}} bzw. f M + 1 {\displaystyle f_{M+1}} gleich Null gesetzt.
Klausurpunkte Note Abs. Häufigkeit Rel. Häufigkeit Häufigkeitsdichte
0–20 5 57 0,208 0,010
20–30 4 93 0,339 0,034
30–37 3 92 0,336 0,048
37–46 2 29 0,106 0,012
46–51 1 3 0,011 0,002
Summe 274 1,000

Die Modalklasse ist die Klasse mit der größten Häufigkeitsdichte, also 30–37. Die Grobberechnung ergibt dann D = 33 , 5 {\displaystyle D=33{,}5} , die Feinberechnung D = 30 + 0,048 0,034 2 0,048 0,034 0,012 ( 37 30 ) = 31 , 96 {\displaystyle D=30+{\tfrac {0{,}048-0{,}034}{2\cdot 0{,}048-0{,}034-0{,}012}}\cdot (37-30)=31{,}96} .

Eigenschaften und Vergleich

Vergleich zwischen Modus, Median und „Mittel“ (eigentlich: Erwartungswert) zweier Log-Normalverteilungen

Der Modus ist immer definiert, allerdings im Allgemeinen nicht eindeutig. Beides zeigt das Beispiel unter Nominalskala: Keines der gängigen Lagemaße ist in solch einem allgemeinen Rahmen anwendbar, jedoch treten bei dieser Stichprobe zwei Modi auf. Der Extremfall tritt ein, wenn alle Merkmalsausprägungen in der Stichprobe voneinander verschieden sind: Dann tritt jede genau einmal auf und damit ist jede ein Modus.

Bei Stichproben mit Ordnungsstruktur lässt sich zusätzlich zum Modus noch der Median definieren. Die beiden müssen nicht übereinstimmen, so wäre im Beispiel unter Ordinalskala der Median

M = befriedigend {\displaystyle M={\text{befriedigend}}} ,

wohingegen der Modus als

D = gut {\displaystyle D={\text{gut}}}

bestimmt wurde. Bei Vorliegen einer Kardinalskala kann zusätzlich noch das arithmetische Mittel bestimmt werden. Modus, Median und arithmetisches Mittel können jedoch weit auseinanderliegen. So ist der Modus im Beispiel unter Kardinalskala zu

D = 1 {\displaystyle D=1}

bestimmt worden. Für den Median der Zahlenfolge 1, 1, 1, 2, 10, 11, 12, 67, 72 ergibt sich

m = 10 {\displaystyle m=10}

und für das arithmetische Mittel

x ¯ = ( 1 + 1 + 1 + 2 + 10 + 11 + 12 + 67 + 72 ) / 9 = 19 , 67 {\displaystyle {\overline {x}}=(1+1+1+2+10+11+12+67+72)/9=19{,}67} .

Aufbauende Begriffe

Häufigkeitsverteilungen mit zwei oder mehr Modi werden als multimodale Verteilungen bezeichnet. Dabei werden Verteilungen mit zwei Modi als bimodal bezeichnet. Verteilungen mit lediglich einem Modus werden unimodal genannt.

Charakterisierung der Neigung

In Beobachtungsreihen mit ordinal und metrisch skalierten Merkmalen kann der Modalwert als Dichtemittel bezeichnet werden. Im Vergleich mit Median und arithmetischem Mittel kann der Modus die Neigung der Verteilung – ähnlich der statistischen Schiefe – charakterisieren.[4] Die Modus-Schiefe nach Karl Pearson ist zum Beispiel definiert als

Arithmetisches Mittel Modus Standardabweichung {\displaystyle {\frac {{\text{Arithmetisches Mittel}}-{\text{Modus}}}{\text{Standardabweichung}}}} .

Folgende Faustregel setzt Modus, Median und arithmetisches Mittel in Beziehung:[5]

  • rechtsschiefe (linkssteile) Häufigkeitsverteilung: Modus < Median < arithmetisches Mittel
  • linksschiefe (rechtssteile) Häufigkeitsverteilung: Modus > Median > arithmetisches Mittel
  • unimodale symmetrische Häufigkeitsverteilung: Modus ≈ Median ≈ arithmetisches Mittel

Einzelnachweise

  1. Thomas Cleff: Deskriptive Statistik und Explorative Datenanalyse. Eine computergestützte Einführung mit Excel, SPSS und STATA. 3., überarbeitete und erweiterte Auflage. Springer Gabler, Wiesbaden 2015, ISBN 978-3-8349-4747-5, S. 37, doi:10.1007/978-3-8349-4748-2. 
  2. Karl Bosch: Elementare Einführung in die angewandte Statistik. 8. Auflage. Vieweg, Wiesbaden 2005, S. 20. 
  3. Reinhold Kosfeld, Hans Friedrich Eckey, Matthias Türck: Deskriptive Statistik. Grundlagen – Methoden – Beispiele – Aufgaben. 6. Auflage. Springer Gabler, Wiesbaden 2016, ISBN 978-3-658-13639-0, S. 68, doi:10.1007/978-3-658-13640-6. 
  4. Markus Wirtz, Christof Nachtigall: Deskriptive Statistik – Statistische Methoden für Psychologen. 5. Auflage. Juventa, 2008. 
  5. Paul T. von Hippel: Mean, Median, and Skew: Correcting a Textbook Rule. (Memento vom 14. Juni 2020 im Internet Archive). In: Journal of Statistics Education, Volume 13, Number 2, 2005.