Mathematik online lernen im Mathe-Forum. Nachhilfe online
Startseite » Forum » Boxplot

Boxplot

Schüler

Tags: problem mit der Quartile

 
Antworten Neue Frage stellen Im Forum suchen
Neue Frage
redhat

redhat aktiv_icon

06:34 Uhr, 15.02.2016

Antworten
Hallo alle zusammen,

ich habe eine kleines Problem mit folgender Rangliste. Es handelt sih um eine Klassenarbeit von 17 Schülern, bei der max20 Punkte ereeicht werden konnten.

Platz...: 1..2..3..4..5..6..7..8..9.....10..11..12..13..14..15..16..17
Punkte: 1..1..2..5..7..7..7..9..12..12..12..12..14..15..16..17..20
Die Rangliste besteht aus 17 Zahlen. Also ist der Zentralwert lgischerweise auf Platz 9, das wurde auch im Lösungsheft so bestätigt.
Was mich verwirrt ist nun die Berechnung der oberen bzw unteren Quartil.

Untere Quartil:
Da es ja nun links bzw. rechts vom Zentralwert eine gerade Anzahl von Zahlen ist, hätte ich die untere Quartil im Boxplot zwischen Platz 4 und 5 eingezeichnet mit dem Wert 6.

Obere Quartil:
Wäre bei mir zwischen Platz 13 und 14 mit dem Wert 14,5.

Im Lösungsbuch ist due untere Quartil aber 7 und die obere ist 14.

Jede beschreibung die ich im Internet finde ist immer ein Beispiel mit einer Reihe von 15 Zahlen, was dann den Vorteil hat, dass sich bei beiden Quatilen eine ungerade Anzahl von Ziffern befindet. Was mache ich bei einer geraden Anzahl links und rechts vom Zentralwert?

Herzlichen Dank im voraus
kupferdach
Online-Nachhilfe in Mathematik
Antwort
Ronsen

Ronsen aktiv_icon

12:02 Uhr, 16.02.2016

Antworten
Hi redhat,

ich habe den Algorithmus mal gegoogelt. Schau mal hier:
http://massmatics.de/merkzettel/index.php#!815:Quantile_Statistik

Demnach hast du n=17
p1=0,25
p2=0,75

xp1=np1=4,25 Aufrunden ergibt 5
xp2=np2=12,75 Aufrunden ergibt 13

Der fünfte Wert deiner Liste ist gerade 7, der dreizehnte Wert deiner Liste ist 14.

Antwort
Roman-22

Roman-22

15:32 Uhr, 16.02.2016

Antworten
Die genaue Definition der 25%- und 75%-Quantilen ist in der Literatur nicht einheitlich, sondern geringfügig unterschiedlich. Das macht in der Praxis de facto keinen Unterschied bei Datensätzen mit großem Umfang.

Quartile und/oder Boxplots für Datensets mit nur 10 oder 20 Datensätzen sind nicht sinnvoll und haben keine Aussagekraft. So etwas kommt daher (leider) auch nur im Schulbereich vor und dort sind dann die Auswirkungen der Definitionsunterschiede noch spürbar.
Also immer die Definition verwenden, die im Unterricht oder im Lehrbuch vorgegeben ist. Wenn du Definitionen verwendest, die von woanders stammen, kann es durchaus Unterschiede in den Werten geben.

Im Anhang vier Screenshots, die die Ergebnisse von drei verschiedene Mathe-Programmen und von Excel zeigen, wenn sie mit deinen 17 Werten gefüttert werden.

- Geogebra und Mathcad sind mit dir einer Meinung und liefern 6 und 14,5.
Nebenbei gesagt liefern auch die online Rechner
http//www.alcula.com/calculators/statistics/quartiles/
http//www.miniwebtool.com/quartile-calculator/
http//www.mathportal.org/calculators/statistics-calculator/descriptive-statistics-calculator.php
www.easycalculation.com/statistics/inter-quartile-range.php
http//www.statisticshowto.com/calculators/interquartile-range-calculator/
diese Werte. Du bist also in guter Gesellschaft.

- Das Widget von Wolfram Alpha meint, dass 6,5 und 14,25 die Quartilwerte sind. Dieses Widget steckt zB auch hinter calculator.tutorvista.com/quartile-calculator.html

- Und Excel wiederum meint, dass erstes und viertes Quartil 7 bzw. 14 sind, so wie es in deiner Lösung steht.

- Der Online Rechner www.hackmath.net/en/calculator/quartile-q1-q3 liefert eigenartigerweise die Werte 6 und 16 (???)

- www.calculatorsoup.com/calculators/statistics/descriptivestatistics.php meint wiederum, dass die Werte 6 und 14 sein sollten

- Und www.wessa.net/quart.wasp liefert die die Ergebnisse auf acht verschiedene Arten berechnet. Da sind da auch so Exoten wie 5,5 und 13,5 ("Weighted Average at Xnp") oder auch 5 und 14 ("Closest Observation") dabei.


Es ist eben alles nur eine Frage der Definition und deren gibts hier leider nicht nur eine und sicher gibt es für jede Definition gute Gründe. Manchmal wird der Index interpoliert und gerundet, manchmal wiederum werden die Datenwerte selbst interpoliert. In der Praxis meist kein Problem, bei Schulaufgaben dann aber eben doch.

Facit: Nur die Definition verwenden, die unterrichtet wurde bzw. die im Lehrbuch steht.

R


Geogebra
wolfram
Mathcad
excel
Diese Frage wurde automatisch geschlossen, da der Fragesteller kein Interesse mehr an der Frage gezeigt hat.