![]() |
---|
Hallo Zusammen, ich zweifle grade an mir. Eigentlich ganz einfache Rechnungen und dennoch ganz viele Fragezeichen: Gleich mit Beispiel: Ich hab 5 Taxis in einem Unternehmen, deren jeweilige Kilometer-Leistung im Jahr und die Anzahl der Unfälle im Jahr. Ziel ist zu ermitteln, wieviele Unfälle je 100.000 km sich durchschnittlich je Taxi ereignen. Klingt erst einmal einfach. Nun dachte ich kann man ja 2 Ansätze verfolgen: 1.: Erst vom jedem Taxi die Unfälle/100.000 km ausrechnen und davon den Mittelwert bilden oder 2.: Den Mittelwert der Unfälle und den Mittelwert der Jahresfahrleistung bilden und dann die Unfälle/100.000 km ausrechnen Eigenartigerweise führt das zu unterschiedlichen Ergebnissen (s. beigefügte Abbildung) Meine Frage: Warum ist das so (da steh ich echt auf dem Schlauch)und wenn es zwei untersch. Ergebnisse sind gibt es da auch ein richtiges und ein falsches Ergebnis für meine Fragestellung? Es tut mir leid, dass ich Euch mit so einfachen mathematischen Dingen um Hilfe bitte muss, aber ich hoffe trotzdem ganz sehr auf Eure Hilfe. DANKE, DANKE, DANKE Andreas Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert): "Ich möchte die Lösung in Zusammenarbeit mit anderen erstellen." |
![]() |
![]() |
"Meine Frage: Warum ist das so" Weil es zwei unterschiedliche Formeln sind, wenn Du sie komplett aufschreiben würdest, würdest Du es sehen. "es da auch ein richtiges und ein falsches Ergebnis für meine Fragestellung?" Schon von Simpson-Paradoxon gehört? de.wikipedia.org/wiki/Simpson-Paradoxon Es gibt statistische Fragen, auf welche keine eindeutige Antwort existiert. |
![]() |
Hallo DrBoogie, zunächst ganz vielen Dank (mal wieder), dass du mir geantwortet hast. Der Hinweis und Link auf das Simpson-Paradoxon ist super. Das Beispiel bei Wikipedia lässt bei mir die Vermutung wachsen, dass es doch eher sinnvoller wäre erst alle Mittelwerte zu bilden und dann die Berechnungen durchzuführen, weil damit die untersch. Gewichtung der Einzelergebnisse ausgeglichen wird. Sagen wir mal ich nehme bewusst die Variante 2: Den Mittelwert der Unfälle und den Mittelwert der Jahresfahrleistung bilden und dann die Unfälle/100.000 km ausrechnen. Wie kann ich jetzt noch eine Varianz berechnen. Die Varianz ist ja die mittlere quadtrat. Abweichung der Einzelergnisse vom Mittelwert. Der Mittelwert den ich dabei vermutet hätte wäre der Mittelwert der Einzelergebnisse. Nun nehme ich diesen aber ja gar nicht. Ist dann meine Varianz noch richtig? ... ein echtes Paradoxon! Ich hoffe nochmal auf deine Hilfe (oder auch ggf. von jemand anderem, wenn er sich traut :-) Danke aber nochmal Dir ganz sehr DrBoogie! |
![]() |
Ergänzung: Die Varianz der Variante 2 wird zwangsläufig immer größer sein, als von Variante 1 (bei der der Mittelwert der Einzelergebnisse angenommen wird) )siehe Abbildung) ... das fühlt sich jetzt wiederum nicht mehr so gut an. Andreas |
![]() |
Es kommt darauf an, was Du mit der Varianz zeigen willst. |
![]() |
Ich möchte schlussendlich das Konfidenzintervall des Mittelwertes berechnen. Da die Streuung des untersuchten Merkmals in der Grundgesamtheit unbekannt ist muss diese durch die Standardabweichung in der Stichprobe geschätzt werden. Das Beispiel war stark abstrahiert. Ich werde jetzt mal schauen wie sich die untersch. Varianzen/ Standardabweichungen auf das Konfidenzintervall mit meinen echten Zahlen auswirkt. Bist du der Meinung, dass das mathematisch vertretbar ist, wenn ich bei der Berechnung des Konfidenzintervalls die Standardabweichung vom Mittelwert nach Variante 2 ansetze? Vielleicht reicht mir dabei auch schon dein Bauchgefühl. Aber wenn du es irgendwie erklären/ begründen könntest wäre das großartig. Unabhängig davon danke ich die ganz sehr für deine Zeit und Mühe. Immerhin, weiß ich jetzt schon, dass ich nichts "falsch" im mathematischen Sinn gemacht habe. Danke. Andreas |
![]() |
"Bist du der Meinung, dass das mathematisch vertretbar ist, wenn ich bei der Berechnung des Konfidenzintervalls die Standardabweichung vom Mittelwert nach Variante 2 ansetze?" Na ja, es kommt darauf an. Kurz gesagt, Konfidenzintervall sieht im allgemeinen so aus: , wo ein Schätzer für den Erwartungswert ist (normalerweise Mittelwert der Verteilung, aber es muss nicht sein) und irgendeine positive Funktion der Verteilung, muss nicht unbedingt Stichprobenstandardabweichung sein. Das Problem beginnt aber dann, wenn Du die Aussage brauchst: "Erwartungswert ist mit W-keit irgendeine Zahl in dem Intervall drin". Um das behaupten zu können, musst Du wissen, wie genau verteilt ist. Auf Deine Frage übertragen: Du kannst auch die Standardabweichung nach Variante 2 nutzen, wenn Du weißt, wie sie verteilt ist. Aber sie in die "Standardformel" einsetzen wäre falsch, es sei denn, Du nutzt zufällig die richtige "Standardformel". Wie genau diese Formel aussieht, weiß ich jetzt selber nicht aus dem Kopf. |
![]() |
Hallo Dr. Boogie, ich habe am Wochenende nochmal mit einem über drei Ecken mir bekannten Mathematiker gesprochen, der in der Stochastik ganz gut aufgestellt ist. Er konnte mir auch nicht aus der Situation heraus eine Lösung für mein Problem geben. Er hat mir aber angeboten nochmal zu recherchieren. Ich hoffe natürlich auf eine Lösung, auch wenn ich glaube, dass er es vielleicht zeitlich nicht schafft sich da nochmal reinzudenken und dann evtl. auch mit Hilfe der Literatur eine Lösung entwickelt. Ich habe an meinen wirklichen Zahlen die Standardabw. mal mit den beiden versch. Mittelwerten ermittelt. Die liegen sehr nah beieinander. Das Konfidenzintervall ist entsprechend. Für die praktische Aussage ist es für mich im Prinzip also kaum von Bedeutung. Aus mathematischer Sicht ist es wie du schon sagtest so falsch mit der Standardformel zu rechnen. Vielleicht poste ich nochmal eine neue Frage dazu in paar Tagen, wenn ich konkret dazu eine Dateilfrage hab. Auch mein Betreff passt dazu einfach nicht mehr, jetzt wo ich dank Dir ein ganzes Stück schlauer bin. Vielen, vielen Dank nochmal!!!! Andreas |