Mathematik online lernen im Mathe-Forum. Nachhilfe online
Startseite » Forum » Signifikanz-Test für gewichtetes Mittel

Signifikanz-Test für gewichtetes Mittel

Universität / Fachhochschule

Erwartungswert

Tests

Tags: test

 
Antworten Neue Frage stellen Im Forum suchen
Neue Frage
griessie

griessie aktiv_icon

19:15 Uhr, 30.08.2017

Antworten
Hallo liebe treuen Helfer in der Not,

ich habe eine Frage zu Signifikanztests. Kennt Ihr einen Test, mit dem man gewichtete Mittel auf signifikanten Unterschied prüfen kann. Für das arithmetische Mittel geht meines (dürftigen) Wissens nach der t-Test (in meinem Fall zweiseitig). Dabei wird aber die Varianz der einzelnen Stichproben benötigt, die sich doch aber auf den (ungewichteten) Mittelwert der Einzelwerte bezieht. Insofern glaube ich nicht, dass dieser Test für meine gewichteten Mittel anwendbar ist. Lieg ich da falsch? Kennt Ihr eine Alternative?

für eine Antwort ganz dolle dankend! Andreas

Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert):
"Ich möchte die Lösung in Zusammenarbeit mit anderen erstellen."
Online-Nachhilfe in Mathematik
Antwort
Mauthagoras

Mauthagoras aktiv_icon

09:06 Uhr, 31.08.2017

Antworten
Hi,

eine interessante Frage. Es klingt zuerst wie eine kleine Verallgemeinerung der "t-Test-Situation", aber könnte komplizierter sein.

Mal schauen, ob ich es richtig verstehe: Wir haben unabhängige
XiN(ai,σ), YiN(bi,σ)
und Gewichte zi>0 für i{1,2,,n}.

Betrachte nun X˜=i=1nziXi und Y˜=i=1nziYi, die zugehörigen Parameter sind
μX:=E[X˜]=i=1nziai, μY=E[Y˜]=i=1nzibi,
Var[X˜]=Var[Y˜]=σ2i=1nzi2.

Das Testproblem ist
H0:μX=μYvs.H1:μXμY.

Erster Fall: Die ai sind alle gleich und die bi sind alle gleich. Dann spielt die Gewichtung keine Rolle und der normale t-Test hilft. Das meinst Du bestimmt nicht, oder?

Zweiter Fall: Unterschiedliche ai bzw. bi. Dann müssen wir bedenken, dass wir bisher nur je eine einzige Realisierung von μX und μY haben - nicht, wie normalerweise, eine Stichprobe der Größe n. Hier gibt es jetzt wieder zwei Fälle: Ist σ bekannt, dann können wir trotzdem einen Test machen, direkt über die Normalverteilung. Ist σ nicht bekannt, brauchen wir mehr Realisierungen, um die Varianz schätzen zu können und wiederum einen t-Test zu verwenden. Das heißt, wir ziehen dann insgesamt N-mal 2n Zufallszahlen (dann wären übrigens auch "σi" kein Problem).

Habe ich die Situation erstmal richtig verstanden? Welcher der Fälle interessiert Dich?

Gruß Mauthagoras



griessie

griessie aktiv_icon

10:27 Uhr, 31.08.2017

Antworten
Hallo Mauthagoras,

ganz herzlichen Danke dafür, dass du bereit bist mir zu helfen. Wahnsinn! Vorab: ich wäre nicht enttäuscht, falls Du zu der Erkenntnis kommst, dass das Problem nicht zu lösen ist. Dann würde ich das so in meinem Bericht schreiben (hätte ich glaube ich auch gemacht, aber ich war mir doch dann sehr unsicher, ob mein Verständnis für die Problematik ausreicht).

Also zu deiner Rückfrage: Ich glaube weder die Gewichtung noch die Standardabweichung ist bekannt. Aber ich versuchs mal an einem Beispiel zu verdeutlichen.

Ich habe zwei Fuhrparks von Taxis (mit unterschiedlicher Anzahl Fahrzeuge). Jedes Auto hat unterschiedliche Fahrleistungen und unterschiedliche Anzahl von Unfällen pro Jahr

Fuhrpark 1:
Taxi A: 50.000km/a; 2 Unfälle/a; Unfallrate: 4 Unfälle/100.000 km
Taxi B: 100.000km/a; 3 Unfälle/a; 3 Unfälle/100.000 km
Taxi B: 25.000km/a; 3 Unfälle/a; 12 Unfälle/100.000 km
(Stichprobe ist eigentlich größer, Fuhrpark 2 analog mit anderen Werten)

Für Fuhrpark 1 gibt das einen gewichteten Mittelwert der Unfallrate von 7 Unfälle/175.000 km = 4 Unfälle/ 100.000 km (Das arithmetische Mittel wäre (4+3+12)/3=6,33))

Jetzt könnte ich zwar aus den Einzelwerten eine Standardabweichung zum arithmetischen Mittelwert berechnen. Aber das wäre ja aus meiner Sicht falsch, denn der arithmetische Mittelwert ist für mich nicht von Interesse. Ich bräuchte die Standartabweichung zum gewichteten Mittel. Dazu habe ich in diesem Forum schon mal eine Frage gestellt, diese war aber entweder zu kompliziert von mir formuliert oder wirklich schwer zu beantworten:
http//www.onlinemathe.de/forum/Ratio-Estimator-Variance-estimates

Unter der Annahme das weder die Gewichte gleich sind, noch die Standardabweichung bekannt ist, lässt sich das Problem nicht lösen, oder? Aber wie gesagt, das wäre okay.

Lieber Mauthagoras, ich hoffe noch einmal auf eine Antwort von Dir. bis dahin und besten Dank! Andreas


Antwort
Mauthagoras

Mauthagoras aktiv_icon

09:51 Uhr, 01.09.2017

Antworten
Dankeschön.

Erstmal eine dämliche Frage... Ich würde vermuten, dass Du den Mittelwert der Unfälle/100000km gewichtet gemäß des Anteils an den Gesamtkilometern berechnest; da würde bei mir
450175+3100175+1225175=3274
rauskommen. Hattest Du etwas anderes im Sinn?

Nun zum Problem: Es sieht also so aus, dass die Gewichte zi selbst zufällig sind - wird denn irgendwie reguliert, welches Taxi wie viel fährt?
Wenn man die Ergebnisse vieler Jahre hätte, könnte man sie vielleicht schätzen und so weiterkommen, aber nur mit einer Stichprobe lässt sich nichts machen.

Noch etwas ganz Wesentliches: Die Annahme einer Normalverteilung ist hier nicht sinnvoll, was jede Art von t-Test ausschließt. Die naheliegendste Annahme wäre, dass die Xi und Yi Poissonverteilt sind, wobei man den zugehörigen Parameter wieder anhand der einzelnen Stichprobe festlegen muss.

Insgesamt habe ich jetzt keine Idee für einen guten Ansatz. Es ist möglich, für X˜ bzw. Y˜ Konzentrationsungleichungen herzuleiten, aber man müsste dann so tun, als wären die Gewichte und Parameter bekannt (indem man die Ergebnisse der einen Stichprobe einsetzt). Allerdings ergibt die Gleichheit des gewichteten Mittels dann immernoch nicht die Gleichheit der beiden Verteilungen, und außerdem sehe ich auf Anhieb nicht, wo die Gleichheit der Mittelwerte explizit verwendet werden könnte...

Ich weiß also leider nicht wirklich weiter. Vielleicht hast Du aber mehr Glück, wenn Du die Frage in einem großen englischsprachigen Forum postest (dafür würde ich vorschlagen, gleich die Modellierung mit Poissonverteilung einzuführen).

Gruß Mauthagoras






griessie

griessie aktiv_icon

16:28 Uhr, 08.09.2017

Antworten
Hallo Mauthagoras,

entschuldige bitte meine so späte Antwort. Ich habe es die letzte Woche nicht geschafft mir deine Antwort gründlich und konzentriert durchzulesen.
Auch wenn du keine "Lösung" für mich hattest, hast du mir doch sehr geholfen. Allein, dass du mir aufzeigen konntest, dass es eben kein ganz einfaches mathematisches Problem darstellt, veranlasst mich es in meiner Arbeit auszuklammern.

Vielleicht komme ich auf deinen Vorschlag nocheinmal zurück und stelle die Frage in einem englischsprachigen Forum. Aber das stell ich erst einmal hinten an. Danke da auch für die Konkretisierung der Fragestellung.

Alles in allem Danke ich Dir vielmals für deine viele Zeit, Geduld und Mühe, die du für die Beantwortung meiner Frage aufgewandt hast. Ich wünsche Dir nun noch ein schönes Wochenende. Danke noch einmal zum Schluss!

Andreas
Diese Frage wurde automatisch geschlossen, da der Fragesteller kein Interesse mehr an der Frage gezeigt hat.