|
Ist es möglich, die Parameter der allgemeinen hypergeometrischen Verteilung aus einer Stichprobe zu approximieren? Ich beschreibe das Problem der Einfachheit halber im Urnenmodell: Angenommen, ich habe Kugeln in der Urne. Die Kugeln haben unterschiedliche Farben und ist die Anzahl der Kugeln mit Farbe . Angenommen, ich ziehe Kugeln aus der Urne, kann ich dann eine Approximation für für alle finden?
Final bin ich an der Anzahl unterschiedlicher Farben interessiert: .
Einfach direkt aus der Stichprobe zu schätzen, ergibt natürlich keinen Sinn, da je größer die Stichprobe ist, desto genauer wird „von oben“ angenähert. Der Grenzwert hängt von der entsprechenden Verteilung, also den Parametern ab.
Ich habe schon unterschiedliche Sachen probiert, leider ohne richtigen Erfolg. Aktuell berechne ich die Wahrscheinlichkeit, dass, wenn ich zwei Kugeln ziehe, sie die gleiche Farbe haben. Der Erwartungswert über die Stichproben ist dann gleich der entsprechenden Wahrscheinlichkeit über der Grundgesamtheit. Das erlaubt mir dann wenigstens für die Extremfälle der Verteilung ein minimales und maximales zu berechnen.
Vielen Dank
Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert): "Ich möchte die Lösung in Zusammenarbeit mit anderen erstellen." |
|
KL700 
08:18 Uhr, 09.10.2025
|
KI kann dir Anregungen geben, falls du dringenden Bedarf hast.
|
|
Hinsichtlich stimmt irgend etwas nicht mit deiner Beschreibung:
Wenn die Anzahl der Kugeln mit Farbe ist, dann ist schlicht , d.h. die Anzahl aller Kugeln.
Was du stattdessen wissen willst ist doch aber die Anzahl der mit , d.h. mit Indikatorfunktion geschrieben sowas wie .
Eine wirklich gute Idee für eine Schätzung, die besser ist als die aktuell festgestellte Anzahl unterschiedlicher Farben (die natürlich nur eine untere Schranke für Q ist), habe ich momentan nicht: Über eine Farbe , die in der Gesamtmenge vertreten ist aber nicht in der Stichprobe, hat man eben keine Information außer, dass sie "selten" ist - aber wie selten (und damit im Zusammenhang wie viele das betrifft) weiß man eigentlich nichts.
|
|
Du hast natürlich absolut recht. Da ist mir ein Konzentrationsfehler unterlaufen.
Warum ich dennoch vermute, dass es eine bessere Approximation geben müsste, ist ja die Tatsache das meine gesamplete Teilmenge die Verteilung der Farben nachbildet. Der Schätzer darf am Ende gerne auch belibig viele Teilmengen samplen.
|
|
Meine Idee, um direkt aus der Stichprobe zu schätzen, war, am Ende mit der Größe der Grundgesamtheit zu skalieren. Dann sollte es meiner Einschätzung nach eine Annäherung von oben sein?!
|