Mathematik online lernen im Mathe-Forum. Nachhilfe online
Startseite » Forum » Stichprobenumfang ermitteln

Stichprobenumfang ermitteln

Universität / Fachhochschule

Tags: Fehlerspanne, Konfidenzintervall, Stichprobenumfang

 
Antworten Neue Frage stellen Im Forum suchen
Neue Frage
matze97vhxy

matze97vhxy aktiv_icon

18:37 Uhr, 29.07.2023

Antworten
Hallo zusammen,
ich bin neu hier und such eine Formel um den Stichprobenumfang zu ermitteln.
gegeben: Menge aller Objekte (Populationsgröße), Fehlerspanne und Konfidenzniveau...
Gesucht: Stichprobengröße...

Könnt ihr mir da weiter helfen?
Mit freundlichen Grüßen euer Matze

PS: Anbei habe ich noch eine Datei mit einer Formel...
Leider verstehe die Formel nicht so ganz, vielleicht kann mir das jemand erklären, da ich leider nicht verstehe, wo ich welche Werte einsetzen muss.



Stichprobengröße

Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert):
"Ich möchte die Lösung in Zusammenarbeit mit anderen erstellen."
Online-Nachhilfe in Mathematik
Antwort
pivot

pivot aktiv_icon

07:37 Uhr, 30.07.2023

Antworten
Hallo,

es geht wohl um ein (approximiertes) Konfidenzintervall der Gestalt

[x¯-z(1-α2)sn;x¯+z(1-α2)sn]

bzw.

[p-z(1-α2)p(1-p)nN-nN-1;p+z(1-α2)p(1-p)nN-nN-1]

Du hast eine Grundgesamtheit der Größe N und ziehst eine Stichprobe der Größe n ohne Zurücklegen. Es gibt zwei Sorten von Objekten in der GG. Sorte 1 mit dem Anteil M. Und Sorte 2 mit dem Anteil N-M. Der interessierende relative Anteil der Sorte 1 ist MN=p. Dieser wird angenommen.

p(1-p)nN-nN-1 ist die Varianz der Hypogeometrischen Verteilung, geteilt durch n. Denn die Varianz eines Stichprobenmittels (identische und unabh. Zufallsvariablen) ist die Varianz geteilt durch n: Var(i=1nXi/n)=σ2n. Nun die Wurzel ziehen. Siehe auch

de.wikipedia.org/wiki/Hypergeometrische_Verteilung

Für den relativen Anteil p ist der obige Term das zweiseitige, approximierte 1-α Konfidenzintervall. Dabei ist

e=z(1-α2)p(1-p)nN-nN-1

Wenn du das nach n auflöst, dann sollte dein Ausdruck in etwa herauskommen, den du angehängt hast. Bei mir ist N-1N was bei dir die 1 im Nenner ist. Für ein hinreichend großes N wird hier angenommen, dass N-1N1 ist.

Wenn jetzt e (prozentuelle Abweichung) vorgegeben ist (und der Rest), dann kannst du approximativ die benötigte Stichprobengröße n mit deiner Formel berechnen.

<<Leider verstehe die Formel nicht so ganz, vielleicht kann mir das jemand erklären, da ich leider nicht verstehe, wo ich welche Werte einsetzen muss.<<

Editiert um 10:15 und 10:55 Uhr:
Wenn du z.B. ein 95%-Konfidenzintervall (α=5%) hast, dann ist 1-α2=0,975. Den Wert z0,975=1,96 kannst du in jeder Tabelle der Standardnormalverteilung nachlesen. e wird vorgegeben mit z.B. 0,02 Es wird p=0,25 behauptet und die Grundgesamtheit hat die Größe N=5000

Jetzt wird der benötigte Stichprobenumfang n für eine Stichprobe berechnet, welcher die obigen Bedingungen erfüllt und um dann im zweiten Schritt
zu überprüfen ob der, bei einer Stichprobe ermittelte Wert, p^=m/n im Intervall liegt.

Gruß
pivot


matze97vhxy

matze97vhxy aktiv_icon

11:23 Uhr, 30.07.2023

Antworten
Erst einmal vielen Dank für die schnelle Antwort,
Ich hab den Fehler gemacht mit der Zahl e zu rechenen...

Allerdings habe ich trotzdem noch eine Frage,
Warum setze ich für p einen relativen anteil der GG in die Formel ein?
Ist das mein relativer Anteil an Fehlern an der GG?

Dann müsste dieser doch mit der prozentutalen Fehlerspanne zusammenhängen, bzw. müsste dann doch sogar den gleichen Wert annehmen oder nicht?

www.surveymonkey.de/mp/sample-size-calculator

Ich frage, weil auf dieser Seite eben auch nur drei Werte für die Berechnung benötigt werden.

Wenn jetzt e= Fehlerspanne, z= Konfidenzniveau und N= GG
Was ist dann p=?

Mit freundlichen Grüßen
Matze
Antwort
pivot

pivot aktiv_icon

20:15 Uhr, 30.07.2023

Antworten
Das mit dem p ist in der Tat etwas tricky. Man will ja eigentlich den Wert schätzen und gleichzeitig benötigt man einen Wert für p.

Ich gebe mal ein Beispiel das mir in den Sinn gekommen ist. Es steht eine Wahl von zwei Bürgermeister-Kandidaten (tatsächliche Wähler=N) an und man will prognostizieren ob Kandidat A gewinnt. Kandidat A gewinnt, wenn N2+1 (N gerade) bzw. N+12 (N ungerade) Wähler für ihn/sie stimmen. Damit man die W'keit berechnen kann ob Kandidat A gewinnt benötigt man einen Wert für p. Dabei ist p die W'keit, dass Wähler i für den Kandidat A stimmt.

Um p zu bestimmen macht man eine Stichprobe und schaut ob sie in das Konfidenzintervall passt. Um jetzt aber den benötigten Stichprobenumfang zu ermitteln benötigt man eine Wert für p. Es gibt mehrere Möglichkeiten für die Bestimmung des Wertes (Ex-Ante) von p vor der eigentlichen Stichprobe:

1. Man nimmt das Ergebnis der vergangenen Wahl (gleiche Kandidaten).
2. Man macht eine kleinere Stichprobe im Voraus.
3. Man nimmt den Wert p=1-p=0,5. Denn die Länge des Konfidenzintervalls wird bei diesem Wert von p maximal und somit der Stichprobenumfang nicht zu klein. Denn p(1-p) ist maximal wenn p=0,5. Bei gegebenen e ist n umso größer je gößer p(1-p) ist. Das wird wohl auch bei der verlinkten Seite so sein.

Ich konnte die Seite nicht verwenden, da die Seite von meinem Add-Blocker in ihrer Funktion blockiert wurde. Es gibt aber auch Seiten, bei denen man p frei wählen kann, z.B. hier
www.calculator.net/sample-size-calculator.html
Frage beantwortet
matze97vhxy

matze97vhxy aktiv_icon

21:08 Uhr, 30.07.2023

Antworten
Vielen Dank nochmal für die ausführliche und schnelle Antwort habs nun verstanden.

Mit freundlichen Grüßen
Matze