Mathematik online lernen im Mathe-Forum. Nachhilfe online
Startseite » Forum » deMoivre - Laplace -> Problem bei Standardisierung

deMoivre - Laplace -> Problem bei Standardisierung

Schüler Gymnasium, 12. Klassenstufe

Tags: Dichtefunktion, Standardisierung, Stochastik, Zentraler Grenzwertsatz

 
Antworten Neue Frage stellen Im Forum suchen
Neue Frage
MathsTom

MathsTom aktiv_icon

23:10 Uhr, 16.05.2012

Antworten
Hallo liebes Onlinemathe-Forum!
Ich bin neu hier und komme direkt mit einer Frage auf euch zu.

Derzeit beschäftige ich mich einhemenfeld des zentrales Grenzwertsatzes (ZGWS).
Ein Begriff, der in diesem Zusammenhang immer wieder auftaucht ist der der standardisierten Zufallsvariablen.

Sn':=Sn-E(Sn)σ

Soweit ich das verstanden habe, gilt für ein binomialverteiltes Sn

Sn':=Sn-npnp(1-p).

Gilt dies nur für binomialverteilte Sn oder allgemein?

Der Erwartnugswert E(Sn')=0, das konnte ich mir selbst herleiten. Wieso ist aber V(Sn')=1?

Nun wird in dem Buch, was ich hier vorliegen habe gefragt, ob man P(np+anp(1-p)Snnp+bnp(1-p)) mit Φ(b)-Φ(a) approximieren kann.

Was genau geben in diesem Zusammenhang die Werte np+anp(1-p) an? Es müssten doch im Prinzipt auch Zufallsvariablen sein, oder?

Als weiterer Schritt wird dann noch der Korrekturfaktor 0,5 mit eingebaut. Wie kann man das begründen?

Ich weiß, dass sind viele Fragen, ich glaube das meiste wird klar, wenn ich zunächst wüsste, was genau diese Standardisierte Zufallsvariable ist, wie man mit ihr umgeht und warum sie so definiert ist, wie oben beschrieben.

Bsp.: Bernoulli Experiment mit n=400 und p=0,3. X:= Anzahl der Treffer.
Meine standardisierte Zufallsvariable beträge, für X=60,X'=-6084. Was bringt mir das nun?

Vielen viele Dank für Antworten und noch einen schönen Abend,

MathsPad

Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert):
"Ich möchte die Lösung in Zusammenarbeit mit anderen erstellen."
Online-Nachhilfe in Mathematik
Antwort
kalli

kalli

06:59 Uhr, 17.05.2012

Antworten
Hallo,
1. der Grund, warum standartisiert wird ist der, dass man so viele Fälle mit ein und derseleben Formel bearbeiten kann.

2. Die Standardisierung ist so gewählt, dass der Erwartungswert den Wert 0 ergibt. Du erhälst dann annährend die GaußscheGlockenkurve.

3. Du kannst dieses Verfahren nur bei binomialverteilten Versuchen anwenden, diese sind allerdings sehr stark vertreten und oft kannst Du annehmen, dass es sich um eine Binomialverteilung handelt. Dafür gibt es dann Regeln. Wenn eine bestimmte Regel erfüllt ist, dann liegt mit großer Wahrscheinlichkeit eine Binomialverteilung vor.

4. np+anp(1-p) ist keine Zufallsvariable, vielmehr gibt dieser Wert den Bereich an, in dem das Ergebnis liegen soll. Du schreibst ja in der Regel P(12x20), um die Wahrscheinlichkeit auszurechnen, dass der Ausgang des Versuches sich in einem gewissen Bereich befindet.

Soviel zuerst einmal. Um genauere Angaben machen zu können müsste ich mich erst einmal einlesen. Dazu fehlt mir die Zeit, aber die Art Deiner Fragen macht den Eindruck auf mich, als könnten Dir diese recht allgemeinen Informationen schon weiterhelfen.

Gruß
Kalli
MathsTom

MathsTom aktiv_icon

10:34 Uhr, 17.05.2012

Antworten
Hallo Kalli und vielen Dank für deine Antwort!

Ich habe ja am Ende das Beispiel gebracht, wie erhalte ich jetzt aus dem X' ein E(X')=0 und V(X')=1?

Okay, aber wieso wählt man np+an+p+(1-p) als festgelegten Bereich? In den meisten Fällen werde ich damit wahrscheinlich keine Natürliche Zahl erhalten, aber die Zufallsvariable einer Binomialverteilung kann doch nur ganze Zahlen annehmen.

Gruß
MathsPad


Antwort
prodomo

prodomo aktiv_icon

10:41 Uhr, 17.05.2012

Antworten
Die Binomialverteilung ist diskret, wie du richtig bemerkt hast. Die neue Näherungsformle, Normalverteilung genannt, ist stetig, kann also nicht ganzzahlige Werte annehmen. Aus dem Histogramm der Binomialverteilung wird so eine Fläche unter der Glockenkurve. Die Korrektur +0,5 an der vrechten und -0,5 an der linken Grenze der Fläche ist sozusagen ein Erbstück des Histogramms. Dort haben ja die Balken eine Breite von 1, also von k-0,5 bis k+0,5. Der Balken an der rechten Seite geht also noch 0,5 weiter, usw.
Antwort
Matlog

Matlog aktiv_icon

11:07 Uhr, 17.05.2012

Antworten
"Nun wird in dem Buch, was ich hier vorliegen habe gefragt, ob man P(n⋅p+a np(1-p) )≤Sn≤n*p+b* np(1-p)) mit Φ(b)-Φ(a) approximieren kann."

Ich schreibe das mal allgemeiner für eine bel. Zufallsvariable X mit Erwartungswert μ und Standardabweichung σ.

P(μ+aσXμ+bσ)=P(aσX-μbσ)=P(aX-μσb)
D.h. also: X liegt genau dann zwischen μ+aσ und μ+bσ, wenn die Standardisierte zwischen a und b liegt.
MathsTom

MathsTom aktiv_icon

14:32 Uhr, 17.05.2012

Antworten
Danke auch an prodomo und Matlog für die Hilfe.

Wenn ich das Histogramm für n=5 und p=0,3 zeichne (meinetwegen auch mit dem GTR), dann liegt mein Maximum ja bei X=np=μ. Den Schritt X-μ für die Standardisierung verstehe ich also.
Bis jetzt sind die Rechtecke ("Balken") verschieden hoch, nämlich h=P(X=k), aber alle besitzen die breite 1. Der Flächeninhalt ist also die Wahrscheinlichkeit.

Wenn ich Sn jetzt noch durch σ dividiere, dann ändert sich das doch aber alles, oder nicht?

Macht man das ganze Standardisieren nur, damit man ausschließlich mit φ(X)=12πe-x22 arbeiten kann und nicht noch irgednwelche Variationen der Form φ(x)=1σ2πe-(x-μ)22σ2 benötigt?

Man kann das Integral der Funktion φ ja nur numerisch lösen, damit man dann einheitlich alle Werte in einer solchen Tabelle ablesen kann, ist es praktischer, wenn man eine Funktion, eben die Gauß'sche Glocke, hat, richtig?

Also habe ich eine nicht-standardisierte Zufallsvariable X, dann lässt sich deren Verteilung durch φ(x)=1σ2πe-(x-μ)22σ2 beschreiben.

Habe ich eine standardisierte Zufallsvariable X'=X-μσ, lässt sich diese einfach mit φ(X)=12πe-x22 approximieren.

Wäre nett, wenn mir jemand sagen würde, ob das so stimmt und nochmal kurz auf meine Frage bzgl. den Balken eingehen würde.

Lieben Danke,
MathsPad
Antwort
Matlog

Matlog aktiv_icon

16:17 Uhr, 17.05.2012

Antworten
Also ich kann nachvollziehen, was Du zur Standardisierung geschrieben hast!

Zu Deinem Histogramm: Wenn Du statt X jetzt Xσ betrachtest, dann ändern sich die Wahrscheinlichkeiten nicht, aber die Skalierung auf der x-Achse. Wenn ich von σ>1 ausgehe, dann wird entlang der x-Achse alles um den Faktor σ zusammengestaucht.
Bei einem richtigen Histogramm muss die Fläche aber immer 1 ergeben. Deshalb muss entlang der y-Achse mit dem Faktor σ gestreckt werden. Dann entsprechen Flächen wieder Wahrscheinlichkeiten.
Dein Histogramm wurde also enger, aber höher.

Zur Frage, warum die standardisierte Zufallsvariable die Varianz 1 hat:
Es gilt V(X+k)=V(X) (Verschiebung ändert die Varianz nicht) und V(Xl)=1l2 Var(X)
(für l=σ folgt das dann).
MathsTom

MathsTom aktiv_icon

19:39 Uhr, 17.05.2012

Antworten
Ja okay, soweit so gut.

Aber was genau bewirkt denn die Division durch σ ? Es muss ja irgendwie bewirken, dass, egal welche Werte die Parameter n und p annehmen, die standartnormalverteilung stets die selbe Varianz besitzt. Ich kann mir aber nicht vorstellen wieso.
Antwort
Matlog

Matlog aktiv_icon

19:45 Uhr, 17.05.2012

Antworten
V(X-μσ)=V(Xσ)=1(σ)2V(X)=V(X)V(X)=1
MathsTom

MathsTom aktiv_icon

19:53 Uhr, 17.05.2012

Antworten
Ja, diese Herleitung habe ich auch schon entdeckt, aber das ist mir nicht "anschaulich" genug.
Bei dem -μ kann man sich das gut vorstellen: Der Erwartungswert μ wird um μ nach links verschoben, mit ihm auch alle anderen Werte von X, also ist der standardisierte Erwartungswert nun 0.
Bei dem Part, wo durch σ dividiert wird, kann ich mir das so aber leider nicht vorstellen.

Ich hab aber eben eine gute Beispielrechnung gefunden: de.wikipedia.org/wiki/Tabelle_Standardnormalverteilung#Beispielrechnung
Da wird das nochmal schön deutlich ;-)

P(3X7=...=P(-1Z1)=P(Z1)-P(Z-1)
Wieso Z-1 und nicht Z-2, wie das bei der Binomialverteilung ja eigentlich üblich war.
Und die Stetigkeitskorrektur wird hier auch nicht vorgenommen (soweit ich das überblicke). Hat dies einen Grund?

Antwort
Matlog

Matlog aktiv_icon

20:06 Uhr, 17.05.2012

Antworten
Stetigkeitskorrektur gibts nur, wenn eine diskrete Verteilung (wie die Binomialverteilung) approximiert wird. In dem link geht es von Anfang an um die Normalverteilung.

Z-2 verstehe ich nicht. Wahrscheinlich meinst Du X<-1X-2 bei diskreter Verteilung. Das macht bei stetigen Verteilungen aber gar keinen Sinn! Dort kann X auch alle Zahlen zwischen -2 und -1 annehmen!
MathsTom

MathsTom aktiv_icon

20:14 Uhr, 17.05.2012

Antworten
Achso, stimmt, ich war davon ausgegangen, dass eine diskrete Verteilung approximiert worden ist, dann erübrigen sich natürlich die beiden Fragen.

Das mit der Division durch σ kann man nicht so schön erklären/einsehen wie den Teil mit der Verschiebung um μ ?
Antwort
Matlog

Matlog aktiv_icon

20:19 Uhr, 17.05.2012

Antworten
Wahrscheinlich ist das einfach nicht genauso anschaulich. Ich kann mir unter μ=15 auch mehr vorstellen als unter σ=4.

Nimm Dir doch eine einfache Zufallsvariable X und berechne deren Varianz (per Hand!). Anschließend berechnest Du die Varianz von X3. Vielleicht ist das dann anschaulich?!
MathsTom

MathsTom aktiv_icon

20:26 Uhr, 17.05.2012

Antworten
Ja okay, dann nehme ich es stillschweigend so hin ;-)

Um dies zu tun, müsste ich aber noch verstehen wieso V(Xσ)=1σ2V(X) gilt.
Antwort
Matlog

Matlog aktiv_icon

20:35 Uhr, 17.05.2012

Antworten
Das dürfte in jedem guten Buch oder Skript stehen.
Vermutlich so:
V(aX+b)= a2V(X)
Ist bestimmt auch nicht schwierig zu beweisen.
MathsTom

MathsTom aktiv_icon

20:46 Uhr, 17.05.2012

Antworten
Ja gut, so steht das hier ja auch, aber die Frage ändert sich dann ja dadurch nicht.
Dann halt: Wieso gilt V(aX)=a2V(X)? Für mich ist das jetzt nicht soo leicht zu beweisen..
Antwort
Matlog

Matlog aktiv_icon

21:03 Uhr, 17.05.2012

Antworten
Var(aX)=E( (aX-E(aX))2)=E((aX-aE(X))2)=E(a(X-E(X))2)=E(a2(X-E(X))2)
=a2E((X-E(X))2)=a2V(X)
Jetzt fragst Du sicher warum E(aX)=aE(X)?
MathsTom

MathsTom aktiv_icon

21:17 Uhr, 17.05.2012

Antworten
Achso.. du definierst die Varianz über den Erwartungswert der quadratischen Abweichung von μ. Auf die Idee muss man auch ersmal kommen ;-)

Nene E(aX)=aE(X) ist klar. Also ich könnte es nicht beweisen, aber es sieht logisch aus.

Nach dem 4. Gleichheitszeichen: Wo hast du das a2 her?

Edit: Ich glaub ich kanns doch beweisen.

E(aX)=i=1naxiP(X=axi)=ai=1nxiP(X=xi)=aE(X)
Antwort
Matlog

Matlog aktiv_icon

22:13 Uhr, 17.05.2012

Antworten
Das liegt wohl daran, dass vor dem vierten Gleichheitszeichen noch eine Klammer fehlt!
MathsTom

MathsTom aktiv_icon

22:55 Uhr, 17.05.2012

Antworten
Hab ich selber auch übersehen.

Gut dann vielen Dank für die liebe Hilfe :-)