Mathematik online lernen im Mathe-Forum. Nachhilfe online

Startseite » Forum » deMoivre - Laplace -> Problem bei Standardisierung

deMoivre - Laplace -> Problem bei Standardisierung

Schüler Gymnasium, 12. Klassenstufe

Tags: Dichtefunktion, Standardisierung, Stochastik, Zentraler Grenzwertsatz

MathsTom aktiv_icon

23:10 Uhr, 16.05.2012

Hallo liebes Onlinemathe-Forum!
Ich bin neu hier und komme direkt mit einer Frage auf euch zu.

Derzeit beschäftige ich mich einhemenfeld des zentrales Grenzwertsatzes (ZGWS).
Ein Begriff, der in diesem Zusammenhang immer wieder auftaucht ist der der standardisierten Zufallsvariablen.

S_{n}' := \frac{S_{n} - E (S_{n})}{σ}

Soweit ich das verstanden habe, gilt für ein binomialverteiltes

S_{n}

S_{n}' := \frac{S_{n} - n \cdot p}{\sqrt{n \cdot p \cdot (1 - p)}}

.

Gilt dies nur für binomialverteilte

S_{n}

oder allgemein?

Der Erwartnugswert

E (S_{n}') = 0,

das konnte ich mir selbst herleiten. Wieso ist aber

V (S_{n}') = 1

?

Nun wird in dem Buch, was ich hier vorliegen habe gefragt, ob man

P (n \cdot p + a \cdot \sqrt{n \cdot p \cdot (1 - p)} \leq S_{n} \leq n \cdot p + b \cdot \sqrt{n \cdot p \cdot (1 - p)})

mit

Φ (b) - Φ (a)

approximieren kann.

Was genau geben in diesem Zusammenhang die Werte

n \cdot p + a \cdot \sqrt{n \cdot p \cdot (1 - p)}

an? Es müssten doch im Prinzipt auch Zufallsvariablen sein, oder?

Als weiterer Schritt wird dann noch der Korrekturfaktor

0,5

mit eingebaut. Wie kann man das begründen?

Ich weiß, dass sind viele Fragen, ich glaube das meiste wird klar, wenn ich zunächst wüsste, was genau diese Standardisierte Zufallsvariable ist, wie man mit ihr umgeht und warum sie so definiert ist, wie oben beschrieben.

Bsp.: Bernoulli Experiment mit

n = 400

und

p = 0,3

X :=

Anzahl der Treffer.
Meine standardisierte Zufallsvariable beträge, für

X = 60, X' = \frac{- 60}{\sqrt{84}}

. Was bringt mir das nun?

Vielen viele Dank für Antworten und noch einen schönen Abend,

MathsPad

Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert):
"Ich möchte die Lösung in Zusammenarbeit mit anderen erstellen."

kalli

06:59 Uhr, 17.05.2012

Hallo,
1. der Grund, warum standartisiert wird ist der, dass man so viele Fälle mit ein und derseleben Formel bearbeiten kann.

2. Die Standardisierung ist so gewählt, dass der Erwartungswert den Wert 0 ergibt. Du erhälst dann annährend die Gauß

s c h e G l o c k e n k u r v e .

3. Du kannst dieses Verfahren nur bei binomialverteilten Versuchen anwenden, diese sind allerdings sehr stark vertreten und oft kannst Du annehmen, dass es sich um eine Binomialverteilung handelt. Dafür gibt es dann Regeln. Wenn eine bestimmte Regel erfüllt ist, dann liegt mit großer Wahrscheinlichkeit eine Binomialverteilung vor.

4.

n \cdot p + a \cdot \sqrt{n \cdot p \cdot (1 - p)}

ist keine Zufallsvariable, vielmehr gibt dieser Wert den Bereich an, in dem das Ergebnis liegen soll. Du schreibst ja in der Regel

P (12 \leq x \leq 20),

um die Wahrscheinlichkeit auszurechnen, dass der Ausgang des Versuches sich in einem gewissen Bereich befindet.

Soviel zuerst einmal. Um genauere Angaben machen zu können müsste ich mich erst einmal einlesen. Dazu fehlt mir die Zeit, aber die Art Deiner Fragen macht den Eindruck auf mich, als könnten Dir diese recht allgemeinen Informationen schon weiterhelfen.

Gruß
Kalli

MathsTom aktiv_icon

10:34 Uhr, 17.05.2012

Hallo Kalli und vielen Dank für deine Antwort!

Ich habe ja am Ende das Beispiel gebracht, wie erhalte ich jetzt aus dem

X'

ein

E (X') = 0

und

V (X') = 1

?

Okay, aber wieso wählt man

n \cdot p + a \cdot \sqrt{n + p + (1 - p)}

als festgelegten Bereich? In den meisten Fällen werde ich damit wahrscheinlich keine Natürliche Zahl erhalten, aber die Zufallsvariable einer Binomialverteilung kann doch nur ganze Zahlen annehmen.

Gruß
MathsPad

prodomo aktiv_icon

10:41 Uhr, 17.05.2012

Die Binomialverteilung ist diskret, wie du richtig bemerkt hast. Die neue Näherungsformle, Normalverteilung genannt, ist stetig, kann also nicht ganzzahlige Werte annehmen. Aus dem Histogramm der Binomialverteilung wird so eine Fläche unter der Glockenkurve. Die Korrektur

+ 0,5

an der vrechten und

- 0,5

an der linken Grenze der Fläche ist sozusagen ein Erbstück des Histogramms. Dort haben ja die Balken eine Breite von

1,

also von

k - 0,5

bis

k + 0,5

. Der Balken an der rechten Seite geht also noch

0,5

weiter, usw.

Matlog aktiv_icon

11:07 Uhr, 17.05.2012

"Nun wird in dem Buch, was ich hier vorliegen habe gefragt, ob man P(n⋅p+a

\cdot \sqrt{n \cdot p \cdot (1 - p)}

)≤Sn≤n*p+b*

\sqrt{n \cdot p \cdot (1 - p)})

mit Φ(b)-Φ(a) approximieren kann."

Ich schreibe das mal allgemeiner für eine bel. Zufallsvariable

X

mit Erwartungswert

μ

und Standardabweichung

σ

P (μ + a \cdot σ \leq X \leq μ + b \cdot σ) = P (a \cdot σ \leq X - μ \leq b \cdot σ) = P (a \leq \frac{X - μ}{σ} \leq b)

D . h

. also:

X

liegt genau dann zwischen

μ + a \cdot σ

und

μ + b \cdot σ,

wenn die Standardisierte zwischen a und

b

liegt.

MathsTom aktiv_icon

14:32 Uhr, 17.05.2012

Danke auch an prodomo und Matlog für die Hilfe.

Wenn ich das Histogramm für

n = 5

und

p = 0,3

zeichne (meinetwegen auch mit dem GTR), dann liegt mein Maximum ja bei

X = n \cdot p = μ

. Den Schritt

X - μ

für die Standardisierung verstehe ich also.
Bis jetzt sind die Rechtecke ("Balken") verschieden hoch, nämlich

h = P (X = k),

aber alle besitzen die breite 1. Der Flächeninhalt ist also die Wahrscheinlichkeit.

Wenn ich

S_{n}

jetzt noch durch

σ

dividiere, dann ändert sich das doch aber alles, oder nicht?

Macht man das ganze Standardisieren nur, damit man ausschließlich mit

φ (X) = \frac{1}{\sqrt{2 \cdot π}} \cdot e^{- \frac{x^{2}}{2}}

arbeiten kann und nicht noch irgednwelche Variationen der Form

φ (x) = \frac{1}{σ \cdot \sqrt{2 \cdot π}} \cdot e^{- \frac{{(x - μ)}^{2}}{2 \cdot σ^{2}}}

benötigt?

Man kann das Integral der Funktion

φ

ja nur numerisch lösen, damit man dann einheitlich alle Werte in einer solchen Tabelle ablesen kann, ist es praktischer, wenn man eine Funktion, eben die Gauß'sche Glocke, hat, richtig?

Also habe ich eine nicht-standardisierte Zufallsvariable

X,

dann lässt sich deren Verteilung durch

φ (x) = \frac{1}{σ \cdot \sqrt{2 \cdot π}} \cdot e^{- \frac{{(x - μ)}^{2}}{2 \cdot σ^{2}}}

beschreiben.

Habe ich eine standardisierte Zufallsvariable

X' = \frac{X - μ}{σ},

lässt sich diese einfach mit

φ (X) = \frac{1}{\sqrt{2 \cdot π}} \cdot e^{- \frac{x^{2}}{2}}

approximieren.

Wäre nett, wenn mir jemand sagen würde, ob das so stimmt und nochmal kurz auf meine Frage bzgl. den Balken eingehen würde.

Lieben Danke,
MathsPad

Matlog aktiv_icon

16:17 Uhr, 17.05.2012

Also ich kann nachvollziehen, was Du zur Standardisierung geschrieben hast!

Zu Deinem Histogramm: Wenn Du statt

X

jetzt

\frac{X}{σ}

betrachtest, dann ändern sich die Wahrscheinlichkeiten nicht, aber die Skalierung auf der x-Achse. Wenn ich von

σ > 1

ausgehe, dann wird entlang der x-Achse alles um den Faktor

σ

zusammengestaucht.
Bei einem richtigen Histogramm muss die Fläche aber immer 1 ergeben. Deshalb muss entlang der y-Achse mit dem Faktor

σ

gestreckt werden. Dann entsprechen Flächen wieder Wahrscheinlichkeiten.
Dein Histogramm wurde also enger, aber höher.

Zur Frage, warum die standardisierte Zufallsvariable die Varianz 1 hat:
Es gilt

V (X + k) = V (X)

(Verschiebung ändert die Varianz nicht) und

V (\frac{X}{l}) = \frac{1}{l^{2}} \cdot

Var(X)
(für

l = σ

folgt das dann).

MathsTom aktiv_icon

19:39 Uhr, 17.05.2012

Ja okay, soweit so gut.

Aber was genau bewirkt denn die Division durch

σ

? Es muss ja irgendwie bewirken, dass, egal welche Werte die Parameter

n

und

p

annehmen, die standartnormalverteilung stets die selbe Varianz besitzt. Ich kann mir aber nicht vorstellen wieso.

Matlog aktiv_icon

19:45 Uhr, 17.05.2012

V (\frac{X - μ}{σ}) = V (\frac{X}{σ}) = \frac{1}{{(σ)}^{2}} \cdot V (X) = \frac{V (X)}{V (X)} = 1

MathsTom aktiv_icon

19:53 Uhr, 17.05.2012

Ja, diese Herleitung habe ich auch schon entdeckt, aber das ist mir nicht "anschaulich" genug.
Bei dem

- μ

kann man sich das gut vorstellen: Der Erwartungswert

μ

wird um

μ

nach links verschoben, mit ihm auch alle anderen Werte von

X,

also ist der standardisierte Erwartungswert nun 0.
Bei dem Part, wo durch

σ

dividiert wird, kann ich mir das so aber leider nicht vorstellen.

Ich hab aber eben eine gute Beispielrechnung gefunden: de.wikipedia.org/wiki/Tabelle_Standardnormalverteilung#Beispielrechnung
Da wird das nochmal schön deutlich ;-)

P (3 \leq X \leq 7 = ... = P (- 1 \leq Z \leq 1) = P (Z \leq 1) - P (Z \leq - 1)

Wieso

Z \leq - 1

und nicht

Z \leq - 2,

wie das bei der Binomialverteilung ja eigentlich üblich war.
Und die Stetigkeitskorrektur wird hier auch nicht vorgenommen (soweit ich das überblicke). Hat dies einen Grund?

Matlog aktiv_icon

20:06 Uhr, 17.05.2012

Stetigkeitskorrektur gibts nur, wenn eine diskrete Verteilung (wie die Binomialverteilung) approximiert wird. In dem link geht es von Anfang an um die Normalverteilung.

Z \leq - 2

verstehe ich nicht. Wahrscheinlich meinst Du

X < - 1 \Leftrightarrow X \leq - 2

bei diskreter Verteilung. Das macht bei stetigen Verteilungen aber gar keinen Sinn! Dort kann

X

auch alle Zahlen zwischen

- 2

und

- 1

annehmen!

MathsTom aktiv_icon

20:14 Uhr, 17.05.2012

Achso, stimmt, ich war davon ausgegangen, dass eine diskrete Verteilung approximiert worden ist, dann erübrigen sich natürlich die beiden Fragen.

Das mit der Division durch

σ

kann man nicht so schön erklären/einsehen wie den Teil mit der Verschiebung um

μ

Matlog aktiv_icon

20:19 Uhr, 17.05.2012

Wahrscheinlich ist das einfach nicht genauso anschaulich. Ich kann mir unter

μ = 15

auch mehr vorstellen als unter

σ = 4

.

Nimm Dir doch eine einfache Zufallsvariable

X

und berechne deren Varianz (per Hand!). Anschließend berechnest Du die Varianz von

\frac{X}{3}

. Vielleicht ist das dann anschaulich?!

MathsTom aktiv_icon

20:26 Uhr, 17.05.2012

Ja okay, dann nehme ich es stillschweigend so hin ;-)

Um dies zu tun, müsste ich aber noch verstehen wieso

V (\frac{X}{σ}) = \frac{1}{σ^{2}} \cdot V (X)

gilt.

Matlog aktiv_icon

20:35 Uhr, 17.05.2012

Das dürfte in jedem guten Buch oder Skript stehen.
Vermutlich so:
V(aX+b)=

a^{2} \cdot V (X)

Ist bestimmt auch nicht schwierig zu beweisen.

MathsTom aktiv_icon

20:46 Uhr, 17.05.2012

Ja gut, so steht das hier ja auch, aber die Frage ändert sich dann ja dadurch nicht.
Dann halt: Wieso gilt

V (a \cdot X) = a^{2} \cdot V (X)

? Für mich ist das jetzt nicht soo leicht zu beweisen..

Matlog aktiv_icon

21:03 Uhr, 17.05.2012

Var(aX)=E(

{(a \cdot X - E (a \cdot X))}^{2}) = E ({(a \cdot X - a \cdot E (X))}^{2}) = E (a \cdot {(X - E (X))}^{2}) = E (a^{2} \cdot {(X - E (X))}^{2})

= a^{2} \cdot E ({(X - E (X))}^{2}) = a^{2} \cdot V (X)

Jetzt fragst Du sicher warum

E (a \cdot X) = a \cdot E (X)

MathsTom aktiv_icon

21:17 Uhr, 17.05.2012

Achso.. du definierst die Varianz über den Erwartungswert der quadratischen Abweichung von

μ

. Auf die Idee muss man auch ersmal kommen ;-)

Nene

E (a \cdot X) = a \cdot E (X)

ist klar. Also ich könnte es nicht beweisen, aber es sieht logisch aus.

Nach dem 4. Gleichheitszeichen: Wo hast du das

a^{2}

her?

Edit: Ich glaub ich kanns doch beweisen.

E (a \cdot X) = \sum_{i = 1}^{n} a \cdot x_{i} \cdot P (X = a \cdot x_{i}) = a \cdot \sum_{i = 1}^{n} x_{i} \cdot P (X = x_{i}) = a \cdot E (X)

Matlog aktiv_icon

22:13 Uhr, 17.05.2012

Das liegt wohl daran, dass vor dem vierten Gleichheitszeichen noch eine Klammer fehlt!

MathsTom aktiv_icon

22:55 Uhr, 17.05.2012

Hab ich selber auch übersehen.

Gut dann vielen Dank für die liebe Hilfe :-)

1003683

1003337

	Status: nicht eingeloggt	Noch nicht registriert?