Mathematik online lernen im Mathe-Forum. Nachhilfe online
Startseite » Forum » Stochastik: Wo ist der Fehler im Ansatz?

Stochastik: Wo ist der Fehler im Ansatz?

Universität / Fachhochschule

Zufallsvariablen

Tags: Äquivalenz, totale wahrscheinlichkeit, Unabhängigkeit, Zufallsvariable

 
Antworten Neue Frage stellen Im Forum suchen
Neue Frage
anonymous

anonymous

19:36 Uhr, 12.03.2017

Antworten
Folgende Fragestellung aus einer Abituraufgabe aus Hessen beschäftigt:
Es geht um einen Spamfilter mit folgenden Angaben:

-Man macht die „naive“ Annahme,dass die Antreffwahrscheinlichkeit für ein Wort nicht von anderen vorkommenden Wörtern abhängt.

-Man zählt das Vorkommen der Wörter "haben" (W1) und "Partner" (W2), dabei gibt es 100
erwünschten E-Mails (Ham-Mails) und 200 Spam-Mails.

Ham-Mails: 30 Mails enthalten "haben"; 3 Mails enthalten "Partner"
Spam-Mails: 11 enthalten "haben"; 12 enthalten "Partner"

Gesucht ist die Wkeit, dass eine zufällige Mail die Wörter "haben" und "Partner" beide enthält, d.h. P(W1W2).

Nun gibt es zwei Lösungsansätze, deren Gleichwertigkeit scheinbar nicht gegeben ist:

1) 3-stufiges Baumdiagramm, erste Unterteilung S und S, dann nach W1, dann nach W2. Hierüber findet man die Wkeiten P(SW1W2)=231120012200 und P(SW1W2)=1003003001003100.
Und es gilt P(W1W2)=P(SW1W2)+P(SW1W2)=132500=0,0052

2) Die Wörter kommen unabhängig voneinander vor P(W1W2)=P(W1)P(W2). Man berechnet dann P(W1)=41300 und P(W2)=15200P(W1W2)=4160000,0068

Weshalb sind diese Lösungen nicht äquivalent? In den Lösungen ist Variante 1 als Lösung angegeben.


Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert):
"Ich bräuchte bitte einen kompletten Lösungsweg." (setzt voraus, dass der Fragesteller alle seine Lösungsversuche zur Frage hinzufügt und sich aktiv an der Problemlösung beteiligt.)
Online-Nachhilfe in Mathematik
Antwort
pwmeyer

pwmeyer aktiv_icon

13:21 Uhr, 13.03.2017

Antworten
Hallo,

das Auftreten der Wörter hängt doch offenbar vom Typ der Mail ab. Es ist daher falsch aus den Angaben auf diese Weise eine Gesamtwahrscheinlichkeit für W1 oder W2 zu "berechnen".

Gruß pwm
anonymous

anonymous

14:15 Uhr, 13.03.2017

Antworten
Die Wkeiten W_1 und W_2 kann man aber auch unter Berücksichtigung der Abhängigkeit vom Typ der Mail mithilfe totaler Wkeit berechnen, man kommt auf dieselben Ergebnisse.

Außerdem ist die gesuchte Wkeit unabhängig von dem Typ der Mail. Dadurch müsste ich doch alle Mails in einen Topf werfen können.
Frage beantwortet
anonymous

anonymous

14:14 Uhr, 15.03.2017

Antworten
Fehler in Ansatz zwei scheint die Verwechselung von Unabhängigkeit und bedingter Unabhängigkeit zu sein.
W1 und W2 sind (bedingt) unabhängig voneinander, gegeben S bzw. S¯. Sie sind nicht vollständig unabhängig voneinander.

Daher gilt nur: P(W1W2)=P(S)*P(W1W2S)+P(S¯)*P(W1W2S¯)P(W1)*P(W2)

Die Wkeiten für P(W1/2) sind trotzdem richtig berechnet!