Folgende Fragestellung aus einer Abituraufgabe aus Hessen beschäftigt: Es geht um einen Spamfilter mit folgenden Angaben:
-Man macht die „naive“ Annahme,dass die Antreffwahrscheinlichkeit für ein Wort nicht von anderen vorkommenden Wörtern abhängt.
-Man zählt das Vorkommen der Wörter "haben" () und "Partner" (), dabei gibt es 100 erwünschten E-Mails (Ham-Mails) und 200 Spam-Mails.
Ham-Mails: 30 Mails enthalten "haben"; 3 Mails enthalten "Partner" Spam-Mails: 11 enthalten "haben"; 12 enthalten "Partner"
Gesucht ist die Wkeit, dass eine zufällige Mail die Wörter "haben" und "Partner" beide enthält, d.h. .
Nun gibt es zwei Lösungsansätze, deren Gleichwertigkeit scheinbar nicht gegeben ist:
1) 3-stufiges Baumdiagramm, erste Unterteilung und , dann nach , dann nach . Hierüber findet man die Wkeiten . Und es gilt
2) Die Wörter kommen unabhängig voneinander vor . Man berechnet dann und
Weshalb sind diese Lösungen nicht äquivalent? In den Lösungen ist Variante 1 als Lösung angegeben.
Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert): "Ich bräuchte bitte einen kompletten Lösungsweg." (setzt voraus, dass der Fragesteller alle seine Lösungsversuche zur Frage hinzufügt und sich aktiv an der Problemlösung beteiligt.) |