Mathematik online lernen im Mathe-Forum. Nachhilfe online
Startseite » Forum » Wahrscheinlichkeit einer Sequenz

Wahrscheinlichkeit einer Sequenz

Universität / Fachhochschule

Wahrscheinlichkeitsmaß

Tags: Sequenz, Wahrscheinlichkeitsmaß

 
Antworten Neue Frage stellen Im Forum suchen
Neue Frage
DNADNA987

DNADNA987 aktiv_icon

21:05 Uhr, 26.08.2019

Antworten
Liebe Forum-Mitglieder,

bei uns kam heute folgende Frage im DNA-Labor auf.

Wie hoch ist die Wahrscheinlichkeit, dass eine bestimmte Sequenz (festgelegte Reihenfolge) mit der Länge von 10 Basen in einer längeren Sequenz von 5.000.000 Basen auftaucht. Insgesamt gibt es vier verschiedene Basen, die alle mit der gleichen Wahrscheinlichkeit auftreten können.

Wir wissen es gibt 410 Möglichkeiten d.h. die Wahrscheinlichkeit für eine bestimmte Basenabfolge ist 1:1048576. Aber uns fehlt die weitere Überlegung wie wir die Länge der Sequenz von 5.000.000 Millionen Basen einbeziehen sollen.

Unser Ansatz sieht wie folgt aus über einen einfachen Dreisatz:
Bei 10 Basen beträgt die Wahrscheinlichkeit 1:1048578 also 0,0000009537%
bei 5.000.000 Basen sind es dann 0,4837%. Diese Zahl erscheint uns etwas hoch, haben wir irgendwo einen Denkfehler?, oder ist die Rechnung so korrekt?

Viele Grüße
das DNA-LAbor
Online-Nachhilfe in Mathematik
Antwort
pivot

pivot aktiv_icon

21:43 Uhr, 26.08.2019

Antworten
Hallo,

erst einmal eine Frage: Soll die Sequenz genau einmal auftreten oder mindestens einmal?

Gruß

pivot
DNADNA987

DNADNA987 aktiv_icon

21:45 Uhr, 26.08.2019

Antworten
Hallo Pivot,

die Sequenz soll mind. 1 Mal auftreten.

LG DNA-Team
Antwort
pivot

pivot aktiv_icon

21:51 Uhr, 26.08.2019

Antworten
W´keit, dass mindestens einmal die Sequent auftritt ist gleich 1 minus W´keit, dass die Sequenz gar nicht auftritt.

W´keit, dass die Sequenz bei 1 mal ziehen nicht auftritt ist 1-1410


W´keit, dass die Sequenz bei 5.000.000 mal ziehen gar nicht auftritt ist (1-1410)5,000,000

Die W´keit ist insgesamt sogar noch viel größer als bei dir.


Antwort
Roman-22

Roman-22

11:22 Uhr, 27.08.2019

Antworten
@pivot
Ich fürchte, so einfach ist die Rechnung nicht.
Du hast angenommen, dass es sich um 5 Millionen voneinander unabhängiger 10-er Sequenzen handelt, die hier vorliegen. Es handelt sich aber um eine Sequenz mit 5 Millionen Basen, innerhalb der sich die gewünschte 10er-Sequenz irgendwo mind. einmal befinden soll.
Es gibt da also nur 4999991 verschiedene 10er-Sequenzen die aber, und das wiegt schwerer, nicht unabhängig voneinander sind.
Antwort
pivot

pivot aktiv_icon

14:24 Uhr, 27.08.2019

Antworten
@roman

Absolut richtig. Da ist wohl nur eine Näherungsformel möglich.
Antwort
Roman-22

Roman-22

14:52 Uhr, 27.08.2019

Antworten
> Da ist wohl nur eine Näherungsformel möglich.
Das weiß ich leider nicht, ist aber vermutlich richtig. Jedenfalls ist dir Fragestellung nicht trivial. Denke, dass es in Richtung Markov-Ketten geht und das ist für mich recht dünnes Eis.
Erinnere mich vage an einen Thread hier im Forum vor längerer Zeit in dem es um ähnliche Prozesse ging (runs in einer Sequenz von Münzwürfen).
Antwort
pivot

pivot aktiv_icon

16:19 Uhr, 27.08.2019

Antworten
Es ist mit Sicherheit auch noch wichtig wie die Sequenz aussieht. Die W´keit für cgggggggga ist sicher anders als für cacactcaca. Die W´keit für die erste Sequenz dürfte leichter zu berechnen sein.

Jetzt die gewichtete W´keit von allen möglichen Sequenzen zu berechnen scheint mir kaum möglich.
Diese Frage wurde automatisch geschlossen, da der Fragesteller kein Interesse mehr an der Frage gezeigt hat.