|
Liebe Forum-Mitglieder,
bei uns kam heute folgende Frage im DNA-Labor auf.
Wie hoch ist die Wahrscheinlichkeit, dass eine bestimmte Sequenz (festgelegte Reihenfolge) mit der Länge von Basen in einer längeren Sequenz von Basen auftaucht. Insgesamt gibt es vier verschiedene Basen, die alle mit der gleichen Wahrscheinlichkeit auftreten können.
Wir wissen es gibt Möglichkeiten . die Wahrscheinlichkeit für eine bestimmte Basenabfolge ist . Aber uns fehlt die weitere Überlegung wie wir die Länge der Sequenz von Millionen Basen einbeziehen sollen.
Unser Ansatz sieht wie folgt aus über einen einfachen Dreisatz: Bei Basen beträgt die Wahrscheinlichkeit also bei Basen sind es dann . Diese Zahl erscheint uns etwas hoch, haben wir irgendwo einen Denkfehler?, oder ist die Rechnung so korrekt?
Viele Grüße das DNA-LAbor
|
|
pivot 
21:43 Uhr, 26.08.2019
|
Hallo,
erst einmal eine Frage: Soll die Sequenz genau einmal auftreten oder mindestens einmal?
Gruß
pivot
|
|
Hallo Pivot,
die Sequenz soll mind. 1 Mal auftreten.
LG DNA-Team
|
pivot 
21:51 Uhr, 26.08.2019
|
W´keit, dass mindestens einmal die Sequent auftritt ist gleich 1 minus W´keit, dass die Sequenz gar nicht auftritt.
W´keit, dass die Sequenz bei 1 mal ziehen nicht auftritt ist
W´keit, dass die Sequenz bei 5.000.000 mal ziehen gar nicht auftritt ist
Die W´keit ist insgesamt sogar noch viel größer als bei dir.
|
|
@pivot Ich fürchte, so einfach ist die Rechnung nicht. Du hast angenommen, dass es sich um 5 Millionen voneinander unabhängiger 10-er Sequenzen handelt, die hier vorliegen. Es handelt sich aber um eine Sequenz mit 5 Millionen Basen, innerhalb der sich die gewünschte 10er-Sequenz irgendwo mind. einmal befinden soll. Es gibt da also nur verschiedene 10er-Sequenzen die aber, und das wiegt schwerer, nicht unabhängig voneinander sind.
|
pivot 
14:24 Uhr, 27.08.2019
|
@roman
Absolut richtig. Da ist wohl nur eine Näherungsformel möglich.
|
|
Da ist wohl nur eine Näherungsformel möglich. Das weiß ich leider nicht, ist aber vermutlich richtig. Jedenfalls ist dir Fragestellung nicht trivial. Denke, dass es in Richtung Markov-Ketten geht und das ist für mich recht dünnes Eis. Erinnere mich vage an einen Thread hier im Forum vor längerer Zeit in dem es um ähnliche Prozesse ging (runs in einer Sequenz von Münzwürfen).
|
pivot 
16:19 Uhr, 27.08.2019
|
Es ist mit Sicherheit auch noch wichtig wie die Sequenz aussieht. Die W´keit für ist sicher anders als für . Die W´keit für die erste Sequenz dürfte leichter zu berechnen sein.
Jetzt die gewichtete W´keit von allen möglichen Sequenzen zu berechnen scheint mir kaum möglich.
|
Diese Frage wurde automatisch geschlossen, da der Fragesteller kein Interesse mehr an der Frage gezeigt hat.
|