"Welche Farbe wird mein Rattenbay haben?"
"Wie viel Babies einer bestimmten Farbe können fallen?"
"Wie hoch ist die Wahrscheinlichkeit, dass mindestens ein Baby einer bestimmten Farbe fällt?"
Um diese und ähnlich Fragen beantworten zu können, benötigt man nicht nur Genetikwissen, sondern auch ein paar Kenntnisse in Wahrscheinlichkeits-Rechnung. In diesem Artikel will ich ein paar grundsätzliche Rechenansätze vorstellen, mit deren Hilfe Ihr schon ein ganzes Stück weiter kommt, wenn es darum geht abzuschätzen, wie Wahrscheinlich das Auftreten bestimmter Merkmale in Euren Würfen ist.
Das Punnett-Quadrat
Wir fangen mit der Grundlage der Berechnung von Wahrscheinlichkeiten verschiedener Gen-Kombinationen, dem Punnett-Quadrat, an (mehr dazu in einem späteren Genetik-Tutorial). Wir nehmen einmal an, wir haben zwei choco-farbene Ratten.
Wir interessieren uns dafür, wie wahrscheinlich es ist, dass die beiden Albino-Nachkommen haben. Das Allel für Albino (abgekürzt c) ist rezessiv. In der reinerbigen Form (cc) sorgt es dafür, das die Ratte keine Farbstoff bilden kann und daher weiß erscheint. Das Gegen-Allel zu Albino ist Non-Albino (abgekürzt C), was eigentlich nur bedeutet, dass der C-Lokus (also der Ort, auf dem das Allel liegt) keinen Einfluss auf die Farbe der Ratte hat. Wir wissen nun, dass beide eine choco-farbene Mutter (reinerbig für Non-Albino CC) und einen albinofarbenen Vater
(reinerbig für Albino cc) hatten. Da sie jeweils ein Gen von der Mutter und eins vom Vater erben, sind sie mischerbig (heterozygot) für Albino (Cc). Da Albino rezessiv ist, sehen beide Ratten choco-farben
aus (Vergleiche erste Mendel Regel: Uniformitätsregel)
Nun verpaaren wir diese beiden mischerbigen Ratten. Nach der zweiten Mendel-Regel, der Spaltungsregel, spalten sich die Merkmale nun auf. Jedes Baby bekommt ein Gen vom Vater und eins von der Mutter. Vater und Mutter können entweder ein C (Non-Albino) oder ein c (Albino) weitergeben. Die Wahrscheinlichkeit, liegt dabei jeweils bei 50%. Zeichnet man das in Form eines Quadrates auf, in dem die Randbeschriftung der Spalten den Genen des einen Elternteils, die Randbeschriftung der Zeilen denen des anderen Elternteiles entsprechen, sieht das so aus:
Wir füllen nun die Zellen so auf, dass jeweils der entsprechende Buchstabe vom Rand der dazu gehörigen Spalte und der vom Rand der dazu gehörigen Zeile zusammen in die entsprechende Zelle eingetragen werden.
Daraus ergibt sich, dass im Wurf reinerbige Non-Albino-Ratten (CC) fallen können, die choc-farben (bzw. Non-Albino) sind , mischerbige Non-Albino/Albino-Ratten (Cc), die ebenfalls choco-farben (bzw. Non-Albino)aussehen, da Albino rezessiv ist
, und reinerbige Albino-Ratten (cc), die eben Albinos sind
.
Jede Zelle des Quadrats hat dabei die gleiche Auftretenswahrscheinlichkeit, nämlich 25%.
Daraus ergibt sich bezogen auf den Genotyp, dass die Wahrscheinlichkeit für reinerbig Non-Albino 25% beträgt, die Wahrscheinlichkeit für mischerbig Non-Albino/Albino 50% und die Wahrscheinlichkeit für reinerbig Albino 25%. Auf den Phänotyp (die äußere Erscheinung) bezogen beträgt die Wahrscheinlichkeit für Choco (bzw. Non-Albino) 75% und die Wahrscheinlichkeit für Albino 25%
.
Was bedeutet das jetzt und wie ist das zu interpretieren? Immer wieder stoße ich auf Aussagen von Züchtern, die dann sagen "Im Wurf werden 75% der Babies Chocos und 25% Albinos" oder schon etwas vorsichtiger "Wir erwarten ungefähr 75% Choco und 25% Albino". Diese Interpretation ist aber aus stochastischer (wahrscheinlichkeitstheoretischer / statistischer Sicht) nicht korrekt. Bei der Farbe der Rattenbabies aus unserem Wurf handelt es sich um Zufallsexperimente, die von einander unabhängig sind. Jedes Rattenbaby hat die gleiche Chance, ein Choco- oder Albino-Gen zu bekommen, unabhängig davon, welche Farben seine Geschwister haben. Die Aussage "Wir erwarten ungefähr 75% Choco und 25% Albino" impliziert aber, dass die Ereignisse abhängig sind von einander, nämlich das es unwahrscheinlicher wird, einen weiteren Albino zu erhalten, wenn bereits 25% vorhanden sind. Das ist aber eben genau nicht der Fall. Korrekt würde die Aussage lauten:
"In unserem Wurf hat jedes Rattenbaby eine Chance von 75%, ein Choco (bzw. Non-Albino) zu werden und eine Chance von 25%, ein Albino
zu werden".
Die Bernoulli-Kette
Wenn wir die Frage beantworten wollen, wie wahrscheinlich es ist, dass genau zwei Albinobabies in einem Wurf von zehn Babies fallen oder wie wahrscheinlich es ist, dass mindestens ein Albino-Baby fällt, müssen wir uns der Bernoulli-Kette (benannt nach dem Mathematiker Jakob I. Bernoulli) bedienen. Die Bernoulli-Kette dient der Berechnung der Wahrscheinlichkeit von Ereignissen in sogenannten Bernoulli-Prozessen. Das klingt jetzt schon etwas kompliziert, ist es aber gar nicht. Ein Bernoulli-Prozess ist ein Abfolge von Ereignissen, die von einander unabhängig sind (das Ergebnis des ersten Ereignisses beeinflusst nicht das Ergebnis des zweiten). Jedes Ereignis hat dabei zwei mögliche Ausgänge: ja oder nein, richtig oder falsch, Treffer oder nicht Treffer. Oder eben wie in unserem Fall Albino oder Nicht-Albino.
Bernoulli-Ketten kann man relativ aufwendig von Hand berechnen. Man berücksichtigt dabei alle Wahrscheinlichkeiten und Gegenwahrscheinlichkeiten (die Wahrscheinlichkeit, dass das Ereignis nicht eintritt, Wahrscheinlichkeit + Gegenwahrscheinlichkeit = 1) und muss dazu noch beachten, dass die "Treffer" an verschiedenen Stellen der Kette auftreten können. Auf unser Beispiel übertragen heißt dass, dass die beiden Albino-Babies an verschiedener Stelle der Geburtsreihenfolge auftreten können (wenn wir mal annehmen, dass wir die Geburt live beobachten und die Babies entsprechend kennzeichnen). Bei unserer Wahrscheinlichkeitsbetrachtung, wie wahrscheinlich es ist, überhaupt 2 Albino-Babies zu bekommen, ist es aber unerheblich, an welcher Stelle sie geboren wurden, man muss also alle Kombinationen berücksichtigen.
Wir nehmen jetzt an, dass wir wissen wollen, wie wahrscheinlich es ist, in einem 10er-Wurf genau 2 Albino-Babies zu erhalten. In diesem Beispiel rechnen wir wie folgt:
Wahrscheinlichkeit, dass die genau das erste und das zweite Baby Albinos sind:
25% * 25% * 75% * 75% * 75% * 75% * 75% * 75% * 75% * 75%
= 0,25 * 0,25 * 0,75 * 0,75 * 0,75 * 0,75 * 0,75 * 0,75 * 0,75 * 0,75
= 0,00625
= 0,625%
Wahrscheinlichkeit, dass genau das zweite und dritte Baby Albinos sind:
75% *25% * 25% * 75% * 75% * 75% * 75% * 75% * 75% * 75%
= 0,25 * 0,25 * 0,75 * 0,75 * 0,75 * 0,75 * 0,75 * 0,75 * 0,75 * 0,75
= 0,00625
= 0,625%
Wahrscheinlichkeit, dass genau das erste und vierte Baby Albinos sind:
25% * 75% * 75% *25% * 75% * 75% * 75% * 75% * 75% * 75%
= 0,25 * 0,25 * 0,75 * 0,75 * 0,75 * 0,75 * 0,75 * 0,75 * 0,75 * 0,75
= 0,00625
= 0,625%
- ...
Da man alles Möglichen Stellen, an denen die Albino-Babies geboren werden könnten, und alle Kombinationen davon berücksichtigen muss, ergibt sich eine wahnsinnige Rechnerei. Dabei ist schon ein Muster zu erkennen: Berücksichtigt werden immer die Wahrscheinlichkeiten für die Treffer (Albino) und auch für die Nicht-Treffer (Non-Albino)
. Und das ganze macht man so oft, wie es Kombinationen gibt von Stellen, an denen die Babies geboren wurden.
Zur Berechnung der Kombinationsmöglichkeiten gibt es eine elegante Methode. Man rechnet n Treffer aus k Wiederholungen ("n über k") wie folgt aus:
Was um alles in der Welt soll das jetzt bedeuten?!? (An dieser Stelle sei schon gesagt: es gibt am Ende einen Link zu einem Berechnungstool)
n ist die Anzahl der Babies im Wurf, in unserem Fall 10.
k ist ganz einfach die Anzahl der Treffer, also der 2 Albino-Babies
Was bedeutet jetzt aber n! (Sprich N Fakultät)? Der Wert n! gibt einfach an, wie viele Möglichkeiten es gibt, n Dinge (in unserem Fall Rattenbabies) aufzureihen. Für den ersten Platz gibt es 10 Möglichkeiten. Nehmen wir mal, auf den Platz kommt Ratttenbaby Anna. Für den zweiten Platz gibt dann nur noch 9 Möglichkeiten, da Rattenbaby Anna ja schon auf Platz 1 sitzt. Nun kommt auf Platz 2 Rattenbaby Anton. Für Platz drei gibt es dann noch 8 Möglichkeiten, nämlich die übrigen Rattenbabies...und so weiter bis für Platz 10 nur noch ein Rattenbaby vorhanden ist. Wir haben also 10 * 9 * 8 * 7 * 6 * 5 * 4 * 3 * 2* 1 Möglichkeiten, die 10 Rattenbabies auf Plätze verteilen, was man kürzer als 10! (zehn Fakultät) schreibt. Und das ergibt 3.628.800 Möglichkeiten. (Dafür gibt es auch Online-Rechner)
Nun geht diese Rechnung aber davon aus, dass wir alle Rattenbabies unterscheiden können. Klar können wir das, wir haben ja alle 10 markiert und mit Namen versehen. Aber uns interessiert ja eigentlich nur, wie viele Möglichkeiten es gibt, Albino und Choco (Non-Albino-)
Babies zu verteilen. Daher müssen wir aus den 3.628.800 Möglichkeiten wieder einige Fälle herausrechnen, nämlich die, die wir nicht unterscheiden können.
Das ist einmal die Menge der Kombinationsmöglichkeiten der Albinos (k!=2!=2) untereinander, also die Fälle, in denen die Albinos die Plätze tauschen. Denn
sieht genauso aus wie
Außerdem müssen wir die Menge der Kombinationsmöglichkeiten der Chocos (Non-Albinos) herausrechnen, also die Fälle, in denen nur die Chocos (Non-Albinos) die Reihenfolge tauschen.
....und so weiter bis
Das sind insgesamt (n-k)!=8!=40.320 Möglichkeiten, die choco-farbenen (Non-Albino) Ratten untereinander zu vertauschen , unabhängig von der Position.
Zusammen ergibt das also:
Es gibt also 45 Möglichkeiten, die zwei Albino an unterschiedliche Stellen in einer Reihe von Choco-Ratten zu stellen.
Jetzt müssen wir nur noch die Wahrscheinlichkeiten berücksichtigen.
Wenn wir an unsere schrittweise Berechnung von oben denken, sehen wir, dass wie die Wahrscheinlichkeit des Ereignisses Albino-Ratte so oft berücksichtigen müssen wie es Treffer gibt (nämlich k=2 mal) und die Wahrscheinlichkeit des Ereignisses Choco-(Non-Albino-)Ratte n-k=8 mal. Die Wahrscheinlichkeit für eine Choco-(Non-Albino-)Ratte beträgt dabei 1 - p = 1 - 0.25 = 0,75.
Daraus ergibt sich: p * p * (1-p) * (1-p)* (1-p)* (1-p)* (1-p)* (1-p)* (1-p)* (1-p) oder kürzer p k *(1-p) n-k = 0,252 * 0,75 10-2= 0,00625=0,625% (Vergleiche mit der Berechnung oben)
Wenn wir jetzt die Anzahl der Möglichkeiten, die Albino-Ratten mit den Chocos zusammen aufzureihen, berücksichtigen, ergibt sich
Mit unseren Zahlen:
Das heißt, die Wahrscheinlichkeit genau 2 Albino-Ratten
in unserem Wurf zu haben, beträgt 0,4%.
Nun interessiert uns aber selten, wie wahrscheinlich es ist, genau eine bestimmte Anzahl von Merkmalsträgern im Wurf zu haben. Meistens geht es ja darum zu berechnen, wie wahrscheinlich es ist, mindestens eins der Tiere zu erhalten, die ein bestimmtes Merkmal tragen. Wir könnten jetzt umständlich alle einzelnen Wahrscheinlichkeiten berechnen (Wahrscheinlichkeit für genau 1 Albino, Wahrscheinlichkeit für genau 2 Albinos u.s.w.). Es gibt aber eine viel elegantere Lösung. Die Wahrscheinlichkeit, mindestens ein Trägertier zu erhalten, ist genau die Gegenwahrscheinlichkeit davon, kein Trägertier zu erhalten.
Wir rechnen also
mit unseren Zahlen
Die Wahrscheinlichkeit, mindestens ein Albino-Baby in unserem Wurf zu haben, beträgt also 94%.
Und da es ziemlich aufwendig ist, dass immer wieder per Hand auszurechnen, haben schlaue Menschen dafür einen Online-Rechner entwickelt.
Berechnung OnlineIch hoffe, dass ich Euch ein paar Tipps zum Thema Wahrscheinlichkeitsrechnung geben konnte. Wenn Ihr Fragen habt: immer her damit - entweder in den Kommentaren oder über das Kontaktformular.