data > opinion

Tom Alby

Wie man mit dem Satz von Bayes einen gezinkten Würfel erkennt

2020-03-01


Sie sind hier: start / wie man mit dem satz von bayes einen gezinkten wuerfel erkennt /

Bayes’ theorem, even if it is not permitted in UK courts, is the scientifically correct way to change our mind on the basis of new evidence. (Spiegelhalter)

Bei einem normalen Würfel wissen wir, dass die Wahrscheinlichkeit, eine 6 zu würfeln, bei 1/6 liegt. Die Wahrscheinlichkeit, dass nach einer 6 noch eine 6 gewürfelt wird, ist

\[p(Sechs \cap Sechs) = \frac{1}{6} * \frac{1}{6} = \frac{1}{36}\] Die Ereignisse sind unabhängig voneinander, daher hat sich die Wahrscheinlichkeit eine 6 zu würfeln bei dem zweiten Wurf nicht geändert. Die Wahrscheinlichkeit, drei Mal hintereinander eine 6 zu würfeln, liegt bei 0,463%, sie ist also gering. Passiert es trotzdem? Natürlich! Niemand würde deswegen jemand anders die Freundschaft kündigen. Es werden sehr viel mehr WÜrfe benötigt.

Nun könnte es sein, dass jemand aus Versehen einen gezinkten Würfel mitgebracht hat; der Spieler besitzt einen normalen Würfel und einen gezinkten, und er weiß einfach nicht mehr, welchen er eingesteckt hat. Wie könnte man herausfinden, ob der Würfel gezinkt ist oder nicht? Der Einfachheit halber gehen wir davon aus, dass die Wahrscheinlichkeit mit solch einem gezinkten Würfel eine 6 zu würfeln bei 100% liegt.

Hier kommt der Satz von Bayes ins Spiel:

\[p(B|A)= \frac{p(A|B)·p(B)} {p(A)}\]

Wir wollen nun wissen, wenn der Spieler mehrere Würfe durchführt, wie hoch die Wahrscheinlichkeit ist, dass dies der gezinkte Würfel ist. Anders ausgedrückt

\[p(unfair | x * Sechs)= \frac{p(x * Sechs | unfair)·p(unfair)} {p(x * Sechs)}\]

Wir haben nun ein Problem, denn wie sollen wir p(A) ausrechnen? Das müssen wir aber gar nicht, denn entweder ist der Würfel unfair oder nicht, gehört also zu einer Klasse oder der anderen, und so können wir p(A) umschreiben:

\[p(unfair | x * Sechs)= \frac{p(x * Sechs | unfair)·p(unfair)} {p(x * Sechs | fair) * p(fair) + p(x * Sechs | unfair) * p(unfair)}\]

Nun kann das für einen beliebigen Wert x durchgerechnet werden, Beispiel: 3 Würfe mit einer 6:

\[p(unfair | 3 * Sechs)= \frac{1 · 0.5} {(0.00462963 · 0.5) + (1 · 0.5)} = 0.995391713\]

Hätten wir einfach nur die Wahrscheinlichkeit berechnet, drei Mal hintereinander eine 6 zu würfeln (und das von 1 abgezogen), dann hätte das Ergebnis nicht viel anders ausgesehen:

((1/6)^3)-1
## [1] -0.9953704

Für beide Fälle gilt, dass drei Würfe nicht ausreichen, um eine Entscheidung zu treffen. Unsere Herausforderung hier aber ist der Prior, also unsere Annahme, mit welcher Wahrscheinlichkeit der Würfel gezinkt ist. Hätte der Spieler nun zehn Würfel und nur einer davon ist gezinkt, so liegt die Wahrscheinlichkeit, dass er den gezinkten Würfel eingesteckt hat, bei 10%.

\[p(unfair | 3 * Sechs)= \frac{1 · 0.1} {(0.00462963 · 0.9) + (1 · 0.1)} = 0.96\]

Oder, in R ausgedrückt:

0.1 / ((((1/6)^3)*0.9)+0.1)
## [1] 0.96

Was aber wenn wir gar nicht wissen, ob ein Spieler einen gezinkten Würfel mitgebracht hat oder nicht? Hier kommt Bayes Faktor ins Spiel.

Interessant ist Bayes Satz auch, wenn es um die Wirksamkeit von Medikamenten oder Drogentests geht. Angenommen ein Drogentest hat eine Quote von 98%, wenn es darum geht, einen Konsumenten von Drogen zu erkennen, allerdings auch eine Quote von 90%, Nicht-Drogennutzer korrekt zu erkennen, dann kann daraus berechnet werden, wie wahrscheinlich es ist, dass ein Drogennutzer korrekt erkannt wird. In diesem Beispiel wird angenommen, dass die Droge von 10% der Bevölkerung konsumiert wird. Schon jetzt ist klar, dass ein False Positive mit einer Wahrscheinlichkeit von 10% auftreten kann (jemand nimmt die Droge nicht, wird aber positiv getestet) und ein False Negative bei 2% (jemand nimmt die Droge, wird aber nicht beschuldigt). Wie hoch ist die Wahrscheinlichkeit, dass ein positv getesteter Mensch tatsächlich Konsument der Droge ist?

\[p(schuldig| positiv)=\] \[\frac{p(positiv | schuldig)·p(schuldig)} {p(positiv | unschuldig) * p(unschuldig) + p(positiv | schuldig) * p(schuldig)}\]

(0.98 * 0.1) / ((0.1*0.9)+(0.98*0.1))
## [1] 0.5212766

\[p(Drogennutzer | Test positiv)= \frac{0.98 · 0.1} {(0.1 · 0.9) + (0.98 · 0.1)} = 0.5212766\]

Die Wahrscheinlichkeit, dass der Verdächtige tatsächlich diese Droge nutzt, liegt also bei etwas über 50%. Und das wird zum Schluss die Frage auf, warum der Satz von Bayes nicht an Gerichten in Uk verwendet werden darf? Ein The Register-Artikel gibt darüber Aufschluss.