Professor Vetterli erklärt
Wie funktionieren einarmige Banditen?

Martin Vetterli ist Präsident der EPFL in Lausanne und führender Experte für Digitalisierung. Jede Woche erklärt er Begriffe aus der digitalen Welt.
Publiziert: 28.01.2018 um 17:48 Uhr
|
Aktualisiert: 12.09.2018 um 16:15 Uhr
Spielautomaten und die Informatik haben Gemeinsamkeiten.
Foto: Keystone
Martin Vetterli
Martin VetterliPräsident der EPFL Lausanne

Vor ein paar Jahren war ich in Las Vegas, um die Consumer Electronics Show zu besuchen, eine der grössten Messen der Welt, wo die neuesten elektronischen Produkte vorgestellt werden. Aber was mir in der für ihre grossen Casinos bekannten Region am meisten auffiel, war, dass es sogar in den Aufzügen der Hotels Spielautomaten gab! Als ich diese «einarmigen Banditen» sah, musste ich an ein berühmtes Problem aus der Informa­tionstheorie denken, das «Mehrarmige-Banditen-Problem».

Es handelt von Folgendem: Stellen Sie sich vor, Sie sitzen vor ­einer Reihe von Spielautomaten, und jeder davon ist anders eingestellt (sodass die Chance auf eine Gewinnkombination an manchen Automaten höher ist als an anderen). Sie haben nur eine begrenzte Menge Geld zur Verfügung, und Sie möchten in den nächsten Stunden so viel Geld wie möglich gewinnen. An welchem Automaten spielen Sie? Und spielen Sie die ganze Zeit an demselben Automaten oder wechseln Sie ab und zu?

1000 Münzen pro Automat

Natürlich müssen Sie zunächst herausfinden, welcher Automat den höchsten Gewinn ausgibt. Eine einfache Methode, das herauszufinden, ist vermutlich die, zu Beginn die gleiche Anzahl an Münzen in jeden Automaten zu stecken und dann nur den zu benutzen, der die höchsten Gewinne ausschüttet. Leider gibt es keine Garantie, dass Sie gleich zu Beginn den richtigen Automaten finden, denn wenn Sie mit fünf Münzen pro Automat anfangen, wären Ihre Chancen, den richtigen zu finden, geringer, als wenn Sie mit 1000 Münzen pro Automat anfangen.

Es zeigt sich, dass, egal wie viele Münzen Sie haben, diese Methode zu starr ist und dass eine ­optimale Strategie auf einem dynamischeren Ansatz beruht. Mit anderen Worten, Sie möchten anfangs prüfen, welcher Spielautomat der beste ist. Aber danach besteht eine ideale Strategie darin, die meisten Münzen zwar an diesem zunächst ausgewählten Automaten zu spielen, aber weiterhin auch ein paar Münzen in die anderen Automaten zu stecken (besonders in die mit hohem Potenzial). Und falls es sich während des Spiels plötzlich herausstellt, dass ein anderer Automat mehr Gewinne ausschüttet, wechseln Sie von ­Ihrem bevorzugten Spielautomaten zu diesem. So machen Sie bis zum Ende weiter.

Anwendungsbereich Online-Werbung

Das letzte Jahrzehnt hat gezeigt, dass es für dieses Problem in der Tat Anwendungsfälle in vielen Bereichen gibt. In der Medizin etwa könnten die Spielautomaten experimentelle Medikamente sein. Forscher möchten mit so wenig klinischen Versuchen wie möglich herausfinden, welches Medikament am besten wirkt. Ein neuerer Anwendungsfall ist die Onlinewerbung. Heutzutage ist es ­absolut möglich, gleichzeitig mehrere Versionen einer Anzeige für eine Untergruppe auf den Markt zu bringen, die Ergebnisse zu messen und so herauszufinden, welche Version am besten funktioniert.
Aber in diesem Lift habe ich noch eine andere Sache verstanden. Egal, wie gut Sie Ihr Spiel optimieren, die Strategie der «einarmigen Banditen» ist trotzdem besser als unsere. Schliesslich gibt es sie immer noch, und sie verdienen an uns – und nicht wir an ihnen.

Fehler gefunden? Jetzt melden
Was sagst du dazu?