Das Pokerspiel und die Statistik

Unterschiedliche Medien haben übereinstimmend gemeldet, dass ein britischer Wissenschaftler vor Kurzem herausgefunden hat, dass das Pokerspiel nicht zu lösen ist und sehr kompliziert ist.

Dazu gehören auch Go, der Börsenhandel und Schach, da sie keine bestmöglichen Taktiken bieten und diese auch nicht von Menschen zu ermitteln sind. Man fragt sich, was es damit auf sich hat. Der Herr aus Manchester hat dies nicht erst neulich festgestellt, sein Dokument, auf das man sich bei den Meldungen nicht unmittelbar bezieht, ist schon zwei Jahre alt. Der Forscher befasst sich in der Hauptsache mit Spieltheorien, Mechaniken in der Statistik und evolutionären Lernalgorithmen im Bereich der Spiele.

In diesem Dokument macht der Forscher klar, dass komplizierte Spiele anders aufzulösen sind als recht einfache Spiele. Kurzum, ein pures Spielen und Ausprobieren jeder möglichen Vorgehensweise legt in zahlreichen Fällen nicht die beste Vorgehensweise auf den Tisch. Das japanische Brettspiel Go und Schach können aus spieltheoretischer Sicht besser aufgelöst werden, da sie eine begrenzte Zahl an Situationen haben und eine limitierte Ziffer an potentiellen Vorgehensweisen haben.

Derartige Spiele halten immer eine bestmögliche Lösung parat, dies ist ein sogenanntes Nash-Gleichgewicht in kombinierten Strategien. Doch was bedeutet das? Im Rahmen der Spiele für zwei Leute ist dieses Gleichgewicht ein Paar aus Taktiken der zwei Spieler, bei dem die individuellen Vorgehensweisen so ausgerichtet sind, dass kein Spieler seine Taktik gewinnbringend ändern kann.

Das Spiel Schere, Stein, Papier beinhaltet drei einzelne Vorgehensweisen, sprich die drei Komponenten des Spiels. Ein Gleichgewicht würde dann hergestellt sein, wenn alle beiden Nutzer mit einer Chance von jeweils 33 Prozent die drei Komponenten nutzen. Bei allen anderen Vorgehensweisen hat der Gegner die Chance, die Option auf einen Gewinn höher zu setzen. Wenn Spieler 1 beispielsweise immer zu 50 Prozent Stein und die restlichen 50 Prozent die anderen beiden Komponenten spielt, dann hätte der Gegner die Option, stets Papier zu nutzen und so 50 Prozent der Spiele für sich zu entscheiden.

Dabei spielt er kein Drittel, so wie es bei der Vorgehensweise im Bereich Gleichgewicht der Fall ist. Zahlreiche Spiele bieten nur die Option, diese Gleichgewichte in kombinierten Strategien zu setzen. So bezeichnet man Vorgehensweisen, wie in dem vorangegangenen Spiel; in einem bestimmten Prozentsatz der Fälle nutzt man die erste Option, in einem anderen Prozentsatz die zweite Möglichkeit, etc. Wenn man stets genau eine dieser individuellen Vorgehensweisen nutzen würde, würde eine reine Vorgehensweise vorliegen.

Vor rund 60 Jahren hat der Nobelpreisträger Nash klargemacht, dass eine Vielzahl der Spiele wenigstens ein derartiges Gleichgewicht in kombinierten Vorgehensweisen vorweisen muss. In puren Vorgehensweisen kann dies nicht immer bewerkstelligt werden. Gerade solche Spiele weisen ein solches Gleichgewicht auf. Dazu gehört auch das Pokerspiel, das lediglich 52 Karten mitbringt und auch limitierte Spielzüge hat. Darum beinhaltet dieses Spiel auch eine Gleichgewichtsstrategie.

Aus spieltheoretischer Sicht ist bereits eine einzelne Strategie für dieses Spiel sehr kompliziert und für jede denkbare Verteilung der Karten und jeden denkbaren Spielverlauf wird gezeigt, welcher Zug gemacht werden soll. Beim Heads-Up-Hold?em finden sich bereits mehr als 55 Billionen mögliche Verteilungen der Karten.

Wenn man Limit spielt, dann finden sich für alle Verteilungen mehr als zehntausend mögliche Setzfolgen. Somit erreicht man die Summe von 55 Trillionen unterschiedlichen und potentiellen Spielen in diesem Bereich. Eine individuelle Vorgehensweise findet sich für alle potentiellen Spiele, die gemacht werden können. Kein Nutzer kann so viele Möglichkeiten im Kopf behalten, wenn er sich eine Strategie aussucht. Doch aus spieltheoretischer Sicht kann man damit rechnen, dass es mehrere Trillionen unterschiedliche Individualvorgehensweisen gibt.

Die richtige Vorgehensweise bei diesem Spiel, sprich die von Nash, gestaltet sich noch schwerer, da diese wahrscheinlich lediglich in gemischter Form vorliegt. Das bedeutet, dass keine dieser Vorgehensweisen genügend ist, um ein solches Gleichgewicht zu erzeugen. Die richtige Vorgehensweise ist die, dass alle potentiellen individuellen Vorgehensweisen eine Wahrscheinlichkeit bekommen, mit der sie ausgesucht werden.

In praktischer Hinsicht ist es nicht möglich, diese richtige Vorgehensweise zu ermitteln, doch es steht fest, dass es eine solche gibt und es ist zumindest denkbar, dass es irgendwann einmal PCs geben wird, die solche Datenmengen handhaben können und die auch in der Lage sind, diese Vorgehensweise zu finden. Hier kommt der britische Forscher ins Spiel und ermittelt, ob und auf welche Weise PCs eine richtige Vorgehensweise ausfindig machen können.

PCs können sehr einfach für einfache Spiele, wie das Schere, Stein, Papier, diese Option ausfindig machen. Hierfür spielt der Computer oft gegen sich selbst und man gleicht die Vorgehensweise nach dem Spiel ein bisschen an. Individuelle Vorgehensweisen, die gewinnbringend sind, nutzt man öfter. Individuelle Vorgehensweisen ohne Erfolg nutzt man nicht so oft.

Nach einer häufigen Spielwiederholung liegen Konvergenzen für die Wahrscheinlichkeiten im Bereich dieser Taktiken vor und dann erzielt man eine Gleichgewichtsstrategie. Das obengenannte Beispiel ist sehr einfach, man findet nur drei einzelne Vorgehensweisen, sprich eine der drei Komponenten. Doch man fragt sich, ob diese Taktik auch bei komplizierten Spielen greift. Um dies herauszufinden, nutzte der Forscher ein erfundenes Spiel mit 50 individuellen Vorgehensweisen und ließ den Rechner gegen sich antreten.

Das Resultat war sehr klar, der PC erzielte normalerweise keine Gleichgewichtsstrategien. Es war unerheblich, wie lange der PC gegen sich antrat, er veränderte stets die Beurteilungen der einzelnen Vorgehensweisen. Dieses Verhalten für die Vorgehensweisen gestaltete sich nicht prognostizierbar. Auch bei diesem Spiel liegt notwendigerweise eine Gleichgewichtsstrategie vor, aber die Vorgehensweise, um diese zu ermitteln, führte nicht zum Erfolg.

Wenn dies bereits bei einem Spiel mit 50 individuellen Strategien nicht hinhaut, dann kann man sich denken, wie diese Methode beim Pokerspiel gehen soll, das viel mehr Strategien hat: Es funktioniert nicht. Dies ist auch beim Schachspiel oder Go der Fall, weil sie, was die Größenordnung angeht, eine ähnliche komplexe Form aufweisen können. Damit solch komplizierte Spiele auf dem PC zu lösen sind, braucht man andere Algorithmen als die, die der Forscher benutzt hat.

Eine optimale Strategie ist per Definition schon mal nicht schlecht, denn man nutzt das Spiel so, dass der Gegenspieler unabhängig von seiner Spielweise auf lange Sicht nicht besser ist, als wenn er auch diese Vorgehensweise nutzt. Sprich, man könnte niemals verlieren. Doch ist dies wirklich das, was bezweckt werden soll? Beim Pokerspiel gibt es augenscheinlich ganz große Verlockungen, eine optimale Strategie außen vorzulassen, wenn klar ist, dass das Gegenüber festgelegte Ambitionen hat.

Bei einem Spieler der immer blufft, macht man öfters einen Call, als es aus Sicht der Spieltheorie gut ist. Gegen einen standhaften Spieler wird man fester. Der Zweck des Pokerspiels besteht nicht darin, auf lange Sicht unbesiegbar zu sein, sondern einen Gewinn zu erzielen. Die Theorie von Nash ist beim Pokerspiel also nur in Grenzen effektiv.

Sie wäre nur dann wichtig, wenn zwei große Rechner gegeneinander antreten und versuchen, über einen sehr langen Zeitraum besser zu sein. Doch PCs, welche diese Anzahl an Strategien überhaupt nutzen können, werden erst in Zukunft kommen. Die Vorgehensweise von Nash ist oft nur gegen die Intuition und im praktischen Umgang nur begrenzt effektiv; dies wird in zahlreichen Beispielen offenbar.

Das Urlauberdilemma, ein erfundenes Spiel, ist sehr verwunderlich. Hier müssen zwei Spieler im Rahmen der Gleichgewichtsstrategie den individuellen Gewinn verringern, um zu sehen, dass sie nicht schlechter spielen als ihr Gegenspieler.

geschrieben am 29.01.2013 von Jessica Neumann


2020-10       2020-9       2020-8       2020-7       2020-6       2020-5       
2020-4       2020-3       2020-2       2020-1       2019-12       2019-11       
2019-10       2019-9       2019-8       2019-7       2019-6       2019-5       
2019-4       2019-3       2019-2       2019-1       2018-12       2018-11       
2018-10       2018-9       2018-8       2018-7       2018-6       2018-5       
2018-4       2018-3       2018-2       2018-1       2017-12       2017-11       
2017-10       2017-9       2017-8       2017-7       2017-6       2017-5       
2017-4       2017-3       2017-2       2017-1       2016-12       2016-11       
2016-10       2016-9       2016-8       2016-7       2016-6       2016-5       
2016-4       2016-3       2016-2       2016-1       2015-12       2015-11       
2015-10       2015-9       2015-8       2015-7       2015-6       2015-5       
2015-4       2015-3       2015-2       2015-1       2014-12       2014-11       
2014-10       2014-9       2014-8       2014-7       2014-6       2014-5       
2014-4       2014-3       2014-2       2014-1       2013-12       2013-11       
2013-10       2013-9       2013-8       2013-7       2013-6       2013-5       
2013-4       2013-3       2013-2       2013-1       2012-12       2012-11       
2012-10       2012-9       2012-8       2012-7       2012-6       2012-5       
2012-4       2012-3       2012-2       2012-1       2011-12       2011-11       
2011-10       2011-9       2011-8       2011-7       2011-6       2011-5       
2011-4       2011-3       2011-2       2011-1       2010-12       2010-11       
2010-10       2010-9       2010-8       2010-7       2010-6       2010-5       
2010-4       2010-3       2010-2       2010-1       2009-12       2009-11       
2009-10