Go ist das komplizierte Spiel der Welt. Erst künstliche Intelligenz (KI) ermöglichte ein Computerprogramm, das die weltbesten Go-Profis schlagen konnte. Jetzt gibt es mit AlphaGo Sero von der Google-Tochter DeepMind eine Software, welche die KI auf die nächste Stufe bringt.

Eigentlich sind die Regeln des asiatischen Brettspiels Go ganz einfach. Es gibt, anders als beim Schach, nur eine Art von Steinen (aber natürlich in zwei Farben, schwarz und weiß), die die beiden beteiligten Spieler abwechselnd auf einen von 361 Schnittpunkten eines Gitters auf einem Brett setzen. Ziel ist es, möglichst große Bereiche des Spielfeldes für sich zu erobern. Das zumindest ist die vereinfachte Beschreibung der Idee von Go. Von da an wird es kompliziert, so kompliziert, dass das Spiel als weitaus komplexer gilt als Schach. Die Zahl aller regelkonformen möglichen Positionen von Steinen auf dem Brett hat 171 Stellen.

2015 schlägt erstmals ein Computer einen Go-Meister

Lange Zeit schien es deshalb fast unmöglich ein Computerprogramm zu entwickeln, das mit den weltbesten Go-Spielern mithalten oder diese sogar schlagen könnte. Das änderte sich im Oktober 2015. Damals schlug das von der Google-Firma DeepMind entwickelte AlphaGo den mehrfachen Europameister Fan Hui. Das Programm wurde laufend verbessert, besiegte weitere Weltklassespieler und in der Version „Master“ gleich 60 Profis in Serie.

Bei allen Versionen kommen zwei neuronale Netzwerke zum Einsatz. Vereinfacht gesagt, kümmert sich eines um die Einhaltung der Regeln, das andere um die Bewertung der möglichen Spielzüge. Sogenannte Monte-Carlo-Algorithmen, die in einem gewissen Rahmen auch falsche Ergebnisse liefern dürfen und den Zufall berechenbar machen sollen, spielen ebenfalls eine wichtige Rolle.

Der Lernprozess zog sich über Monate

Damit das System funktioniert, muss es mit einer Menge Informationen gefüttert werden. Grundlage ist eine Datenbank mit Millionen von Spielzügen. Diese Spielzüge stammen aus Partien der besten Spieler der Welt. AlphaGo hat also von den Meistern des Go gelernt, ein Prozess, der sich über Monate hingezogen hat. An dessen Ende spielte das Programm in der Master-Version wie der optimale errechenbare menschliche Spieler.

Video: Professor David Silver von DeepMind erklärt AlphaGo Zero

Und dann kam AlphaGo Zero. Diese Weiterentwicklung widerspricht der gängigen Meinung, das bei künstlicher Intelligenz viel auch viel bringt, also riesige Datenmengen für bestmögliche Ergebnisse sorgen. Zero bekam nur die Grundregeln von Go erklärt und keinerlei Informationen über bereits gespielte Partien.

Schon nach drei Tagen schlug AlphaGo Zero ohne fremde Hilfe ein Vorgängersystem

Dieses System startete mit nur einem neuronalen Netzwerk, das zu Beginn absolut nichts über Go wusste. Es fing dann an, gegen sich selbst zu spielen, und lernte schnell, seine eigenen Spielzüge zu analysieren und mögliche Ergebnisse vorherzusagen. So schnell, dass es schon nach drei Tagen eine frühere Ausgabe von AlphaGo schlagen konnte, und zwar mit 100 zu 0. Nach vierzig Tagen war Zero dann deutlich stärker als das bisherige Maß aller Dinge, die „Master“-Version.

Ein erheblich geringerer Datenaufwand, eine deutlich kürzere Rechenzeit, kompaktere Algorithmen, weniger Hardware im Einsatz (vier statt ursprünglich 48 Prozessoren) und aus all dem folgend auch ein signifikant niedrigerer Energieverbrauch – und trotzdem ein Ergebnis, das alles bisher Dagewesene in den Schatten stellt. In dieser Kombination sehen viele einen Durchbruch bei der künstlichen Intelligenz, dessen Konsequenzen bisher noch gar nicht absehbar sind. Ist AlphaGo Zero vielleicht in gewisser Weise sogar übermenschlich?

Droht jetzt die KI den Menschen zu überflügeln?

Bei DeepMind ist man zumindest zuversichtlich, die Erkenntnisse aus der Entwicklung von AlphaGo Zero auf andere Bereiche übertragen zu können. Mögliche Einsatzgebiete sind die Erforschung der Proteinfaltung, die Wirkstoffforschung, beim Materialdesign und in der Quantenchemie. Aber besteht nicht auch die Gefahr, dass sich diese Form der KI in irgendeiner Weise selbstständig macht, da sie auf menschlichen Input nicht mehr angewiesen ist?

Von dieser Schreckensvision seien wir noch weit entfernt, beruhigen Experten. Wie eingangs erklärt, ist Go ein sehr komplexes Spiel, das aber auf festen, vergleichsweise simplen Regeln beruht. Das „wahre Leben“ ist dagegen wesentlich vielschichtiger und chaotischer, genau definierbare Regeln gibt es nicht immer, oder der Mensch hat sie noch nicht vollständig erkannt und kann sie einem Programm daher nicht vorgeben. Eine echte Entwarnung soll das aber nicht sein. Schließlich schien es vor wenigen Jahren noch undenkbar ein Programm zu entwickeln, das besser Go spielt als jeder Mensch. Geschweige denn eines, das sich diese Fähigkeit auch ganz von selbst beibringt.

Bild ganz oben: Wikipedia / Fcb981

X
X