Computer verslaat Go-kampioen

Computer verslaat Go-kampioen

AlphaGo, een computerprogramma van het Google- bedrijf DeepMind, heeft tot vier maal toe een kampioen in het bordspel Go verslagen. Daarmee lijkt definitief duidelijk dat computers ook in dit moeilijke bordspel beter zijn dan mensen.

Go gold als het laatste spel waarin de computer geen kans maakte tegen een tegenstander van vlees en bloed. Het bordspel, dat vooral in landen als Japan, China en Korea populair is, is namelijk veel ingewikkelder dan dammen of schaken. Het wordt bijvoorbeeld op een bord van 19 bij 19 vakjes gespeeld (tegen 8 $\times$ 8 bij schaken) en het aantal zetten is veel groter. Daardoor is het aantal mogelijke potjes Go veel groter dan het aantal schaakspellen: $10^{761}$ tegen ongeveer $10^{120}$.

Bij schaken verloor de mens al in 1997, toen schaakkampioen Gary Kasparov het aflegde tegen de schaakcomputer Deep Blue van IBM. Die computer was echter op een specifieke manier geprogrammeerd om potjes te winnen: het rekenvermogen van de krachtige pc was simpelweg groter dan dat van de grootmeester.

Bij Go leggen spelers om de beurt steentjes neer op kruispunten. Het doel is om zoveel mogelijk van het bord in te sluiten in jouw kleur steentjes, en ondertussen te zorgen dat de tegenstander zo min mogelijk terrein wint. Hoewel de regels van Go simpel zijn, is het in de praktijk een moeilijk spel. Ver vooruitdenken en intuïtie zijn belangrijke vaardigheden. De techniek die vergelijkbaar is met die van Deep- Blue werkt bij Go niet, omdat het aantal mogelijkheden om steentjes neer te leggen veel te groot is.

In plaats daarvan leert AlphaGo door middel van ‘machine learning’, een nieuwe methode om programma’s dingen te laten doen. Je schrijft niet een code die de computer opdrachten geeft, maar een instructie om te leren uit ervaring. Zo lieten de onderzoekers bij DeepMind een programma duizenden potjes Go bekijken om zo optimale tactieken te ontdekken. De computer bepaalde daarna een tactiek om het spel te winnen.

Die methode bleek succesvol. AlphaGo won drie maal op rij van de 33-jarige kampioen Lee Sedol uit Korea, dankzij een paar ongebruikelijke tactieken die voor de kenners ongewoon waren. De computer deed regelmatig dingen die onlogisch en nadelig leken, maar vele beurten later hun vruchten afwierpen. Mede door die ‘onmenselijke’ manier van spelen maakte Lee Sedol geen kans. Lee won wél de vierde partij, nadat hij goed had gekeken hoe de computer de eerdere potjes speelde. In een wedstrijd van vijf uur dwong Sedol AlphaGo tot opgeven. De vijfde (en laatste) partij won AlphaGo weer. (MS)