Miért bukik el az AlphaGo módszer egy egyszerű táblajátékban?

Bei Zhou és Soren Riis publikált egy tanulmányt, amelyben az AlphaGo és AlphaZero módszerét alkalmazták a Nim játékra. A Nim egy két játékos, egyszerű szabályokkal rendelkező, imparciális játék, ahol a játékosok ugyanazokat a szabályokat és darabokat használják.

A kutatás szerint az AlphaGo megközelítése nem képes megtanulni a Nimben alkalmazandó paritásfüggvényt, amely meghatározza, hogy melyik játékos nyerhet. Ennek ellenére AlphaZero a sakkban sikeres volt, mert a játékosok egyedi darabokkal rendelkeztek.

A Nim példája rámutat arra, hogy az AlphaGo alapú tréning nem minden játékra általánítható, különösen az imparciális játékok esetén. A kutatók szerint a jövőbeli fejlesztéseknek más módszert kell alkalmazniuk a Nimhez hasonló játékokhoz.