Miért bukik el az AlphaGo módszer egy egyszerű táblajátékban?
Bei Zhou és Soren Riis kutatása kimutatta, hogy az AlphaGo tréningtechnikája kudarcot vall Nimben, egy egyszerű imparciális játékban.
Bei Zhou és Soren Riis publikált egy tanulmányt, amelyben az AlphaGo és AlphaZero módszerét alkalmazták a Nim játékra. A Nim egy két játékos, egyszerű szabályokkal rendelkező, imparciális játék, ahol a játékosok ugyanazokat a szabályokat és darabokat használják.
A kutatás szerint az AlphaGo megközelítése nem képes megtanulni a Nimben alkalmazandó paritásfüggvényt, amely meghatározza, hogy melyik játékos nyerhet. Ennek ellenére AlphaZero a sakkban sikeres volt, mert a játékosok egyedi darabokkal rendelkeztek.
A Nim példája rámutat arra, hogy az AlphaGo alapú tréning nem minden játékra általánítható, különösen az imparciális játékok esetén. A kutatók szerint a jövőbeli fejlesztéseknek más módszert kell alkalmazniuk a Nimhez hasonló játékokhoz.