Az Alpha Zero megnyitástanulásának rejtelmei

Az Alpha Zero megnyitástanulásának rejtelmei

Hogyan néznek ki a megnyitások egy minden eddiginél magasabb szintről nézve?

A januári lapszámunkban hosszú cikk foglalkozik a Stockfish sakkprogramot 100 játszmából veretlenül lenyomó Alpha Zero programmal. A cikkben ígértük, hogy a Zero megnyitáselmélet tanulására itt a honlapunkon kitérünk.

A Zero a sakk szabályainak ismeretében minden sakktudás nélkül kezdett el saját magával sakkozgatni, és minden játszmából tanult. Így vált órák alatt a világ legerősebb sakkjátékosává. Az általa felfedezett sakktudás egy vetülete, hogy az emberi megnyitásokhoz hogyan viszonyult a tanulási folyamata alatt. Az alábbi grafikonok azt mutatják, hogy a tanulás előrehaladtával mennyire gyakran játszotta meg Alpha Zero az adott megnyitást. Például az első grafikon az angol megnyitást mutatja. Eleinte csak a játszmák 5%-ában nyitott Zero 1.c4-el, majd az idő múlásával, azaz a játékerejének növekedésével, ez felment közel 25%-ra. Viszont további felismerések arra vezették, hogy az angol megnyitás nem is annyira hatékony, ezért egyre ritkábban kezdte megjátszani. Mígnem rádöbbent, hogy valójában több is van benne, és akkor újra emelkedni kezdett az 1.c4 gyakorisága az önmaga elleni partijaiban, de már csak 12%-ig. A grafikonok alatti lépéssor a program által várt legvalószínűbb folytatást mutatja, vagyis nem feltétlenül az emberi elmélet lépéssora. Hanem esetleg jobb annál.  :)

Érdekes, hogy mind a Francia védelem, mind a Caro-Kann egy ideig jól játszhatónak tűnt számára, mígnem rájött a cáfolatára, és gyakorlatilag kiiktatta a játékából. Ez eléggé összhangban az emberi megnyitáselmélet fejlődésével.

Feltűnő, hogy a Szicíliai a Zero szerint mennyire lúzer dolog – pont ami a kedvenc védelmem. Valójában egyik Szicíliai fővarit sem tartotta soha sokra.

És ami számomra a legérdekesebb, az a Spanyol elleni 3…a6-os védelem. Olyan sokáig jónak tartotta, hogy szinte már egy igazi biztos nyerő védelemnek tűnt. Már túlhaladta játékerőben az emberi tudást, és még mindig egyre jobbnak tartotta. Már túlhaladta a mai sakkprogramok tudását, és még mindig jónak tartotta. És amikor már csak a saját szintjéhez képest fejlődött felfoghatatlan magasságokba, nos akkor jött rá ennek a változatnak a tarthatatlanságára.

És nézzünk még egy érdekességet: Zero a promóciók 77%-ában a vezérré válást választja, 11%-ában lóvá, és 12%-ában futó vagy bástyává promótál.

Horváth Gyula