De quantas horas precisa um algoritmo para ser o rei do xadrez?

No tabuleiro, as máquinas dominam. Mas o que está em jogo não é fazer xeque-mate.

Foto

O xadrez, um jogo com cerca de 1500 anos, tem sido visto ao longo da História como um duelo de inteligências. Ser muito bom a jogar xadrez é frequentemente apontado como sinónimo de genialidade. A ideia é discutível, e o actual tricampeão do mundo, o norueguês Magnus Carlsen, afirmou uma vez, numa entrevista, que é “um tipo completamente normal” e que o pai (um jogador amador) é “consideravelmente mais inteligente”. Ser um jogador de topo implica anos de estudo e memorização intensiva. Ganhar uma partida é mais uma questão de treino do que um golpe de génio.

Este é, também, um jogo em que os computadores são, há muito, melhores do que os humanos. A viragem aconteceu em 1997, quando Garry Kasparov perdeu contra o computador Deep Blue, da IBM. “O jogo do xadrez é o domínio mais estudado na história da inteligência artificial”, lembrou esta semana uma equipa de investigadores da Deep Mind (a empresa de inteligência artificial do Google), num artigo científico divulgado no site ArXiv.

O que leva, então, uma equipa de cientistas a regressar a um tabuleiro que os computadores dominam há duas décadas? Tem pouco a ver com xadrez e muito a ver com o que, para alguns, é o graal desta área de investigação: criar inteligência artificial genérica, que seja capaz de aprender o que quer que seja, sem que os humanos lhe dêem explicações.

Os programas de xadrez que profissionais e amadores usam para treinar são feitos especificamente para o jogo, e têm um manancial de conhecimento prévio. Ou seja, sabem aquilo que a humanidade foi aprendendo ao longo de séculos. Já o programa agora desenvolvido assenta num algoritmo genérico, que pode ser usado tanto para xadrez como para outros jogos. Não tem qualquer conhecimento para além das regras e aprende jogando repetidamente contra si próprio.

Chamado AlphaZero, este algoritmo é uma adaptação do AlphaGo Zero, que já se tinha tornado um mestre no jogo chinês de Go. O AlphaZero é ainda mais genérico do que o antecessor, e foi capaz de aprender Go, xadrez e shogi, também conhecido como xadrez japonês. Em todos os casos, tornou-se muito bom, superando os melhores programas específicos.

No xadrez, o resultado foi claro: com quatro horas de treino, passou de uma nulidade sem conhecimentos para uma superpotência xadrezística, com um desempenho superior ao daquele que é considerado um dos melhores programas de xadrez do mundo.

Apesar das capacidades sobrehumanas, o AlphaZero, apontaram os investigadores, pode ser visto como mais próximo do funcionamento do cérebro do que acontece com um programa tradicional. Em vez de analisar 70 milhões de posições por segundo, como o software rival, ficava-se por umas meras 80 mil posições. O menor volume era compensado com a capacidade para seleccionar as jogadas mais promissoras.

Para os humanos, o xadrez pode ser um desafio usado há séculos como uma medida de inteligência. Para a inteligência artificial, é uma trivialidade que se domina em poucas horas.

A rubrica Tecnologia encontra-se publicada no P2, caderno de domingo do PÚBLICO