A inteligência artificial pode ser a chave para decifrar textos medievais misteriosos que têm confundido os humanos durante séculos. Entre os avanços recentes na área, uma dupla de investigadores no Canadá mostrou que um algoritmo é capaz de ler parte do Manuscrito Voynich. São 240 páginas num alfabeto irreconhecível, sem vogais, ilustradas com imagens crípticas de plantas, diagramas de astrologia, e mulheres a tomar banho.

As teorias abundam desde o século XV: não se sabe se o livro é uma versão da história mundial em latim abreviado, um manual de alquimia encriptado, ou um conjunto de palavras sem nexo para confundir gerações futuras. Apesar do conteúdo ilegível, a obra foi passada por imperadores e eruditos antes de ser comprada pelo polaco que lhe deu o nome, Wilfrid Voynich, em 1912. Nos últimos anos, programas de computador e fórmulas matemáticas têm sido usadas para o tentar compreender.

“Parece estar escrito em código, mas sem se saber a linguagem em que está encriptado torna-se um desafio decifrá-lo”, explicam os investigadores da Universidade de Alberta na apresentação da experiência que começaram em 2016. O objectivo era encontrar a “língua desconhecida” por detrás do Voynich. Muitos historiadores acreditam que o manuscrito foi encriptado com uma “cifra de substituição” em que as letras de um alfabeto conhecido são substituídas por letras inventadas.

Foto O livro pode ser visto na secção de livros raros da biblioteca digital da Universidade de Yale Universidade de Yale

Num email ao P2, o investigador Greg Kondrak, descreve o Voynich como o “texto ideal para pôr a inteligência artificial à prova porque ainda não foi resolvido e é longo o suficiente para um computador analisar.” O primeiro passo foi treinar um algoritmo com 380 traduções diferentes da Declaração Universal dos Direitos Humanos. Quando passou a reconhecer 97% das palavras sem erro, os investigadores perguntaram-lhe a língua do manuscrito.

Teorias recentes sugeriam uma versão de arábico em abjad, um sistema de escrita que omite vogais. O algoritmo discordou: o hebraico é a língua mais provável e "ela fez recomendações ao padre, ao homem da casa e mim e pessoas” são das primeiras palavras. Ao treinar novos algoritmos de criptografia com antigos textos sagrados na língua, conseguiram identificar 80% das palavras nas dez primeiras páginas embora continuem sem fazer sentido na ordem em que surgem. Uma análise posterior dos resultados, porém, mostra que muitas não estariam fora de contexto num herbanário medieval: “agricultor”, “fogo”, “água”, e “leve” surgem repetidamente na parte do livro ilustrado com imagens de folhas e árvores desconhecidas.

Os resultados mostram o potencial da tradução algorítmica para decifrar textos do passado, mas a equipa reconhece que precisa agora de historiadores para validar os resultados e continuar. “Os algoritmos são só o ponto de partida,” frisa Greg Kondrack. "Não podem decifrar cifras antigas sem a ajuda de peritos que trabalham nisto durante anos". A interpretação do mistério continua a cargo dos humanos.

