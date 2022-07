As gigantes tecnológicas, como a Google ou a Meta, já não são as únicas empresas com sistemas de inteligência artificial gigantescos treinados para compreender a forma como os humanos falam. Depois de um ano a reunir especialistas e a treinar algoritmos, uma equipa de mais de mil voluntários de todo o mundo lançou um modelo de linguagem em código aberto que qualquer pessoa pode utilizar para criar — chama-se Bloom (sigla inglesa para Modelo de Linguagem Multilingue de Ciência e Código Aberto). O Bloom quer tornar-se uma alternativa aos modelos de linguagem, pouco transparentes e com bases de dados desconhecidas, das gigantes tecnológicas.

Na base, os modelos de linguagem são sistemas que usam inteligência artificial para traduzir, resumir e escrever textos da mesma forma que humanos. Nos últimos anos, têm surgido modelos de linguagem capazes de escrever partes de romances ou notícias – é o caso do GTP-3, da OpenAI (um grupo apoiado por Elon Musk e Peter Thiel, fundador do PayPal). O facto de exigirem muito dinheiro, devido às elevadas exigências computacionais, leva a que a maioria seja detida por gigantes tecnológicas como a Meta (dona do Facebook, Instagram e WhatsApp), Google e Baidu.

A primeira versão do Bloom consegue produzir textos em 46 línguas (incluindo português) e 13 linguagens de programação. Qualquer pessoa ou empresa pode usá-lo nos seus sistemas de inteligência artificial: por exemplo, em ferramentas para resumir livros, responder a perguntas, traduzir e criar notícias curtas ou mesmo formular receitas.

Este é o primeiro grande projecto da BigScience, uma comunidade internacional de especialistas de diversas áreas que se juntaram em 2021 para criar sistemas de inteligência artificial mais acessíveis que permitam explorar o impacto desta tecnologia na sociedade. Em 2022, o grupo junta profissionais de advocacia, ética, políticas públicas, engenharia, inteligência artificial, linguística, e outras ciências sociais. O projecto para criar o Bloom foi liderado pela startup de inteligência artificial Hugging Face, que, em Maio, angariou mais de 100 milhões de euros em investimento.

“Modelos como o Bloom permitem uma investigação mais inclusiva e representativa na inteligência artificial”, explica ao PÚBLICO Thomas Wolf que lidera a equipa de cientistas na Hugging Face. “Dado o impacto da investigação em inteligência artificial em todas as tecnologias que nos rodeiam, tornar essa investigação mais inclusiva, aberta e colaborativa levará a uma utilização e compreensão da inteligência artificial, que também será mais democrática e inclusiva”, argumenta. “[A investigação] não estará apenas nas mãos de um par de grandes empresas tecnológicas.”

À primeira vista, porém, o Bloom parece ficar aquém dos projectos de grandes conglomerados. A semana passada, a Meta anunciou um novo sistema de inteligência artificial capaz de traduzir texto em mais de 200 línguas. O modelo, chamado No Language Left Behind (nenhuma língua fica para trás), suporta dezenas de idiomas a mais que o sistema de tradução da Google que funciona com 133 línguas.

“São projectos muito diferentes”, sublinha Wolf. “A versão da Meta é um modelo de língua aplicado que se foca em traduções automáticas”, esclarece o investigador. “O Bloom é um modelo genérico, criado para fazer múltiplas tarefas. A universidade de Stanford diz que são ‘modelos de fundação’. Isto inclui responder a perguntas de história ou escrever poemas.”

O sistema está a ser treinado através do Jean Zay, um supercomputador francês que fica no Centro Nacional de Investigação Científica, em Paris.