De um lado, o maior jornal do mundo. Do outro, uma dupla constituída por uma gigante tecnológica e pela mais relevante empresa de inteligência artificial dos últimos tempos. Em jogo, mais uma vez, o futuro de um sector sem o qual as democracias deixam de o ser.

O New York Times avançou em Dezembro com um processo contra a OpenAI, a empresa que criou o ChatGPT, e contra a Microsoft, investidora na primeira. São 69 páginas, muitas das quais não passam da obrigatória verborreia legal. Mas algumas oferecem um bom resumo das preocupações que assaltam o sector do jornalismo face à rápida evolução da chamada inteligência artificial generativa.

Está hoje a emergir uma nova disputa entre as empresas de jornalismo e as empresas tecnológicas. É motivada pelo uso não autorizado do conteúdo produzido pelas redacções, que tem servido (a par de muitos outros tipos de conteúdo) para alimentar sistemas de inteligência artificial; em particular, sistemas do estilo ChatGPT. Esta tecnologia já está a servir de base a produtos que podem vir a mudar a forma como se consome quotidianamente informação.

Não é um caso da proverbial repetição da História, mas é uma sequela do intrincado filme a que assistimos há uns anos com a Google e a agregação de notícias. A Google teve alguns argumentos sérios ("aparecer nas pesquisas significa tráfego para os sites de notícias"; "qualquer site pode decidir unilateralmente não ser indexado") e outros menos sérios ("o Google News nem sequer tem publicidade", ideia com que pretendia dar uma aura não lucrativa à indexação de notícias). Os media cometeram o mesmo género de pecadilhos retóricos.

A vitória não foi completa, mas a Google ganhou, embora ambas as partes tendam a escamotear este desfecho: os media, porque ninguém gosta de perder; a gigante tecnológica, porque não lhe traz qualquer benefício (pelo contrário) assumir o papel de vencedora. As empresas de tecnologia hoje pagam por alguns dos conteúdos jornalísticos que mostram, mas pagam muito menos do que os produtores de jornalismo gostariam.

Uma das diferenças face ao que aconteceu na altura é que o sector dos media está mais atento. Aprendeu que chorar sobre leite derramado não é inútil, mas tem um efeito reduzido. E decidiu abrir mais cedo as negociações e as hostilidades, duas estratégias que andam a par. 

O processo do New York Times começa com um par de frases óbvias e verdadeiras. "O jornalismo independente é vital para a nossa democracia. Também é cada vez mais raro e valioso."

Dali, parte para argumentar que a OpenAI usou milhões de artigos do jornal sem permissão, incluindo artigos exclusivos para assinantes. Estes serviram para treinar os grandes modelos de linguagem em que assentam o ChatGPT e outros produtos que recorrem à mesma tecnologia. É o caso do assistente de inteligência artificial que a Microsoft foi rápida a acoplar a muitos dos seus produtos populares e também ao motor de busca Bing.

O jornal disse que tentou negociar um acordo com a OpenAI e a Microsoft, mas sem resultados. Contactada por jornalistas do próprio New York Times, a OpenAI disse que as conversas "avançavam de forma construtiva" e disse estar surpreendida com a acção legal. A Microsoft não comentou. Mas é relevante notar que a empresa decidiu assumir todas as responsabilidades legais por infracções de direitos de autor decorrentes do uso da tecnologia por parte dos seus clientes.

Os danos infligidos por estas empresas tecnológicas são múltiplos, argumentam os advogados do Times.

Por um lado, há o uso não autorizado de conteúdo para criar tecnologias que têm fins lucrativos. Neste aspecto, os media não estão sozinhos. Autores de todo o tipo de obras têm-se insurgido contra a infofagia indiscriminada dos grandes modelos de linguagem. Os autores de livros são um exemplo. É possível que, neste capítulo, a disputa se desembrulhe de formas distintas nos EUA e na Europa, uma vez que as respectivas leis são diferentes. 

Por outro, existe um possível dano reputacional. Usando a expressão que se tornou habitual, ChatGPT e demais chatbots têm "alucinações". Isto significa que é possível que inventem um pseudo-facto, atribuindo-o falsamente a um jornal. Quem já experimentou este tipo de ferramenta sabe que é frequente.

Por fim, estão a ser criados produtos que assentam no jornalismo produzido nas redacções e que fornecem informação aos utilizadores num formato que mina o próprio negócio dos produtores. Este é o ponto mais relevante e aquele em que há mais paralelos com a discussão de outros tempos sobre a agregação de notícias online.

O assistente do Bing é um bom exemplo. Ao apresentar notícias sumarizadas, mesmo que com links para os respectivos artigos, a ferramenta da Microsoft pode suprir as necessidades informativas de muitos utilizadores, que são assim dissuadidos de visitar os sites noticiosos. Estes sumários podem incluir artigos cujo acesso é pago.

Argumentarão alguns que não é uma prática diferente da de mostrar notícias numa página normal de um motor de busca, como acontece há anos. Mas existem, pelo menos, duas distinções cruciais.

Em primeiro lugar, até aqui, os jornalistas escreviam o texto que é mostrado nos motores de busca, tendo nesse aspecto um controlo absoluto (e fazer títulos rigorosos e interessantes, que levem o leitor a querer ler mais, é uma técnica jornalística nobre, que há uns anos foi denegrida pelo clickbait).

Em segundo, os chatbots dão respostas a questões específicas, pelo que é fácil a qualquer pessoa obter tudo o que quer saber com duas ou três perguntas, sem qualquer necessidade de fazer o clique do qual depende todo o negócio dos jornais. 

É certo que tudo isto está muito no início. Mas é concebível um cenário em que chatbots ou ferramentas derivadas transformem a forma como consumimos informação. Os motores de busca, um esteio da Internet há um quarto de século, poderão vir a ser substituídos por assistentes inteligentes. Podemos estar no início de uma forma mais conveniente e eficaz de obter informação que, em muitos aspectos, vai beneficiar milhões de utilizadores.

Mas há, como é habitual nestas transformações, um risco. E não é para serviços como os de pesquisa tradicional online. Tal como aconteceu sempre desde a massificação da Internet, são as empresas de jornalismo que podem ver outra vez o tapete fugir-lhe debaixo dos pés.

Vale a pena terminar com outra citação do processo judicial, também tão óbvia como verdadeira: "Se o Times e outras organizações noticiosas não puderem produzir e proteger o seu jornalismo independente, haverá um vácuo que nenhum computador ou inteligência artificial pode preencher. Menos jornalismo será produzido, e o custo para a sociedade será enorme."