Todos os dias, plataformas como o Facebook, o YouTube e o Instagram removem centenas de publicações com informação falsa, fraudulenta e potencialmente perigosa sobre a covid-19, como teorias de que beber lixívia cura a doença ou que o distanciamento social é inútil. Só que os autores da desinformação descobriram uma forma de manter as peças online: os arquivos da Internet, criados com o propósito de preservar páginas web para consulta futura.

A estratégia foi detectada pelos membros do Projecto de Tecnologia e Alterações Sociais da Universidade de Harvard, nos EUA, que tem como objectivo “combater campanhas de desinformação e manipulação nos media”. A equipa define estas notícias falsas como "conteúdo zombie” porque continua a ser partilhado mesmo quando a página original deixa de estar activa.

Um dos exemplos encontrados pelo grupo é uma peça de um site chamado News NT, criado no começo de Março, que alega que 21 milhões de pessoas já morreram por covid-19 na China (o número oficial é 4637). Embora o artigo original, que já foi desmentido, não seja muito popular, a versão guardada na Wayback Machine – uma plataforma que permite consultar versões antigas de sites de todo o mundo – foi partilhada milhares de vezes nas redes sociais e circulou durante dias no Facebook sem qualquer aviso de “informação dúbia” pela equipa de verificação de factos.

“Se não fosse pelos registos do arquivo não poderíamos realizar investigação sobre conteúdo apagado, mas estes casos [de notícias falsas] sugerem que o arquivo da Internet terá de pensar a forma como o serviço lida com a desinformação”, argumenta a coordenadora do projecto de Harvard, Joan Donovan, numa peça publicada na Technology Review, uma revista do MIT, a reputada universidade dos EUA em Massachusetts. “Encontrámos uma explosão preocupante de ‘conteúdo zombie'”, acrescenta.

A equipa não consegue, no entanto, precisar o número de notícias falsas a circular através de hiperligações da Wayback Machine. “Uma coisa com que os investigadores continuam a lutar é o facto de as plataformas não fornecerem dados sobre as páginas que removem”, justifica Joan Donovan em resposta a questões do PÚBLICO. “Como tal, seguir este trilho de desinformação em grande escala é impossível.”

Outra página de informação falsa arquivada muito popular é um texto originalmente publicado na plataforma Medium, que defende que a Organização Mundial da Saúde está a mentir sobre a covid-19. Até ao final de Abril, a versão arquivada foi partilhada 310 mil vezes nas redes sociais, mas o texto original, que foi apagado por desrespeitar as regras da plataforma, só tinha sido partilhado 1200 vezes.

O director da Wayback Machine, Mark Graham, diz ao PÚBLICO que a equipa está consciente da situação e a trabalhar em soluções. Por detrás do problema, está a funcionalidade que permite guardar páginas automaticamente naquele arquivo. Isto permite que grupos que promovem desinformação nas redes sociais tenham uma forma alternativa de partilhar informação falsa, mesmo que o conteúdo original seja apagado. Guardar a homepage desta quarta-feira no Público, por exemplo, demorou menos de um minuto (e está disponível aqui).

Com isto, Mark Graham explica que uma das estratégias é a inclusão de uma faixa colorida, disponível a partir desta terça-feira, que clarifica quando as páginas originais foram apagadas por violar as regras das plataformas.

Outra questão a ponderar é que muitas das páginas recentemente arquivadas sobre a covid-19 fazem parte de uma colecção de conteúdo digital com o objectivo de preservar a forma como a informação disponível sobre a covid-19 evoluiu na Internet. Para Mark Graham, a informação falsa faz parte da história. “Preservar a realidade de qualquer tempo é vital para dar a investigadores, historiadores, jornalistas e pessoas que queiram perceber a verdade, a oportunidade de o fazer. Especialmente se essa verdade estiver cheia de desinformação e má informação”, justifica o director da Wayback Machine.

Arquivo.pt escapa a notícias falsas

Ainda não há notícias falsas sobre a covid-19 no Arquivo.pt. Contrariamente à Wayback Machine, o serviço português que permite consultar páginas de sites portugueses publicadas desde 1996, só vai disponibilizar páginas sobre a covid-19 em 2021. Também farão parte de uma colecção especial dedicada à história do novo coronavírus, contada através das páginas da Internet.

“Só depois de um ano é que os conteúdos que recolhemos, independentemente do tema, são colocados no nosso site”, explica ao PÚBLICO João Gomes, que coordena o Arquivo.pt, desenvolvido pela Fundação para a Computação Científica Nacional (FCCN), uma unidade da Fundação para a Ciência e a Tecnologia. “Este período de embargo é muito importante para nós. Não só para garantir que o conteúdo no arquivo não está a competir com páginas que estão actualmente online, mas também para filtrar algum conteúdo ilegal.”

Foto João Gomes, coordenador do Arquivo.pt. São necessários 77 servidores para guardar toda a informação do site Nuno Ferreira Santos

O objectivo é que as autoridades tenham tempo de alertar a equipa do Arquivo.pt sobre conteúdo danoso que tenha sido publicado no último ano. “Nós não filtramos conteúdo porque não se sabe o que será relevante no futuro, mas há informação que levanta problemas. Se os nossos programas recolherem dicas detalhadas sobre como fazer bombas ou mandar um avião abaixo, disponibilizar essa informação num arquivo pode colocar em risco a segurança pública”, continua João Gomes.

Com isto, todos anos a equipa recebe entre um ou dois pedidos para remoção de conteúdo que são avaliados por um jurista.

O coordenador do Arquivo.pt ressalva que a questão nas notícias falsas “é complexa”. “Se queremos analisar o passado daqui a 50 anos é importante ver o que foi publicado – de falso e de verdadeiro, porque isso influenciou a opinião das pessoas numa dada época”, reflecte João Gomes. “Há páginas que mostram a forma como a informação disponível mudou, e é por isso que preservamos as versões de notícias online onde estava informação errada, e as versões das páginas com o desmentido”.

É frequente os jornalistas utilizarem a informação de vários arquivos online para encontrar informação propositadamente apagada da Internet por figuras públicas. Em Abril, por exemplo, a Wayback Machine foi usada por jornalistas da CNN para encontrar tweets apagados por Michael Caputo, que foi recentemente nomeado Secretário de Estado Adjunto para Assuntos Público nos EUA. Num dos tweets arquivados, Caputo respondia a uma teoria, sem bases factuais, de que os EUA levaram o vírus da SARS-CoV-2 com “milhares de chinesas sugam o sangue de fora de morcegos raivosos”.

A própria Wayback Machine guarda colecções de notícias falsas disponíveis na Internet.

Em Portugal, João Gomes diz que o Arquivo.pt também já ajudou na investigação de alguns crimes. “É claro que também há um direito ao esquecimento. É compreensível que alguém se arrependa de uma fotografia ou publicação que fez enquanto era jovem”, admite. “Nós respeitamos a legislação, desde o Regulamento Geral para a Protecção de Dados ao direito ao esquecimento, mas o nosso propósito é defender o direito a recordar e garantir que informação que é apagada não é informação perdida.”