Arquivo da Web portuguesa cria prémio para atrair investigadores

Até dia 4 de Maio, as 3360 milhões de páginas arquivadas podem ser usadas para projectos de investigação. O melhor recebe dez mil euros.

Foto
Nos últimos dez anos o investimento anual no Arquivo roundou os 285 mil euros Reuters/SERGIO PEREZ

Algumas das memórias deixadas pelas páginas da Internet de Portugal nos últimos 22 anos cabem em quatro armários com menos de dois metros de altura. Escondem perto de 80 servidores e ficam na Avenida Brasil, no edifício da Fundação para a Ciência e Tecnologia, em Lisboa. Contêm 3360 milhões de páginas Web (essencialmente, em português), criadas desde 1996 e que podem ser reencontradas no site Arquivo.pt.

A verdade faz-nos mais fortes

Das guerras aos desastres ambientais, da economia às ameaças epidémicas, quando os dias são de incerteza, o jornalismo do Público torna-se o porto de abrigo para os portugueses que querem pensar melhor. Juntos vemos melhor. Dê força à informação responsável que o ajuda entender o mundo, a pensar e decidir.

Algumas das memórias deixadas pelas páginas da Internet de Portugal nos últimos 22 anos cabem em quatro armários com menos de dois metros de altura. Escondem perto de 80 servidores e ficam na Avenida Brasil, no edifício da Fundação para a Ciência e Tecnologia, em Lisboa. Contêm 3360 milhões de páginas Web (essencialmente, em português), criadas desde 1996 e que podem ser reencontradas no site Arquivo.pt.

Até dia 4 de Maio, aquelas páginas podem ser utilizadas para criar um projecto de investigação sobre qualquer tema. O melhor recebe 10 mil euros, com o segundo e o terceiro classificados a receberem 3000 euros e 2000 euros respectivamente.  O objectivo é mostrar como preservar a Internet, permite reunir informação importante para outras áreas do conhecimento.

“Somos uma espécie de Google do passado,” diz ao PÚBLICO Daniel Gomes, o actual responsável pelo Arquivo. “Não o parece, mas a Internet é extremamente efémera. Há dados mostram que cerca de 80% das páginas criadas desaparecem ou são alteradas no período de um ano.” Há mais de dez anos que o investigador da Fundação para a Computação Científica Nacional trabalha na preservação do digital. Quem quiser, pode, no entanto, pedir ao Arquivo para não guardar as suas páginas.

O objectivo do Arquivo.pt é remediar a situação ao armazenar pedaços do passado digital. O problema, porém, é que ainda há muitas pessoas que não conhecem o projecto. "Este ano, com o novo concurso o objectivo é mostrar que o nosso site pode ser utilizado como uma enorme fonte de informação histórica”, diz Gomes. “Nas gerações futuras, ninguém se vai lembrar de páginas que não existem, ou que eram diferentes.”

Poucos se recordarão, por exemplo, da Cidade da Malta, uma espécie de “rede social” para crianças portuguesas criada final dos anos 1990 com o apoio da União Europeia. Lá, as crianças e jovens com acesso a computador já falavam em chats, coleccionavam patins (como likes), tiravam cursos virtuais e decoravam casas virtuais que funcionavam como páginas de perfil. Apesar de extinta, a rede pode ser recordada através do Arquivo. Já o Comezainas descrevia-se como “a primeira homepage feita de apetite virtual”. Havia também o Projecto Vertical: uma biblioteca online de obras clássicas portuguesas com cursos de literatura no valor de 2500 escudos, que podiam também ser adquiridos em versão CD-ROM. 

Foto
O Comezainas é um dos sites preservados pelo Arquivo

“Há alguma confusão quando se diz que o que ‘vai para a Internet é para sempre’, porque causa danos alguém. A maioria das páginas na Internet desaparece num ano, mas num ano pode causar muitos danos a alguém”, esclarece Daniel Gomes. “É importante frisar que a informação pessoal não devia estar disponível publicamente na Internet.”

“Tentamos reunir todas as páginas com interesse futuro à comunidade portuguesa”, acrescenta o investigador. “É um conceito muito subjectivo e amplo de definir, sim, mas todas as páginas com a terminação em .pt são incluídas automaticamente.” Cerca de 89% das páginas arquivadas são com o domínio .pt. É isto que o distingue de arquivos internacionais de preservação digital, como o Internet Way Back Archive.

“Focamo-nos, por exemplo, em alturas de campanha política e a forma como são noticiadas e discutidas online”, esclarece Gomes. “E tudo o que temos antes de 2007 foi practicamente um trabalho de arqueologia. Tivemos de entrar em contacto com pessoas que tinham informação em CDs, e trabalhos fora.” 

Os custos do arquivo

Nos últimos dez anos, o investimento anual no Arquivo foi de cerca 285 mil euros. A maioria é para a aquisição e manutenção dos meios tecnológicos, mas uma pequena fatia também vai para a divulgação. É um dos maiores desafios. Em Fevereiro deste ano, 18 mil pessoas visitaram o site (17 mil pela primeira vez), mas Gomes acredita que o número pode aumentar com mais conhecimento. Entre 2016 e 2017 o número de visitantes anuais duplicou (de perto de 50 mil visitantes para 100 mil).

Com o novo concurso, o objectivo é alertar os investigadores para a existência de um recurso que podem utilizar para detalhar o passado na Internet. Além disso, qualquer pessoa pode participar e enviar sugestões de páginas a preservar. “Se a informação está ‘cada vez mais’ online ou ‘toda online’, mas não temos o cuidado de preservar o que está online… O que estamos a guardar?” questiona Daniel Gomes. “É isso que merece reflexão.”