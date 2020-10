De forma a recolher e analisar todos os gastos da administração pública com a pandemia, o PÚBLICO partiu de uma base de dados disponibilizada pelo Instituto dos Mercados Públicos, do Imobiliário e da Construção (IMPIC) no portal de dados abertos do estado português dados.gov.pt. Nessa base de dados, actualizada semanalmente, este organismo tem vindo a publicar todos os contratos celebrados ao abrigo do Decreto-Lei n.º 10-A/2020 que prevê a aquisição de material ou serviços para a “prevenção, contenção, mitigação e tratamento de infecção epidemiológica por covid-19”, bem como para a “reposição da normalidade em sequência da mesma”.

No entanto, e como foi possível verificar logo no início da pandemia, muitos organismos públicos realizaram contratos públicos para adquirir materiais ou serviços directamente relacionados com a pandemia que não constavam desta base de dados. Por isso, a equipa do PÚBLICO desenvolveu um “scraper” – um “robot” em código que recolhe informações – que, diariamente, pesquisava no portal BASE por um conjunto de 98 palavras-chave – como “EPI”, “FFP2”, “ventilador”, “zaragatoa” ou “covid” – para recolher todos os contratos publicados naquele dia com uma dessas palavras. Optou-se por fazer essa pesquisa desde o início de Fevereiro – altura em que, apesar de o novo coronavírus ainda não ter sido identificado em Portugal (tal só aconteceu a 2 de Março), alguns organismos públicos poderiam já estar a realizar compras de material para colmatar os efeitos da sua possível chegada. Esta lista de 98 palavras foi gerada a partir de uma análise textual à base de dados publicada do portal dados.gov em que se identificaram as palavras mais relevantes, às quais o PÚBLICO acrescentou outras que, acreditava, poderiam ser um forte indício de que aquele contrato estaria relacionado com o combate ao coronavírus SARS-CoV-2. Como muitas vezes as descrições dos contratos publicadas no Portal BASE não possuem acentos, o PÚBLICO procurou prever, nesta lista de termos a pesquisar, falta de acentos, plurais ou outras variações da mesma palavra.

Além de eliminar as duplicações de contratos que pudessem decorrer desta recolha baseada em palavras-chave – dois termos diferentes poderiam recolher o mesmo contrato duas vezes – o PÚBLICO eliminou também os contratos que surgiam na recolha feita por este scraper que já constavam na base de dados disponibilizada pelo IMPIC no dados.gov.pt.

No entanto, os contratos recolhidos por este scraper foram também analisados um a um, de forma a evitar que a recolha automatizada tivesse recolhido contratos em que não havia qualquer ligação directa ao coronavírus. Procurou-se apenas manter apenas os contratos em que se percebia uma ligação directa à pandemia. No entanto, este critério pode ser algo complexo uma vez que alguns dos material ou serviços utilizados no combate à pandemia já eram adquiridos, em situações normais. É o caso, por exemplo, da prestação de serviços de limpeza ou da compra de algum material médico/hospitalar, que o PÚBLICO considerou como gasto associado à luta contra a pandemia mas que, em situações normais, muitas instituições públicas já compravam.

Classificação dos contratos

Além da recolha dos contratos, o PÚBLICO procedeu também a uma classificação dos contratos numa tentativa de perceber para que tipo de produtos/serviços foram canalizados os dinheiros públicos. Em diálogo com um consórcio internacional de jornalistas do Organized Crime and Corruption Reporting Project (OCCRP) e outros 37 órgãos de comunicação social europeus, que analisaram os contratos públicos feitos no combate à covid-19 para toda a Europa, estabeleceram-se dez grandes categorias de produtos/serviços: “Equipamentos de Proteção Individual” (máscaras, viseiras, fatos, toucas, luvas), “Testes” (kits de teste, reagentes, zaragatoas), “Material Médico e de saúde” (camas, seringas, oxigénio), “ventiladores”, “acessórios de ventilador”, “obras e reparações”, “produtos de desinfecção e limpeza”, “equipamentos médicos” (como monitores ou termómetros), “medicamentos” e “outros contratos”. Como, no entanto, a equipa do PÚBLICO entendia que estas categorias eram demasiado latas e que, dentro delas, era possível agregar em unidades mais pequenas estes contratos, foi criada uma segunda catalogação, chegando-se a cerca de 100 subcategorias que vão desde “Máscaras FFP” a “Materiais e serviços informáticos”.

Esta catalogação dos contratos foi feita, numa primeira fase, de forma manual, tendo a equipa do PÚBLICO catalogado os primeiros 5 mil contratos procedendo a uma leitura da informação disponibilizada quer no Portal BASE quer no dados.gov.pt. Depois dos primeiros 5 mil contratos catalogados, o PÚBLICO recorreu a machine learning para classificar os restantes contratos. Na prática, o algoritmo recorreu às palavras nas descrições dos contratos, da empresa contratada e da instituição pública que contratou, do CPV (Vocabulário Comum para os Contratos Públicos) e do preço para tentar fazer uma classificação automática destes contratos. Como a taxa de sucesso dessa classificação não era suficientemente alta para ser 100% confiável, a equipa do PÚBLICO procedeu a uma verificação manual dessas classificações automáticas. Sempre que os jornalistas do PÚBLICO tinham alguma dúvida em relação a determinado contrato ou qual a natureza de determinado produto, procedeu-se a várias pesquisas e conversou-se com alguns profissionais da área.

No entanto, dada a quantidade de dados e a falta de informação disponibilizada em muitos contratos, o PÚBLICO admite que alguns contratos possam estar numa categoria incorrecta.

Para além do valor adjudicado, o PÚBLICO calculou também, sempre que possível, o preço por unidade de alguns produtos. Esse cálculo foi feito recorrendo às descrições dos produtos ou ao documento do contrato publicado no Portal BASE quando era indicada a quantidade adquirida. Dividiu-se assim o total adjudicado pelo número de produtos indicado de forma a tentar perceber quanto é que custou uma unidade daquele produto. Admite-se, no entanto, que alguns destes preços unidade possam não estar correctos uma vez que muitas vezes a descrição não é muito clara quanto à quantidade comprada e muitos dos contratos não tinham disponível o contrato em formato .pdf ou o caderno de encargos. Como nos explicou o IMPIC, nos contratos divulgados não é obrigatório que conste a quantidade adquirida, respeitando-se apenas “um modelo no qual consta a descrição sucinta do objecto do contrato”. Além disso, “nas prestações de serviços não existe, na maioria dos casos, quantidades”.