Um grupo de investigadores portugueses criou uma plataforma online para recolher gravações anónimas de pessoas a tossir e a falar para estudar a covid-19.

O projecto resulta de uma colaboração entre o Instituto Superior Técnico (IST) e o Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento (Inesc-ID) para pôr máquinas a detectar os primeiros sinais do vírus SARS-CoV-2 através do som. Com dados suficientes, os algoritmos devem ser capazes de detectar mudanças nas vibrações das cordas vocais que são imperceptíveis ao ouvido humano e assim identificar casos de infectados assintomáticos.

Desde que foi apresentado, no passado dia 12 de Fevereiro, já foram recolhidas mais de duas centenas de vozes. Para participar, basta partilhar pequenos excertos da voz — a ler um texto, a tossir, a suster as vogais (dizer “ahhhh") — na plataforma e indicar o género, a língua materna, data e resultado do teste de covid-19 (caso tenha feito algum) e a existência de problemas crónicos na voz. As restantes perguntas são opcionais.

“Queremos criar um mecanismo para ajudar a detectar pistas da covid-19 através de sinais acústicos”, resume ao PÚBLICO Isabel Trancoso, responsável pelo projecto e docente do Departamento de Engenharia Electrotécnica e de Computadores (DEEC). “Pedimos às pessoas para tossir, mas não estamos só a ouvir a tosse”, clarifica a investigadora. “Também estamos a analisar indicadores de descontinuidade no fluxo de ar que vem dos pulmões, problemas na laringe, entre outros.”

Há iniciativas semelhantes um pouco por todo o mundo. A Universidade de Augsburgo (Alemanha), o Imperial College de Londres (Reino Unido) e o Instituto de Tecnologia do Massachusetts (Estados Unidos) também estão a recolher excertos de voz para aprender mais sobre o vírus que causa a covid-19.

Isabel Trancoso admite que pensou em criar uma versão em português já no começo da pandemia. “Fui demasiado optimista”, reconhece. “Achei que quando tivesse algo concreto, já não iria a tempo. Decidi avançar quando começaram a surgir as notícias das novas variantes.”

Uma das maiores dificuldades é a obtenção de dados, particularmente de pessoas infectadas com covid-19. Cinco dias depois do lançamento, menos de um quarto das gravações eram de pessoas diagnosticadas com a doença.

“Só vamos perceber como distinguir problemas respiratórios da covid-19 se tivermos dados suficientes de pessoas infectadas e de pessoas que sofrem de outras patologias”, alerta Isabel Trancoso. Uma parceria com o Centro de Electroencefalografia e Neurofisiologia Clínica (CENC) permite à equipa ter acesso a vozes de doentes com apneia do sono.

Se as bases de dados não forem variadas o suficiente, os algoritmos podem ser induzidos em erro. Se só existirem dados de homens infectados com covid-19, o sistema pode passar a identificar todos os homens como potenciais doentes.

É algo que já aconteceu num estudo recente de uma aluna do IST sobre o diagnóstico de apneia do sono. “Os primeiros resultados que obtivemos antes de equilibrarmos o número de participantes, indicavam que o sistema estava polarizado, com tendência a classificar homens como doentes de apneia”, lembra Trancoso.

​“Um dos nossos medos com este projecto sobre a covid-19 era que a nossa base de dados tivesse desequilíbrios ao nível das faixas etárias. Pensávamos que gerações mais velhas não teriam tanta disponibilidade em usar a plataforma”, nota a investigadora. “Tenho sido razoavelmente surpreendida porque temos muitas pessoas com mais de 50 anos a participar.”

“É fundamental termos bases de dados variadas”, reforça a investigadora que espera que o projecto se prolongue além da pandemia. No futuro, Trancoso vê as análises à voz vão a serem tão importantes como análises ao sangue. “As análises à voz vão ser cada vez mais importantes como forma de diagnóstico cada vez mais importantes como forma de diagnóstico”, nota. “Até é bom guardarmos dados da nossa própria voz para percebermos mudanças que ocorrem se ficarmos doentes.”