Google pede autorização para trabalhadores analisarem áudio dos utilizadores

A clarificação surge depois de se ter tornado público que gravar excertos de conversas para avaliação é uma prática comum entre empresas que desenvolvem estes sistemas, como a Apple, a Amazon, a Microsoft e o Facebook.

Foto
O Google diz que apenas ouve cerca de 0,2% dos excertos de áudio que grava de conversas entre os utilizadores e o Assistant Kim Kyung Hoon

O Google vai passar a pedir autorização aos seus utilizadores para pôr humanos a ouvir excertos de áudio dos muitos pedidos feitos ao Google Assistant, o assistente virtual da empresa. Partilhar os pequenos diálogos que se tem com o assistente sempre foi uma opção disponível nas definições da conta de cada utilizador (a funcionalidade nunca esteve activa por defeito), mas agora a empresa norte-americana quer clarificar que o processo de revisão é feito por profissionais de carne e osso, e não por algoritmos.

A explicação surge depois de se ter tornado público que gravar excertos de conversas com assistentes digitais para avaliação é uma prática comum entre empresas que desenvolvem estes sistemas, como a Apple, a Amazon, a Microsoft, e o Facebook. Por norma, a tarefa é desempenhada por trabalhadores externos, que são contratados para controlo de qualidade. O objectivo é melhorar serviços que funcionam através da voz, como a pesquisa e serviços de tradução (no Google, pode-se ver o que a empresa guarda de cada utilizador através da página A minha Actividade, que inclui transcrições das gravações, bem como a data e hora em que foram obtidas). Embora a Amazon e o Google sempre tenham permitido aos utilizadores desligar a função, nem sempre se percebia o que estavam a recusar.

“Recentemente, temos ouvido preocupações sobre o processo em que recorremos a linguistas profissionais para ouvir e transcrever dados de áudio do Google Assistente para melhorar a linguagem em diferentes línguas”, justifica Nino Tasca, da equipa do Google Assistant, num comunicado desta segunda-feira a explicar a mudança. “É evidente que ficamos aquém das nossas expectativas em esclarecer os utilizadores sobre a forma como os seus dados são utilizados.”

Agora, todos os utilizadores que já tinham autorizado a gravação do seu áudio terão de voltar a fazê-lo. Além disso, vai passar a ser possível adaptar a forma como os assistentes digitais são activados, para evitar gravações de conversas privadas por engano. Há vários casos conhecidos na área.

Em Maio de 2018, por exemplo, um casal norte-americano começou a alertar as pessoas para desligarem colunas de som equipadas com assistentes virtuais depois de o aparelho da Amazon – a coluna inteligente Echo –, ter gravado uma discussão privada entre os dois, que enviou a um contacto. Na altura, a Amazon disse que se tratou de uma sequência de confusões por parte da Alexa. “O Echo ‘acordou’ com uma palavra na conversa de fundo [entre o casal] que soava a ‘Alexa’”, justificou a empresa.

 A Apple e o Google também foram atingidos por controvérsias semelhantes. Em Julho, o canal de televisão belga VRT NWS revelou ter na sua posse gravações acidentais do assistente digital do Google que incluíam dados pessoais dos utilizadores – desde a morada, a discussões conjugais ou chamadas de negócios. Já em Agosto um antigo trabalhador da Apple, encarregue de fazer a revisão do material de áudio da Siri, admitiu ouvir regularmente informação confidencial como negócios sobre tráfico de drogas e gravações de casais a fazer sexo – com isto, a empresa decidiu suspender temporariamente a prática de ter pessoas a avaliar excertos de voz captados pela assistente virtual Siri.

No comunicado partilhado esta semana, a equipa do Google reforça que a grande vantagem em partilhar actividade de áudio e de voz com a empresa é melhorar as capacidades da assistente em reconhecer diferentes sotaques e idiomas, e diz que apenas ouve cerca de 0,2% de todos os excertos de conversas. “Os nossos linguistas ouvem apenas um pequeno número de pedidos e perguntas feitas”, frisa Nino Tasca. “E há várias precauções para proteger os dados durante o processo de revisão humana – por exemplo, os excertos de áudio nunca são associados a nenhuma conta de utilizador.”