Os computadores são bons com números e por isso estão a escrever

Há empresas a desenvolver algoritmos para escrever notícias. Mas decidiram expandir o negócio para outra áreas.

Adriano Miranda

Os computadores conseguem processar rapidamente enormes quantidades de dados. Mas têm muito mais dificuldades em perceber e usar linguagem natural, como aquela a que os humanos recorrem diariamente. No entanto, há empresas cujo negócio é desenvolver algoritmos capazes de escrever texto que seja coerente e possa ser compreendido por pessoas.

Este tipo de tecnologia levou a que, nos anos recentes, a pergunta se tenha repetido numa miríade de artigos de jornais, revistas, sites e blogues: podem os computadores substituir os jornalistas? Afinal, empresas como a Narrative Science e a Automated Insights, ambas dos EUA, estão há anos a desenvolver algoritmos capazes de escrever notícias. 

Tanto uma como outra começaram por pôr os computadores a escrever notícias precisamente sobre números. Eram textos curtos sobre resultados desportivos, normalmente de competições (amadoras ou de jovens) a que os jornalistas não dão atenção. Com acesso a elementos como o resultado, o nome e as acções de cada jogador, bem como as faltas e outras ocorrências importantes (que normalmente ficam registadas numa base de dados) o algoritmo é capaz de criar um texto coerente. Não fará comentários sobre o entusiasmo (ou falta dele) nas bancadas, nem sobre um aparte do treinador. Mas as notícias são capazes de oferecer um resumo decente da partida.

O historiador de tecnologia e cultura Edward Tenner, que já escreveu ensaios sobre o assunto, argumenta que os jornalistas não devem estar preocupados com esta tecnologia. “A não ser que haja um salto radical no desenvolvimento de algoritmos para resolver as questões muito difíceis da inteligência artificial, vamos continuar indefinidamente a precisar de humanos competentes para a maior parte do trabalho mental e físico”, explica ao PÚBLICO. “Ainda precisamos de médicos que vejam a pessoa como um todo e de advogados psicologicamente sensíveis aos clientes e juízes, não apenas de máquinas capazes de raciocínio legal”. Da mesma forma, diz, “o Tradutor Google não é receado por tradutores profissionais competentes, ainda que possa ser melhor do que alguns tradutores medíocres”.

A Automated Insights começou por lançar uma rede de sites chamada StatSheet (literalmente, folha de estatísticas). Hoje, esta rede publica cerca de meio milhão de artigos por ano sobre desporto profissional e ligas estudantis. Também vende serviços de geração de textos a empresas de media como a CBS, o Yahoo, o USA Today e a Bloomberg. “Mas a tecnologia é flexível para se adaptar a qualquer segmento assente em dados estruturados, o que nos permite trabalhar numa variedade de mercados: análise de negócio, finanças, imobiliário”, explica Adam Smith, um dos vice-presidentes. Isto significa que também têm com clientes empresas que precisam de escrever análises financeiras ou relatórios de vendas apenas para consumo interno.

Dados estruturados é o jargão para o tipo de informação organizada – por exemplo, numa tabela ou base de dados. Pode ser seja uma ficha de jogo ou uma folha de Excell com informação sobre venda de casas numa cidade. Mas Smith garante que a tecnologia já consegue trabalhar com dados não estruturados “desde que sejam consistentes” (por exemplo, que estejam em documentos PDF cujo texto obedeça a um padrão pré-definido).

A tecnologia destas empresas não é feita apenas por cientistas e programadores. O fundador e director executivo, Robbie Allen, é engenheiro de formação, mas já escreveu 12 livros. É também ele que co-dirige o departamento de tecnologia e desenvolvimento, a par de Joe Procopio, um híbrido de engenheiro e colunista de tecnologia, cujos artigos são publicados em vários órgãos de comunicação. “É uma mistura de desenvolvimento de software e de experiência de escrita”, nota Smith. A equipa que dirigem inclui analistas, especialistas em estatística e escritores.

Numa entrevista à revista Wired, o director executivo da Narrative Science (a empresa não respondeu a um pedido de entrevista do PÚBLICO) disse acreditar que no futuro 90% das notícias serão escritas por programas de computador. Mas não porque os jornalistas serão substituídos por máquinas. Antes porque a tecnologia de escrita de notícias por algoritmos vai permitir, de forma barata, cobrir eventos e temas de nicho a que nenhum jornalista presta atenção.

Edward Tenner diz haver até vantagens neste tipo de tecnologia e dá o exemplo de como  os xadrezistas usam computadores para treinar e melhorar a respectiva técnica. Estes algoritmos-escritores, defende, podem lembrar os jornalistas de que não há grande valor acrescentado em textos que sigam as fórmulas tradicionais de escrita e levá-los a tentar "atrair a atenção dos leitores com a qualidade e a originalidade da pesquisa e da escrita".

Comentários

Os comentários a este artigo estão fechados. Saiba porquê.

Nos Blogues