A profissão mais sexy do século XXI

De entre as novas profissões criadas merece destaque aquela que se poderá designar em português por engenheiro, cientista ou analista de dados.

A capacidade para automatizar determinadas tarefas, que começou com a primeira revolução industrial e se reforçou com os inúmeros desenvolvimentos tecnológicos posteriores, trouxe consigo uma questão que continua por responder: a automação cria ou não desemprego, ao tornar desnecessárias certas profissões? Aqueles que acreditam que a tecnologia não criará desemprego argumentam com o facto de que novas profissões estão permanentemente a ser criadas pelas alterações tecnológicas, muitas das quais não existiam há apenas poucas dezenas de anos, tais como gestor de redes sociais, engenheiro de aplicações móveis e web designer.

De entre as novas profissões criadas pelas tecnologias da quarta revolução industrial merece, porém, destaque aquela que se poderá designar em português por engenheiro, cientista ou analista de dados (traduções sempre desconfortáveis dos originais em inglês: data engineer, data scientist e data analist), descrita pela Harvard Business Review em 2012 como “a mais sexy do século XXI”.

Mas o que é um engenheiro de dados e, exactamente, o que faz? É uma pergunta de difícil resposta, porque esta área é, por inerência, multidisciplinar e multifacetada. Genericamente, um engenheiro, ou analista, de dados tem como função principal extrair valor dos dados disponíveis numa empresa, instituição ou serviço. Para tal, deve ter a capacidade de compreender as questões que têm de ser respondidas, processar e estruturar os dados por forma a poderem ser analisados, e, por fim, executar as análises estatísticas e tirar as inferências necessárias para extrair conhecimento dos dados.

Um dos casos mais paradigmáticos desta abordagem teve lugar em 2002, numa loja da empresa de distribuição Target, em Minneapolis, EUA. A empresa guardava registos das aquisições dos clientes e foi pedido a um analista, graduado em Estatística e em Economia, que tentasse identificar, com base no historial de compras, se uma cliente estava ou não grávida. A análise dos dados demonstrou que existiam padrões de compras que permitiam efectivamente prever, com grande precisão, se uma cliente estava grávida. Por exemplo, a aquisição de loções hidratantes acentuava-se marcadamente no segundo trimestre de gravidez, assim como a aquisição de suplementos de cálcio, magnésio e zinco.

Este caso tornou-se conhecido, porque, com base nesta análise, a loja começou a enviar coupons de produtos para bebés às clientes identificadas como estando grávidas, aumentando as vendas, mas causando também alguns efeitos colaterais. O episódio mais divulgado teve lugar quando um pai irado apareceu na loja, perguntando a razão por que tinham enviado à sua filha adolescente cupões para berços e roupas de bebés. O gerente desculpou-se profusamente e até ligou uns dias mais tarde para reforçar o pedido de desculpas, mas foi atendido por um pai consternado que se desculpou pelo comportamento anterior e lhe disse que a filha estava efectivamente grávida e iria ter um bebé no mês de Agosto seguinte. Este episódio, e outros semelhantes, levaram a que a loja passasse a disfarçar o envio de coupons para mulheres grávidas, juntando-os a outros coupons mais genéricos, mantendo assim o efeito positivo nas vendas, mas reduzindo as complicações.

Se ignorarmos as questões éticas subjacentes, este caso particular ilustra a abordagem geral que um engenheiro de dados deve ter para extrair valor da informação existente. Com base no historial e no conhecimento do negócio, os dados são transformados e analisados, por forma a revelar padrões de comportamento que são úteis para a definição de políticas de actuação. Esta abordagem pode ser usada em praticamente todos os domínios da economia e da sociedade e penso ser útil sugerir, a título meramente exemplificativo, algumas áreas de aplicação que são de interesse nacional, nas áreas do território, mobilidade, saúde e recursos naturais.

Uma análise estatística das ocorrências de incêndios em Portugal poderá permitir determinar quais os factores que aumentam o risco de incidente e/ou de propagação descontrolada do mesmo. Será o factor mais importante o tipo de árvores plantadas (nomeadamente os eucaliptos), a topografia do terreno, a inexistência de quebra-fogos, a demora na resposta dos bombeiros ou a hora da deflagração? A análise dos dados acumulados que, tanto quanto sei, nunca foi feita, poderá dar importantes informações sobre as políticas a seguir no futuro.

A análise dos dados de ocupação e mobilidade de uma grande cidade, como Lisboa, poderá permitir determinar quais as acções a tomar para reduzir a congestão e a poluição, através do controlo dos semáforos, horários dos transportes públicos e restrições ao tráfego. Este é, aliás, um dos objectivos do Portal de Dados Abertos de Lisboa, que disponibiliza aos potenciais interessados um manancial cada vez maior de informação sobre a cidade, que poderá ser transformada, por engenheiros de dados, em políticas de actuação com valor económico e social.

A análise integrada da informação disponível em bases de dados da área da saúde poderá ajudar a tornar mais eficaz o sistema, reduzindo os custos e melhorando a qualidade do serviço. Para tal será necessário integrar muitas bases de dados diferentes, e também criar algumas novas, mas o valor acrescentado deste tipo de informação é, potencialmente, enorme, como já foi demonstrado por numerosos países e estados, entre os quais o estado de Nova Iorque, como já aqui referi numa anterior crónica.

A aplicação de técnicas preditivas aos dados históricos da pesca de espécies com valor económico poderá permitir detectar padrões relevantes que permitam optimizar a captura e assegurar a sustentabilidade das reservas piscícolas, um recurso essencial para o futuro do país.

Este conjunto, necessariamente limitado, de exemplos permite perceber a razão pela qual um engenheiro (ou analista) de dados é, idealmente, uma pessoa com uma formação muito variada. Para além da uma sólida formação em estatística, em inteligência artificial aplicada à análise de dados (especialmente aprendizagem automática e inferência) e em computação, um analista de dados precisa de conhecimentos do domínio que lhe permitam dirigir a análise. Para os exemplos que dei atrás serão particularmente valiosos analistas de dados com formação de base em Agronomia ou Engenharia Florestal, Engenharia de Transportes, Gestão de Sistemas Hospitalares e Ciências do Mar. Mas, naturalmente, estas áreas são apenas exemplos de aplicação, a lista é quase infindável.

Face às necessidades do mercado e tal como já acontece com muitas outras escolas e universidades, o Instituto Superior Técnico identificou a necessidade de passar a oferecer formação específica nesta área. Assim, a partir de 2019, irão ser oferecidas formações em Engenharia e Ciência de Dados, ao nível executivo e de formação profissional avançada, incluídas na iniciativa Técnico+, que integrará toda a formação de curta duração do IST. Existe também o plano para oferecer um curso de mestrado nesta área, mas tal só acontecerá quando o IST conseguir convencer a Agência de Avaliação e Acreditação do Ensino Superior (A3ES) de que uma formação flexível nesta área, acessível a partir de diversas formações básicas e sem pré-requisitos demasiado específicos, é relevante e do interesse do país.

Sugerir correcção
Ler 38 comentários