Hoje, 20 de Outubro, é o Dia Mundial da Estatística, efeméride celebrada a cada cinco anos e estabelecida na Assembleia Geral das Nações Unidas a 3 de Junho de 2010. O lema de 2020 é fundamental e atual: “Ligar o mundo com dados em que podemos confiar.” O mundo é uma aldeia global em que tudo acontece à velocidade da luz, e uma informação em Auckland tem impactos quase imediatos na bolsa de Nova Iorque. É, assim, fundamental que a informação seja de confiança, que a ciência veja reconhecida a sua importância e que o conhecimento científico seja respeitado e valorizado.

Paradoxalmente, assistimos provavelmente ao período da história em que há mais dados disponíveis e maior desinformação à volta destes.

Opiniões e ciência confundem-se. Infelizmente, uma das formas mais frequentemente usadas para tentar impor uma ideia sem fundamento é pelo meio de argumentos quantitativos porque a maior parte das pessoas tem alguma dificuldade em desconstruir números – por exemplo, 92% das pessoas que experimentaram uma dieta perderam em média 12 quilos em três meses, eu também a quero experimentar e estou disposto a pagar bom preço por ela. Infelizmente, 87% das estatísticas são inventadas e 97% são distorcidas. Espero que seja óbvio que estas foram inventadas, depois de escritas, até parecem credíveis!

Estou certo de que passa despercebido à maior parte das pessoas como, de facto, a estatística está na base de muitas das decisões que nos afetam a vida no dia a dia. Desde o GPS que prevê a hora a que vamos chegar a uma reunião até aos anúncios que nos são apresentados na Internet, tudo é controlado, de uma forma ou de outra, por análises estatísticas mais ou menos sofisticadas.

Quem nunca ouviu falar em termos como big data, inteligência artificial, machine learning, business inteligence ou medicina baseada na evidência? Estes termos, tão pomposos e potencialmente intimidantes que quase tornam mais inteligentes aqueles que os usam ou neles trabalham, não passam de diferentes roupagens para modelos estatísticos que utilizam dados para fazer previsões que são depois usadas para tomar decisões em face de incerteza. E é assim que, por exemplo, a nossa operadora de telecomunicações nos sugere outra(s) série(s) com base naquela que acabámos de ver e, curioso, até parece interessante!

Com base nas avaliações que vamos fazendo, “eles” descobrem aquilo de que gostamos. Aquelas cinco estrelinhas que vamos colocando nas avaliações dos programas a que assistimos vão permitir à operadora, com base em vários milhares de estrelinhas, dos muitos milhares de clientes, perceber os gostos de grupos de pessoas com perfis de visualização semelhantes que, no limite, poderão estar disponíveis para pagar um canal premium que terá mais séries direcionadas para as preferências. Aí sim, temos operadoras contentes, que usaram big data, que ajustaram um algoritmo de machine learning, e estão a fazer business inteligence, ou, diria eu, estatística.

A origem da palavra “estatística” vem da ciência que estuda o Estado, mais concretamente, os números que o Estado precisaria de compreender para ser mais eficiente. É essa vertente que dá origem à área das Estatísticas Oficiais, e que muitas vezes nos examinam a vida, frequentemente sem sequer sabermos bem como. Desemprego, inflação ou défice, que podem afundar ou salvar uma economia, não são mais do que previsões de modelos estatísticos. Quando se diz que o desemprego está em 12%, não se perguntou a cada um dos portugueses se estavam ou não desempregados. Foi recolhida uma amostra e com base nessa amostra foram feitas inferências sobre a população. O processo de amostragem é por isso fundamental, e se se facilitar este processo, as consequências são desconhecidas.

Se eu quero saber quantas pessoas já foram expostas ao SARS-COV-2, não posso usar uma amostra de conveniência. Usando como amostra um grupo de pessoas que foi fazer análises de livre e espontânea vontade, como no estudo recente do Instituto Nacional de Saúde Dr. Ricardo Jorge, e voluntários, como num estudo recente do Instituto de Medicina Molecular, não vamos conseguir, à partida, interpretar com robustez os resultados obtidos porque alguém que foi fazer análises o fez certamente por uma razão, e quem se dá ao trabalho de se oferecer como voluntário para um estudo terá também a sua justificação. Em nenhum dos casos os grupos serão uma amostra representativa da população nacional: é a estatística que nos permite compreender isso.

A estatística é fundamental nas nossas vidas e é uma área em que não existe desemprego. É uma das áreas que terá maior expansão no século XXI, época em que há mais informação disponível que precisa de ser tratada. Assim, da próxima vez que pensar numa carreira que possa propor aos seus filhos, desafio-o a pensar além das tradicionais medicina, advocacia ou economia, porque quem dominar a estatística poderá trabalhar em qualquer uma dessas áreas, se assim o pretender. Ou dedicar-se a qualquer outra, porque os dados estão presentes em todas. A estatística é, no século XXI, a mão que governa o mundo.

O melhor do Público no email Subscreva gratuitamente as newsletters e receba o melhor da actualidade e os trabalhos mais profundos do Público. Subscrever ×

Um pouco por todo o mundo são realizados eventos comemorativos do Dia Mundial da Estatística. Por cá teremos um evento que liga a estatística ao tema quente do momento, a covid-19. Trata-se de uma iniciativa conjunta do Centro de Estatística e Aplicações da Universidade de Lisboa – único centro de investigação nacional com a estatística como foco, a REVSTAT – Statistical Journal, revista científica internacional indexada, editada pelo Instituto Nacional de Estatística – e a Sociedade Portuguesa de Estatística, que juntam esforços para divulgar a importância da estatística, em particular num contexto de pandemia. Os epidemiologistas Baltazar Nunes e Gabriela Gomes, dois nomes que têm estado na vanguarda de diferentes abordagens à pandemia, vão discutir num webinar, que se prevê muito concorrido, os esforços portugueses para responder a esta pandemia.

O autor escreve segundo o novo Acordo Ortográfico