Agregar as sondagens

Foto

Há poucos dias, foram conhecidos, quase simultaneamente, os resultados de três sondagens, aguardadas com redobrado interesse à luz da recente crise política. Seguiu-se perplexidade. O PSD subiu ou desceu? O CDS-PP é apoiado por 8% ou 3%? O PS subiu ou não? A sua vantagem é de 13, 10 ou 3 pontos?

Uma possível reacção a estes resultados tão díspares é dar crédito a um e ignorar os restantes. É a atitude, compreensível, dos órgãos de comunicação que encomendam cada estudo. E foi também a atitude de muitos comentadores, que escolheram o resultado que melhor apoiava a sua história.

Contudo, há boas razões para ir para além disto. Primeiro, a ideia de que há empresas de sondagens que produzem resultados mais "certos" do que outras é difícil de defender em Portugal. Em 2012, publicámos, com Miguel Maria Pereira, no Boletim da Sociedade Portuguesa de Estatística, um estudo comparando sondagens feitas nos últimos 100 dias antes de todas as eleições realizadas desde 2001. Nenhuma das empresas que divulgam sondagens políticas regularmente se destaca sistematicamente das restantes.

Segundo, uma sondagem é apenas uma sondagem. É uma de muitas tentativas de captar uma realidade que, por definição, é inacessível. Inferências com base em amostras têm associada uma margem de incerteza, a conhecida "margem de erro". Adicionalmente, uma vez tomada em conta a incerteza de cada sondagem, resultados aparentemente discrepantes podem ser, afinal, compatíveis com uma mesma realidade. E a melhor maneira de reduzir - sem nunca eliminar - essa incerteza consiste em agregar os resultados das sondagens. Nos Estados Unidos, sites como o Real Clear Politics, o Pollster.com e o 538.com (do conhecido Nate Silver) operaram uma revolução na maneira como o público lida com os resultados das sondagens. O seu objectivo é simples: usar o máximo de informação possível para diminuir a incerteza em torno da realidade que as sondagens visam descrever. Hoje, o público norte-americano olha para cada sondagem não como um ilusório retrato definitivo da opinião pública, mas apenas como uma fonte de informação adicional.

Mas como "agregar" as sondagens? Se acreditarmos que a opinião pública é muito estável, uma média das sondagens mais recentes, eventualmente ponderada pela dimensão das amostras, é perfeitamente adequada. Contudo, se acreditarmos que a opinião pública é muito volátil, uma simples média pode seriamente subestimar as mudanças de opinião. Mas como separar a variabilidade da opinião pública da variabilidade das sondagens, quando a única forma de medir a opinião pública é recorrendo a... sondagens? Haverá forma de interpretar de forma sistemática e estatisticamente rigorosa cada nova informação que nos chega? A resposta é sim.

A ideia principal consiste em considerar a existência de dois tipos de variáveis - variáveis não-observadas (a opinião pública) e observadas (as sondagens). Recorrendo ao Filtro de Kalman, técnica que nasceu em 1960 na engenharia, é possível estimar a relação entre umas e outras. O Filtro de Kalman toma automaticamente em conta a evolução das sondagens ao longo do tempo, a margem de erro que lhes está associada, bem como o facto de que as sondagens são uma mera medida imperfeita da opinião pública. A componente técnica é demasiado complexa para estas páginas, mas o aspecto central é este: em cada dia que sai uma nova sondagem, é possível gerar uma estimativa combinando de forma óptima toda a informação disponível até ao momento, assim como um intervalo de confiança que reflecte a incerteza que permanece. Nos dias que se seguem, enquanto não se revelam novas sondagens, não há novas informações, pelo que a estimativa não se altera. No entanto, a incerteza em torno da estimativa cresce, dado que a opinião pública não deixa de evoluir só porque não há sondagens.

Os gráficos mostram a sucessão das nossas estimativas das intenções de voto nos cinco principais partidos desde as últimas legislativas. Note-se como a recente sondagem da Católica, que atribuía 34% de intenções de voto ao PSD, é integrada: por um lado, ela levou a um aumento da estimativa de intenções de voto no PSD; por outro lado, esse aumento foi mitigado na base da informação anterior e na medida em que, como qualquer sondagem, esta tinha uma margem de incerteza que a torna menos incompatível com a informação preexistente do que poderia parecer à primeira vista. Este método não nos impede de detectar mudanças bruscas na opinião pública. Em apenas 15 dias, entre o dia 6 de Setembro de 2012 (data da última sondagem antes do anúncio do aumento da TSU para os trabalhadores e sua diminuição para as empresas) e o dia 20 de Setembro, o apoio estimado ao PSD diminuiu em 5 pontos percentuais, queda que o fez perder a liderança e de que não voltou a recuperar. Neste momento, a nossa melhor estimativa é de que o PS tenha uma vantagem de cerca de 9 pontos sobre o PSD (ver quadro A).

A análise dos dados para os restantes três principais partidos é também reveladora. Por um lado, a frequente sobreposição dos intervalos de confiança mostra como, em determinados momen-tos, as afirmações sobre "quem vai à frente" neste campeonato dos "mais pequenos" são, em rigor, impossíveis de fazer. Por outro, é bastante claro que, pelo menos desde o início deste ano, a CDU se destaca dos restantes partidos, tendo hoje uma intenção de voto que se estima em 12% (ver quadro B).

A partir de Outubro, no âmbito do projecto POPSTAR (Public Opinion and Sentiment Tracking, Analysis, and Research, www.popstar.pt), uma parceria entre o Instituto de Ciências Sociais e o INESC-ID, da ULisboa, a Faculdade de Engenharia da Universidade do Porto e a Escola de Economia e Gestão da Universidade do Minho apoiada pela Fundação para a Ciência e Tecnologia, estes e outros indicadores estarão disponíveis diariamente para a consulta do público em geral.

Nunca é de mais realçar que o que estamos a fazer mais não é do que um método tecnicamente sofisticado de agregação de sondagens. Tal como uma refeição não pode ser melhor do que os ingredientes que a compõem, as nossas estimativas só podem ser exactas na exacta medida em que as sondagens nos dêem uma fotografia da realidade que não contenha erros sistemáticos. Contudo, mesmo com essa incontornável limitação, queremos contribuir para que os indicadores disponíveis sobre a opinião pública sejam vistos no seu conjunto, extraindo deles o máximo de informação possível, em vez de vistos de forma isolada e, por assim dizer, ingénua e apressada.

Instituto de Ciências Sociais e Universidade do Minho