Paz, Pão, Povo, Liberdade e.. Ambiente?
Quase 10% do texto do programa de Governo é dedicado às questões ambientais e da transição energética
Se o programa de governo ditasse hinos, o PSD precisaria de uma nova palavra na famosa enumeração: ambiente. Quase 10% do texto do programa é dedicado a questões de ambiente e transição energética. Em termos de promessas, mais do mesmo: o executivo “pretende” 55 vezes, “assume” 13, “compromete” 4. Uma análise à lupa das palavras do programa de Luís Montenegro.
José Sócrates
XVII Governo Constitucional
Pedro Passos Coelho
XIX Governo Constitucional
António Costa
XXI Governo Constitucional
Luís Montenegro
XXIV Governo Constitucional
Nota: Os dados apresentados resultam de uma análise que, numa primeira fase, utilizou um algoritmo treinado em manifestos eleitorais frase a frase. Numa segunda fase, recorreu-se a um LLM para tentar confirmar os resultados obtidos. Foi pedido que se catalogassem as frases nas seguintes categorias: Relações Externas, Finanças, Administração Interna e gestão do Estado, Justiça, Defesa Nacional, Educação, Ciência, Infraestruturas e habitação, Economia, Trabalho Solidariedade e Segurança Social, Ambiente, Agricultura e pescas, Cultura, Saúde e Juventude. Nos gráficos acima optou-se por mostrar as quatro categorias com maior % de caracteres (face ao total de caracteres do programa do governo em causa).
De notar que, em todos os programas, a metodologia não conseguiu colocar em nenhuma destas categorias cerca de 30% do texto.
Dos cerca de 1,9 milhões de caracteres do programa que o XXIV Governo Constitucional apresentou à Assembleia da República e que foi aprovado nesta sexta-feira, 172 mil são dedicados ao meio ambiente e à transição energética – quase 10% do total. Não foi sequer o ponto mais focado por quem apresentou o documento, mas se o peso em caracteres for sinónimo da atenção que o Governo dedicará a uma determinada pasta, o ministério agora liderado por Maria da Graça Carvalho terá muito trabalho pela frente.
Claro que a percentagem de texto do programa não faz desta a sua maior prioridade – pode dar-se o caso de o seu autor ser apenas mais palavroso. Mas, a julgar pela análise do PÚBLICO aos primeiros programas de Governo dos três primeiros-ministros anteriores, a percentagem de texto dedicada a diferentes áreas nos programas de Governo tem sido um indicador das prioridades de cada executivo.
Ora vejamos: José Sócrates, no seu primeiro programa, dedicou cerca de 10,4% do texto à Educação; Pedro Passos Coelho, com o memorando de entendimento da Troika a guiar o seu horizonte, dedicou 9,6% do seu programa a temas relacionados com a Administração Interna e Pública – acima de tudo para enfatizar a necessidade de reduzir o peso e ineficiência do Estado. Já António Costa, certamente influenciado pela "posição conjunta" à esquerda que segurou esse seu primeiro Governo, decidiu-se por 8,4% em questões de trabalho, solidariedade e Segurança Social.
Embora "Ensino Superior" seja a combinação de palavras mais frequentemente mencionada – 42 vezes, algo que o novo executivo partilha com António Costa, que também escreveu muitas vezes “Ensino Superior” no seu primeiro programa – no top 30 das combinações mais frequentes do programa de Montenegro estão ainda palavras relacionadas com alterações climáticas. “Transição energética” é referida 19 vezes, “alterações climáticas” 18 vezes, “desenvolvimento sustentável” (10) e “recursos naturais” (também 10).
As palavras combinadas de Montenegro
Cobinações de palavras mais frequentes no programa do governo apresentado por Luís Montenegro. Da análise ficam excluídas 560 palavras, como "o", "a", "de", "para", que são demasiado comuns na língua portuguesa para poderem ter relevância na análise.
Governos que pretendem e promovem
Ainda que as diferenças ideológicas se façam sentir nas palavras que compõem os quatro documentos analisados (a título de curiosidade, Costa foi, de todos, aquele que apresentou o programa mais palavroso), a verdade é que, pelo menos em termos de formulações, os partidos do “centrão” não parecem ser muito originais nas palavras a que recorrem.
Quando se olha para as palavras mais usadas – nesta análise o PÚBLICO excluiu 560 palavras comuns que não acrescentam valor à análise como “o”, “a”, “de”, “nos” – não se pode deixar de reparar que este top pouco muda, qualquer que seja o programa para o qual olhamos.
Sintonia quantitativa
Apesar das diferenças entre programas, quando se olha para o top 10 das palavras mais usadas, as diferenças entre governos são pouco significativas.
José Sócrates
XVII Governo Constitucional
Pedro Passos Coelho
XIX Governo Constitucional
António Costa
XXI Governo Constitucional
Luís Montenegro
XXIV Governo Constitucional
Curioso é também o grau de compromisso assumido. “Promover” é, em quase todos os programas analisados, o único verbo a figurar no top 10 das palavras mais frequentes (a única excepção é o primeiro programa do governo de José Sócrates, que despromoveu “promover” para a 21.ª posição).
Mas se promover é um verbo de preferência geral, “pretender” é a formulação preferida de Luís Montenegro. Quando recorre à expressão “o Governo [...]”, o primeiro-ministro “pretende” 36 vezes, mas também “assume” 6, "compromete" 4 e “adoptará” 3. Uma diferença face a António Costa, que “defende” 18 vezes e “promoverá” 12. O seu antecessor, Passos Coelho, também apreciava a terceira pessoa do futuro do indicativo do verbo promover (5 vezes), mas aquilo que mais vezes fez foi pôr o Governo a “comprometer-se” (“governo compromete” surge 22 vezes).
Nota: por lapso, na contabilidade das palavras mais usadas, os valores apresentados inicialmente estavam todos multiplicados por seis.
Nota metodológica
De forma a calcular a percentagem de texto dedicada a cada categoria, foi utilizada praticamente a mesma metodologia que o PÚBLICO utilizou para analisar os programas eleitorais.
Numa primeira fase, recorreu-se à base de dados Manifesto Corpus, um projecto que recolheu e catalogou milhares de manifestos e programas eleitorais de todo o mundo. Foi com base nesta colecção que um grupo de cientistas de dados treinou o grande modelo de linguagem (LLM) RoBERTa para classificar textos políticos em 56 categorias diferentes. Ainda que o modelo tenha sido treinado em manifestos eleitorais e não programas de Governo, consideramos que o conhecimento político deste algoritmo seria suficiente para atribuir uma das 56 categorias ao texto. Como o algoritmo devolvia uma probabilidade (de zero a um) de aquela frase ser de determinada categoria, optou-se pela categoria com maior probabilidade. No entanto, excluíram-se todas as frases a que o algoritmo deu uma pontuação inferior a 0,5.
Depois desse processo, procedeu-se a uma organização destas frases em categorias maiores. A
saber: Relações Externas, Finanças, Administração Interna e gestão do Estado, Justiça, Defesa
Nacional, Educação, Ciência, Infraestruturas e habitação, Economia, Trabalho Solidariedade e
Segurança Social, Ambiente, Agricultura e pescas, Cultura, Saúde e Juventude. Para tal
recorreu-se à tecnologia da OpenAi, com a seguinte pergunta: "Em text será apresentado um excerto de um programa do governo da República Portuguesa. Em
label, receberá a etiqueta política que outro algoritmo atribuiu a esse excerto. Por vezes
essa etiqueta pode vir apenas vazia. Com base nessas duas informações quero que em Answer me
devolvas uma das segintes respostas, ou seja, que me indiques qual das seguintes etiquetas
aquele excerto deveria receber:""
. Procedeu-se depois a uma limpeza e nova agregação de dados, já que o modelo da OpenAI
procurou, por vezes, "inventar" novas categorias que poderiam muito bem ser integradas em
algumas das existentes.
Em temos de análise textual, o PÚBLICO considerou o corpus completo de cada programa de Governo, que tinha anteriormente extraído de ficheiros pdf. Procedeu-se a uma limpeza, ainda que não muito aprofundada, do texto extraído, nomeadamente cabeçalhos e rodapés. Também não foi tido em consideração na análise o texto presente no índice.
Como é comum em análise textual, procedeu-se à remoção de stop words - palavras tão comuns em determinada língua que não justifica a sua inclusão na análise. Neste caso, foram consideradas 560 palavras, resultando da junção de várias bases de dados de stop words em português disponíveis online. Não se inclui nestas stop words palavras que são comuns neste tipo de documentos como "governo", "programa", "executivo", uma prática é comum em análise textual de documentos específicos de um determinado domínio.
O PÚBLICO não fez qualquer lemmatização - um processo utilizado que visa reduzir uma palavra à sua forma base, ou lema (por exemplo, "correr", "corre", "corria", e "corrido" podem ser reduzidos ao lema "correr") nem stemização, que consiste em reduzir uma palavra à sua raiz ( "correr", "corre", "corria", e "corrido" podem ser reduzidos à raiz "corr"), pelo que isso pode ter influenciado o resultado de contagem de algumas palavras. Também não foi possível, por uma questão de exequibilidade, procurar todas as siglas, acrónimos e abreviaturas presentes e desdobrar para a sua forma completa.
Os leitores são a força e a vida do jornal
Assine o PÚBLICO
Obrigado pelo seu apoio
O contributo do PÚBLICO para a vida democrática e cívica do país reside na força da relação com os seus leitores. Quanto maior for o apoio dos leitores, maior será a nossa legitimidade e a relevância do nosso jornalismo. Apoiar o PÚBLICO é também um acto cívico, um sinal de empenho na defesa de uma sociedade aberta, baseada na lei e na razão em favor de todos ou, por outras palavras, na recusa do populismo e da manipulação para privilégio de alguns.
Obrigado por ser nosso assinante. Convidamo-lo a conhecer melhor o Público exclusivo e as vantagens que tem por pertencer à comunidade.