Influência de uma língua mede-se pela capacidade de ligar línguas distantes

Nem o número de falantes, nem a riqueza económica são o que mais condiciona a influência de uma dada língua a nível global, conclui estudo com participação portuguesa.

Foto
Na rede de ligações linguísticas derivada do Twitter, o português é das línguas mais influentes a nível global DR

Os resultados, publicados na última edição da revista Proceedings of the National Academy of Sciences (PNAS), mostram que, ao contrário do que se poderia pensar, influência global de uma língua mede-se principalmente pelo seu nível de ligação com outras línguas. E em particular, pela sua capacidade de mediar a comunicação entre línguas que de outra forma não conseguiriam “falar” entre si.

A verdade faz-nos mais fortes

Das guerras aos desastres ambientais, da economia às ameaças epidémicas, quando os dias são de incerteza, o jornalismo do Público torna-se o porto de abrigo para os portugueses que querem pensar melhor. Juntos vemos melhor. Dê força à informação responsável que o ajuda entender o mundo, a pensar e decidir.

Os resultados, publicados na última edição da revista Proceedings of the National Academy of Sciences (PNAS), mostram que, ao contrário do que se poderia pensar, influência global de uma língua mede-se principalmente pelo seu nível de ligação com outras línguas. E em particular, pela sua capacidade de mediar a comunicação entre línguas que de outra forma não conseguiriam “falar” entre si.

A questão reside em saber, no fundo, como avaliar a influência de uma língua na cultura global. Ora, até aqui, os parâmetros utilizados têm sido, justamente, o número de pessoas que falam uma dada língua e o nível económico dessas pessoas. Mas agora, estes cientistas decidiram avaliar esse poderio linguístico com outra bitola: mapeando as redes de ligações entre as diferentes línguas do mundo. E concluem que, muito mais do que ao peso da demografia ou da riqueza – que obviamente também contribuem para o poderio das diversas línguas –, o sucesso global de uma língua deve-se sobretudo ao número e à força dessas ligações.

Mais: o que define a influência global de uma língua, argumentam os autores, é a sua capacidade de estabelecer pontes entre línguas associadas a culturas por vezes muito diferentes e afastadas do ponto de vista geográfico.

“O chinês (ou mandarim para ser mais preciso), apesar de ter um grande número de falantes, é uma língua relativamente periférica, ou seja é uma língua que está isolada sobre si mesma e não interage com as restantes”, explicou ao PÚBLICO Bruno Gonçalves, co-autor português do artigo, a trabalhar na Universidade de Aix-Marseille (França). “Ou seja… o chinês é útil na China, mas está longe de ser uma língua falada frequentemente noutros países ou regiões. Isto deve-se tanto à sua complexidade (que dificulta a aprendizagem) quanto ao tamanho da China (que facilita o isolamento cultural, visto poderem ser auto-suficientes).”

Twitter, Wikipédia & companhia
Para determinar as ligações existentes entre as línguas e avaliar a sua força, os cientistas – liderados por César Hidalgo e incluindo Steven Pinker (ambos do célebre Media Lab do Massachusetts Institute of Technology ou MIT, EUA) – construíram três mapas diferentes a partir de três grandes massas de dados, respectivamente provenientes do Twitter, da Wikipédia e de traduções literárias.

No caso do Twitter, explica em comunicado o MIT, o critério de ligação entre duas línguas era que o autor de um tweet na sua própria língua (a primeira) também tivesse produzido pelo menos três tweets na segunda língua. Os dados representavam assim 17 milhões de tweets produzidos em 73 línguas por cerca de 280 milhões de utilizadores deste serviço online. Quanto à força da ligação entre duas línguas, era medida pelo número de utilizadores desse “par” de línguas. Essencialmente, “a força de ligação entre as diversas línguas é dada pelo número de pessoas bilingues”, diz-nos Bruno Gonçalves.

No caso da Wikipédia, o critério era semelhante: os “editores” daquela mega-ciber-enciclopédia eram retidos para análise quando tinham editado artigos na sua língua-mãe e noutras línguas. O conjunto final continha 2,2 milhões de tais editores.

Por último, para gerar os dados de base relativos à tradução literária, os cientistas utilizaram o chamado Index Translationum da UNESCO – um catálogo de 2,2 milhões de traduções de livros em mais de mil línguas, publicadas entre 1979 e 2011. Aqui, a força da ligação entre duas línguas era determinada pelo número de traduções que existiam de uma para a outra.

Para obter as redes, os cientistas utilizaram, lê-se no artigo da PNAS, um algoritmo semelhante ao que o motor de pesquisa da Google utiliza para fazer o ranking das páginas da Web nas suas listagens de resultados de pesquisa. Esse algoritmo utiliza o número e a qualidade dos links que apontam para um dado site como estimativa da importância desse site.

Por outro lado, para validar os seus mapas de forma independente, os cientistas recorreram a mais dois conjuntos de dados que ligam pessoas famosas e difusão linguística: uma lista (obtida anteriormente por César Hidalgo) de 11.340 pessoas que tinham artigos acerca delas na Wikipédia escritos em mais de 26 línguas; e uma outra lista, publicada num livro da autoria politólogo norte-americano Charles Murray, das 4002 pessoas mais citadas em 167 obras de referência (de enciclopédias a inquéritos) publicadas à escala mundial.

Resultados? Os três mapas das redes linguísticas não eram idênticas – o que era de esperar, uma vez que o grupo de “autores” utilizado para cada um dos mapeamentos era diferente: no caso do Twitter, representava uma parcela dos internautas bilingues; no caso da Wikipédia, uma mistura de curiosos e especialistas (poliglotas) de um tema; e, no caso da base de dados da UNESCO, obras literárias de fama internacional. “Por exemplo”, lê-se no mesmo comunicado, “na rede da Wikipédia, o alemão é muito mais central do que o espanhol, enquanto o contrário se verifica na rede gerada a partir do Twitter.”

Da mesma forma – e pela mesma razão –, a rede derivada dos dados da UNESCO estava mais em linha com a lista de famosos de Murray, cujos elementos provêem das artes e das ciências. Pelo seu lado, as redes derivadas do Twitter e da Wikipédia correspondiam melhor à lista de famosos estabelecida pelo co-autor César Hidalgo com base na Wikipédia, que é mais inclusiva, uma vez que contém famosos das mais variadas profissões, da música pop ao desporto.

Mas mesmo assim, fosse qual fosse a lista de celebridades considerada, havia sempre pelo menos um dos mapas que conseguia prever de forma mais fiável a composição dessa lista com base na “centralidade” da língua na rede correspondente do que no PIB ou no número de falantes associados.

Línguas do futuro?
Uma coisa é certa: no topo da influência global está actualmente o inglês. Com 1500 milhões de falantes e um elevado rendimento per capita, os novos resultados também confirmam esta língua como a mais capaz de ligar outras línguas entre si, o que aliás já todos sabíamos.

Quanto ao chinês (com mais de 1600 milhões de falantes) ou o árabe (500 milhões de falantes), apesar destas línguas serem mais faladas do que línguas como o português (290 milhões), o francês (200 milhões), o alemão (185 milhões), o italiano (70 milhões), ambas surgem nos resultados como mais periféricas, menos centrais do este conjunto de línguas europeias.

De facto, a seguir ao inglês, as línguas mais centrais a nível global são o francês, o alemão, o espanhol, o italiano e o russo (nessa ordem, com os três últimos no mesmo patamar). E, no "círculo" seguinte, encontram-se, entre outras, o holandês (com apenas 27 milhões de falantes), o português, o sueco (com dez milhões) e o dinamarquês (com seis milhões).

“O português é uma língua intermédia”, explica ainda Bruno Gonçalves. “Porque, apesar de estar difundida pelo mundo e ter ligações a línguas mais distantes, tanto geográfica como linguisticamente, não tem a importância global de uma língua como o inglês tem actualmente ou como o francês teve em décadas passadas.”

“Para mim, o resultado mais surpreendente em relação ao português foi a sua ligação à língua malaia e ao finlandês, que são visíveis na redes derivadas do Twitter e da Wikipédia”, acrescenta Bruno Gonçalves.

Seja como for, todas estas línguas medianamente periféricas – e muito menos faladas do que o chinês ou o árabe – revelam-se, nos três mapas, mais centrais do que o chinês ou o árabe (os diversos mapas estão acessíveis no site do projecto). E em particular, no mapa derivado do Twitter, o português e o espanhol são as línguas indo-europeias mais centrais a seguir ao inglês – enquanto as línguas "sino-tibetanas" como o chinês se tornam praticamente irrelevantes (ver imagem).

Poder-se-á objectar que estes dados estão enviesados, dado que consideram populações não representativas da totalidade da população humana – e que portanto não representam a influência real de cada língua. A isso, César Hidalgo responde no mesmo comunicado: “Quero dizer claramente que este estudo não é sobre línguas globais. As três redes são representativas de elites. Mas, ao mesmo tempo, essas elites são os motores da transferência de informação entre culturas.”

“O que estes resultados demonstram é que a cultura e a língua estão intrinsecamente ligadas e que promover uma é promover a outra”, frisa Bruno Gonçalves. Como preservar o português? “Através de medidas que aumentem o número de estrangeiros que falam a nossa língua (promoção de aulas de português para estrangeiros, etc.) ou que difundam a cultura portuguesa, como a tradução de livros de autores nacionais para outras línguas”, responde-nos o cientista.

E qual será a língua franca do futuro?, perguntámos. “Será provavelmente uma mistura de línguas. O inglês manterá o seu domínio, mas acho que não corremos o risco de ter uma única língua global que elimine as outras.”