Mais de mil histórias lidas e há apenas seis formas básicas de as escrever?

Do pobre ao rico, do rico ao pobre, “homem no buraco”, Ícaro, Cinderela e Édipo. Cientistas da área computacional e matemática analisaram 1327 obras de ficção em inglês e concluíram que estas são as seis formas básicas que dominam os arcos emocionais das histórias.

Foto
Um dos exemplos que merece destaque no artigo é o gráfico do arco emocional de um dos livros das aventuras de Harry Potter AFP/MARTIN OESER

Rapaz conhece rapariga, rapaz perde rapariga, rapaz reconquista rapariga. Um enredo clássico. Tal como a história da Cinderela, que começa em estado de desgraça, melhora com uma fada madrinha e um baile, cai de novo à meia-noite quando tudo se desfaz e, no final, acabam por viver felizes para sempre. Nada de novo aqui. Estes percursos clássicos das histórias já foram muito explorados por vários autores e até traduzidos em gráficos, com um humor acutilante, numa célebre palestra do escritor de ficção norte-americano Kurt Vonnegut. Agora, inspirados nesta teoria de Vonnegut, um grupo de matemáticos colocou computadores a “ler” 1327 histórias e concluiu que 85% dos livros são dominados por seis formas básicas. São os seis principais arcos emocionais das histórias, dizem.

É obrigatório ver a palestra de Kurt Vonnegut. Porque é divertida, interessante e porque tem tudo a ver com este artigo. Na versão curta (pouco mais do que quatro minutos) que está disponível na Internet, o escritor (que morreu em 2007) começa por defender que “não há razão para que as formas das histórias não possam ser introduzidas num computador: são belas formas”.

A citação está no artigo publicado agora por uma equipa das universidades de Vermont (EUA) e de Adelaide (na Austrália) que não só assume que a inspiração veio de Vonnegut como mostra que o levaram à letra. “Os avanços na capacidade de computação, processamento de linguagem natural e digitalização de texto tornam agora possível estudar a evolução de uma cultura através do seus textos usando uma lente de big data [análise computacional de grandes quantidades de dados]”, começam por escrever os autores no artigo.

 Assim, os cientistas colocaram computadores a ler 1327 histórias de ficção em inglês que estão no repositório gratuito do Projecto Gutenberg. A análise das obras (só foram incluídos textos com um total de palavras entre as 20 mil e as 100 mil e com mais de 40 downloads) foi feita com uma busca de dez mil palavras-chave, de conotação negativa ou positiva. “Encontrámos um conjunto de seis arcos emocionais principais que são os tijolos essenciais para uma trajectória emocional complexa”, dizem. E, afinal, quais? Do pobre ao rico (ascensão), do rico ao pobre (queda), “homem no buraco” (queda-ascensão), Ícaro (ascensão-queda), Cinderela (ascensão-queda-ascensão) e Édipo (queda-ascensão-queda).

São estas as linhas principais com que se cose uma popular história de ficção, defendem os autores do artigo publicado este mês na revista EPJ Data Science, que concluíram ainda que os arcos de Ícaro, Édipo e “homem no buraco” são as soluções mais populares e com mais sucesso (medido pelo número de downloads).

Andrew Reagan, um dos autores do artigo, confessa ao PÚBLICO que também para ele não há nada como uma história de um “homem no buraco”. Mais a sério, questionado sobre se esta análise a literatura feita por computadores não é demasiado simplista e redutora, o matemático concede alguma margem para críticas. “A análise que fizemos é de alguma forma simples, mas consegue algo que não seria possível fazer à mão, sem os computadores. Encontrámos o arco emocional de uma história usando dez mil palavras-chave que certamente deixam escapar acontecimentos que estão numa simples frase. No entanto, usámos aproximadamente 1300 livros, mais do que seria possível comparar de forma manual.”

Por outro lado, Andrew Reagan esclarece: “Temos o cuidado de declarar que o arco emocional é só uma parte da história e não é o enredo (sequência de acontecimentos). ” No artigo, os autores consideram que “o enredo é a espinha dorsal dos acontecimentos numa sequência cronológica”. E estabelecem a diferença com os seus “arcos emocionais”: “Enquanto o enredo capta a mecânica da narrativa e a estrutura permite que se concretize, neste trabalho analisámos o arco emocional que é invocado pelas palavras usadas”, explicam.

Foto
AFP / DANIEL ROLAND

“Este tipo de procedimentos de análise literária é muito limitado, pode ter mais um interesse sociológico ou cultural”, comenta Manuel Portela, professor no Departamento de Línguas, Literaturas e Culturas da Faculdade de Letras da Universidade de Coimbra. “Aquilo que é interessante do ponto de vista narrativo e aquilo que leva, de facto, os escritores a criarem inúmeras variações sobre padrões de histórias que estão mais ou menos interiorizados na cultura não é tanto os elementos comuns e que permitem relacionar as histórias entre si mas os elementos singulares”, nota, acrescentando que ”esses dilemas singulares e a forma como as emoções se desenvolvem na narrativa dificilmente se conseguem captar neste tipo de análise.”

Porém, nota, este tipo de trabalho não é inédito. Está associado ao desenvolvimento computacional e das bases de dados literárias. Segundo Manuel Portela, uma das mais importantes referências nestas análises quantitativas está no laboratório literário da Universidade de Stanford, onde trabalha o professor de literatura Franco Moretti. “Estes projectos permitem olhar para os textos numa macro-escala. Encontramos padrões que de outro modo nos passariam despercebidos”, reconhece.

Um exemplo? “Um dos argumentos de Moretti é que normalmente a teoria literária é construída sobre um cânone limitado de textos. Aquilo que sabemos sobre a literatura do período vitoriano ou do modernismo, por exemplo, resulta de uma amostra que são 100, 200, 300 textos. Mas se formos ao arquivo histórico, nesse período foram produzidos cinco mil, dez mil ou 100 mil textos. Estes métodos quantitativos adequam-se a esse tratamento macro da produção”, responde Manuel Portela.

Mas, afinal, o que podemos aprender com este tipo de análise? “Uma das coisas que é interessante perceber é a forma como um determinado género literário evolui. Em coisas tão simples como a quantidade de texto, por exemplo. Quanto texto tem em média um romance em determinado período? Ou do ponto de vista do vocabulário, como é que evolui o léxico à medida que observamos esse corpus ao longo do tempo?”, argumenta. No entanto, sublinha, apesar de estes projectos permitirem inferir determinados aspectos da cultura não permitem “uma análise literária no sentido estrito”.

A seguir, o cinema

Ainda que o trabalho dos seis arcos emocionais possa ser um alvo fácil para críticas da vasta comunidade ligada à literatura, desde académicos, a escritores, passando por leitores, os autores argumentam que esta é a primeira vez que uma análise, com base científica, sobre os traços comuns das histórias é publicada numa revista. Mas, como já referimos, estão muito longe de ser os primeiros a olhar para as formas das histórias. Aristóteles foi pioneiro na esquematização de géneros literários. Depois do filósofo grego, a busca pelas formas mais comuns das histórias continuou em vários sentidos. O russo Vladimir Propp analisou os componentes básicos dos contos populares e identificou um núcleo comum que parte da queda de um herói seguindo-se a narrativa das tentativas de recuperação. Há também o trabalho de Foster-Harris que em 1959 defendeu a existência de apenas três padrões básicos de enredos (de final feliz, final infeliz e tragédia) ou as sete estruturas identificadas por Christopher Booker no livro The Seven Basic Plots: Why We Tell Stories. E há ainda autores que defendem a existência de 20 ou 36 enredos básicos.

Para Andrew Reagan e os seus colegas matemáticos, a grande maioria (85%) das obras que analisaram aponta para a existência de apenas seis formas básicas de arcos emocionais, ainda que no seu artigo apresentem uma lista de livros para 12, incluindo assim outras formas narrativas com menos expressão. Em Julho, os mesmos autores do artigo agora publicado divulgaram uma primeira versão do trabalho que fazia a análise de 1737 histórias. “Usámos as classificações da Biblioteca do Congresso para conseguir um filtro mais adequado para as histórias de ficção em inglês. Desta forma, conseguimos retirar da análise algumas histórias que não deviam estar no nosso estudo. O Projecto Gutenberg é muito diversificado (inclui poemas pessoais e três cópias do Genoma Humano, por exemplo).”

No artigo, os cientistas dão alguns exemplos das obras que mais se adequaram aos arcos emocionais que foram detectados pelos computadores. No caso do arco do “pobre ao rico” referem a obra Conto de Inverno, de Shakespeare; no “rico ao pobre” o primeiro lugar no top vai para Lady Susan, de Jane Austen; no caso do arco que desenha “o homem no buraco” surge O Feiticeiro de Oz, de L. Frank Baum; no cenário de Ícaro surge Shadowings, de Lafcadio Hearn; no arco da Cinderela o primeiro livro é The Mistery Of The Hasty Arrow, de Anna Katharine Green; e finalmente no caso do arco de Édipo está o livro This World Is Taboo, de Murray Leinster. Todas histórias consideradas exemplares para cada um dos arcos emocionais encontrados pela análise computacional, todas velhas histórias mais ou menos conhecidas.

Também há obras recentes. Um dos exemplos que merece destaque no artigo é o gráfico do arco emocional do livro Harry Potter e o Talismã da Morte, da saga de J. K. Rowling. Os autores notam que o enredo do livro é intrincado e complicado, mas defendem que o arco emocional de cada subnarrativa é claro e evidente.

A equipa analisou ainda estes livros numa espécie de barómetro da felicidade (http://hedonometer.org/books/v1/). Mas ainda é pouco. Não é possível perceber, por exemplo, quais os arcos emocionais das histórias predominantes e mais populares em português, francês ou outra língua. Seriam sequer os mesmos? “É uma excelente questão para investigar”, responde Andrew Reagan, adiantando que o estudo das variações em diferentes culturas será um dos próximos passos desta investigação.

Outros, diz, passam por olhar para os livros digitalizados da Google, para os best-sellers do jornal New York Times ou para os guiões dos filmes. Porém, no cinema, além das palavras, há choro e riso e outras emoções não verbais. “Já começámos a olhar para alguns guiões e, de facto, verificámos que precisamos de uma abordagem diferente para incluir as indicações cénicas.” Um exemplo do uso desta abordagem dos arcos emocionais nos guiões de um filme, como o Pulp Fiction, no tal barómetro da felicidade. Será que, além de palavras positivas e negativas, os computadores vão ser capazes de encontrar nos filmes as lágrimas e os sorrisos? E se alguém chorar de tanto rir?

Sugerir correcção
Comentar