O que é leitura à distância?
Quando você lê um romance ou poema, como você o analisa? Que tipo de informação você procura e como decide o que isso significa? O que um romance britânico escrito em 1855 pode dizer sobre a sociedade e a vida das pessoas naquela época? O que isso pode lhe dizer sobre o que está sendo escrito hoje?
Para a maioria dos alunos e professores, compreender a literatura envolve uma leitura atenta . A leitura atenta é feita lendo cuidadosamente e refletindo sobre uma peça da literatura, seja um poema, romance ou ensaio. Você pode prestar atenção especial à caracterização, ao ritmo da trama ou ao simbolismo e às imagens encontrados ao longo de uma obra. Isso tem tradicionalmente levado a muitas teorias interessantes e complexas sobre literatura, mas e se houver outra maneira?
Essa é exatamente a pergunta para a qual o professor de Stanford Franco Moretti está procurando respostas. Moretti foi o pioneiro de uma nova prática chamada leitura à distância , que é o oposto da leitura atenta. Em vez de ler e analisar cuidadosamente uma única obra (ou um grupo de obras), a leitura à distância pega milhares de peças de literatura e as alimenta em um computador para análise.
Por que estar distante?
A leitura à distância tenta descobrir os padrões e regras não ditas por trás da literatura de uma perspectiva muito técnica. Enquanto a leitura atenta depende da análise subjetiva do que significa uma única peça de literatura, a leitura à distância compila dados objetivos sobre muitas, muitas obras.
Essa ideia nasce do fato de que simplesmente existem livros demais para alguém ler e estudar a sério. Se você está estudando literatura vitoriana, diz Moretti, existem cerca de duzentos romances no cânone para ler. Um cânone literário é a lista de obras importantes que constituem a maior parte da literatura estudada. Comparar e analisar duzentos livros é uma tarefa muito, muito grande, mas Moretti a vê como muito limitada.
Veja, o cânone representa uma seleção muito pequena do que está escrito. Existem dezenas de milhares de outros livros escritos durante a era vitoriana que raramente (ou nunca) são lidos mais. Como você poderia ler todos eles para ter certeza de que tinha a ‘imagem completa’ de como era a escrita naquela época? E quanto a todos os outros períodos da história e todos os outros lugares onde as coisas foram escritas?
A resposta simples é que você não pode estudar tudo com eficácia. Ninguém pode ler e analisar cuidadosamente tantas informações, mas um computador pode. Para tanto, Moretti fundou o Stanford Literary Lab, uma parte da Stanford University dedicada ao uso de computadores para analisar literatura.
Como funciona a leitura à distância
Com a ajuda de outros acadêmicos e especialistas em dados, Moretti desenvolveu um sistema de uso de computadores para analisar romances como dados brutos. Embora os computadores não possam ‘ler’ e entender um romance da maneira que as pessoas podem, eles são muito bons em pesquisar informações específicas que você lhes dá e em encontrar padrões. Eles podem medir o comprimento, a estrutura e o léxico da frase e podem fornecer a um estudioso padrões de dados para análise. Desta forma, a leitura à distância é mais uma prática do que uma teoria literária.
Por exemplo, Moretti colocou os títulos de 7.000 romances britânicos publicados entre 1740 e 1850 em seu computador. Ele então fez o computador contar as palavras de cada título e comparar as médias. O computador descobriu que, à medida que o tempo passava, os títulos ficavam mais curtos. Em 1740, o romance médio tinha um título de vinte e cinco palavras. Em 1850, isso havia encolhido para oito palavras muito mais administráveis.
É natural se perguntar ‘e daí?’ quando você ouve isso. Por si só, essa informação é pouco mais do que uma trivialidade. No entanto, Moretti pegou essa informação e olhou para o que mais mudava na mesma proporção que os títulos e encontrou uma resposta: o mercado de livros.
Antes de 1740, a produção de livros era um mercado muito pequeno na Grã-Bretanha, com cinco ou dez novos livros publicados a cada ano. Com o passar do tempo, mais e mais livros começaram a ser publicados. Ao mesmo tempo, os autores começaram a escrever títulos mais curtos.
Por que isso pode ser? O que há em ter tanta competição que faz com que um escritor precise inventar um título mais curto? Qual é o apelo de um título mais curto? O que isso diz sobre escritores ou leitores que esses títulos florescem à medida que mais e mais livros são produzidos? Todas essas são perguntas interessantes e que talvez nunca pensemos em perguntar sem uma leitura à distância.
Essa abordagem de texto como dados também permite que programas de computador aprendam como identificar a que gênero uma história pertence sem ser contada. Curiosamente, os programas usam medidas muito diferentes para isso do que um leitor humano faria.
Por exemplo, consideremos a literatura gótica. Você pode reconhecer um exemplo desse estilo pelo vilão voltado para o terror, seja uma ameaça sobrenatural como o Drácula ou o terror mais mundano de instituições como a Inquisição Espanhola em The Pit and the Pendulum . Você pode procurar temas recorrentes de lugares sombrios e sombrios, ênfase na morte e melancolia ou muitos outros elementos.
Por comparação, um dos programas de Moretti reconheceria um pedaço da literatura gótica ao verificar a frequência com que a palavra «o» aparece na história, aproveitando certos padrões de fraseado nesse gênero para determinar a probabilidade de ser gótico. Padrões como esse iludem os leitores humanos, tanto porque tendemos a não notar pequenos detalhes quanto porque não temos bibliotecas de livros em nossas cabeças, sob demanda, para comparar rapidamente da mesma maneira.
A velocidade com que «o» aparece nos romances góticos pode não significar muito em si mesma. No entanto, isso levanta a questão: que outros padrões ignoramos nas coisas que lemos? Que regras não ditas e não consideradas governam nossas formas favoritas (e menos favoritas) de escrita? Por que parecemos seguir essas regras das quais nem mesmo estamos cientes?
Esse processo tem o potencial de iluminar alguns processos que ocorrem fora do mundo literário também. O Laboratório Literário de Moretti está atualmente examinando relatórios do Banco Mundial de 1946 a 2010. Eles estão mapeando a freqüência com que palavras como ‘redução da pobreza,’ governança ‘e outras aparecem nesses relatórios. O que a ascensão e queda de certos termos nos dizem sobre como o Banco Mundial fala sobre economias e o estado do mundo?
Resumo
Franco Moretti desenvolveu a leitura à distância, técnica que usa computadores para analisar a literatura como dados. Isso permite que enormes quantidades de informações sejam processadas rapidamente. A leitura à distância enfatiza a procura de padrões e regras que um leitor humano provavelmente não perceberia, e o faz em uma coleção maior de obras do que uma pessoa poderia realmente ler.