📚 Como eu criei um site que testa a facilidade de leitura de um texto
Tech • 🗓️ 22 de maio de 2022 • ☕ 5 min(s) de leituraHá um tempo atrás, enquanto via uns posts no Instagram, eu achei um site que analisava a facilidade de leitura de um texto. O funcionamento era bem simples: você colava seu texto lá (ou escrevia usando um editor WYSIWYG simples) e ele mostrava algumas informações sobre seu texto, como facilidade de leitura, número de palavras, etc.
Mesmo sendo feito para textos em inglês, o site aparentemente funcionava muito bem para conteúdo nacional. Sinceramente, o funcionamento do site me chamou muita atenção que eu resolvi entender como ele funcionava.
Entendendo o funcionamento do site
Antes de mais nada, o fato do site retornar a facilidade de leitura de um texto tanto em português quando em inglês me chamou a atenção. Isso porque todo a interface do site estava em língua inglesa e ele não parecia ter sido feito para outras línguas.
Na verdade, mesmo colocando textos sem sentido algum ele retornava um valor para o teste. Ou seja, aparentemente ele não analisava a língua em si, mais algo relacionado com tamanho do texto ou da palavra.
Não encontrei no site nada a respeito do algoritmo que eles utilizavam muito menos o código fonte do site.
Nesse caso, a pergunta continua: como funciona esse site?
Teste de Legibilidade de quem?
Dando uma procurada, eu encontrei alguns textos e pesquisas sobre como medir a facilidade de leitura de um texto. A fórmula mais famosa é o Teste de Legibilidade de Flesch–Kincaid.
O funcionamento da fórmula é bem simples. Para calcular a facilidade de leitura ela usa somente a quantidade de palavras, quantidade de frases e o total de sílabas.
Como não há nada sobre a língua em si na fórmula, em primeira análise ela funciona — melhor dizendo, ela retorna algum valor.
Infelizmente, esse valor não está correto quando o texto não está na língua inglesa - o que já era de se esperar, já que a fórmula foi feita para textos em inglês.
Bom, será que não existe uma fórmula que funcione em textos nacionais?
Índice Flesch brasileiro
Respondendo a pergunta: obvio que tem uma versão em português - não estaria escrevendo esse texto se não tivesse.
A versão em língua portuguesa foi do Índice de Flesch-Kincaid - o mesmo citado anteriormente. Essa versão foi adaptada em 1996 por pesquisadores da USP.
A versão teve que ser modificada porque as variáveis utilizadas para medição (tamanho das palavras, total de frases etc) variam de acordo com a língua.
A precisão desse teste é de quase 90% - um valor considerável, dada a simplicidade da fórmula.
Por que não fazer um site?
Achei que seria uma experiência interessante criar um site que permitia qualquer pessoa colocar seu texto e saber a facilidade da leitura, então eu fiz. O projeto inteiro pode ser encontrado no Github do projeto.
A ideia era criar algo simples, rápido para que qualquer um pudesse testar seu texto. Por isso, não há muita coisa no site.
A primeira coisa que aparece quando o usuário entra no site, é uma área de texto e uma barra lateral que mostra a facilidade de leitura e outras informações do texto.
Além disso, depois de um tempo eu adicionei a essa barra um botão que permite ao usuário importar automaticamente qualquer página do Notion e medir a facilidade de leitura desta.
Logo abaixo da parte principal do site, há um FAQ com algumas perguntas e respostas a respeito do funcionamento do site.
E é isso: simples e fácil.
Algumas ideias pro futuro
Acredito que tenha muita coisa a melhorar no site - sempre tem, não é mesmo?
Por isso, ainda quero adicionar mais funcionalidade nele e torná-lo mais intuitivo.
Alguns planos são:
1. Permitir importar textos de outras plataformas, como Google Docs, Word ou de qualquer site.
2. Permitir aos usuários logarem e salvarem seus textos ( na verdade, eu já criei algo similar em um bloco de notas simples).
3. Mais detalhes sobre o texto, como: números de substantivos, verbos etc.
4. Dicas de como melhorar seu texto.
5. Informação de leitura feita por frases, e não somente pelo texto todo.
É isso!
Como já dito, esse é um texto rápido sobre como funciona o site e sobre as fórmulas usadas.
Se você quiser saber mais, pode acessar: