SÃO PAULO, SP (FOLHAPRESS) - A vastidão de conteúdos da internet pode encolher ou aumentar de acordo com a língua com que o usuário escolhe navegar.

Um relatório inédito dá a dimensão da desigualdade linguística da internet no mundo: para usar as 39 plataformas analisadas, que incluem Wikipedia, YouTube e Facebook, 90% dos africanos e asiáticos dependem de uma segunda língua.

O Relatório do Estado das Línguas na Internet, o primeiro do tipo no mundo, reuniu as organizações Whose Knowledge?, Instituto da Internet de Oxford e Centro para Internet e Sociedade, da Índia, para produzir e reunir informações sobre a diversidade linguística nas principais plataformas online. Além das instituições, foram mais de mil colaboradores, entre falantes, revisores e tradutores.

Segundo o relatório, mais de três quartos dos internautas navegam em apenas dez línguas.

São 25,9% os que o fazem em inglês e 19,4% os que escolhem algum idioma da família do chinês, como o mandarim. O terceiro grupo do ranking, o de falantes de espanhol, cai mais de dez pontos percentuais, concentrando apenas 7,9% dos internautas.

O conteúdo oferecido na internet segue uma lógica parecida --as línguas coloniais europeias são as predominantes. A Wikipedia, espécie de enciclopédia online e colaborativa, está disponível em mais de 300 línguas, mas em apenas 20 delas a plataforma comporta mais de 1 milhão de artigos. As que sustentam mais de 100 mil são apenas 70.

"Informações sobre lugares na Europa e na América do Norte são altamente detalhadas, enquanto várias outras regiões do mundo são relativamente sub-representadas, especialmente locais da África, parte da Ásia e outras regiões do Sul Global", diz trecho do relatório.

Essa desigualdade pode levar à paradoxal situação de um usuário ter que mudar a sua língua materna para saber mais sobre o próprio país.

A falta de conteúdo também pode ser um problema, segundo o relatório, especialmente para populações já excluídas.

"Quando há informação e conhecimento em outras línguas mais marginalizadas, o conteúdo nessas línguas é limitado por quem tem acesso e poder para criá-los, ou para impedir que outros produzam informações alternativas", diz o relatório.

"Por exemplo, a falta de conteúdo online feminista em cingalês [falado no Sri Lanka] ou a falta de conteúdo positivo para pessoas LGBT+ e com deficiência em bengali [falado em Bangladesh] ou bahasa [falado na Indonésia]."

Assim como o conhecimento acessado depende do idioma, o mundo também se expande ou se contrai de acordo com a língua falada pelo usuário. A conclusão foi feita com a investigação de 44 termos no Google Maps, principal ferramenta de geolocalização do mundo. As palavras incluíam aquelas que representam locais comuns, como café, igreja e cabeleireiro.

Enquanto em inglês a informação é volumosa e dispersa ao redor do globo, em bengali há resultados quase que exclusivamente na Índia, em Bangladesh e no Butão. Há ainda os que quase não estão representados no mapa.

"Apesar dos esforços para examinar a cobertura do zulu e do xhosa na África do Sul e do guarani no Paraguai, essas línguas praticamente não estão representadas no Google Maps, a despeito de serem faladas por milhões", conclui o relatório.

"Até mesmo o suaíli --uma das 15 línguas mais faladas do mundo-- está praticamente ausente, e em duas das cidades onde é falado, o conteúdo em inglês é predominante."

Isso reforça a impressão dos pesquisadores de que as línguas africanas têm menos suporte nas principais plataformas.

Há ainda as limitações técnicas em relação a essas línguas. O Unicode, padrão que permite a codificação e manipulação de textos nos computadores, tem hoje 143.859 caracteres para cerca de 30 sistemas de escrita --que não contemplam todos os idiomas.

O lançamento da pesquisa ocorre no ano que inaugura a década de ação pelas línguas indígenas, que vai até 2032 --iniciativa definida pela Unesco no final de 2019, que já era o ano das línguas indígenas.

"As tecnologias digitais nos oferecem muitas possibilidades para representar as formas de linguagem que se baseiam em textos, sons, gestos e muito mais", afirma o relatório.

Das mais de 7.000 línguas que existem hoje, 4.000 têm sistemas escritos --muitos deles desenvolvidos durante períodos de colonização e incompreensíveis para parte dos falantes.

"Línguas com uma tradição oral não cabem na internet que temos hoje", diz em trecho do documento Ana Alonso, linguista zapoteca de Oaxaca, no México.

Na contramão do observado no estudo, segundo o relatório, a tecnologia poderia ajudar a preservar idiomas que correm risco de extinção, situação de 40% das 7.000 línguas atuais.

"A cada mês, duas línguas indígenas e os saberes que elas expressam morrem e se perdem para nós", afirma o relatório.