La brecha digital de México en Internet: Aprovechamiento

Luis Zul
4 min readOct 13, 2020

Desde Estonia hasta Estados Unidos, la óptima distribución y aprovechamiento del Internet parece siempre escapar de nuestras manos. Para bien y para mal, la industria de las telecomunicaciones corre como ninguna otra desde hace 20 años. Si intentamos regularla, ya es otra cuando aplicamos un marco legal. Si intentamos mejorarla, nuestra solución se vuelve obsoleta tan pronto la acabamos. México no es diferente, pero sus antecedentes y obstáculos son únicos. En esta segunda parte revisaremos el aprovechamiento del internet en el país.

Aprovechamiento

Aunque México cuenta con más de 7,000 centros de Internet gratuito en el país, no puede aprovecharse debido a tres tipos de analfabetismo: de lectura y escritura, tecnológico y lingüístico.

Por el lado del primer analfabetismo, la baja calidad educativa en México, sobre todo para comunidades indígenas, resulta en una disparidad en la capacidad de leer y escribir por parte de los habitantes. A la fecha, cinco millones de habitantes en México no saben leer ni escribir. Además, el rezago es fuerte en comunidades pequeñas de alrededor de 15,000 personas.

El segundo tipo de analfabetismo ocurre cuando los hogares pobres no tienen acceso a computadoras personales. El poco o escaso acceso a esta máquina, muchas veces limitado solamente a los centros de internet por localidad, impide practicar la serie de tareas más básicas de un ordenador, incluyendo el acceso y búsqueda de recursos en Internet.

En los estados con comunidades más pobres, encontramos la barrera del lenguaje. En Oaxaca, Chiapas, Tabasco y Veracruz hay comunidades que hablan solo la lengua indígena “mixe”. No hay tecnología al alcance de los habitantes de su comunidad en su primera y muchas veces única lengua nativa. Peor aún, la traducción de páginas que proporcionan herramientas como Google Translate no incluyen este lenguaje como opción.

Si el habitante es monolingüe no puede aprovechar el internet que está en español, mucho menos el inglés. Además, no solamente hay comunidades que solo entienden el mixe, sino que esto se repite para más de nuestras lenguas indígenas en México:

Porcentaje de monolingüismo de habitantes que hablan una lengua indígena en particular

Frente a este difícil problema, yo me pregunté si había algo que podíamos hacer nosotros los tecnólogos al respecto.

Traducción Automática

Actualmente, se puede entrenar un algoritmo con oraciones en ambos lenguajes (español y la lengua indígena) para realizar una traducción por computadora. Los dos tipos principales de algoritmos son los estadísticos y los neuronales. Mientras que antes se utilizaban métodos estadísticos (SMT, por Statistical Machine Translation en inglés) basados en probabilidad, recientemente ha habido una mayor atención a los modelos de redes neuronales (Neural Machine Translation en inglés). Esto se debe a que una red puede entrenarse sobre múltiples lenguajes, no solo dos como en los algoritmos estadísticos. La red es capaz de aprender de una manera más comprehensiva y general la manera de traducir estos lenguajes, similar a como nosotros mismos aprendemos un lenguaje. A continuación pueden ver los resultados realizados por una investigación realizada Jesús Mager e Iván Mesa de la UNAM en el 2008:

Resultados presentados en “Hacia La Traducción Automática De Las Lenguas Indígenas De México” 2018

Las puntuaciones presentadas se expresan en BLEU (Bilingual Evaluation Understudy Score). BLEU es un indicador de la efectividad de un traductor. Un mayor valor indica una mejor traducción en general. Los rangos (x100) son del 0 a 100. El valor de BLEU para Inglés-Español de un modelo de NMT entrenado con 358.7 millones de palabras es generalmente de 31. Ninguno de las traducciones en la tabla mostrada llegan a acercarse a ese valor. Además, el “mixe” no figura en la lista de lenguajes, por falta de recursos y textos en esta lengua.

Entonces, queda mucho trabajo por hacer si queremos hacer realmente efectivos los 7,000 centros de Internet que el gobierno ha proporcionado a lo largo de la república mexicana:

  • El gobierno necesita mejorar sus programas en materia del analfabetismo. Nos corresponde a nosotros podemos exigir y elegir a gobernantes que apoyen este tipo de iniciativas.
  • Necesita haber más voluntarios profesionales en áreas de tecnología y TI que capaciten a las comunidades marginadas en México en el uso efectivo del Internet.
  • La academia necesita revivir las más de 63 lenguas indígenas. Se deben encontrar nuevas y mejores maneras de traducir un lenguaje bajo las estrictas limitaciones de las lenguas indígenas: lenguajes con pocos datos, poca diversidad en los datos, morfología diferente al español y con falta de un estándar.

Referencias

--

--