LIMA, Perú (AP) – Alrededor de 10 millones de personas hablan quechua, pero tratar de traducir automáticamente correos electrónicos y mensajes de texto a la lengua indígena más hablada en las Américas ha sido imposible durante mucho tiempo.
Eso cambió el miércoles, cuando Google agregó el quechua y una variedad de otros idiomas a su servicio de traducción digital.
El gigante de Internet dice que la nueva tecnología de inteligencia artificial le permite expandir el repertorio de traducción de Google para los idiomas del mundo. Agregó 24 de ellos esta semana, entre ellos el quechua y las lenguas indígenas sudamericanas como el guaraní y el aymara. También agrega una serie de idiomas africanos y del sur de Asia ampliamente difundidos que han estado ausentes durante mucho tiempo en los productos tecnológicos populares.
«Hemos analizado los idiomas que tienen una población desatendida muy grande», dijo a los periodistas Isaac Caswell, científico investigador de Google.
Las noticias de la feria anual de tecnología I/O de California se pueden celebrar en muchas partes del mundo. Pero también es probable que genere críticas de aquellos frustrados con productos tecnológicos anteriores que no entendieron los matices de su idioma o cultura.
El quechua era la lengua franca del Imperio Inca, que se extendía desde lo que ahora es el sur de Colombia hasta el centro de Chile. Su situación comenzó a deteriorarse tras la conquista española del Perú hace más de 400 años.
Su incorporación a los idiomas reconocidos de Google es una gran victoria para los activistas del idioma quechua como Luis Illaccanqui, un peruano que creó el sitio web Qichwa 2.0, que incluye diccionarios y recursos para el aprendizaje de idiomas.
“Ayudará a poner al quechua y al español en la misma posición”, dijo Ilakanki, quien no participó en el proyecto de Google.
Illaccanqui, cuyo apellido quechua significa «tú, rayo», dijo que el traductor también ayudará a mantener vivo el idioma con una nueva generación de jóvenes y adolescentes, «que hablan quechua y español al mismo tiempo y están fascinados con las redes sociales».
Caswell calificó la noticia como un «gran avance tecnológico» porque hasta hace poco no era posible agregar idiomas si los investigadores no podían encontrar una gran cantidad de texto en línea, como libros digitales, periódicos o publicaciones en redes sociales. sistemas de inteligencia artificial para aprender de ellos.
Los gigantes tecnológicos de EE. UU. no tienen un historial de hacer que su tecnología lingüística funcione bien fuera de los mercados más ricos, un problema que les ha dificultado detectar información errónea peligrosa en sus plataformas. Hasta esta semana, Google Translate se ofrecía en idiomas europeos como el frisón, el maltés, el islandés y el corso -cada uno con menos de un millón de hablantes-, pero no en idiomas del este de África como el oromo y el tigrinya, que tienen millones de hablantes.
Los nuevos idiomas se darán a conocer esta semana. El asistente de voz de Google aún no lo entenderá, limitándose por ahora a traducciones de texto a texto. Google dijo que está trabajando para agregar reconocimiento de voz y otras capacidades, como la capacidad de traducir un letrero al apuntar la cámara hacia él.
Esto sería importante para lenguas muy habladas como el quechua, sobre todo en el ámbito de la salud, porque muchos médicos y enfermeras peruanos que hablan solo español trabajan en zonas rurales y son “incapaces de entender a los pacientes que hablan mayoritariamente quechua”, dijo. .Ilakanki.
“El próximo desafío es trabajar en el habla”, dijo Arturo Uncivay, investigador peruano de traducción automática de la Universidad de Edimburgo, quien cofundó un grupo de investigación para mejorar la tecnología de las lenguas indígenas en las Américas. “Las lenguas indígenas de las Américas son tradicionalmente orales”.
En su anuncio, Google advirtió que la calidad de las traducciones en los idiomas recién agregados «todavía está muy por detrás» de otros idiomas que los admiten, como el inglés, el español y el alemán, y señaló que los modelos «cometerán errores y mostrarán su propios sesgos». Caswell dijo que la compañía agregó idiomas solo si investigó los sistemas. Su IA tiene un cierto nivel de eficiencia.
Él dijo: «Si hubiera una gran cantidad de casos en los que fue un gran error, no lo incluiríamos. Incluso si el 90% de las traducciones son perfectas, pero el 10% son tonterías, eso es demasiado para nosotros».
Google dijo que sus productos ahora admiten 133 idiomas. El último 24 es el lote individual más grande agregado desde que Google enumeró 16 nuevos idiomas en 2010. Lo que hizo posible la expansión es lo que Google llama un modelo de traducción automática «sin disparos» o «sin recursos», un modelo que aprende a traducir a otro idioma sin ver un ejemplo de eso.
La empresa matriz de Facebook e Instagram, Meta, introdujo un concepto similar llamado Universal Speech Translator el año pasado.
“En un nivel alto, la forma en que puedes imaginar que funciona es que tienes un modelo neuronal gigante y está entrenado en 100 idiomas diferentes”, dijo Caswell sobre el modelo de Google.
El nuevo grupo, dijo, abarca desde idiomas más pequeños como el mizo, hablado por unas 800.000 personas en el noreste de India, hasta idiomas más extendidos como el lingala, hablado por unos 45 millones de personas en África central.
Hace más de 15 años, en 2006, Microsoft obtuvo una atención positiva en América del Sur con una función de software que traduce los menús y comandos familiares de Microsoft al quechua. Pero eso fue antes de la ola actual de desarrollos de IA en interpretación.
Obtener la atención de Google brinda una perspectiva muy necesaria del idioma en lugares como Perú, donde los hablantes de quechua aún carecen de muchos servicios públicos, dijo Amerigo Mendoza-Mori, profesor de idiomas de Harvard que habla el idioma quechua. La supervivencia de muchos de estos lenguajes, dijo, «dependerá de su uso en contextos digitales».
Los nuevos idiomas añadidos son: asamés, aymara, bambara, bhojpuri, dhivehi, dojri, ewe, guaraní, ilukanu, konkani, kreo, lingala, luganda, maithili, metilun (manipuri), mizu, oromo, quechua, sánscrito, sabedi , Sorani. Kurdo, Tigrinya, Tsonga y Twi.
—-
O’Brien informó desde Providence, Rhode Island.
«Zombieaholic. Nerd general de Twitter. Analista. Gurú aficionado de la cultura pop. Fanático de la música».