Latxa, un ChatGPT en euskera contra la brecha digital de los idiomas

Latxa, un ChatGPT en euskera contra la brecha digital de los idiomas

ChatGPT dice poder “generar texto coherente y comprensible” en unos 25 idiomas. El euskera no está en esa lista. Este modelo de lenguaje tiene algo de capacidad para interactuar en vasco, pero carece de la precisión con la que produce texto en lenguas con miles de millones de hablantes. Parece lejano pensar que esté entre las prioridades de la empresa OpenAI mejorar las competencias de su modelo para un idioma que hablan unas 800.000 personas en el mundo. Esto alimenta la “brecha digital” que existe en este tipo de tecnología, según Eneko Agirre, director del Centro Vasco de Tecnología del Lenguaje (HiTZ) de la Universidad del País Vasco (UPV). Por esta razón, el grupo de especialistas que dirige está trabajando en un chatbot propio del euskera, que han bautizado Latxa y ya supera al GPT-3.5 “en todas las evaluaciones”. Pero no se quedan ahí: “Seremos los primeros en crear un modelo tan bueno como el GPT-4″.

Seguir leyendo