China ha desarrollado un modelo de IA más avanzado que

ChatGPT
se ha convertido rápidamente en la referencia en lo que a modelos de IA
respecta, Al menos en Occidente. Pero a medida que se intensifica la
competencia entre los grandes
modelos de lenguaje (LLM por sus siglas en inglés), comenzamos a descubrir
que el modelo de Open AI podría tener una seria
competencia en China, en particular un programa conocido como ChatGLM, un
chatbot que se acerca a ChatGPT en algunas capacidades y lo supera en chino,
según sus desarrolladores.

“Básicamente, ChatGLM es una alternativa a ChatGPT”, explica Jie Tang, científico
informático de la Universidad Tsinghua en Beijing, durante una charla en la que
presentó las capacidades de ChatGLM en la Conferencia Internacional sobre
Representaciones de Aprendizaje (ICLR 2024). ChatGPT, al igual que la mayoría de los modelos similares,
puede responder en una variedad de idiomas, pero están creados por empresas
estadounidenses y utilizan el inglés como idioma principal. Por el contrario,
ChatGLM es bilingüe y está diseñado para funcionar en chino e inglés.

La Universidad de Tsinghua y su empresa derivada Zhipu AI,
valorada en más de 2 mil millones de dólares, según Tang, desarrollaron ChatGLM
y el modelo subyacente GLM, que significa Modelo de Lenguaje General. Más de
700 investigadores e ingenieros de Zhipu AI y alrededor de 100 estudiantes de
la Universidad de Tsinghua están trabajando en modelos de lenguaje de IA.

Un motivo para centrarse en el avance de China es que ChatGPT
no está disponible en este país. Pero esa no es la única razón para construir
alternativas locales. Los LLM orientados a China producen resultados que
reflejan mejor las necesidades y preferencias de los habitantes del país, afirma
Tang, incluida, por ejemplo, información financiera o educativa específica de
cada país.

Este experto compara su programa con entrenar un modelo de
lenguaje en una aplicación de redes sociales china en lugar de una occidental.
“Básicamente, WeChat sabe más sobre la gente de China que Snapchat – añade
Tang -. Los modelos que se adaptan a diferentes idiomas evitan simplificar
demasiado o descuidar las características específicas de ciertos idiomas y
culturas”.

En ICLR 2024, los responsables de Chat GLM compartieron datos
que afirman que la versión de mayor rendimiento del modelo subyacente de
ChatGLM, GLM-4, se encuentra dentro del 90% de las puntuaciones logradas por GPT-4
de OpenAI en varios puntos de referencia. Entre ellos se incluyen pruebas de
conocimientos generales, sentido común y matemáticas. ChatGLM también supera a
GPT-4 en un punto de referencia de optimización de LLM en chino.

A esto hay que sumarle que en China se están desarrollando
decenas de otros LLM: solo en 2023 se hicieron públicos más de 100 modelos de
lenguaje de IA. Gigantes tecnológicos como Baidu o Alibaba tienen sus propios
chatbots de inteligencia artificial, por ejemplo.

Para dotar a los sistemas de IA de capacidades a nivel humano
cuando se trata de una amplia gama de tareas (un hito conocido como
inteligencia artificial general o AGI) será necesario que estén incorporados en
el mundo. ¿Podría ChatGLM ser el primer sistema de inteligencia artificial en
lograr AGI? “No tengo idea – concluye Tang-. Espero que seamos los primeros,
pero estamos compitiendo con todos los demás”.

La siguiente pregunta obvia entonces es cuan cerca están los
científicos informáticos del desarrollo de un modelo AGI y si conseguir este
avance es algo deseable. Ese es uno de los mayores dilemas a los que nos
enfrentamos.