IA générative : pourquoi la Chine a un train de retard

IA générative : pourquoi la Chine a un train de retard

Hong Kong, 20 octobre 2023. Le bruit court sur une mystérieuse cargaison regorgeant de processeurs Nvidia A100. Valeur sur catalogue : environ 100 millions d’euros. Dans la nuit, des équipes d’acheteurs provenant de firmes comme Pinduoduo ou Kingsoft affluent pour mettre la main sur le trésor, raconte le journal chinois Meiri Renwu, dans un article fleuve repéré par la newsletter ChinAI. Cette précipitation, dans l’atmosphère étouffante de la péninsule, s’explique par l’importance et la rareté de ce type de matériel, les GPU, indispensables à la fabrication de modèles d’IA de dernière génération, les LLM (pour large language models). Mais aussi par le fait que ces processeurs graphiques de conception américaine, de loin les meilleurs sur le marché, font l’objet d’interdictions de ventes par Washington sur le sol chinois. On ignore la fin du thriller. Qui a obtenu quoi, et surtout, à quel prix ?

L’avènement de ChatGPT, en novembre 2022, a été vécu comme un moment “Spoutnik” par de nombreux pays. Une prise de conscience soudaine de l’impact conséquent qu’aura l’IA générative sur les sociétés et l’économie mondiale. La guerre commerciale entre les Etats-Unis et la Chine tombe donc particulièrement mal pour cette dernière. Si elle peut parfois compter sur des livraisons secrètes sous le manteau, ce manque d’équipements spécialement dédié à la “GenAI” ne suffit pas à combler la distance. “La Chine est très avancée sur les voitures autonomes et d’autres segments nécessitant de l’IA classique, mais elle a un retard sur l’IA générative”, observe Anne Bouverot, la coprésidente du Comité d’experts sur l’intelligence artificielle mis en place par Matignon.

“Crispation politique”

Des chiffres en attestent. Jusqu’à la mi-janvier, la Chine se trouvait derrière la France, le Royaume-Uni, Israël et le Canada en matière d’argent investi par les capital-risqueurs dans des start-ups d’IA générative, avec un peu plus de 500 millions de dollars, d’après les données collectées par Dealroom.co. Si une très récente levée de fonds de Moonshot AI, d’environ un milliard de dollars, replace davantage la Chine dans la course, cela reste néanmoins près de 30 fois moins que les Etats-Unis. Plusieurs experts interrogés par le New York Times estiment ainsi que Pékin a “au moins un an” de retard sur son rival. Les premiers modèles, dont certains sont ouvertement bâtis sur des LLM open source comme Llama, de Meta, n’émergent pas dans les classements de performances basés sur des tests standards dans l’industrie. La plupart sont américains, appartenant à OpenAI, Anthropic ou encore Google. Accompagnés par quelques Français (Mistral AI en particulier), Britanniques (Leeroo) ou encore Canadiens (Cohere). Ce sont eux qu’utilisent en premier lieu les entreprises ainsi que bon nombre d’applications prisées par les particuliers.

“Cette situation a augmenté le niveau de crispation politique sur le sujet en Chine”, indique Mathilde Velliet, chercheuse au sein du Centre Géopolitique des technologies de l’Ifri, spécialisée dans les relations sino-américaines. Le Premier ministre, Li Qiang, en visite cette semaine chez le géant Baidu – le “Google chinois” – a rappelé combien l’IA était importante “pour le développement de nouvelles forces productives”. Mais une partie du problème vient du régime lui-même. Ce dernier a abordé l’avènement de la technologie avec sa volonté de contrôle, de censure qui le caractérise. Une méfiance redoublée en ce qui concerne la “GenAI”, touchant directement le savoir et le langage. “C’est une des hantises sur place : qu’un programme comme ChatGPT se mette à parler politique”, souligne Pierre Sel, doctorant à l’Université de Vienne et spécialiste des questions liées aux nouvelles technologies en Chine. Ainsi, chaque LLM doit faire l’objet d’une autorisation avant diffusion. Les premières licences n’ont été accordées au compte-goutte qu’à l’été dernier, des mois après la sortie de ChatGPT. Une quarantaine sont aujourd’hui approuvés, sur plus de 230 modèles existants, selon le South China Morning Post. La qualité des données utilisées pour l’entraînement des LLM peut aussi être interrogée : pour rappel, la Chine interdit totalement Wikipédia sur son territoire, une source libre de droits pourtant massivement utilisée par les modèles occidentaux pour améliorer leur fiabilité.

Session de rattrapage

Tout n’est pas perdu pour autant. La levée de fonds massive de Moonshot en est peut-être une illustration. Zhipu, 01.AI de l’éminent chercheur Kai-Fu Lee, iFlytek, Qihoo 360, Baichuan font également partie de ces firmes émergentes localement, dans l’IA générative. Celles-ci accèdent à de la puissance de calcul grâce à Baidu, Alibaba ou ByteDance, des géants de la Tech solidement installés, disposant d’importantes réserves de GPU, acquises avant les différentes salves de sanctions en 2022 et 2023. Bien informé, le Meiri Renwu estime à environ 200 000 GPU, dont la moitié d’équivalents A100, dans les mains du propriétaire de ByteDance. De quoi entraîner quatre à cinq modèles d’envergure similaire à GPT-4. Le pays prévoit enfin de construire 20 centres informatiques supplémentaires en deux ans.

“La qualité de la technologie chinoise”, ainsi que le niveau de ses universités “de niveau mondial” sur le sujet sont par ailleurs élevés, rappelle Pierre Sel. En particulier, comme le pointait Anne Bouverot, dans le domaine de l’IA non générative. “ByteDance a probablement développé le meilleur algorithme de recommandation au monde”, explique Pierre Sel. Trois autres éléments plaident pour un rattrapage chinois à court ou moyen terme : le dynamisme de l’open source, permettant d’accéder facilement à des briques technologiques de qualité sur l’IA générative, la tendance aux plus petits modèles nécessitant moins de puissance de calcul, et le dynamisme de son marché intérieur. Baidu revendique déjà 100 millions d’utilisateurs de son chatbot Ernie.

De vrais motifs d’espoirs. Même si les sanctions américaines demeurent un fardeau pour la Chine. “Il est probable que les Etats-Unis procèdent à de nouveaux contrôles des exportations de technologies, par exemple sur l’accès au cloud, à partir duquel il est toujours possible d’avoir accès à de la puissance de calcul”, signale Mathilde Velliet. Et le stock de GPU finira par s’épuiser, malgré les filouteries. La Chine place actuellement des milliards de dollars afin de stimuler sa propre production ; quarante se sont ajoutés en septembre. Huawei et le fondeur SMIC (Semiconductor Manufacturing International Corporation) mènent la remontada. Le premier a commercialisé l’an passé, pour la première fois, des smartphones 5G avec son propre matériel. Et il a lancé une gamme de serveurs d’entraînements spécialisés dans l’IA baptisée Atlas. Une progression notable, bien qu’il reste du chemin à parcourir. “Les performances, en ce qui concerne les GPU, sont encore loin de Nvidia, et les entreprises sont trop habituées à l’écosystème logiciel de l’Américain fourni avec ses processeurs”, note Pierre Sel. Ce qui explique peut-être le choix du nom Atlas, une référence mythologique à un titan défait par Zeus et les dieux de l’Olympe, avant d’être condamné à porter la voûte céleste sur ses épaules. Une bonne allusion aux défis monumentaux auxquels fait face Huawei, remarque avec justesse le Meiri Renwu. Et en creux, sûrement, ceux de la Chine dans l’IA générative.

Leave a Reply

Your email address will not be published. Required fields are marked *