DeepSeek à la peine pour lancer la nouvelle version de son chatbot
La start-up chinoise rivale d’OpenAI aurait échoué à entraîner son nouveau modèle R2 avec les puces de Huawei, moins performantes que celles Nvidia. Selon le “Financial Times”, les déboires de DeepSeek illustrent les défis auxquels la Chine reste confrontée pour devenir autosuffisante en matière de technologie.
Il était annoncé au printemps, mais il n’est toujours pas finalisé. Le modèle R2 de l’intelligence artificielle de DeepSeek, la start-up chinoise qui avait fait sensation en janvier dernier avec le lancement de son modèle de raisonnement “open source”, est en train de prendre un sérieux retard sur ses concurrents, rapporte le Financial Times.
Après la sortie de son modèle R1, DeepSeek a été “incitée” par les autorités chinoises à adopter le processeur Ascend de Huawei plutôt que les systèmes de Nvidia. “Mais la start-up a rencontré des problèmes techniques récurrents lors du processus d’entraînement de son modèle R2.” Une étape qui requiert une puissance de calcul très élevée afin de traiter un ensemble colossal de données.
Les sources du Financial Times expliquent que DeepSeek s’est finalement trouvée contrainte de faire appel à des puces Nvidia pour la phase d’entraînement de son chatbot, et de réserver les processeurs Huawei, manifestement moins performants, à la phase d’inférence, soit l’étape de génération des réponses par le modèle déjà entraîné, moins exigeante en puissance de calcul.
Selon les spécialistes, les puces de Huawei souffrent de problèmes de stabilité et d’une latence importante lorsqu’elles sont connectées entre elles. Le logiciel serait également en cause. Malgré l’appoint d’une équipe d’ingénieurs de Huawei dépêchée chez DeepSeek, la start-up n’a pu mener à bien un test d’entraînement avec la puce Ascend.
“Les difficultés de DeepSeek montrent à quel point les puces chinoises sont encore à la traîne par rapport à leurs rivales américaines pour les tâches critiques”, soulignent les correspondants du Financial Times à Pékin et Hong Kong.
Après plusieurs mois d’interruption forcée, Nvidia devrait pouvoir reprendre très prochainement l’exportation vers la Chine de ses puces H20, mais le ministère de l’Industrie et des Technologies de l’information (MIIT) exige désormais des entreprises technologiques qu’elles justifient leurs achats de puces de Nvidia. “Ce n’est pas interdit, mais c’est devenu politiquement incorrect”, indiquait la semaine dernière une source chinoise.
Courrier International