DeepSeek lucha por lanzar la nueva versión de su chatbot
Según informes, la startup china rival de OpenAI no logró entrenar su nuevo modelo R2 con chips Huawei, que son menos potentes que los de Nvidia. Según el Financial Times, los reveses de DeepSeek ilustran los desafíos que aún enfrenta China para alcanzar la autosuficiencia tecnológica.
Se anunció en primavera, pero aún no está finalizado. El modelo R2 de inteligencia artificial de DeepSeek, la startup china que causó sensación el pasado enero con el lanzamiento de su modelo de razonamiento de código abierto, se está quedando muy por detrás de sus competidores, según informa el Financial Times .
Tras el lanzamiento de su modelo R1, las autoridades chinas animaron a DeepSeek a adoptar el procesador Ascend de Huawei en lugar de los sistemas de Nvidia . Sin embargo, la startup experimentó problemas técnicos recurrentes durante el proceso de entrenamiento de su modelo R2. Un paso que requiere una potencia de procesamiento muy alta para procesar una cantidad colosal de datos.
Fuentes del Financial Times explican que DeepSeek finalmente se vio obligado a utilizar chips Nvidia para la fase de entrenamiento de su chatbot, y a reservar los procesadores Huawei, claramente menos potentes, para la fase de inferencia, es decir la etapa de generación de respuestas por parte del modelo ya entrenado, que requiere menos potencia de cálculo.
Según los expertos, los chips de Huawei presentan problemas de estabilidad y una latencia significativa al conectarse entre sí. Se cree que el software también influye. A pesar de contar con un equipo de ingenieros de Huawei en DeepSeek, la startup no logró completar con éxito una prueba de entrenamiento con el chip Ascend .
“Los problemas de DeepSeek muestran hasta qué punto los chips chinos aún están por detrás de sus rivales estadounidenses en tareas críticas”, señalan los corresponsales del Financial Times en Pekín y Hong Kong.
Tras varios meses de interrupción forzosa, Nvidia debería poder reanudar la exportación de sus chips H2O a China muy pronto, pero el Ministerio de Industria y Tecnología de la Información (MIIT) exige ahora a las empresas tecnológicas que justifiquen sus compras de chips Nvidia. «No está prohibido, pero se ha vuelto políticamente incorrecto», declaró una fuente china la semana pasada.