DeepSeek luta para lançar a nova versão do seu chatbot
A startup chinesa rival da OpenAI supostamente não conseguiu treinar seu novo modelo R2 com chips da Huawei, que são menos potentes que os da Nvidia. Segundo o Financial Times, os contratempos da DeepSeek ilustram os desafios que a China ainda enfrenta para se tornar tecnologicamente autossuficiente.
Foi anunciado na primavera, mas ainda não está finalizado. O modelo R2 de inteligência artificial da DeepSeek, a startup chinesa que causou sensação em janeiro passado com o lançamento de seu modelo de raciocínio de "código aberto", está ficando muito atrás de seus concorrentes, relata o Financial Times .
Após o lançamento do modelo R1, a DeepSeek foi "incentivada" pelas autoridades chinesas a adotar o processador Ascend da Huawei em vez dos sistemas da Nvidia . "Mas a startup encontrou problemas técnicos recorrentes durante o processo de treinamento do modelo R2." Uma etapa que exige um poder computacional altíssimo para processar um conjunto colossal de dados.
Fontes do Financial Times explicam que a DeepSeek acabou sendo forçada a usar chips da Nvidia para a fase de treinamento do seu chatbot e a reservar os processadores da Huawei, que são claramente menos potentes, para a fase de inferência, ou seja, o estágio de geração de respostas pelo modelo já treinado, o que requer menos poder de computação.
Segundo especialistas, os chips da Huawei sofrem com problemas de estabilidade e latência significativa quando conectados entre si. Acredita-se que o software também seja um fator. Apesar de uma equipe de engenheiros da Huawei ter sido enviada à DeepSeek, a startup não conseguiu concluir com sucesso um teste de treinamento com o chip Ascend .
“As dificuldades da DeepSeek mostram o quanto os chips chineses ainda estão atrás de seus rivais americanos em tarefas críticas”, apontam correspondentes do Financial Times em Pequim e Hong Kong.
Após vários meses de interrupção forçada, a Nvidia deverá poder retomar a exportação de seus chips H20 para a China em breve, mas o Ministério da Indústria e Tecnologia da Informação (MIIT) agora exige que as empresas de tecnologia justifiquem suas compras de chips Nvidia. "Não é proibido, mas se tornou politicamente incorreto", disse uma fonte chinesa na semana passada.