Le lancement du nouveau modèle de la start-up chinoise d’intelligence artificielle DeepSeek aurait été reporté après que des problèmes techniques liés aux puces de Huawei Technologies ont contraint l’entreprise à utiliser les processeurs américains de Nvidia Corp. (NASDAQ : NVDA ).
Les puces Huawei butent dans une phase critique d’entraînement
DeepSeek a rencontré des problèmes techniques persistants en tentant d’entraîner son modèle R2 à l’aide des processeurs Ascend de Huawei, selon le Financial Times, qui cite des sources proches du dossier.
Les difficultés ont obligé la société à utiliser les puces Nvidia pour la formation, tout en ne s’appuyant sur le matériel Huawei que pour les tâches d’inférence.
Le lancement, initialement prévu en mai, a été retardé en raison de ces obstacles techniques, ce qui a permis à DeepSeek de prendre du retard sur ses concurrents dans la course à l’IA, selon le rapport.
Voir aussi : Dan Ives déclare que la stratégie d’IA d’Apple a été une ‘catastrophe’
La pression du gouvernement chinois sur les puces nationales a ses limites
Le revers souligne les limites de la volonté de la Chine de réduire sa dépendance à la technologie américaine. Selon les informations, la Chine a encouragé les entreprises à privilégier les puces d’IA nationales et examine les commandes des processeurs H20 de Nvidia afin de promouvoir des alternatives locales.
Les experts de l’industrie notent que les puces chinoises accusent encore un retard en matière de stabilité, de support logiciel et de connectivité inter-puces par rapport à Nvidia.
Huawei a même dépêché des ingénieurs dans les bureaux de DeepSeek pour apporter son aide, mais l’entreprise n’a pas réussi à faire fonctionner les puces Ascend. DeepSeek continue de travailler avec Huawei pour rendre le modèle compatible avec l’inférence, a ajouté le rapport, citant des sources.
Collision entre revenus, sécurité et géopolitique alors que les tensions sino-américaines s’intensifient
Plus tôt ce mois-ci, Nvidia et Advanced Micro Devices, Inc. (NASDAQ : AMD ) ont convenu de de reverser 15 % de leurs ventes de puces en Chine au gouvernement américain afin d’obtenir des licences d’exportation.
Parallèlement, les autorités chinoises ont exprimé des inquiétudes en matière de sécurité concernant les puces H20 de Nvidia, avertissant les entreprises de ne pas les utiliser dans des projets gouvernementaux ou des infrastructures sensibles.
“Le fait que nous ne voyons pas de modèles d’entraînement de pointe sur Huawei aujourd’hui ne signifie pas que cela n’arrivera pas à l’avenir. Ce n’est qu’une question de temps”, a déclaré Ritwik Gupta, chercheur en IA à l’Université de Californie à Berkeley, au Financial Times.
Le modèle DeepSeek R1 avait déclenché une chute de 600 milliards de dollars dans la valeur de Nvidia
Le fondateur Liang Wenfeng aurait demandé plus de temps pour faire avancer R2, qui a également été retardé en raison d’un étiquetage de données approfondi pour le modèle mis à jour. Les médias chinois suggèrent que le lancement pourrait avoir lieu dans les semaines à venir.
DeepSeek a provoqué une $600 milliards de perte dans la valeur marchande de Nvidia avec le lancement de son modèle R1 en janvier.
Nvidia avait alors reconnu le modèle d’IA R1 de DeepSeek, en déclarant que le travail de la société illustrait comment de nouveaux modèles pouvaient être développés en utilisant la mise à l’échelle en temps réel, en tirant parti des modèles largement disponibles et en calculant le plein respect des contrôles à l’exportation.
Lire la suite :
Avertissement : Ce contenu a été partiellement produit à l’aide d’outils d’IA et a été revu et publié par les rédacteurs de Benzinga.
Photo avec l’aimable autorisation de : mundissima sur Shutterstock.com