Mardi, la start-up chinoise d’IA DeepSeek a publié son modèle amélioré DeepSeek-V3-0324, améliorant les capacités de raisonnement et de codage.
Disponible sur Hugging Face, le modèle présente des performances améliorées dans les repères techniques, intensifiant la concurrence avec les leaders américains tels que OpenAI et Anthropic.
Le modèle mis à jour a montré des améliorations sur plusieurs repères, obtenant en particulier un score de 59,4 à l’examen américain de mathématiques, contre 39,6 pour son prédécesseur, selon un rapport du South China Morning Post.
Il a également gagné 10 points sur LiveCodeBench, obtenant un score de 49,2. Le nouveau modèle, qui comporte 685 milliards de paramètres, utilise une licence logicielle du MIT, contrairement à DeepSeek V3, qui possède 671 milliards de paramètres et une licence commerciale.
Plus tôt cette année, le modèle R1 de DeepSeek a perturbé la suprématie technologique américaine, suscitant des débats sur les investissements importants des Big Tech dans de grands modèles linguistiques et des centres de données.
Le modèle R1 a fait sensation grâce à ses performances et à ses coûts inférieurs, mais selon des informations rapportées par CNBC, les analystes estiment que le plus grand impact de DeepSeek réside dans son encouragement à l’utilisation de modèles d’IA open source. Ce changement a été un facteur clé de l’influence de l’entreprise sur le secteur.
Wei Sun, analyste principal chez Counterpoint Research, a déclaré à CNBC que le succès de DeepSeek montre que les stratégies open source favorisent la croissance de l’innovation et leur adoption généralisée, de nombreuses entreprises adoptant le modèle. Elle a également mentionné que le modèle R1 influence le paysage de l’IA en Chine, incitant des sociétés majeures comme Baidu à ouvrir leur propre LLM en open source en guise de réponse.
Le mois dernier, Kai-Fu Lee, l’ancien responsable de Google en Chine et fondateur de la start-up d’IA 01.AI, a déclaré que la montée des modèles d’IA open source tels que DeepSeek a exposé un risque existentiel pour le modèle économique d’OpenAI – et qu’il oriente sa société en conséquence.
Il a remis en cause la viabilité à long terme du modèle économique d’OpenAI, en particulier face à la concurrence de projets open source offrant une qualité similaire à une fraction du coût.
Tim Wang, associé directeur chez Monolith Management, a déclaré à CNBC dans un entretien que les modèles des entreprises comme DeepSeek ont été de puissants facilitateurs en Chine, montrant comment des progrès peuvent être réalisés avec moins de ressources.
Il a noté que les modèles open source avaient permis de réduire les coûts, permettant d’innover, un domaine dans lequel les entreprises chinoises excellent.
Wang a comparé ce développement au “moment Android”, lorsque la décision de Google de rendre son code source du système d’exploitation disponible a suscité l’innovation dans l’écosystème des applications.
Il a ajouté que la perception du retard de la Chine de 12 à 24 mois par rapport aux États-Unis dans le domaine de l’IA s’est désormais limitée à 3 à 6 mois.
Ce changement dans le paysage de l’IA en Chine, stimulé par des modèles open source comme DeepSeek, est en train de changer la concurrence mondiale et de remettre en question les modèles économiques traditionnels.
Lire la suite:
Image via Shutterstock