Alibaba Group (NYSE:BABA) a lancé une version améliorée de sa famille de modèles de langage (LLM) de troisième génération Qwen3, améliorant ses capacités en intelligence artificielle en mathématiques et en codage pour dépasser les principaux modèles d’OpenAI et de DeepSeek dans les principaux tests.
Le nouveau modèle open source, Qwen3-235B-A22B-Instruct-2507-FP8, a apporté des améliorations notables dans le domaine du suivi des instructions, du raisonnement logique, du codage, des sciences et de l’utilisation d’outils, comme l’a rapporté le South China Morning Post (SCMP) mardi.
Le modèle Qwen3-235B-A22B-Instruct-2507-FP8 a apporté des améliorations notables dans le suivi des instructions, le raisonnement logique, le codage, les sciences et l’utilisation d’outils. C’est ce qu’indiquent les mises à jour sur HuggingFace et la plateforme ModelScope d’Alibaba, comme l’a rapporté le South China Morning Post (SCMP) mardi.
Le modèle Qwen amélioré fonctionne actuellement en mode non-réflexion, fournissant des sorties directes sans afficher les étapes de raisonnement, mais il prend désormais en charge des entrées allant jusqu’à 256 000 jetons. Cela représente une augmentation de huit fois, permettant au modèle de traiter des séquences de texte beaucoup plus longues au cours d’une seule conversation.
Lire aussi: Alibaba et Huawei dominent le marché du cloud chinois
Outre ses avancées fondamentales en matière de LLM, Alibaba a également annoncé que son modèle Qwen de 3 milliards de paramètres alimentera l’assistant intelligent “Xiaowei Hui” de HP en Chine. Cette intégration vise à aider les utilisateurs à rédiger des documents de manière plus efficace et à résumer les réunions.
Les données de performance publiées par l’entreprise montrent que Qwen3-Coder a surpassé des concurrents nationaux tels que DeepSeek et le K2 d’IA Moonshot dans des tests de codage clés. Alibaba a également déclaré que son modèle rivalisait avec les meilleures offres américaines, notamment le GPT-4 d’OpenAI et le Claude d’Anthropic, dans certaines de ses capacités.
Lors d’une récente visite en Chine, le PDG de Nvidia (NASDAQ:NVDA), Jensen Huang, a salué la série Qwen, aux côtés des modèles Kimi de DeepSeek et de Moonshot, parmi les systèmes d’IA les plus avancés au monde en matière de raisonnement ouvert, soulignant que la Chine a fait d’énormes progrès dans la course mondiale à l’IA.
Huang a visité la Chine peu de temps après que les États-Unis ont approuvé les demandes de licences d’exportation pour les H20 GPU de la société, qui ont été conçues pour répondre aux réglementations américaines en matière d’exportation. Bien que les agences américaines n’aient pas encore finalisé les documents, Huang a déclaré que le gouvernement avait assuré à Nvidia que les licences seraient accordées.
Le titre Alibaba a enregistré des gains substantiels cette année, avec une augmentation de plus de 42% depuis le début de l’année, dépassant la hausse de l’indice composite NYSE, qui est de plus de 8%.
Le mouvement des prix: Mercredi matin, avant le marché, les actions de BABA avaient augmenté de 2,15% à 123,31 dollars.
Lire aussi:
Photo de Mamun_Sheikh via Shutterstock