Au cours d’un concours de trading de la cryptomonnaie de deux semaines organisé par Nof1, ChatGPT d’OpenAI a perdu 63 % de ses fonds, finissant dernier parmi six grands modèles de langage (LLM), selon Protos.
Les bots d’IA testent leurs compétences en trading de cryptomonnaies
Le concours “Alpha Arena”, qui s’est terminé lundi, a demandé à six systèmes d’IA de premier plan de trader des actifs numériques en utilisant des instructions et des ensembles de données limités identiques.
ChatGPT, Gemini de Google (NASDAQ:GOOGL), Grok de X et Claude de Anthropic ont tous terminé dans le rouge.
En revanche, Qwen3 Max, de Alibaba (NYSE:BABA), a dominé le classement avec un bénéfice de 2 232 dollars, suivi par DeepSeek, qui a gagné 489 dollars.
Les autres ont enregistré de fortes pertes – ChatGPT a perdu 6 267 dollars, Gemini 5 671 dollars, Grok 4 531 dollars et Claude 3 081 dollars, sur leurs soldes de départ de 10 000 dollars.
Les frais de trading érodent la performance de l’IA
Nof1 a déclaré que les bénéfices ont été “dominés par les frais de trading lors des premiers tours”, les agents tradant excessivement et réalisant de petits gains supprimés ensuite par les frais.
Gemini a enregistré 238 transactions, tandis que Claude n’en a réalisé que 38. Sur l’ensemble des six modèles, les taux de réussite se situaient entre 25 et 30 %.
Qwen3 Max a payé le plus de frais au total, avec 1 654 dollars, mais il a tout de même surpassé ses pairs grâce à sa sélection de transactions disciplinée.
La rentabilité constante du modèle chinois contraste fortement avec les lourdes pertes de ChatGPT, ce qui souligne un comportement à risque divergent parmi les LLM dans des conditions identiques.
Les organisateurs appellent ça un test de résistance pour l’IA
Le fondateur de Nof1, Jay Azhang, a décrit l’événement comme un test de résistance contrôlé pour les systèmes d’IA générative.
“Les LLM ne gèrent pas très bien les données numériques de séries chronologiques, mais c’est tout le contexte que nous leur avons donné”, a déclaré Azhang, en notant que chaque modèle était confronté à “des règles strictes et des fenêtres contextuelles limitées”.
Il a ajouté que chaque IA avait affiché une “personnalité d’investissement” unique, ce qui suggère des tendances prévisibles dans l’approche des modèles de langage sur les marchés.
Azhang prévoit d’organiser un autre tour du concours avec des instructions affinées et une rigueur statistique accrue.
Pourquoi c’est important
Le concours montre que les modèles de langage peuvent sembler confiants, mais qu’ils peuvent aussi échouer lorsqu’il s’agit d’argent réel.
Les LLM ont traité les mêmes graphiques et données, mais leurs résultats ont divergé comme des traders humains avec différentes habitudes de risque.
Qwen3 Max a réussi, non pas grâce à la vitesse, mais en évitant le sur-trading, ce qui prouve que la discipline l’emporte sur la prédiction.
La perte de ChatGPT souligne que l’exécution sur le marché est plus importante que les idées ou les narratifs.
Les investisseurs apprennent que l’IA peut aider à analyser les marchés, mais qu’elle ne peut pas remplacer une stratégie ou une gestion des risques.
Lire la suite :
Image : Shutterstock
