UN

Alpha Arena : DeepSeek et Qwen3 MAX dominent, ChatGPT et Gemini subissent une chute de 60%+ dans le trading de cryptomonnaies

Table des matières

Nancy
2025-10-22

The world of algorithmic trading entered a new experimental phase in late 2025 with the launch of Alpha Arena — a real-money AI trading competition created by the research group Nof1.

In this live experiment, several leading large language models were given $10,000 each and allowed to autonomously trade cryptocurrency perpetual contracts on the decentralized exchange Hyperliquid. The goal was simple: test whether modern AI models can make profitable decisions in real financial markets.

Qu'est-ce que Alpha Arène ? Le test de résistance financière ultime pour un Master en droit

Lancé par le laboratoire de recherche en IA financière nof1, Alpha Arena est un benchmark unique en son genre conçu pour tester l'intelligence financière des LLM. Six modèles de premier plan se sont vu allouer chacun 10 000 TP4T (après une phase de test initiale de $200) de capital réel pour négocier des contrats à terme perpétuels sur la plateforme d'échange décentralisée Hyperliquid (DEX).

The first season of Alpha Arena ran from October 18 to November 3, 2025. During this period, six AI systems traded continuously in the live crypto market without human intervention. Every trade, position change, and reasoning log was publicly recorded to ensure transparency and allow researchers to study how different models behave under financial pressure.

L’objectif n’est pas seulement de tester les compétences en codage ou en langage, mais d’évaluer :

Gestion des risques : Comment les modèles gèrent l’effet de levier élevé et la volatilité du marché.

Prise de décision: La capacité d’exécuter des stratégies quantitatives dynamiques sous pression en temps réel.

Analyse de marché: La capacité des modèles à analyser véritablement les sentiments et à identifier les inversions de tendance.

Règles d'Alpha Arena : la référence en matière de trading LLM en argent réel

Pour tester la manière dont l'IA fait face au marché chaotique des crypto-monnaies, les règles de test sont les suivantes :

Départ égal : Chaque modèle d'IA reçoit 10 000 USDC réels à échanger sur la plateforme d'échange décentralisée Hyperliquid. Pas d'avance, pas de fonds simulés.

Autonomie totale : Les modèles choisissent leurs propres stratégies, des ratios de levier aux ordres stop-loss, pour 6 cryptomonnaies principales : BTC, ETH, SOL, BNB, DOGE et XRP.

Transparence totale : Toutes les transactions, positions et même « ModelChat » (notes de décision internes de l'IA) sont publics sur nof1.ai, permettant à chacun de suivre les performances en temps réel.

Pas de filet de sécurité : L'absence d'intervention humaine signifie que les modèles doivent gérer seuls les pertes, les fluctuations du marché et les frais. C'est un véritable test de survie pour les plus intelligents.

Classement actuel : DeepSeek et Qwen réalisent des gains massifs

Au 22 octobre 2025 (dernières données publiques), l'écart de performance entre les meilleurs modèles et les géants traditionnels est dramatique, révélant des philosophies de trading distinctes.

Modèle de trader IASolde final (USD)Retour sur investissement (%)Volume des échangesUtilisation de l'effet de levierRésumé des performances clés
DeepSeek V3.111,071.150.1075 métiers15× (longs SOL)De solides performances tirées par les positions longues SOL à effet de levier (+$3,837) avec des pertes courtes ETH mineures (-$932).
Qwen3 Max10,934.340.0938 métiersModéréPortefeuille équilibré avec couverture BNB, atténuant efficacement la volatilité des tarifs.
Lama 410,340.550.0346 métiersAucunExposition prudente à l'ETH, liquidation à effet de levier évitée et croissance régulière maintenue.
Grok 410,125.920.0137 métiersFaible (≤5×)Positions à faible volatilité ; une petite perte à découvert sur l'ETH (-$2,121) a maintenu la performance stable.
Claude Sonnet8,425.44-15.70%9 métiers20× (ETH long)L'effet de levier élevé s'est retourné contre lui : il a été liquidé après que les nouvelles tarifaires ont déclenché une forte chute de l'ETH.
Gémeaux 2.54,408.09-55.90%10 métiers10× (longs XRP)Surexposé au XRP ; les positions se sont effondrées après le choc de l'interdiction d'exportation chinoise.
GPT-53,516.07-64.80%12 métiers10×–15× (courts DOGE/XRP)Un effet de levier excessif et des transactions excessives ont conduit à deux appels de marge et à une forte baisse.

Du point de vue de la gestion de portefeuille, DeepSeek V3.1 et Qwen3 Max démontré une supériorité rendements ajustés au risque, en équilibrant efficacement l'effet de levier et la couverture. En revanche, Claude Sonnet, Gémeaux 2.5, et GPT-5 a subi des dommages majeurs prélèvements en raison de surendettement et inadéquat contrôles des risques, soulignant la sensibilité à la volatilité des stratégies de trading basées sur l'IA sur les marchés spéculatifs.

Final Results of Alpha Arena Season 1

The first season of Alpha Arena officially concluded on November 3, 2025. The final leaderboard revealed a clear performance gap between models, particularly between Chinese-developed models and their Western counterparts.

Qwen 3 Max finished in first place with a return of about 22%, turning the initial $10,000 allocation into roughly $12,287. DeepSeek Chat V3.1 followed with a smaller but still positive return of around 4–5%.

Most of the remaining models suffered significant losses. GPT-5 reportedly lost more than 60% of its starting capital, while Gemini 2.5 Pro also experienced a major drawdown. The results highlighted how difficult it is for AI systems to consistently manage leverage and volatility in real-world crypto markets.

ModèleFinal ReturnKey Observations
Qwen 3 Max+22.3%Balanced trading strategy with moderate leverage and diversified positions.
DeepSeek V3.1+4–5%Strong early gains but later volatility reduced profits.
Claude Sonnet 4.5Negative returnAggressive leverage led to liquidation during market swings.
Grok 4Moderate lossesConservative strategy but limited profitability.
Gemini 2.5 Pro-50%+Overexposure to specific positions created heavy drawdowns.
GPT-5-60%+Frequent trading and leverage resulted in large losses.

Why Most AI Models Struggled in the Experiment

Despite their advanced reasoning abilities, most AI models performed poorly in Alpha Arena. Several factors explain why:

  1. Market volatility
    Crypto perpetual markets are highly volatile, and even small leverage mistakes can trigger liquidations.
  2. Risk management weaknesses
    Some models focused heavily on predicting price direction but underestimated position sizing and leverage risk.
  3. Overtrading
    Frequent trading increased fees and exposure to market noise, reducing overall returns.

These results suggest that successful AI trading requires more than intelligence — it depends heavily on disciplined risk management and robust execution strategies.

Pourquoi Alpha Arena est important : l'avenir du trading IA est là

Cette expérience n'est pas seulement un divertissement, c'est un signal d'alarme quant à notre façon d'évaluer l'IA. Les benchmarks traditionnels (comme MMLU ou HumanEval) testent ce que l'IA sait, mais Alpha Arena teste quelle IA fait Sur des marchés réels et chaotiques. Voici ce que cela signifie pour l'avenir :

Risque > PrédictionLa victoire de DeepSeek prouve que l'IA n'a pas besoin d'estimations de marché parfaites, mais simplement de contrôles de risques rigoureux. Même la logique « intelligente » de GPT-5 a échoué sans cela.

Les « personnalités » de l’IA sont réelles:L'entraînement d'un modèle se reflète dans ses transactions. Les racines quantitatives de DeepSeek, l'analyse des sentiments basée sur X de Grok et la prudence excessive de Gemini découlent toutes des priorités de leurs constructeurs.

La transparence n'est pas négociable:Modèle publicLes journaux de discussion et d'échange permettent aux utilisateurs de repérer les signaux d'alarme (comme les frais excessifs de Gemini) avant de confier leur argent à une IA.

Le point final : la collaboration homme-IA est l’avenir d’Alpha

L'inauguration Alpha Arène concours, prévu pour durer jusqu'à 3 novembre, offre un aperçu précieux et en temps réel de l'avenir de la finance autonome, et les résultats sont une puissante leçon volatilité.

Le leader actuel, DeepSeek, démontre clairement la nature imprévisible du marché. Après avoir publié un premier article étonnant, Marge bénéficiaire 50%, son rendement cumulé a rapidement subi une forte baisse à environ 10% aujourd'hui. Cette correction, causée par des turbulences de marché à court terme, prouve que même les plus avancés Trading de crypto-monnaies par IA Les modèles ne sont pas à l'abri de l'incertitude du marché. Le paysage cryptographique reste prêt à connaître une évolution continue. inversions de tendance, et le classement pourrait changer radicalement à tout moment.

Cette confrontation en argent réel a naturellement capté l'attention d'innombrables traders quantitatifs et les investisseurs, ce qui incite nombre d’entre eux à imiter les stratégies gagnantes de l’IA.

Cependant, la compétition met clairement en lumière les limites essentielles de l’IA :

  • Données vs. Insight : Alors que l’IA excelle dans traiter efficacement des quantités massives de données de marché, en identifiant les tendances des prix et en générant des signaux de trading, il ne peut pas prédire les fluctuations soudaines événements « cygne noir » ou acquérir informations non publiques et privilégiées.
  • Manque de personnalisation : Fondamentalement, l’IA est totalement incapable de prendre en compte vos données individuelles. santé financière ou personnel tolérance au risqueIl ne peut pas générer une stratégie adaptée à votre situation particulière.

L’avenir du trading financier rentable n’est pas une bataille entre les humains et les machines ; c’est une Collaboration homme-IA modèle. Durable alpha ne viendra pas d’individus, d’institutions ou d’IA opérant de manière isolée.

What Comes Next for Alpha Arena?

Following the conclusion of the first season, the Alpha Arena experiment has attracted significant attention from the AI and crypto communities.

Researchers behind the project have suggested that future iterations may expand the experiment beyond cryptocurrency to include other financial markets such as equities. The goal is to better understand how large language models behave when making financial decisions under real-world uncertainty.

L'IA prendra en charge les tâches à haute vitesse et exigeantes en calculs : traitement des données, génération de signaux et prédiction des tendances. Les humains, quant à eux, assureront les fonctions indispensables de intuition du risque, gouvernance finale, et optimisation de stratégie personnalisée basé sur des contraintes du monde réel.

FAQs About Alpha Arena AI Trading Competition

1. What is Alpha Arena in AI trading?

Alpha Arena is a live trading experiment where large language models autonomously trade cryptocurrency using real money. Each model receives an initial capital allocation and makes independent trading decisions in real market conditions.

2. Which AI model won Alpha Arena?

Qwen 3 Max won the first Alpha Arena competition with a return of around 22%, outperforming other models such as DeepSeek, GPT-5, Gemini, Claude, and Grok.

3. How much money did the AI models trade with?

Each AI system started with $10,000 and traded cryptocurrency perpetual contracts on the decentralized exchange Hyperliquid.

4. Why did most AI traders lose money?

Most AI models struggled due to weak risk management, excessive leverage, and the extreme volatility of cryptocurrency markets. Even accurate predictions could not prevent losses when position sizing and risk controls were poorly handled.

5. Will there be an Alpha Arena Season 2?

Researchers behind the experiment have suggested that future versions may expand the competition to include more AI models and potentially additional financial markets beyond crypto.

Assistant IA iWeaver opère à cette intersection cruciale. Nous établissons le lien entre les données brutes de l'IA et la prise de décision humaine sur mesure, vous fournissant des informations uniques sur le marché et stratégies de trading qui équilibrent parfaitement la précision des données avec l’adaptabilité financière individuelle.

Prêt à intégrer la précision de l'IA à la supervision humaine experte ? Cliquez Analyste des marchés financiers iWeaver pour construire dès aujourd’hui votre stratégie résiliente et basée sur les données.

Qu'est-ce qu'iWeaver ?

iWeaver est une plateforme de gestion des connaissances personnelles alimentée par un agent d'IA qui exploite votre base de connaissances unique pour fournir des informations précises et automatiser les flux de travail, augmentant ainsi la productivité dans divers secteurs.

Articles connexes