Компания NOF1 запустила Alpha Arena — первый публичный бенчмарк, где AI-модели торгуют на реальном рынке с реальными деньгами.

Концепция эксперимента

17 октября 2025 года стартовал первый сезон Alpha Arena. Шести AI-моделям дали по $10,000 для автономной торговли криптовалютами на платформе Hyperliquid:

  • DeepSeek Chat V3.1
  • Qwen3 Max
  • Claude Sonnet 4.5
  • GPT-5 (OpenAI)
  • Gemini 2.5 (Google)
  • Llama 4 (Meta)

Все модели работают с одинаковыми условиями: идентичные промпты, доступ к данным и исполнение сделок. Никакого человеческого вмешательства — только алгоритмы.

Результаты на 22 октября 2025

Лидеры:

  1. DeepSeek V3.1: $11,071 (+10.7%)
    • Агрессивное плечо 15× на SOL
    • Прибыль $3,837 на SOL компенсировала убытки на ETH
  2. Qwen3 Max: $10,934 (+9.3%)
    • Сбалансированный портфель с хеджированием BNB
    • Консервативная стратегия управления рисками
  3. Llama 4: $10,340 (+3.4%)
    • Умеренный подход без крайностей

Аутсайдеры:

  • Claude Sonnet 4.5: -15.7% (ликвидация с плечом 20× на ETH)
  • Gemini 2.5: -55.9% (перегруженность позициями XRP)
  • GPT-5: -64.8% (избыточная торговля с плечом 10-15×)

Что пошло не так?

Главная причина провала лидеров индустрии — отсутствие контроля рисков. ChatGPT и Gemini использовали чрезмерное плечо и не умели вовремя выходить из убыточных позиций.

DeepSeek и QWEN победили не точностью прогнозов, а дисциплиной управления капиталом: контролировали просадки, балансировали позиции и не гнались за быстрой прибылью.

QWEN держится, но…

QWEN показывает стабильные результаты и сохраняет второе место. Однако текущая просадка намекает на знакомый сценарий — если модель не удержит риски под контролем, её может постигнуть участь других “звёзд”, которые начинали хорошо, но слились из-за неконтролируемого плеча.

Главный урок эксперимента: управление рисками важнее прогнозирования рынка.

Что дальше?

Первый сезон Alpha Arena завершился 3 ноября 2025 года. Платформа продолжает работу, показывая, что современные AI-модели способны торговать автономно, но без встроенного риск-менеджмента даже самые продвинутые модели теряют деньги быстрее, чем зарабатывают.

Чуда не случилось — искусственный интеллект пока не превзошёл человека в трейдинге. Но эксперимент показал, что правильная настройка параметров риска важнее размера нейросети.


Источники: