Qwen 3.7 Max: Модель, превзошедшая Claude Opus 4.7 и GPT 5.5

Source
en-origru
May 22, 2026 May 22, 2026
Video preview
Share:

В этом видео автор тестирует новую модель Qwen 3.7 Max от команды Quent и утверждает, что она превосходит Claude Opus 4.6 и Kim K 2.6, а также сравнивается с Claude Opus 4.7 и GPT 5.5 в агентных задачах и фронтенд-кодинге.

Бенчмарки и производительность ⏱ 0:00

  • На бенчмарках SWB Pro, SWB Multilingual и Terminal Bench 2.0 модель показывает 100% точность в агентном кодинге.
  • На Claw Eval модель превосходит Kim K 2.6 и показывает такую же производительность, как Claude Opus 4.6.
  • В категории реальных агентных задач (Open Claw) модель демонстрирует лучшую производительность на длительных задачах.
  • Сравнение фронтенд-кодинга: Qwen 3.7 Max vs Claude Opus 4.7 ⏱ 1:01

    ХарактеристикаQwen 3.7 MaxClaude Opus 4.7
    Горизонтальная прокруткаПрисутствует анимация с градиентом слева направоПрисутствует анимация, но без градиента, только оранжевый цвет
    Клик по ячейкамКорректно кликает на AM, W, T и кнопку SaveКликает, но анимация менее детализирована
    Анимация чиселЧисла отображаются с градиентной анимациейЧисла отображаются, но без градиента
    Общее качествоПолностью соответствует или превосходит Opus 4.7Хорошее, но уступает Qwen 3.7 Max
  • Автор показывает, что анимации Qwen 3.7 Max выглядят лучше, с плавными переходами и градиентами, чего нет у Claude Opus 4.7.
  • Ценообразование и агентные возможности ⏱ 5:00

  • Цена Qwen 3.7 Max через OpenRouter: $2.5 за 1 млн входных токенов, $7.5 за 1 млн выходных токенов.
  • Для сравнения, цена Claude Opus 4.6/4.7: $15 и $5, что значительно выше.
  • Модель может использоваться как продвинутый коворкер для реальных задач: синтез сложной информации, анализ данных, моделирование, создание документов и визуализаций для корпоративных рабочих нагрузок.
  • Протестирована в различных средах (IDE, терминал, браузер) для обеспечения стабильной производительности на новых платформах.
  • Самообучение в дикой природе и тест на Tetris ⏱ 7:29

  • В тесте на оптимизацию ядра на неизвестном оборудовании (ECS-инстанс с процессором TH JW, никогда не встречавшемся в обучении) Qwen 3.7 Max достиг 7.3x ускорения, тогда как Gemini 5.1 — 7.3x, Kim K 2.6 — 5.0x, DeepSeek V4 Pro — 3.3x, а 3.6 Plus от Co — 1.1x (модель остановилась раньше).
  • В задаче создания и обучения игры Tetris (10 итераций, с возможностью читать свой код, запускать бенчмарки и переписывать себя) результаты: Qwen 3.7 Max — стоимость $1.32, улучшение 56%; Claude Opus 4.7 — стоимость $12.15, улучшение 28%; GPT 5.5 — стоимость $2.85, улучшение 7%. Qwen 3.7 Max в 9 раз дешевле Claude и показал наибольший прирост.
  • Модель названа лучшей по соотношению цена/качество в длинных агентных циклах.
  • Сравнение с Gemini 3.5 Flash и рекомендации ⏱ 9:23

    ПараметрQwen 3.7 MaxGemini 3.5 Flash
    Цена за выходные токены$7.5 за 1 млн$9 за 1 млн
    ПроизводительностьТысячекратно лучшеНиже
  • Автор рекомендует выбирать Qwen 3.7 Max вместо Gemini 3.5 Flash.
  • Модель имеет контекстное окно в 1 млн токенов.
  • По словам автора, Qwen 3.7 Max — текущая модель номер один, обладающая такими же возможностями, как Claude Opus.
  • Ключевые выводы

  • Qwen 3.7 Max превосходит Claude Opus 4.6/4.7 и Kim K 2.6 на бенчмарках SWB Pro, SWB Multilingual, Terminal Bench 2.0 и Claw Eval.
  • В фронтенд-кодинге Qwen 3.7 Max демонстрирует более качественные анимации с градиентами, чем Claude Opus 4.7.
  • Цена Qwen 3.7 Max ($2.5 вход, $7.5 выход) значительно ниже, чем у Claude Opus ($15 и $5), при аналогичной или лучшей производительности.
  • В тесте на самообучение (Tetris) Qwen 3.7 Max показал улучшение 56% при стоимости $1.32, что в 9 раз дешевле Claude Opus (28% улучшение, $12.15).
  • Модель превзошла Gemini 3.5 Flash по производительности и цене (выходные токены $7.5 vs $9).
  • Заключение

    Qwen 3.7 Max — текущая модель номер один, обладающая такими же возможностями, как Claude Opus, но по значительно более низкой цене.

    Visual Highlightsbeta