В этом видео автор тестирует новую модель Qwen 3.7 Max от команды Quent и утверждает, что она превосходит Claude Opus 4.6 и Kim K 2.6, а также сравнивается с Claude Opus 4.7 и GPT 5.5 в агентных задачах и фронтенд-кодинге.
Бенчмарки и производительность ⏱ 0:00
•На бенчмарках SWB Pro, SWB Multilingual и Terminal Bench 2.0 модель показывает 100% точность в агентном кодинге.•На Claw Eval модель превосходит Kim K 2.6 и показывает такую же производительность, как Claude Opus 4.6.•В категории реальных агентных задач (Open Claw) модель демонстрирует лучшую производительность на длительных задачах.Сравнение фронтенд-кодинга: Qwen 3.7 Max vs Claude Opus 4.7 ⏱ 1:01
| Характеристика | Qwen 3.7 Max | Claude Opus 4.7 |
|---|
| Горизонтальная прокрутка | Присутствует анимация с градиентом слева направо | Присутствует анимация, но без градиента, только оранжевый цвет |
| Клик по ячейкам | Корректно кликает на AM, W, T и кнопку Save | Кликает, но анимация менее детализирована |
| Анимация чисел | Числа отображаются с градиентной анимацией | Числа отображаются, но без градиента |
| Общее качество | Полностью соответствует или превосходит Opus 4.7 | Хорошее, но уступает Qwen 3.7 Max |
•Автор показывает, что анимации Qwen 3.7 Max выглядят лучше, с плавными переходами и градиентами, чего нет у Claude Opus 4.7.Ценообразование и агентные возможности ⏱ 5:00
•Цена Qwen 3.7 Max через OpenRouter: $2.5 за 1 млн входных токенов, $7.5 за 1 млн выходных токенов.•Для сравнения, цена Claude Opus 4.6/4.7: $15 и $5, что значительно выше.•Модель может использоваться как продвинутый коворкер для реальных задач: синтез сложной информации, анализ данных, моделирование, создание документов и визуализаций для корпоративных рабочих нагрузок.•Протестирована в различных средах (IDE, терминал, браузер) для обеспечения стабильной производительности на новых платформах.Самообучение в дикой природе и тест на Tetris ⏱ 7:29
•В тесте на оптимизацию ядра на неизвестном оборудовании (ECS-инстанс с процессором TH JW, никогда не встречавшемся в обучении) Qwen 3.7 Max достиг 7.3x ускорения, тогда как Gemini 5.1 — 7.3x, Kim K 2.6 — 5.0x, DeepSeek V4 Pro — 3.3x, а 3.6 Plus от Co — 1.1x (модель остановилась раньше).•В задаче создания и обучения игры Tetris (10 итераций, с возможностью читать свой код, запускать бенчмарки и переписывать себя) результаты: Qwen 3.7 Max — стоимость $1.32, улучшение 56%; Claude Opus 4.7 — стоимость $12.15, улучшение 28%; GPT 5.5 — стоимость $2.85, улучшение 7%. Qwen 3.7 Max в 9 раз дешевле Claude и показал наибольший прирост.•Модель названа лучшей по соотношению цена/качество в длинных агентных циклах.Сравнение с Gemini 3.5 Flash и рекомендации ⏱ 9:23
| Параметр | Qwen 3.7 Max | Gemini 3.5 Flash |
|---|
| Цена за выходные токены | $7.5 за 1 млн | $9 за 1 млн |
| Производительность | Тысячекратно лучше | Ниже |
•Автор рекомендует выбирать Qwen 3.7 Max вместо Gemini 3.5 Flash.•Модель имеет контекстное окно в 1 млн токенов.•По словам автора, Qwen 3.7 Max — текущая модель номер один, обладающая такими же возможностями, как Claude Opus.Ключевые выводы
•Qwen 3.7 Max превосходит Claude Opus 4.6/4.7 и Kim K 2.6 на бенчмарках SWB Pro, SWB Multilingual, Terminal Bench 2.0 и Claw Eval.•В фронтенд-кодинге Qwen 3.7 Max демонстрирует более качественные анимации с градиентами, чем Claude Opus 4.7.•Цена Qwen 3.7 Max ($2.5 вход, $7.5 выход) значительно ниже, чем у Claude Opus ($15 и $5), при аналогичной или лучшей производительности.•В тесте на самообучение (Tetris) Qwen 3.7 Max показал улучшение 56% при стоимости $1.32, что в 9 раз дешевле Claude Opus (28% улучшение, $12.15).•Модель превзошла Gemini 3.5 Flash по производительности и цене (выходные токены $7.5 vs $9).Заключение
Qwen 3.7 Max — текущая модель номер один, обладающая такими же возможностями, как Claude Opus, но по значительно более низкой цене.