Новейшие прорывы в мире ИИ: Gemma 4, секретный агент Anthropic, Qwen 3.6 и другие
Source
Неделя принесла волну значимых анонсов в сфере искусственного интеллекта. Google представила самую мощную открытую модель Gemma 4, работающую на потребительском железе, а Anthropic, судя по утечке, разрабатывает автономного агента Conway. Alibaba и Z.AI также выпустили модели, ориентированные на агентное программирование и генерацию кода из визуальных дизайнов.
Google Gemma 4: открытая модель для потребительского железа
Google выпустила семейство открытых моделей Gemma 4 под лицензией Apache 2.0, что позволяет использовать их без ограничений. Модель представлена в четырёх размерах: компактные E2B и E4B для работы на смартфонах и Raspberry Pi, а также более крупные 26-миллиардная смешанная экспертов и 31-миллиардная плотная модель, которые работают на потребительских GPU офлайн. 31-миллиардная версия занимает третье место на Arena AI Open Model Leaderboard, конкурируя с моделями в 20 раз больше. Все модели поддерживают мультимодальный ввод, включая аудио, функцию вызова, структурированный JSON-вывод и контекстное окно до 256 000 токенов, а также обучены на 140 языках. Веса уже доступны в Google AI Studio, HuggingFace и Kaggle.
Conway от Anthropic: всегда активный ИИ-агент
В результате утечки исходного кода Claude Code были обнаружены ссылки на неанонсированный проект Conway, который, судя по всему, представляет собой автономную агентную среду. Conway открывается как отдельная страница в интерфейсе Claude и включает три раздела: поиск, чат и систему. В системном разделе можно устанавливать пользовательские инструменты через файлы CNW.zip, что указывает на создание стандарта расширений. Наиболее важная деталь — поддержка веб-хуков, позволяющих внешним сервисам активировать Conway, делая его всегда активным агентом, реагирующим на внешние события. Это фундаментально отличается от текущей архитектуры Anthropic и может стать значительным шагом в развитии продуктов компании.
Alibaba Qwen 3.6 Plus: фокус на агентном программировании
Alibaba представила Qwen 3.6 Plus, модель, сфокусированную на агентном программировании на уровне репозиториев. Она способна навигировать по сложным кодовым базам, выполнять терминальные операции и планировать многошаговые задачи. На бенчмарке Software Engineering Bench Verified она набирает 78.8 баллов, немного уступая Claude Opus 4.5 (80.9), но лидирует в Terminal Bench 2.0 с 61.6 баллами. Контекстное окно в 1 миллион токенов позволяет загружать целые репозитории без фрагментации. Модель также демонстрирует прогресс в мультимодальности, генерируя рабочий код из скриншотов интерфейсов, и включает функцию Preserve Thinking для сохранения цепочек рассуждений в длинных рабочих процессах.
GLM 5V Turbo от Z.AI: визуальное кодирование
Z.AI выпустила GLM 5V Turbo, модель, специально разработанную для преобразования визуальных дизайнов в рабочий код. Она оптимизирована для workflow «увидел экран — написал код», обрабатывая скриншоты, макеты и даже нарисованные от руки схемы. На бенчмарке Design to Code модель набирает 94.8 баллов, опережая Kimi K2.5 (91.3) и Claude Opus 4.6 (77.3). В Android World, тестирующем взаимодействие с GUI, она также лидирует с 75.7 баллами. Архитектура включает новый визуальный энкодер Cog VIT и обучение с подкреплением на 30 типах задач, что предотвращает деградацию текстовых возможностей при добавлении зрения. Модель интегрируется с Claude Code и OpenClaw, предлагая сильное решение для генерации кода из визуалов.
Взгляд Greg Brockman на путь к AGI
Сооснователь OpenAI Greg Brockman прокомментировал заявление CEO Nvidia о том, что AGI уже здесь, оценив прогресс в 70-80% и предсказав появление AGI в ближайшие пару лет. Он использовал концепцию «неровного интеллекта», объясняя, что современный ИИ превосходит человека во многих областях, например, в программировании, но всё ещё допускает ошибки в простых задачах. Ключевая проблема — низкая надёжность, а не недостаток возможностей. По мнению Brockman, путь к AGI лежит через повышение минимального уровня производительности, а не через улучшение лучших случаев, что сделает ИИ способным выполнять любые интеллектуальные задачи на компьютере.
Ключевые выводы
Заключение
Неделя подтвердила, что развитие ИИ идёт по пути специализации и доступности: от открытых моделей Google до узконаправленных решений для визуального кодирования. При этом такие проекты, как Conway, указывают на сдвиг в сторону автономных агентов, а комментарии лидеров отрасли подчёркивают близость AGI. Остаётся следить за тем, как эти инновации будут внедряться в реальные продукты.








