Новейшие прорывы в мире ИИ: Gemma 4, секретный агент Anthropic, Qwen 3.6 и другие

Source
en-origru
Apr 2, 2026 Apr 2, 2026
Video preview
Share:

Неделя принесла волну значимых анонсов в сфере искусственного интеллекта. Google представила самую мощную открытую модель Gemma 4, работающую на потребительском железе, а Anthropic, судя по утечке, разрабатывает автономного агента Conway. Alibaba и Z.AI также выпустили модели, ориентированные на агентное программирование и генерацию кода из визуальных дизайнов.

Google Gemma 4: открытая модель для потребительского железа

Google выпустила семейство открытых моделей Gemma 4 под лицензией Apache 2.0, что позволяет использовать их без ограничений. Модель представлена в четырёх размерах: компактные E2B и E4B для работы на смартфонах и Raspberry Pi, а также более крупные 26-миллиардная смешанная экспертов и 31-миллиардная плотная модель, которые работают на потребительских GPU офлайн. 31-миллиардная версия занимает третье место на Arena AI Open Model Leaderboard, конкурируя с моделями в 20 раз больше. Все модели поддерживают мультимодальный ввод, включая аудио, функцию вызова, структурированный JSON-вывод и контекстное окно до 256 000 токенов, а также обучены на 140 языках. Веса уже доступны в Google AI Studio, HuggingFace и Kaggle.

Conway от Anthropic: всегда активный ИИ-агент

В результате утечки исходного кода Claude Code были обнаружены ссылки на неанонсированный проект Conway, который, судя по всему, представляет собой автономную агентную среду. Conway открывается как отдельная страница в интерфейсе Claude и включает три раздела: поиск, чат и систему. В системном разделе можно устанавливать пользовательские инструменты через файлы CNW.zip, что указывает на создание стандарта расширений. Наиболее важная деталь — поддержка веб-хуков, позволяющих внешним сервисам активировать Conway, делая его всегда активным агентом, реагирующим на внешние события. Это фундаментально отличается от текущей архитектуры Anthropic и может стать значительным шагом в развитии продуктов компании.

Alibaba Qwen 3.6 Plus: фокус на агентном программировании

Alibaba представила Qwen 3.6 Plus, модель, сфокусированную на агентном программировании на уровне репозиториев. Она способна навигировать по сложным кодовым базам, выполнять терминальные операции и планировать многошаговые задачи. На бенчмарке Software Engineering Bench Verified она набирает 78.8 баллов, немного уступая Claude Opus 4.5 (80.9), но лидирует в Terminal Bench 2.0 с 61.6 баллами. Контекстное окно в 1 миллион токенов позволяет загружать целые репозитории без фрагментации. Модель также демонстрирует прогресс в мультимодальности, генерируя рабочий код из скриншотов интерфейсов, и включает функцию Preserve Thinking для сохранения цепочек рассуждений в длинных рабочих процессах.

GLM 5V Turbo от Z.AI: визуальное кодирование

Z.AI выпустила GLM 5V Turbo, модель, специально разработанную для преобразования визуальных дизайнов в рабочий код. Она оптимизирована для workflow «увидел экран — написал код», обрабатывая скриншоты, макеты и даже нарисованные от руки схемы. На бенчмарке Design to Code модель набирает 94.8 баллов, опережая Kimi K2.5 (91.3) и Claude Opus 4.6 (77.3). В Android World, тестирующем взаимодействие с GUI, она также лидирует с 75.7 баллами. Архитектура включает новый визуальный энкодер Cog VIT и обучение с подкреплением на 30 типах задач, что предотвращает деградацию текстовых возможностей при добавлении зрения. Модель интегрируется с Claude Code и OpenClaw, предлагая сильное решение для генерации кода из визуалов.

Взгляд Greg Brockman на путь к AGI

Сооснователь OpenAI Greg Brockman прокомментировал заявление CEO Nvidia о том, что AGI уже здесь, оценив прогресс в 70-80% и предсказав появление AGI в ближайшие пару лет. Он использовал концепцию «неровного интеллекта», объясняя, что современный ИИ превосходит человека во многих областях, например, в программировании, но всё ещё допускает ошибки в простых задачах. Ключевая проблема — низкая надёжность, а не недостаток возможностей. По мнению Brockman, путь к AGI лежит через повышение минимального уровня производительности, а не через улучшение лучших случаев, что сделает ИИ способным выполнять любые интеллектуальные задачи на компьютере.

Ключевые выводы

  • Google Gemma 4 — самая мощная открытая модель, работающая на потребительском железе и конкурирующая с моделями в 20 раз больше.
  • Anthropic разрабатывает Conway — всегда активного агента с веб-хуками и расширениями, реагирующего на внешние события.
  • Alibaba Qwen 3.6 Plus фокусируется на агентном программировании с контекстом в 1 млн токенов и лидирует в терминальных операциях.
  • Z.AI GLM 5V Turbo специализируется на генерации кода из визуальных дизайнов, показывая лучшие результаты в своей нише.
  • Greg Brockman оценивает прогресс к AGI в 70-80%, выделяя проблему «неровного интеллекта» и необходимость повышения надёжности.
  • Заключение

    Неделя подтвердила, что развитие ИИ идёт по пути специализации и доступности: от открытых моделей Google до узконаправленных решений для визуального кодирования. При этом такие проекты, как Conway, указывают на сдвиг в сторону автономных агентов, а комментарии лидеров отрасли подчёркивают близость AGI. Остаётся следить за тем, как эти инновации будут внедряться в реальные продукты.

    Visual Highlights beta

    Gemma 4 E2B на Android Studio 0:42

    Gemma 4 E2B на Android Studio

    Модели Gemma 4 с разным количеством параметров 0:51

    Модели Gemma 4 с разным количеством параметров

    Сравнение производительности моделей 1:40

    Сравнение производительности моделей

    Пример работы генерации кода 2:12

    Пример работы генерации кода

    Сравнение моделей по баллам 3:59

    Сравнение моделей по баллам

    Пример работы GUI-агента 5:03

    Пример работы GUI-агента

    Возможности модели GLM-5V-Turbo 7:25

    Возможности модели GLM-5V-Turbo

    Генерация визуального контента 10:27

    Генерация визуального контента