Автор получил ранний доступ к модели GLM-5.2 от Z.A.I., которая доступна в кодинг-планах. Модель пост-обучена, имеет контекстное окно в 1 миллион токенов и позиционируется как конкурент Opus 4.8, а не Fable.
Тесты автора ⏱ 1:06
•Симулятор лифта: оценка 8/10 (почти идеально, небольшая проблема с выравниванием при посадке пассажиров)•3D-модель контейнера для линз: оценка 3/10 (чересчур высокий)•3D-модель складного стола: оценка 9/10 (лучше, чем Fable; Fable сделал две складки)•SVG панды с бургером: оценка 8/10 (очень хорошие зубы и ракурс)•Игра-симулятор лука и стрел: оценка 9/10 (сложная, как и хотелось, без отображения траектории)•Математический вопрос: пройдено успешно•Тонкая настройка Gemma на фактах о пандах (веб-интерфейс): выполнено за 30 минут, полностью локально, работало отлично•Приложение для отслеживания фильмов: выполнено хорошоДополнительные детали ⏱ 5:42
•Итоговый балл по бенчмарку автора: 81.43 (примерно на 6% ниже Opus 4.8 и Fable)•Стоимость кодинг-плана: всего $8 в месяц (годовой план стоит примерно как месяц Codex или Claude, то есть в 10 раз дешевле)•Модель быстрее, токенов стало меньше, более целенаправленная•Веса будут открытыми, вероятно, под лицензией MITКлючевые выводы
•GLM-5.2 имеет контекстное окно в 1 миллион токенов.•Модель набрала 81.43 балла в тестах автора, что на 6% ниже Opus 4.8 и Fable.•Кодинг-план стоит $8 в месяц — примерно в 10 раз дешевле аналогов.•Веса будут открытыми, вероятно, под лицензией MIT.Заключение
Модель стоит своих денег и отлично сочетается с open code. Интересно, какой будет модель уровня Mythos от ZAI.