WAN2.2: Обзор моделей 5B и 14B для генерации видео

Source
en-origru
Aug 5, 2025 Jun 5, 2026
Video preview
Share:

Видео представляет обновлённый рабочий процесс для WAN 2.2, включая модели 5B и 14B, с демонстрацией их возможностей и настроек.

Модель 5B ⏱ 0:30

  • Размер: 5B параметров, подходит для большинства потребительских видеокарт
  • Поддерживает block swap для видеокарт с 8 ГБ VRAM
  • Качество: достойное, но уступает 14B в следовании промпту
  • Рекомендуемое разрешение: 1280x704 (720p даёт ошибки)
  • Настройки: CFG 3, shift 3-9 (выше 9 для изменения лиц), сэмплер DPM++ SDE
  • Время генерации 121 кадра: ~6 минут 21 секунда
  • Image-to-video: ~6.5 минут, сэмплер DPM++ SDE beta
  • Video-to-video: FPS 16, denoise 0.88, resize кратно 32
  • Модель 14B ⏱ 8:44

  • Две версии: text-to-video и image-to-video
  • Использует LoRA для уменьшения шагов до 6 (сэмплер DPM++ SDE)
  • VAE версии 2.1 (не 2.2, иначе ошибки)
  • Требует block swap (настройка 20 для 3090)
  • Квантование FP8 для экономии VRAM
  • Text-to-video: 81 кадр при 16 fps, разрешение 1280x576, ~6 минут
  • Двойной сэмплер: первые 3 шага high model, остальные low model
  • CFG 1, shift 6
  • Video-to-video: denoise 0.81, сэмплер LCM
  • Image-to-video: сэмплер LCM, без квантования ~9 минут (с квантованием ~6 минут)
  • Метод C.A.M.E.R.A. для промптов ⏱ 2:34

  • Camera: кадрирование и движение камеры (панорамирование, наклон)
  • Action: действия объектов
  • Movement: стиль движения (активный, грациозный)
  • Environment: объекты окружения (деревья и т.д.)
  • Rest: стиль, освещение, цвета
  • Сравнение 5B и 14B ⏱ 14:57

    Характеристика5B14B
    Следование промптуХорошее, но хуже 14BЛучше, создаёт точные образы
    VRAMНизкие требованияВысокие, нужен block swap
    Качество видеоДостойноеАналогичное 5B
    Скорость (121 кадр)~6 минут~6 минут (с квантованием)
    Рекомендуемый FPS24 или 1616 (иначе глюки)

    Ключевые выводы

  • Модель 5B подходит для большинства видеокарт, 14B требует больше VRAM и block swap
  • 14B значительно лучше следует промпту, чем 5B
  • Для 14B используются LoRA для сокращения шагов до 6, что ускоряет генерацию
  • Рекомендуемое разрешение для избежания ошибок — 1280x704 (5B) и 1280x576 (14B)
  • Метод C.A.M.E.R.A. помогает структурировать промпты для лучших результатов
  • Заключение

    Обе модели имеют свои сильные и слабые стороны; рекомендуется попробовать обе, чтобы определить лучший вариант для конкретных задач.

    Ask AI about this video

    Visual Highlightsbeta