DeepSeek V3.1 Terminus: многоязычные агенты, готовые к продакшену
DeepSeek V3.1 Terminus: что важно знать билдерам
Краткий обзор релиза
DeepSeek V3.1 Terminus вышел 22 сентября 2025 года и стал точечным развитием версии от 21 августа. DeepSeek уже обновил приложение, веб-интерфейс и API до Terminus, поэтому существующие агенты получают улучшения без дополнительной миграции.
Многоязычные улучшения
Релиз сосредоточен на качестве работы с несколькими языками. Terminus сохраняет контекстное окно в 128 тысяч токенов и получает настройки декодирования, которые снижают галлюцинации при переключении между языками. Команды, работающие на глобальный рынок, тратят меньше времени на переписывание промптов для разных локалей.
Производительность агентов
Бенчмарки подтверждают прогресс: Terminus набирает 57.8 балла в SWE-bench Multilingual (ранее 54.5) и 62.9 в MixInstruct 2/8-shot (ранее 59.2). Дополнительно модель показывает 68.4 в SWE Verified и 91.2 в HumanEval, что свидетельствует о более широких навыках рассуждения для длинных цепочек агентов.
Функциональный стек
Архитектура по-прежнему основана на Mixture-of-Experts с 685 миллиардами параметров и примерно 37 миллиардами активных параметров на токен. Доступны режимы вывода Swift (скорость) и Think (глубина), а также встроенные инструменты управления данными и векторами, объединяющие retrieval и fine-tuning в единой среде. Переход на Terminus не требует перестройки текущих пайплайнов.
Деплой и доступ
DeepSeek публикует чекпоинты Terminus в форматах BF16, FP8 (E4M3) и FP32 под лицензией MIT на Hugging Face и поддерживает зеркала на ModelScope для рабочих нагрузок в материковом Китае. Это упрощает адаптацию модели под разные ускорители с учётом требований по точности и стоимости.
Следующие шаги
- Пересмотрите бюджеты API с учётом тарифов на Terminus, Swift и Think, действующих с 5 сентября 2025 года.
- Повторно выполните многоязычные QA-тесты и проверки следования инструкциям, чтобы убедиться в корректности новых настроек декодирования.
- Загрузите актуальные чекпоинты Terminus и подготовьте пайплайны для fine-tuning или оценки перед масштабным запуском.