Model Update
6 minutes мин чтения
DeepSeek Insights Team

DeepSeek V3.1 Terminus: многоязычные агенты, готовые к продакшену

DeepSeek V3.1 Terminus: что важно знать билдерам

Краткий обзор релиза

DeepSeek V3.1 Terminus вышел 22 сентября 2025 года и стал точечным развитием версии от 21 августа. DeepSeek уже обновил приложение, веб-интерфейс и API до Terminus, поэтому существующие агенты получают улучшения без дополнительной миграции.

Многоязычные улучшения

Релиз сосредоточен на качестве работы с несколькими языками. Terminus сохраняет контекстное окно в 128 тысяч токенов и получает настройки декодирования, которые снижают галлюцинации при переключении между языками. Команды, работающие на глобальный рынок, тратят меньше времени на переписывание промптов для разных локалей.

Производительность агентов

Бенчмарки подтверждают прогресс: Terminus набирает 57.8 балла в SWE-bench Multilingual (ранее 54.5) и 62.9 в MixInstruct 2/8-shot (ранее 59.2). Дополнительно модель показывает 68.4 в SWE Verified и 91.2 в HumanEval, что свидетельствует о более широких навыках рассуждения для длинных цепочек агентов.

Функциональный стек

Архитектура по-прежнему основана на Mixture-of-Experts с 685 миллиардами параметров и примерно 37 миллиардами активных параметров на токен. Доступны режимы вывода Swift (скорость) и Think (глубина), а также встроенные инструменты управления данными и векторами, объединяющие retrieval и fine-tuning в единой среде. Переход на Terminus не требует перестройки текущих пайплайнов.

Деплой и доступ

DeepSeek публикует чекпоинты Terminus в форматах BF16, FP8 (E4M3) и FP32 под лицензией MIT на Hugging Face и поддерживает зеркала на ModelScope для рабочих нагрузок в материковом Китае. Это упрощает адаптацию модели под разные ускорители с учётом требований по точности и стоимости.

Следующие шаги

  • Пересмотрите бюджеты API с учётом тарифов на Terminus, Swift и Think, действующих с 5 сентября 2025 года.
  • Повторно выполните многоязычные QA-тесты и проверки следования инструкциям, чтобы убедиться в корректности новых настроек декодирования.
  • Загрузите актуальные чекпоинты Terminus и подготовьте пайплайны для fine-tuning или оценки перед масштабным запуском.

Похожие статьи

Moonshot AI официально выпустила Kimi K2.6, переведя ветку Code Preview в статус общедоступной модели для 12-часовых сессий автономного программирования, роёв из 300 агентов и полноценной full-stack-генерации. Что изменилось, что это означает и как применить это на практике.
Главный вопрос о Kimi K2.6 — не что он умеет, а для какой модели его явно готовят. Рассмотрите 12-часовые запуски, рои из 300 агентов и компрессор контекста как несущую инфраструктуру — и форма K3 станет видна.
13 апреля 2026 года Moonshot AI официально подтвердила, что Kimi K2.6 Code Preview вышла на этап бета-тестирования. Построенная на архитектуре MoE с триллионом параметров, эта модель нового поколения обеспечивает значительные улучшения в генерации кода и возможностях агентов.