Model Comparison
8 minutes мин чтения
Команда аналитики ИИ

DeepSeek V3.1 Terminus vs Kimi K2-0905: выбор ядра агента к четвёртому кварталу 2025

Сроки выпусков и позиционирование

DeepSeek выпустила патч Terminus 22 сентября 2025 года, улучшив многоязычную согласованность и обновив шаблоны агентов без прерывания веб-, мобильного и API-доступа. Moonshot AI представила Kimi K2-0905 5 сентября 2025 года как обновление сентября с акцентом на агентное кодирование, фронтенд и удвоенную длину контекста.

Архитектура, контекст и способы доступа

Обе модели используют MoE, но делают разные акценты:

ПараметрDeepSeek V3.1 TerminusKimi K2-0905
Всего / активно685B / ~37B1T / 32B
Экспертов на слой98 из 384
Окно контекста128K tokens256K tokens
Режимы по умолчаниюSwift (низкая задержка) и Think (глубокий вывод)Один профиль, заточенный под инструментальное кодирование
РаспространениеВесы под MIT (Hugging Face, ModelScope)Весы по MIT-производной + управляемые API

Terminus сохраняет дуэт Swift/Think и окно 128K, балансируя скорость и глубину. K2-0905 оставляет 1T/32B и расширяет окно до 256K, что удобно для целых репозиториев и больших технических заданий.

Бенчмарки и стабильность агентов

По сравнению с августом Terminus растёт во всех агентных тестах:

Бенчмарк (конфигурация агента)DeepSeek V3.1 (авг 2025)DeepSeek V3.1 TerminusKimi K2-0905
SWE-bench Multilingual54,557,855,9
SWE Verified66,068,469,2
Terminal-bench31,336,744,5
BrowseComp30,038,5н/д
LiveCodeBench56,460,0 (рост успешности)61,0

Это подтверждает устранение смешения языков и обновление шаблонов агентов в Terminus. K2-0905 сохраняет лидерство в Terminal-bench и SWE Verified, что соответствует стратегии «full-stack» разработки.

Цены (USD за 1 млн токенов, сентябрь 2025)

КаналВвод (cache hit)Ввод (cache miss)Вывод
DeepSeek API (после 5 сентября)$0,07$0,27$1,10
Novita serverless K2-0905$0,60$2,50
Groq hosted K2-0905$1,00$3,00
LangDB gateway K2-0905$0,49$1,99

DeepSeek унифицировала цены для Terminus, Swift и Think после 5 сентября 2025 года. Стоимость Kimi зависит от дистрибьютора: Novita ($0,60/$2,50), Groq ($1,00/$3,00) и LangDB ($0,49/$1,99).

Экосистема и развёртывание

  • Self-hosting: Terminus предлагает веса BF16/FP8/FP32 под MIT для развёртывания в VPC или on-prem средах с жёсткими требованиями.
  • Управляемое ускорение: K2-0905 через Groq, Novita или Kimi Cloud обеспечивает 60–200+ tokens/s и снижает операционную нагрузку.
  • Мультилингвальная устойчивость: Terminus сокращает смешение английского и китайского в промптах, уменьшая ручную правку.
  • Качество фронтенда: Moonshot подчёркивает улучшенные React/Vue-компоненты из K2-0905.

Чек-лист выбора

  1. Основная задача: Terminus — если важна многоязычная чистота и контроль над развёртыванием; K2-0905 — если нужны 256K контекста или максимум в терминальной автоматизации.
  2. Оркестрация моделей: Задания по планированию доверяйте Terminus (Swift/Think), долгие циклы кодинга — Kimi.
  3. Контроль стоимости: Сравните фиксированную ставку DeepSeek с прайсингом Novita/Groq/LangDB — разброс может превышать 4x.
  4. Говернанс: Terminus полностью размещается в вашей инфраструктуре; управляемый Kimi упрощает эксплуатацию, но требует проверки регуляторных ограничений.

Учитывая таймлайн, архитектуру, метрики и цены, можно точно разместить deepseek v3.1 terminus и Kimi K2-0905 в тех слоях агентного стека, где они принесут максимум пользы к концу 2025 года.

Похожие статьи

Moonshot AI официально выпустила Kimi K2.6, переведя ветку Code Preview в статус общедоступной модели для 12-часовых сессий автономного программирования, роёв из 300 агентов и полноценной full-stack-генерации. Что изменилось, что это означает и как применить это на практике.
Главный вопрос о Kimi K2.6 — не что он умеет, а для какой модели его явно готовят. Рассмотрите 12-часовые запуски, рои из 300 агентов и компрессор контекста как несущую инфраструктуру — и форма K3 станет видна.
13 апреля 2026 года Moonshot AI официально подтвердила, что Kimi K2.6 Code Preview вышла на этап бета-тестирования. Построенная на архитектуре MoE с триллионом параметров, эта модель нового поколения обеспечивает значительные улучшения в генерации кода и возможностях агентов.