DeepSeek V3.1 Terminus vs Kimi K2-0905: выбор ядра агента к четвёртому кварталу 2025
Сроки выпусков и позиционирование
DeepSeek выпустила патч Terminus 22 сентября 2025 года, улучшив многоязычную согласованность и обновив шаблоны агентов без прерывания веб-, мобильного и API-доступа. Moonshot AI представила Kimi K2-0905 5 сентября 2025 года как обновление сентября с акцентом на агентное кодирование, фронтенд и удвоенную длину контекста.
Архитектура, контекст и способы доступа
Обе модели используют MoE, но делают разные акценты:
| Параметр | DeepSeek V3.1 Terminus | Kimi K2-0905 |
|---|---|---|
| Всего / активно | 685B / ~37B | 1T / 32B |
| Экспертов на слой | 9 | 8 из 384 |
| Окно контекста | 128K tokens | 256K tokens |
| Режимы по умолчанию | Swift (низкая задержка) и Think (глубокий вывод) | Один профиль, заточенный под инструментальное кодирование |
| Распространение | Весы под MIT (Hugging Face, ModelScope) | Весы по MIT-производной + управляемые API |
Terminus сохраняет дуэт Swift/Think и окно 128K, балансируя скорость и глубину. K2-0905 оставляет 1T/32B и расширяет окно до 256K, что удобно для целых репозиториев и больших технических заданий.
Бенчмарки и стабильность агентов
По сравнению с августом Terminus растёт во всех агентных тестах:
| Бенчмарк (конфигурация агента) | DeepSeek V3.1 (авг 2025) | DeepSeek V3.1 Terminus | Kimi K2-0905 |
|---|---|---|---|
| SWE-bench Multilingual | 54,5 | 57,8 | 55,9 |
| SWE Verified | 66,0 | 68,4 | 69,2 |
| Terminal-bench | 31,3 | 36,7 | 44,5 |
| BrowseComp | 30,0 | 38,5 | н/д |
| LiveCodeBench | 56,4 | 60,0 (рост успешности) | 61,0 |
Это подтверждает устранение смешения языков и обновление шаблонов агентов в Terminus. K2-0905 сохраняет лидерство в Terminal-bench и SWE Verified, что соответствует стратегии «full-stack» разработки.
Цены (USD за 1 млн токенов, сентябрь 2025)
| Канал | Ввод (cache hit) | Ввод (cache miss) | Вывод |
|---|---|---|---|
| DeepSeek API (после 5 сентября) | $0,07 | $0,27 | $1,10 |
| Novita serverless K2-0905 | — | $0,60 | $2,50 |
| Groq hosted K2-0905 | — | $1,00 | $3,00 |
| LangDB gateway K2-0905 | — | $0,49 | $1,99 |
DeepSeek унифицировала цены для Terminus, Swift и Think после 5 сентября 2025 года. Стоимость Kimi зависит от дистрибьютора: Novita ($0,60/$2,50), Groq ($1,00/$3,00) и LangDB ($0,49/$1,99).
Экосистема и развёртывание
- Self-hosting: Terminus предлагает веса BF16/FP8/FP32 под MIT для развёртывания в VPC или on-prem средах с жёсткими требованиями.
- Управляемое ускорение: K2-0905 через Groq, Novita или Kimi Cloud обеспечивает 60–200+ tokens/s и снижает операционную нагрузку.
- Мультилингвальная устойчивость: Terminus сокращает смешение английского и китайского в промптах, уменьшая ручную правку.
- Качество фронтенда: Moonshot подчёркивает улучшенные React/Vue-компоненты из K2-0905.
Чек-лист выбора
- Основная задача: Terminus — если важна многоязычная чистота и контроль над развёртыванием; K2-0905 — если нужны 256K контекста или максимум в терминальной автоматизации.
- Оркестрация моделей: Задания по планированию доверяйте Terminus (Swift/Think), долгие циклы кодинга — Kimi.
- Контроль стоимости: Сравните фиксированную ставку DeepSeek с прайсингом Novita/Groq/LangDB — разброс может превышать 4x.
- Говернанс: Terminus полностью размещается в вашей инфраструктуре; управляемый Kimi упрощает эксплуатацию, но требует проверки регуляторных ограничений.
Учитывая таймлайн, архитектуру, метрики и цены, можно точно разместить deepseek v3.1 terminus и Kimi K2-0905 в тех слоях агентного стека, где они принесут максимум пользы к концу 2025 года.