Model Comparison
8 minutes min de lectura
Equipo de Análisis IA

DeepSeek V3.1 Terminus vs Kimi K2-0905: Cómo elegir el motor de agentes para el cuarto trimestre de 2025

Calendario de lanzamientos e intención

DeepSeek liberó el parche Terminus el 22 de septiembre de 2025, afinando la alineación multilingüe y actualizando los agentes de código y búsqueda sin exigir migraciones para web, app o API. Moonshot AI lanzó Kimi K2-0905 el 5 de septiembre de 2025 como actualización de septiembre, orientada a coding agentico, mejoras de front-end y una ventana de contexto más amplia.

Arquitectura, contexto y modalidad de servicio

Ambos modelos siguen el enfoque MoE, pero priorizan elementos distintos:

DimensiónDeepSeek V3.1 TerminusKimi K2-0905
Parámetros totales / activos685B totales, ~37B activos por token1T total, 32B activos por llamada
Expertos por capa9 expertos8 de 384 expertos
Ventana de contexto128K tokens256K tokens
Modos por defectoSwift (baja latencia) y Think (profundidad)Perfil único optimizado para coding con herramientas
DistribuciónPesos MIT vía Hugging Face y ModelScopePesos con licencia MIT + APIs gestionadas

Terminus conserva Swift/Think y los 128K tokens para equilibrar velocidad y razonamiento. K2-0905 duplica el contexto a 256K y mantiene el stack 1T/32B, ideal para revisar repositorios completos o briefs extensos.

Benchmarks y fiabilidad de agentes

Frente al build de agosto, Terminus mejora en todas las pruebas centradas en agentes:

Benchmark (configuración de agente)DeepSeek V3.1 (ago 2025)DeepSeek V3.1 TerminusKimi K2-0905
SWE-bench Multilingual54,557,855,9
SWE Verified66,068,469,2
Terminal-bench31,336,744,5
BrowseComp30,038,5n/a
LiveCodeBench56,460,0 (más éxitos)61,0

Los saltos confirman que Terminus corrigió la mezcla de idiomas y reforzó las plantillas de agentes. K2-0905 sigue liderando Terminal-bench y SWE Verified, acorde con su enfoque de software de extremo a extremo.

Precios (USD por millón de tokens, septiembre 2025)

Ruta de accesoInput (cache hit)Input (cache miss)Output
API DeepSeek (desde 5 sep)$0,07$0,27$1,10
Novita serverless K2-0905$0,60$2,50
Groq hospedando K2-0905$1,00$3,00
Pasarela LangDB K2-0905$0,49$1,99

DeepSeek unificó tarifas para Terminus, Swift y Think tras el ajuste del 5 de septiembre de 2025. Los precios de Kimi dependen del distribuidor: Novita ($0,60/$2,50), Groq ($1,00/$3,00) y LangDB ($0,49/$1,99).

Ecosistema y despliegue

  • Autoalojamiento: Terminus entrega pesos BF16/FP8/FP32 bajo MIT, útil para VPCs o entornos con requisitos regulatorios.
  • Servicios gestionados: K2-0905 vía Groq, Novita o Kimi Cloud ofrece 60–200+ tokens/s y soporte integrado para reducir la carga operativa.
  • Fidelidad multilingüe: El parche Terminus aborda la mezcla inglés-chino, reduciendo limpieza manual.
  • Calidad front-end: Moonshot subraya mejoras estéticas y estructurales en componentes React/Vue generados por K2-0905.

Lista rápida de decisión

  1. Caso principal: Terminus para calidad multilingüe y despliegue controlado; K2-0905 cuando 256K tokens o la automatización terminal sean críticos.
  2. Orquestación híbrida: Usa Terminus para planificar (Swift/Think) y Kimi para ejecutar bucles de coding extensos.
  3. Control de costes: Compara la tarifa fija de DeepSeek con las opciones de Kimi (Novita, Groq, LangDB); la brecha puede exceder 4x.
  4. Gobernanza: Terminus cabe íntegramente en tu infraestructura; Kimi gestionado simplifica operaciones pero requiere revisar jurisdicción y datos.

Con una visión clara de tiempos, arquitectura, métricas y coste, es posible colocar deepseek v3.1 terminus y Kimi K2-0905 en los tramos de agentes que ofrecerán mayor impacto en el cuarto trimestre de 2025.

Artículos relacionados

Moonshot AI ha lanzado oficialmente Kimi K2.6, llevando la rama Code Preview a un modelo de disponibilidad general diseñado para sesiones de codificación autónoma de 12 horas, enjambres de 300 agentes y generación full-stack. Esto es lo que cambió, lo que significa y cómo aprovecharlo.
La pregunta interesante sobre Kimi K2.6 no es qué hace, sino qué tipo de modelo está siendo claramente construido para albergar. Trata las ejecuciones de 12 horas, los enjambres de 300 agentes y el compresor de contexto como infraestructura de carga, y la forma de K3 se vuelve visible.
El 13 de abril de 2026, Moonshot AI confirmó oficialmente que Kimi K2.6 Code Preview ha entrado en fase beta. Construido sobre una arquitectura MoE de un billón de parámetros, este modelo de próxima generación ofrece mejoras significativas en generación de código y capacidades de agentes.