Cronograma e propósito

DeepSeek disponibilizou o patch Terminus em 22 de setembro de 2025, afinando a saída multilingue e atualizando templates de agentes sem interromper web, app ou API. Moonshot AI lançou Kimi K2-0905 em 5 de setembro de 2025 como atualização de setembro, voltada para coding agentico, qualidade front-end e expansão de contexto.

Arquitetura, contexto e distribuição

Ambos utilizam MoE, mas com prioridades distintas:

Dimensão	DeepSeek V3.1 Terminus	Kimi K2-0905
Parâmetros totais / ativos	685B / ~37B	1T / 32B
Especialistas por camada	9	8 de 384
Janela de contexto	128K tokens	256K tokens
Modos padrão	Swift (baixa latência) & Think (profundo)	Perfil único otimizado para coding com ferramentas
Distribuição	Pesos MIT via Hugging Face & ModelScope	Pesos derivados MIT + APIs gerenciadas

Terminus mantém Swift/Think e 128K tokens para equilibrar throughput e raciocínio. K2-0905 sustenta o stack 1T/32B e dobra o contexto para 256K, útil para repositórios completos e briefs longos.

Benchmarks e estabilidade dos agentes

Comparado ao build de agosto, Terminus melhora em todas as suítes orientadas a agentes:

Benchmark (configuração)	DeepSeek V3.1 (ago 2025)	DeepSeek V3.1 Terminus	Kimi K2-0905
SWE-bench Multilingual	54,5	57,8	55,9
SWE Verified	66,0	68,4	69,2
Terminal-bench	31,3	36,7	44,5
BrowseComp	30,0	38,5	n/a
LiveCodeBench	56,4	60,0 (maior taxa de sucesso)	61,0

Esses ganhos mostram que Terminus corrigiu a mistura linguística e reforçou os templates agent. K2-0905 mantém vantagem em Terminal-bench e SWE Verified, refletindo a proposta full-stack.

Snapshot de preços (USD por milhão de tokens, setembro 2025)

Canal	Input (cache hit)	Input (cache miss)	Output
API DeepSeek (após 5 set.)	$0,07	$0,27	$1,10
Novita serverless K2-0905	—	$0,60	$2,50
Groq hospedando K2-0905	—	$1,00	$3,00
Gateway LangDB K2-0905	—	$0,49	$1,99

DeepSeek unificou as tarifas de Terminus, Swift e Think após 5 de setembro de 2025. Já os preços de Kimi variam conforme o distribuidor: Novita ($0,60/$2,50), Groq ($1,00/$3,00) e LangDB ($0,49/$1,99).

Notas sobre ecossistema e deployment

Self-hosting: Terminus fornece pesos BF16/FP8/FP32 sob MIT, ideal para VPCs ou ambientes on-prem regulados.
Managed acceleration: K2-0905 via Groq, Novita ou Kimi Cloud entrega 60–200+ tokens/s com suporte operacional embutido.
Fidelidade multilingue: Terminus reduz a mistura inglês-chinês em prompts de agentes, poupando retrabalho.
Qualidade front-end: Moonshot destaca saídas React/Vue mais limpas e estéticas geradas por K2-0905.

Checklist para decisão

Caso principal: prefira Terminus se a qualidade multilingue e o controle de implantação forem críticos; use K2-0905 quando 256K tokens ou automação terminal tiverem prioridade.
Orquestração híbrida: planeje com Terminus (Swift/Think) e execute longos ciclos de coding com Kimi.
Gestão de custos: compare a tarifa fixa de DeepSeek com Novita/Groq/LangDB – a diferença pode ultrapassar 4x.
Governança: Terminus roda integralmente na sua infraestrutura; Kimi gerenciado simplifica operações, mas exige atenção a requisitos regulatórios.

Com visão clara de cronograma, arquitetura, métricas e custos, você posiciona deepseek v3.1 terminus e Kimi K2-0905 onde gerarão mais valor no quarto trimestre de 2025.

DeepSeek V3.1 Terminus vs Kimi K2-0905: qual motor de agentes escolher no 4º trimestre de 2025

Cronograma e propósito

Arquitetura, contexto e distribuição

Benchmarks e estabilidade dos agentes

Snapshot de preços (USD por milhão de tokens, setembro 2025)

Notas sobre ecossistema e deployment

Checklist para decisão

Popular Kimi K2 paths

Kimi K3

Kimi K2.7 Code

Kimi Code

Kimi K3 Status

Artigos relacionados