Model Update
6 minutes min de leitura
DeepSeek Insights Team

DeepSeek V3.1 Terminus: agentes multilíngues prontos para produção

DeepSeek V3.1 Terminus: novidades para builders

Visão geral do lançamento

DeepSeek V3.1 Terminus foi lançado em 22 de setembro de 2025 como um refinamento direcionado da versão de 21 de agosto. DeepSeek já atualizou o aplicativo, a web e a API para Terminus, portanto os agentes existentes recebem os ganhos sem migrações extras.

Avanços multilíngues

Esta versão prioriza a qualidade multilíngue. Terminus mantém a janela de contexto de 128K tokens e incorpora ajustes de decodificação que reduzem alucinações quando o diálogo muda de idioma. Para equipes que atendem mercados globais, isso significa menos tempo reescrevendo prompts para cada localidade.

Desempenho dos agentes

Os benchmarks confirmam o avanço: Terminus marca 57,8 no SWE-bench Multilingual (antes 54,5) e 62,9 no MixInstruct 2/8-shot (antes 59,2). O modelo também atinge 68,4 no SWE Verified e 91,2 no HumanEval, sinalizando uma capacidade de raciocínio mais ampla para cadeias de agentes extensas.

Conjunto de recursos

A arquitetura segue sendo um Mixture-of-Experts de 685B parâmetros, com cerca de 37B ativos por token. Os builders continuam a contar com os modos de inferência Swift (rápido) e Think (profundo), além das ferramentas integradas de gestão de dados e vetores que unificam retrieval e fine-tuning. Assim, é possível adotar Terminus sem reconstruir pipelines existentes.

Implantação e acesso

DeepSeek publica checkpoints de Terminus em BF16, FP8 (E4M3) e FP32 sob licença MIT no Hugging Face, com espelhos no ModelScope para cargas na China continental. Isso facilita ajustar precisão e custos aos aceleradores disponíveis.

Próximos passos

  • Reavaliar os orçamentos de API considerando os preços de Terminus, Swift e Think vigentes desde 5 de setembro de 2025.
  • Reexecutar testes de QA multilíngue e de aderência a instruções para validar o comportamento com as novas configurações de decodificação.
  • Baixar os checkpoints mais recentes de Terminus e preparar pipelines de fine-tuning ou avaliação antes de uma adoção em larga escala.

Artigos relacionados

A Moonshot AI lançou oficialmente o Kimi K2.6, promovendo o branch Code Preview a um modelo de disponibilidade geral construído para sessões de codificação autônoma de 12 horas, enxames de 300 agentes e geração full-stack. O que mudou, o que significa e como colocar isso em prática.
A pergunta interessante sobre o Kimi K2.6 não é o que ele faz — é que tipo de modelo ele está claramente sendo construído para hospedar. Trate as execuções de 12 horas, os enxames de 300 agentes e o compressor de contexto como infraestrutura de suporte de carga, e a forma do K3 torna-se visível.
Em 13 de abril de 2026, a Moonshot AI confirmou oficialmente que o Kimi K2.6 Code Preview entrou em fase beta. Construído sobre uma arquitetura MoE de um trilhão de parâmetros, este modelo de próxima geração oferece melhorias significativas na geração de código e capacidades de agentes.