DeepSeek V3.1 Terminus: agentes multilíngues prontos para produção
DeepSeek V3.1 Terminus: novidades para builders
Visão geral do lançamento
DeepSeek V3.1 Terminus foi lançado em 22 de setembro de 2025 como um refinamento direcionado da versão de 21 de agosto. DeepSeek já atualizou o aplicativo, a web e a API para Terminus, portanto os agentes existentes recebem os ganhos sem migrações extras.
Avanços multilíngues
Esta versão prioriza a qualidade multilíngue. Terminus mantém a janela de contexto de 128K tokens e incorpora ajustes de decodificação que reduzem alucinações quando o diálogo muda de idioma. Para equipes que atendem mercados globais, isso significa menos tempo reescrevendo prompts para cada localidade.
Desempenho dos agentes
Os benchmarks confirmam o avanço: Terminus marca 57,8 no SWE-bench Multilingual (antes 54,5) e 62,9 no MixInstruct 2/8-shot (antes 59,2). O modelo também atinge 68,4 no SWE Verified e 91,2 no HumanEval, sinalizando uma capacidade de raciocínio mais ampla para cadeias de agentes extensas.
Conjunto de recursos
A arquitetura segue sendo um Mixture-of-Experts de 685B parâmetros, com cerca de 37B ativos por token. Os builders continuam a contar com os modos de inferência Swift (rápido) e Think (profundo), além das ferramentas integradas de gestão de dados e vetores que unificam retrieval e fine-tuning. Assim, é possível adotar Terminus sem reconstruir pipelines existentes.
Implantação e acesso
DeepSeek publica checkpoints de Terminus em BF16, FP8 (E4M3) e FP32 sob licença MIT no Hugging Face, com espelhos no ModelScope para cargas na China continental. Isso facilita ajustar precisão e custos aos aceleradores disponíveis.
Próximos passos
- Reavaliar os orçamentos de API considerando os preços de Terminus, Swift e Think vigentes desde 5 de setembro de 2025.
- Reexecutar testes de QA multilíngue e de aderência a instruções para validar o comportamento com as novas configurações de decodificação.
- Baixar os checkpoints mais recentes de Terminus e preparar pipelines de fine-tuning ou avaliação antes de uma adoção em larga escala.