Model Update
6 minutes min de lecture
DeepSeek Insights Team

DeepSeek V3.1 Terminus : des agents multilingues prêts pour la production

DeepSeek V3.1 Terminus : les nouveautés pour les builders

Coup d'œil sur le lancement

DeepSeek V3.1 Terminus est arrivé le 22 septembre 2025 comme un perfectionnement ciblé de la version du 21 août. DeepSeek a déjà migré l'application, le site web et l'API vers Terminus, si bien que les agents en production profitent des améliorations sans travail supplémentaire.

Progrès multilingues

Cette itération met l'accent sur la qualité multilingue. Terminus conserve la fenêtre de contexte de 128K tokens et introduit des ajustements de décodage qui limitent les hallucinations lorsque les conversations basculent d'une langue à l'autre. Pour les équipes qui alternent entre cahiers des charges en anglais et implémentations locales, les prompts demandent moins de réécriture.

Fiabilité des agents

Les chiffres confirment la progression : Terminus atteint 57,8 sur SWE-bench Multilingual (contre 54,5 auparavant) et 62,9 sur MixInstruct 2/8-shot (contre 59,2). Le modèle signe également 68,4 sur SWE Verified et 91,2 sur HumanEval, ce qui soutient des chaînes d'agents plus longues et plus exigeantes.

Un stack prêt pour la production

Terminus conserve l'architecture Mixture-of-Experts de 685B paramètres, avec environ 37B actifs par token. Les modes d'inférence Swift (rapide) et Think (profond) restent disponibles, tout comme les outils intégrés de gestion des données et des vecteurs qui unifient retrieval et fine-tuning. L'adoption se fait donc sans refonte des pipelines existants.

Déploiement et accès

DeepSeek publie des checkpoints Terminus en BF16, FP8 (E4M3) et FP32 sous licence MIT sur Hugging Face, avec des miroirs sur ModelScope pour les charges continentales. Les équipes peuvent ainsi choisir la précision qui correspond le mieux à leurs contraintes de coût et à leurs accélérateurs.

Pistes d'action

  • Réévaluer les budgets API à la lumière des tarifs Terminus, Swift et Think actifs depuis le 5 septembre 2025.
  • Rejouer les tests de QA multilingues et de suivi d'instructions afin de valider le comportement avec les nouveaux réglages de décodage.
  • Télécharger les derniers checkpoints Terminus pour préparer des parcours de fine-tuning ou d'évaluation avant un déploiement étendu.

Articles associés

Moonshot AI a officiellement lancé Kimi K2.6, faisant passer la branche Code Preview au statut de modèle en disponibilité générale, conçu pour des sessions de codage autonome de 12 heures, des essaims de 300 agents et la génération full-stack. Ce qui a changé, ce que cela signifie et comment le mettre en œuvre.
La question intéressante concernant Kimi K2.6 n'est pas ce qu'il fait — c'est pour quel type de modèle il est manifestement conçu. Considérez les exécutions de 12 heures, les essaims de 300 agents et le compresseur de contexte comme une infrastructure porteuse, et la forme de K3 devient visible.
Le 13 avril 2026, Moonshot AI a officiellement confirmé que Kimi K2.6 Code Preview est entré en phase bêta. Construit sur une architecture MoE d'un billion de paramètres, ce modèle de nouvelle génération offre des améliorations significatives en génération de code et en capacités d'agents.