DeepSeek V3.1 Terminus : des agents multilingues prêts pour la production
DeepSeek V3.1 Terminus : les nouveautés pour les builders
Coup d'œil sur le lancement
DeepSeek V3.1 Terminus est arrivé le 22 septembre 2025 comme un perfectionnement ciblé de la version du 21 août. DeepSeek a déjà migré l'application, le site web et l'API vers Terminus, si bien que les agents en production profitent des améliorations sans travail supplémentaire.
Progrès multilingues
Cette itération met l'accent sur la qualité multilingue. Terminus conserve la fenêtre de contexte de 128K tokens et introduit des ajustements de décodage qui limitent les hallucinations lorsque les conversations basculent d'une langue à l'autre. Pour les équipes qui alternent entre cahiers des charges en anglais et implémentations locales, les prompts demandent moins de réécriture.
Fiabilité des agents
Les chiffres confirment la progression : Terminus atteint 57,8 sur SWE-bench Multilingual (contre 54,5 auparavant) et 62,9 sur MixInstruct 2/8-shot (contre 59,2). Le modèle signe également 68,4 sur SWE Verified et 91,2 sur HumanEval, ce qui soutient des chaînes d'agents plus longues et plus exigeantes.
Un stack prêt pour la production
Terminus conserve l'architecture Mixture-of-Experts de 685B paramètres, avec environ 37B actifs par token. Les modes d'inférence Swift (rapide) et Think (profond) restent disponibles, tout comme les outils intégrés de gestion des données et des vecteurs qui unifient retrieval et fine-tuning. L'adoption se fait donc sans refonte des pipelines existants.
Déploiement et accès
DeepSeek publie des checkpoints Terminus en BF16, FP8 (E4M3) et FP32 sous licence MIT sur Hugging Face, avec des miroirs sur ModelScope pour les charges continentales. Les équipes peuvent ainsi choisir la précision qui correspond le mieux à leurs contraintes de coût et à leurs accélérateurs.
Pistes d'action
- Réévaluer les budgets API à la lumière des tarifs Terminus, Swift et Think actifs depuis le 5 septembre 2025.
- Rejouer les tests de QA multilingues et de suivi d'instructions afin de valider le comportement avec les nouveaux réglages de décodage.
- Télécharger les derniers checkpoints Terminus pour préparer des parcours de fine-tuning ou d'évaluation avant un déploiement étendu.