DeepSeek V3.1 Terminus vs Kimi K2-0905 : choisir le bon cœur d’agent pour fin 2025
Chronologie et intention
DeepSeek a diffusé le patch Terminus le 22 septembre 2025, renforçant l’alignement multilingue et actualisant les templates d’agents sans interrompre ses interfaces web, mobiles ou API. Moonshot AI a publié Kimi K2-0905 le 5 septembre 2025 comme mise à jour de septembre, dédiée au coding agentique, à la qualité front-end et à l’extension de contexte.
Architecture, contexte et distribution
Les deux modèles reposent sur MoE, mais leurs choix diffèrent :
| Dimension | DeepSeek V3.1 Terminus | Kimi K2-0905 |
|---|---|---|
| Paramètres totaux / actifs | 685B au total, ~37B actifs par token | 1T au total, 32B actifs par requête |
| Experts par couche | 9 experts | 8 sur 384 experts |
| Fenêtre de contexte | 128K tokens | 256K tokens |
| Modes par défaut | Swift (latence) & Think (raisonnement) | Profil unique optimisé pour le coding outillé |
| Distribution | Poids MIT via Hugging Face & ModelScope | Poids sous licence MIT + APIs gérées |
Terminus conserve Swift/Think et 128K tokens pour équilibrer débit et profondeur. K2-0905 conserve le stack 1T/32B et double le contexte à 256K, pratique pour explorer un dépôt entier ou un brief long.
Benchmarks et fiabilité des agents
Par rapport à août, Terminus progresse sur toutes les suites orientées agents :
| Benchmark (configuration agent) | DeepSeek V3.1 (août 2025) | DeepSeek V3.1 Terminus | Kimi K2-0905 |
|---|---|---|---|
| SWE-bench Multilingual | 54,5 | 57,8 | 55,9 |
| SWE Verified | 66,0 | 68,4 | 69,2 |
| Terminal-bench | 31,3 | 36,7 | 44,5 |
| BrowseComp | 30,0 | 38,5 | n/a |
| LiveCodeBench | 56,4 | 60,0 (plus de succès) | 61,0 |
Ces gains montrent que Terminus corrige le mélange de langues et consolide les agents. K2-0905 garde une avance sur Terminal-bench et SWE Verified, en phase avec son positionnement software complet.
Tarifs (USD par million de tokens, septembre 2025)
| Canal | Input (cache hit) | Input (cache miss) | Output |
|---|---|---|---|
| API DeepSeek (après 5 sept.) | $0,07 | $0,27 | $1,10 |
| Novita serverless K2-0905 | — | $0,60 | $2,50 |
| Groq hébergeant K2-0905 | — | $1,00 | $3,00 |
| Passerelle LangDB K2-0905 | — | $0,49 | $1,99 |
DeepSeek a unifié les tarifs de Terminus, Swift et Think depuis le 5 septembre 2025. Les tarifs de Kimi dépendent du distributeur : Novita ($0,60/$2,50), Groq ($1,00/$3,00) et LangDB ($0,49/$1,99).
Écosystème et déploiement
- Auto-hébergement : Terminus fournit des poids BF16/FP8/FP32 sous MIT, adaptés aux environnements VPC ou on-prem exigeant contrôle et conformité.
- Services managés : K2-0905 via Groq, Novita ou Kimi Cloud délivre 60–200+ tokens/s avec support intégré, limitant l’effort opérationnel.
- Robustesse multilingue : Terminus cible la cohabitation anglais-chinois dans les prompts d’agents, réduisant le nettoyage manuel.
- Qualité front-end : Moonshot met en avant des sorties React/Vue plus propres et esthétiques.
Checklist décisionnelle
- Cas principal : privilégier Terminus pour la qualité multilingue et l’auto-hébergement ; K2-0905 pour 256K tokens ou pour la productivité terminale.
- Orchestration hybride : utiliser Terminus pour planifier (Swift/Think) et Kimi pour exécuter les boucles de coding longues.
- Contrôle des coûts : comparer le forfait DeepSeek aux offres Novita/Groq/LangDB – l’écart peut dépasser un facteur 4.
- Gouvernance : Terminus reste intégralement sur votre infra ; Kimi managé simplifie l’exploitation mais impose de valider les contraintes réglementaires.
En combinant chronologie, architecture, benchmarks et coûts, les équipes peuvent positionner deepseek v3.1 terminus et Kimi K2-0905 sur les niveaux d’agents les plus pertinents pour le quatrième trimestre 2025.