Model Comparison
8 minutes min de lecture
Équipe Analyse IA

DeepSeek V3.1 Terminus vs Kimi K2-0905 : choisir le bon cœur d’agent pour fin 2025

Chronologie et intention

DeepSeek a diffusé le patch Terminus le 22 septembre 2025, renforçant l’alignement multilingue et actualisant les templates d’agents sans interrompre ses interfaces web, mobiles ou API. Moonshot AI a publié Kimi K2-0905 le 5 septembre 2025 comme mise à jour de septembre, dédiée au coding agentique, à la qualité front-end et à l’extension de contexte.

Architecture, contexte et distribution

Les deux modèles reposent sur MoE, mais leurs choix diffèrent :

DimensionDeepSeek V3.1 TerminusKimi K2-0905
Paramètres totaux / actifs685B au total, ~37B actifs par token1T au total, 32B actifs par requête
Experts par couche9 experts8 sur 384 experts
Fenêtre de contexte128K tokens256K tokens
Modes par défautSwift (latence) & Think (raisonnement)Profil unique optimisé pour le coding outillé
DistributionPoids MIT via Hugging Face & ModelScopePoids sous licence MIT + APIs gérées

Terminus conserve Swift/Think et 128K tokens pour équilibrer débit et profondeur. K2-0905 conserve le stack 1T/32B et double le contexte à 256K, pratique pour explorer un dépôt entier ou un brief long.

Benchmarks et fiabilité des agents

Par rapport à août, Terminus progresse sur toutes les suites orientées agents :

Benchmark (configuration agent)DeepSeek V3.1 (août 2025)DeepSeek V3.1 TerminusKimi K2-0905
SWE-bench Multilingual54,557,855,9
SWE Verified66,068,469,2
Terminal-bench31,336,744,5
BrowseComp30,038,5n/a
LiveCodeBench56,460,0 (plus de succès)61,0

Ces gains montrent que Terminus corrige le mélange de langues et consolide les agents. K2-0905 garde une avance sur Terminal-bench et SWE Verified, en phase avec son positionnement software complet.

Tarifs (USD par million de tokens, septembre 2025)

CanalInput (cache hit)Input (cache miss)Output
API DeepSeek (après 5 sept.)$0,07$0,27$1,10
Novita serverless K2-0905$0,60$2,50
Groq hébergeant K2-0905$1,00$3,00
Passerelle LangDB K2-0905$0,49$1,99

DeepSeek a unifié les tarifs de Terminus, Swift et Think depuis le 5 septembre 2025. Les tarifs de Kimi dépendent du distributeur : Novita ($0,60/$2,50), Groq ($1,00/$3,00) et LangDB ($0,49/$1,99).

Écosystème et déploiement

  • Auto-hébergement : Terminus fournit des poids BF16/FP8/FP32 sous MIT, adaptés aux environnements VPC ou on-prem exigeant contrôle et conformité.
  • Services managés : K2-0905 via Groq, Novita ou Kimi Cloud délivre 60–200+ tokens/s avec support intégré, limitant l’effort opérationnel.
  • Robustesse multilingue : Terminus cible la cohabitation anglais-chinois dans les prompts d’agents, réduisant le nettoyage manuel.
  • Qualité front-end : Moonshot met en avant des sorties React/Vue plus propres et esthétiques.

Checklist décisionnelle

  1. Cas principal : privilégier Terminus pour la qualité multilingue et l’auto-hébergement ; K2-0905 pour 256K tokens ou pour la productivité terminale.
  2. Orchestration hybride : utiliser Terminus pour planifier (Swift/Think) et Kimi pour exécuter les boucles de coding longues.
  3. Contrôle des coûts : comparer le forfait DeepSeek aux offres Novita/Groq/LangDB – l’écart peut dépasser un facteur 4.
  4. Gouvernance : Terminus reste intégralement sur votre infra ; Kimi managé simplifie l’exploitation mais impose de valider les contraintes réglementaires.

En combinant chronologie, architecture, benchmarks et coûts, les équipes peuvent positionner deepseek v3.1 terminus et Kimi K2-0905 sur les niveaux d’agents les plus pertinents pour le quatrième trimestre 2025.

Articles associés

Moonshot AI a officiellement lancé Kimi K2.6, faisant passer la branche Code Preview au statut de modèle en disponibilité générale, conçu pour des sessions de codage autonome de 12 heures, des essaims de 300 agents et la génération full-stack. Ce qui a changé, ce que cela signifie et comment le mettre en œuvre.
La question intéressante concernant Kimi K2.6 n'est pas ce qu'il fait — c'est pour quel type de modèle il est manifestement conçu. Considérez les exécutions de 12 heures, les essaims de 300 agents et le compresseur de contexte comme une infrastructure porteuse, et la forme de K3 devient visible.
Le 13 avril 2026, Moonshot AI a officiellement confirmé que Kimi K2.6 Code Preview est entré en phase bêta. Construit sur une architecture MoE d'un billion de paramètres, ce modèle de nouvelle génération offre des améliorations significatives en génération de code et en capacités d'agents.