Model Update
6 minutes Min. Lesezeit
DeepSeek Insights Team

DeepSeek V3.1 Terminus: Mehrsprachige Agents für den Produktivbetrieb

DeepSeek V3.1 Terminus: Das Update für Builder

Release im Überblick

DeepSeek V3.1 Terminus ist am 22. September 2025 erschienen und verfeinert das Release vom 21. August gezielt weiter. DeepSeek hat App, Web und API bereits auf Terminus umgestellt, sodass bestehende Agents die Verbesserungen ohne zusätzlichen Migrationsaufwand übernehmen.

Mehrsprachige Verbesserungen

Der Fokus liegt auf stärkerer Sprachabstimmung. Terminus behält das Kontextfenster mit 128K Tokens bei und bringt Decoder-Anpassungen, die Halluzinationen in mehrsprachigen Q&A-Szenarien reduzieren. Teams, die zwischen englischen Anforderungen und lokaler Umsetzung wechseln, sparen dadurch Zeit beim Nachjustieren von Prompts.

Agent-Performance

Die Benchmarks bestätigen den Sprung: Terminus erreicht 57,8 Punkte auf SWE-bench Multilingual (zuvor 54,5) und 62,9 auf MixInstruct 2/8-shot (zuvor 59,2). Zusätzlich liegen SWE Verified bei 68,4 und HumanEval Pass@1 bei 91,2. Damit eignet sich das Modell besser für längere Agent-Ketten.

Feature-Stack

Die Architektur bleibt ein Mixture-of-Experts-Design mit 685B Parametern und rund 37B aktiven Parametern pro Token. Builder nutzen weiterhin die Modi Swift (schnell) und Think (tief), außerdem integrierte Daten- und Vektormanagement-Werkzeuge, sodass Retrieval und Fine-Tuning auf derselben Plattform laufen. Eine Umstrukturierung bestehender Pipelines ist nicht nötig.

Bereitstellung und Zugriff

DeepSeek veröffentlicht Terminus-Checkpoints in BF16, FP8 (E4M3) und FP32 unter MIT-Lizenz auf Hugging Face, mit Spiegeln auf ModelScope für Workloads in Festland-China. So lassen sich unterschiedliche Beschleuniger-Setups nutzen und Präzision sowie Kosten flexibel ausbalancieren.

Nächste Schritte

  • API-Budgets im Hinblick auf die seit dem 5. September 2025 gültigen Preise für Terminus, Swift und Think neu bewerten.
  • Mehrsprachige QA- und Instruktions-Tests erneut ausführen, um das Verhalten mit den neuen Decoder-Defaults zu validieren.
  • Die aktuellen Terminus-Checkpoints herunterladen und Feinabstimmungen oder Evaluierungen vorbereiten.

Verwandte Artikel

Moonshot AI hat Kimi K2.6 offiziell ausgeliefert und den Code-Preview-Zweig zu einem allgemein verfügbaren Modell weiterentwickelt, das für 12-stündige autonome Coding-Sitzungen, 300-Agenten-Schwärme und Full-Stack-Generierung ausgelegt ist. Was sich geändert hat, was das bedeutet und wie man es einsetzt.
Die interessante Frage bei Kimi K2.6 ist nicht, was es leistet — sondern für welche Art von Modell es offensichtlich gebaut wird. Betrachtet man die 12-Stunden-Läufe, 300-Agenten-Schwärme und den Kontext-Kompressor als tragende Infrastruktur, wird die Form von K3 sichtbar.
Am 13. April 2026 bestätigte Moonshot AI offiziell, dass Kimi K2.6 Code Preview in die Beta-Testphase eingetreten ist. Dieses auf einer MoE-Architektur mit einer Billion Parametern basierende Modell der nächsten Generation bietet erhebliche Verbesserungen bei der Codegenerierung und den Agentenfähigkeiten.