DeepSeek V3.1 Terminus: Mehrsprachige Agents für den Produktivbetrieb
DeepSeek V3.1 Terminus: Das Update für Builder
Release im Überblick
DeepSeek V3.1 Terminus ist am 22. September 2025 erschienen und verfeinert das Release vom 21. August gezielt weiter. DeepSeek hat App, Web und API bereits auf Terminus umgestellt, sodass bestehende Agents die Verbesserungen ohne zusätzlichen Migrationsaufwand übernehmen.
Mehrsprachige Verbesserungen
Der Fokus liegt auf stärkerer Sprachabstimmung. Terminus behält das Kontextfenster mit 128K Tokens bei und bringt Decoder-Anpassungen, die Halluzinationen in mehrsprachigen Q&A-Szenarien reduzieren. Teams, die zwischen englischen Anforderungen und lokaler Umsetzung wechseln, sparen dadurch Zeit beim Nachjustieren von Prompts.
Agent-Performance
Die Benchmarks bestätigen den Sprung: Terminus erreicht 57,8 Punkte auf SWE-bench Multilingual (zuvor 54,5) und 62,9 auf MixInstruct 2/8-shot (zuvor 59,2). Zusätzlich liegen SWE Verified bei 68,4 und HumanEval Pass@1 bei 91,2. Damit eignet sich das Modell besser für längere Agent-Ketten.
Feature-Stack
Die Architektur bleibt ein Mixture-of-Experts-Design mit 685B Parametern und rund 37B aktiven Parametern pro Token. Builder nutzen weiterhin die Modi Swift (schnell) und Think (tief), außerdem integrierte Daten- und Vektormanagement-Werkzeuge, sodass Retrieval und Fine-Tuning auf derselben Plattform laufen. Eine Umstrukturierung bestehender Pipelines ist nicht nötig.
Bereitstellung und Zugriff
DeepSeek veröffentlicht Terminus-Checkpoints in BF16, FP8 (E4M3) und FP32 unter MIT-Lizenz auf Hugging Face, mit Spiegeln auf ModelScope für Workloads in Festland-China. So lassen sich unterschiedliche Beschleuniger-Setups nutzen und Präzision sowie Kosten flexibel ausbalancieren.
Nächste Schritte
- API-Budgets im Hinblick auf die seit dem 5. September 2025 gültigen Preise für Terminus, Swift und Think neu bewerten.
- Mehrsprachige QA- und Instruktions-Tests erneut ausführen, um das Verhalten mit den neuen Decoder-Defaults zu validieren.
- Die aktuellen Terminus-Checkpoints herunterladen und Feinabstimmungen oder Evaluierungen vorbereiten.