DeepSeek V3.1 Terminus: flerspråkiga agenter klara för produktion
DeepSeek V3.1 Terminus: viktiga nyheter för builders
Översikt av lanseringen
DeepSeek V3.1 Terminus släpptes den 22 september 2025 som en riktad förfining av versionen från 21 augusti. DeepSeek har redan uppdaterat appen, webben och API:et till Terminus, så befintliga agenter får förbättringarna utan extra migreringsarbete.
Förbättringar i flerspråkiga scenarier
Den här versionen prioriterar flerspråkig kvalitet. Terminus behåller 128K tokens i kontextfönstret och introducerar decoder-justeringar som minskar hallucinationer när samtal byter språk. För team med globala produkter innebär det mindre tid på att omskriva prompts för varje marknad.
Agenternas prestanda
Benchmarkresultaten visar framsteg: Terminus når 57,8 på SWE-bench Multilingual (tidigare 54,5) och 62,9 på MixInstruct 2/8-shot (tidigare 59,2). Modellen noterar dessutom 68,4 på SWE Verified och 91,2 på HumanEval, vilket ger stöd för längre och mer komplexa agentkedjor.
Funktionstack
Arkitekturen förblir ett Mixture-of-Experts-upplägg med 685 miljarder parametrar och cirka 37 miljarder aktiva parametrar per token. Builders kan fortsatt välja mellan Swift-läget för hastighet och Think-läget för djupare resonemang, samt använda de integrerade verktygen för data- och vektorhantering som förenar retrieval och fine-tuning. Därmed kan Terminus tas i drift utan att befintliga pipelines byggs om.
Distribution och åtkomst
DeepSeek publicerar Terminus-checkpoints i BF16-, FP8 (E4M3)- och FP32-precision under MIT-licens på Hugging Face, med speglar på ModelScope för arbetslaster i Kina. Detta underlättar anpassning till olika acceleratorer samtidigt som precision och kostnad balanseras.
Nästa steg
- Se över API-budgetarna med hänsyn till prissättningen för Terminus, Swift och Think som gäller sedan 5 september 2025.
- Kör om flerspråkiga QA- och instruktionstester för att verifiera beteendet med de nya decoder-standarderna.
- Ladda ned de senaste Terminus-checkpointsen och förbered pipelines för fine-tuning eller utvärdering inför en bredare utrullning.