Model Update
6 minutes min läsning
DeepSeek Insights Team

DeepSeek V3.1 Terminus: flerspråkiga agenter klara för produktion

DeepSeek V3.1 Terminus: viktiga nyheter för builders

Översikt av lanseringen

DeepSeek V3.1 Terminus släpptes den 22 september 2025 som en riktad förfining av versionen från 21 augusti. DeepSeek har redan uppdaterat appen, webben och API:et till Terminus, så befintliga agenter får förbättringarna utan extra migreringsarbete.

Förbättringar i flerspråkiga scenarier

Den här versionen prioriterar flerspråkig kvalitet. Terminus behåller 128K tokens i kontextfönstret och introducerar decoder-justeringar som minskar hallucinationer när samtal byter språk. För team med globala produkter innebär det mindre tid på att omskriva prompts för varje marknad.

Agenternas prestanda

Benchmarkresultaten visar framsteg: Terminus når 57,8 på SWE-bench Multilingual (tidigare 54,5) och 62,9 på MixInstruct 2/8-shot (tidigare 59,2). Modellen noterar dessutom 68,4 på SWE Verified och 91,2 på HumanEval, vilket ger stöd för längre och mer komplexa agentkedjor.

Funktionstack

Arkitekturen förblir ett Mixture-of-Experts-upplägg med 685 miljarder parametrar och cirka 37 miljarder aktiva parametrar per token. Builders kan fortsatt välja mellan Swift-läget för hastighet och Think-läget för djupare resonemang, samt använda de integrerade verktygen för data- och vektorhantering som förenar retrieval och fine-tuning. Därmed kan Terminus tas i drift utan att befintliga pipelines byggs om.

Distribution och åtkomst

DeepSeek publicerar Terminus-checkpoints i BF16-, FP8 (E4M3)- och FP32-precision under MIT-licens på Hugging Face, med speglar på ModelScope för arbetslaster i Kina. Detta underlättar anpassning till olika acceleratorer samtidigt som precision och kostnad balanseras.

Nästa steg

  • Se över API-budgetarna med hänsyn till prissättningen för Terminus, Swift och Think som gäller sedan 5 september 2025.
  • Kör om flerspråkiga QA- och instruktionstester för att verifiera beteendet med de nya decoder-standarderna.
  • Ladda ned de senaste Terminus-checkpointsen och förbered pipelines för fine-tuning eller utvärdering inför en bredare utrullning.

Relaterade artiklar

Moonshot AI har officiellt levererat Kimi K2.6 och fört Code Preview-grenen till en allmänt tillgänglig modell byggd för 12-timmars autonoma kodningssessioner, svärmar med 300 agenter och full-stack-generering. Vad som förändrats, vad det innebär och hur du sätter det i arbete.
Den intressanta frågan om Kimi K2.6 är inte vad den gör — utan för vilken typ av modell den uppenbarligen byggs för att vara värd. Betrakta 12-timmarskörningarna, svärmar med 300 agenter och kontextkompressorn som bärande infrastruktur, och formen på K3 blir synlig.
Den 13 april 2026 bekräftade Moonshot AI officiellt att Kimi K2.6 Code Preview har gått in i betatestfasen. Byggd på en MoE-arkitektur med en biljon parametrar erbjuder denna nästa generations modell betydande förbättringar inom kodgenerering och agentkapacitet.