DeepSeek V3.1 Terminus vs Kimi K2-0905: rätt agentmotor för Q4 2025
Release och syfte
DeepSeek släppte Terminus-patchen den 22 september 2025 och förbättrade multilinguala svar samt agentmallar utan att kräva migration för webben, appar eller API:er. Moonshot AI lanserade Kimi K2-0905 den 5 september 2025 med fokus på agentiskt kodande, front-end-kvalitet och en större kontextbuffert.
Arkitektur, kontext och distribution
Båda modellerna använder MoE, men med olika prioriteringar.
| Dimension | DeepSeek V3.1 Terminus | Kimi K2-0905 |
|---|---|---|
| Totala / aktiva parametrar | 685B / ~37B | 1T / 32B |
| Experter per lager | 9 | 8 av 384 |
| Kontextfönster | 128K tokens | 256K tokens |
| Standardlägen | Swift (latens) & Think (djup) | En profil optimerad för verktygsdrivet kodarbete |
| Distribution | MIT-licenserade vikter via Hugging Face & ModelScope | MIT-deriverade vikter + managed APIs |
Terminus behåller Swift/Think och 128K-fönstret för balans mellan hastighet och resonemang. K2-0905 fortsätter med 1T/32B men dubblar kontexten till 256K, vilket gynnar hela kodbaser och långa briefs.
Benchmarks och agentstabilitet
Jämfört med augustibygget visar Terminus förbättringar i alla agenttunga tester:
| Benchmark (agentläge) | DeepSeek V3.1 (aug 2025) | DeepSeek V3.1 Terminus | Kimi K2-0905 |
|---|---|---|---|
| SWE-bench Multilingual | 54,5 | 57,8 | 55,9 |
| SWE Verified | 66,0 | 68,4 | 69,2 |
| Terminal-bench | 31,3 | 36,7 | 44,5 |
| BrowseComp | 30,0 | 38,5 | n/a |
| LiveCodeBench | 56,4 | 60,0 (högre success rate) | 61,0 |
Förbättringarna visar att Terminus åtgärdade blandade språk och stärkte agentmallarna. K2-0905 behåller dock ett övertag i Terminal-bench och SWE Verified, i linje med sin fullstack-inriktning.
Prissnapshot (USD per miljon tokens, september 2025)
| Kanal | Input (cache hit) | Input (cache miss) | Output |
|---|---|---|---|
| DeepSeek API (från 5 sep) | $0,07 | $0,27 | $1,10 |
| Novita serverless K2-0905 | — | $0,60 | $2,50 |
| Groq-hostad K2-0905 | — | $1,00 | $3,00 |
| LangDB-gateway K2-0905 | — | $0,49 | $1,99 |
DeepSeek harmoniserade priserna för Terminus, Swift och Think den 5 september 2025. Kimi-priser varierar beroende på distributör: Novita ($0,60/$2,50), Groq ($1,00/$3,00) och LangDB ($0,49/$1,99).
Ekosystem och deployment
- Self-hosting: Terminus levererar BF16/FP8/FP32-vikter under MIT för VPC/on-prem deployment.
- Managed acceleration: K2-0905 via Groq, Novita eller Kimi Cloud når 60–200+ tokens/s och minskar driftbördan.
- Multilingval robusthet: Terminus reducerar engelska-kinesiska mixar i prompts och sparar manuell efterbearbetning.
- Front-end-kvalitet: Moonshot lyfter fram snyggare React/Vue-komponenter från K2-0905.
Beslutschecklista
- Primärt behov: Terminus för hög meertal kvalitet och kontrollerad drift; K2-0905 vid krav på 256K kontext eller terminalautomation.
- Hybrid orkestrering: Låt Terminus planera (Swift/Think) och Kimi exekvera långa coding-loopar.
- Kostnadskontroll: Ställ DeepSeeks fasta taxa mot Novita/Groq/LangDB – skillnaden kan överstiga 4×.
- Styrning: Terminus kan helt köras i egen infrastruktur; Kimi managed förenklar drift men kräver regulatorisk kontroll.
Med tydlig överblick av timing, arkitektur, benchmarks och kostnader placerar du deepseek v3.1 terminus och Kimi K2-0905 där de ger mest värde under Q4 2025.