Release och syfte

DeepSeek släppte Terminus-patchen den 22 september 2025 och förbättrade multilinguala svar samt agentmallar utan att kräva migration för webben, appar eller API:er. Moonshot AI lanserade Kimi K2-0905 den 5 september 2025 med fokus på agentiskt kodande, front-end-kvalitet och en större kontextbuffert.

Arkitektur, kontext och distribution

Båda modellerna använder MoE, men med olika prioriteringar.

Dimension	DeepSeek V3.1 Terminus	Kimi K2-0905
Totala / aktiva parametrar	685B / ~37B	1T / 32B
Experter per lager	9	8 av 384
Kontextfönster	128K tokens	256K tokens
Standardlägen	Swift (latens) & Think (djup)	En profil optimerad för verktygsdrivet kodarbete
Distribution	MIT-licenserade vikter via Hugging Face & ModelScope	MIT-deriverade vikter + managed APIs

Terminus behåller Swift/Think och 128K-fönstret för balans mellan hastighet och resonemang. K2-0905 fortsätter med 1T/32B men dubblar kontexten till 256K, vilket gynnar hela kodbaser och långa briefs.

Benchmarks och agentstabilitet

Jämfört med augustibygget visar Terminus förbättringar i alla agenttunga tester:

Benchmark (agentläge)	DeepSeek V3.1 (aug 2025)	DeepSeek V3.1 Terminus	Kimi K2-0905
SWE-bench Multilingual	54,5	57,8	55,9
SWE Verified	66,0	68,4	69,2
Terminal-bench	31,3	36,7	44,5
BrowseComp	30,0	38,5	n/a
LiveCodeBench	56,4	60,0 (högre success rate)	61,0

Förbättringarna visar att Terminus åtgärdade blandade språk och stärkte agentmallarna. K2-0905 behåller dock ett övertag i Terminal-bench och SWE Verified, i linje med sin fullstack-inriktning.

Prissnapshot (USD per miljon tokens, september 2025)

Kanal	Input (cache hit)	Input (cache miss)	Output
DeepSeek API (från 5 sep)	$0,07	$0,27	$1,10
Novita serverless K2-0905	—	$0,60	$2,50
Groq-hostad K2-0905	—	$1,00	$3,00
LangDB-gateway K2-0905	—	$0,49	$1,99

DeepSeek harmoniserade priserna för Terminus, Swift och Think den 5 september 2025. Kimi-priser varierar beroende på distributör: Novita ($0,60/$2,50), Groq ($1,00/$3,00) och LangDB ($0,49/$1,99).

Ekosystem och deployment

Self-hosting: Terminus levererar BF16/FP8/FP32-vikter under MIT för VPC/on-prem deployment.
Managed acceleration: K2-0905 via Groq, Novita eller Kimi Cloud når 60–200+ tokens/s och minskar driftbördan.
Multilingval robusthet: Terminus reducerar engelska-kinesiska mixar i prompts och sparar manuell efterbearbetning.
Front-end-kvalitet: Moonshot lyfter fram snyggare React/Vue-komponenter från K2-0905.

Beslutschecklista

Primärt behov: Terminus för hög meertal kvalitet och kontrollerad drift; K2-0905 vid krav på 256K kontext eller terminalautomation.
Hybrid orkestrering: Låt Terminus planera (Swift/Think) och Kimi exekvera långa coding-loopar.
Kostnadskontroll: Ställ DeepSeeks fasta taxa mot Novita/Groq/LangDB – skillnaden kan överstiga 4×.
Styrning: Terminus kan helt köras i egen infrastruktur; Kimi managed förenklar drift men kräver regulatorisk kontroll.

Med tydlig överblick av timing, arkitektur, benchmarks och kostnader placerar du deepseek v3.1 terminus och Kimi K2-0905 där de ger mest värde under Q4 2025.

DeepSeek V3.1 Terminus vs Kimi K2-0905: rätt agentmotor för Q4 2025

Release och syfte

Arkitektur, kontext och distribution

Benchmarks och agentstabilitet

Prissnapshot (USD per miljon tokens, september 2025)

Ekosystem och deployment

Beslutschecklista

Popular Kimi K2 paths

Kimi K3

Kimi K2.7 Code

Kimi Code

Kimi K3 Status

Relaterade artiklar