Release-Rhythmus und Zielsetzung

DeepSeek lieferte das Terminus-Update am 22. September 2025 aus, inklusive Verbesserungen bei mehrsprachigen Antworten und aktualisierten Code-/Search-Agent-Templates – ohne Migrationen für Web, App oder API. Moonshot AI veröffentlichte Kimi K2-0905 bereits am 5. September 2025 als September-Refresh mit Fokus auf agentisches Coding, Frontend-Qualität und verdoppelter Kontextlänge.

Architektur, Kontext und Bereitstellung

Beide Modelle setzen auf MoE, aber mit unterschiedlichen Schwerpunkten:

Dimension	DeepSeek V3.1 Terminus	Kimi K2-0905
Parameter gesamt / aktiv	685B gesamt, ~37B aktiv pro Token	1T gesamt, 32B aktiv pro Aufruf
Experten je Layer	9 Experten	8 von 384 Experten
Kontextfenster	128K Tokens	256K Tokens
Standardmodus	Swift (Latenz) & Think (Tiefe)	Ein Profil für tool-lastiges Coding
Distribution	MIT-Lizenzierte Gewichte via Hugging Face & ModelScope	MIT-abgeleitete Gewichte plus Managed-APIs

Terminus behält Swift/Think und das 128K-Fenster bei, um Geschwindigkeit und Tiefe auszubalancieren. K2-0905 bleibt bei 1T/32B und erweitert den Kontext auf 256K – ideal für komplette Repos oder Design-Briefs.

Benchmarks und Agentenstabilität

Gegenüber dem August-Build steigt Terminus in allen agentenlastigen Suites:

Benchmark (Agent-Konfiguration)	DeepSeek V3.1 (Aug 2025)	DeepSeek V3.1 Terminus	Kimi K2-0905
SWE-bench Multilingual	54,5	57,8	55,9
SWE Verified	66,0	68,4	69,2
Terminal-bench	31,3	36,7	44,5
BrowseComp	30,0	38,5	n/a
LiveCodeBench	56,4	60,0 (höhere Erfolgsquote)	61,0

Damit schließt Terminus die Lücken bei SWE Verified und Terminal-bench und bestätigt die Multi-Language-Fixes. K2-0905 bleibt jedoch vorne, wenn Terminal-Automatisierung oder SWE Verified im Fokus stehen – passend zur Full-Stack-Ausrichtung.

Preissnapshot (USD pro 1 Mio. Tokens, September 2025)

Anbieterweg	Input (Cache Hit)	Input (Cache Miss)	Output
DeepSeek API (seit 5. Sept)	$0,07	$0,27	$1,10
Novita serverless K2-0905	—	$0,60	$2,50
Groq gehostetes K2-0905	—	$1,00	$3,00
LangDB Gateway K2-0905	—	$0,49	$1,99

DeepSeek vereinheitlichte die Preise für Terminus, Swift und Think mit der Anpassung am 5. September 2025. Kimi-Preise hängen vom Distributor ab: Novita ($0,60/$2,50), Groq ($1,00/$3,00) und LangDB ($0,49/$1,99).

Ökosystem- und Deployment-Hinweise

Self-Hosting: Terminus liefert BF16/FP8/FP32-Gewichte unter MIT – optimal für VPC- oder On-Prem-Setups mit Compliance-Anforderungen.
Managed Speed: K2-0905 über Groq, Novita oder Kimi Cloud erreicht 60–200+ Tokens/s und reduziert Betriebsaufwand.
Mehrsprachige Robustheit: Terminus behebt englisch-chinesische Vermischung in Agent-Prompts – weniger manuelle Nacharbeit.
Frontend-Output: Moonshot hebt bessere React/Vue-Ausgaben hervor – ideal für designkritische Teams.

Entscheidungs-Checkliste

Haupt-Use-Case: Terminus, wenn Multilinguale Qualität und Self-Hosting Priorität haben. K2-0905, wenn 256K-Kontext oder Terminal-Automatisierung entscheidend sind.
Modell-Orchestrierung: Terminus für Planung (Swift/Think), Kimi für lange Coding-Loops kombinieren – besonders in Multi-Agent-Setups.
Kostensteuerung: DeepSeek-Fixkosten mit den Anbieterpreisen von Kimi vergleichen; die Spannweite beträgt bis zu Faktor 4.
Governance: Terminus lässt sich komplett in der eigenen Infrastruktur betreiben; Kimi Managed Services vereinfachen den Betrieb, verlangen aber ggf. datenschutzrechtliche Abwägungen.

Mit einer klaren Sicht auf Timeline, Architektur, Benchmarks und Preise lassen sich deepseek v3.1 terminus und Kimi K2-0905 exakt dort platzieren, wo sie für Q4 2025 den größten Mehrwert liefern.

DeepSeek V3.1 Terminus vs. Kimi K2-0905: Agentenentscheidungen für Q4 2025

Release-Rhythmus und Zielsetzung

Architektur, Kontext und Bereitstellung

Benchmarks und Agentenstabilität

Preissnapshot (USD pro 1 Mio. Tokens, September 2025)

Ökosystem- und Deployment-Hinweise

Entscheidungs-Checkliste

Popular Kimi K2 paths

Kimi K3

Kimi K2.7 Code

Kimi Code

Kimi K3 Status

Verwandte Artikel