Model Comparison
8 minutes 分钟阅读
AI 分析团队

DeepSeek V3.1 Terminus 对比 Kimi K2-0905:2025 年四季度智能体选型指南

发布节奏与定位

DeepSeek 于 2025 年 9 月 22 日推出 Terminus 补丁版,在不打断现有 Web、App 与 API 的前提下,重点修复跨语言输出与代理模板。 Moonshot AI 则在 2025 年 9 月 5 日发布 Kimi K2-0905,聚焦智能编程、前端美学以及上下文长度扩展。

架构、上下文与服务形态

两款模型依旧使用稀疏 MoE 结构,但取舍不同:

维度DeepSeek V3.1 TerminusKimi K2-0905
总参数 / 激活参数685B 总量,单 Token 激活约 37B1T 总量,单次激活 32B
每层专家数9 个专家(粒度更细)384 名专家中动用 8 个(专家池更大)
上下文窗口128K tokens256K tokens
默认模式Swift(低延迟)+ Think(深度推理)单一推理档,针对工具链编码优化
分发方式MIT 许可开源权重(Hugging Face & ModelScope)MIT 衍生权重 + 官方/合作方托管服务

Terminus 延续 Swift/Think 双模式与 128K 窗口,以平衡吞吐与推理深度。 K2-0905 保持 1T/32B 架构并把上下文扩展到 256K,有利于整仓代码审查与长篇设计稿。

基准测试与代理稳定性

相较 8 月版本,Terminus 在多项代理场景获得显著提升:

基准(代理配置)DeepSeek V3.1(2025 年 8 月)DeepSeek V3.1 TerminusKimi K2-0905
SWE-bench Multilingual54.557.855.9
SWE Verified66.068.469.2
Terminal-bench31.336.744.5
BrowseComp30.038.5n/a
LiveCodeBench56.460.0(代理成功率提升)61.0

Terminus 收敛跨语言错配并刷新 Terminal-bench 与 BrowseComp,印证代码/搜索代理模板更新的效果。 K2-0905 仍在 Terminal-bench 与 SWE Verified 保持优势,符合其“全栈软件”定位。

价格快照(美元 / 百万 tokens,2025 年 9 月)

接入途径输入(缓存命中)输入(缓存未命中)输出
DeepSeek 官方 API(9 月 5 日后)$0.07$0.27$1.10
Novita 无服务器 Kimi K2-0905$0.60$2.50
Groq 托管 Kimi K2-0905$1.00$3.00
LangDB 聚合层 Kimi K2-0905$0.49$1.99

DeepSeek 自 9 月 5 日起统一 Terminus、Swift、Think 的计价档,方便内部预算管理。 Kimi 的价格取决于分发渠道:Novita 报价 $0.60 / $2.50,Groq 主打 $1.00 / $3.00 的低延时算力,LangDB 则提供 $0.49 / $1.99 的聚合出口。

生态与部署提示

  • 自托管优势: Terminus 提供 BF16/FP8/FP32 权重,可在自建集群或专有云中落地,满足合规与数据主权诉求。
  • 托管加速: K2-0905 通过 Groq、Novita、Kimi Cloud 等渠道提供 60–200+ tokens/s 吞吐,对低延迟开发者友好。
  • 多语言鲁棒性: Terminus 针对代码 / 搜索代理和中英混输做了针对性修复,减少人工清洗成本。
  • 前端产出质量: Moonshot 强调 K2-0905 在 React/Vue 等前端组件的结构与美观度提升,适合设计要求严格的团队。

决策清单

  1. 核心场景: 若重视跨语种对话质量与可控部署,优先 Terminus;若需 256K 长上下文与终端自动化吞吐,选择 K2-0905。
  2. 多模型编排: 可让 Terminus 负责 Swift/Think 规划,交由 Kimi 执行长链路编码任务,以提高整体成功率。
  3. 成本管控: 先核算 DeepSeek 平价模型的 Token 结构,再与目标 Kimi 渠道(Novita / Groq / LangDB)对比,价差最高可达 4 倍。
  4. 治理合规: Terminus 可完全部署在私有网络内;Kimi 的托管服务运维轻量,但需确认跨境与数据托管政策。

围绕时间线、架构差异、基准数据与价格策略的全方位分析,可以帮助团队在 2025 年四季度将 deepseek v3.1 terminus 与 Kimi K2-0905 精准放入各自擅长的智能体环节。

相关文章

月之暗面正式发布 Kimi K2.6,将 Code Preview 分支升级为通用可用模型,支持 12 小时自主编码、300 智能体协同、全栈生成。本文解读版本变化、实际意义以及落地用法。
关于 Kimi K2.6,真正值得追问的不是它能做什么,而是它明显在为怎样的模型搭建舞台。把 12 小时长跑、300 智能体 Swarm、上下文压缩器当作承重的基础设施来读,K3 的形态就显出来了。
月之暗面于 2026 年 4 月 13 日正式确认 Kimi K2.6 Code Preview 进入内测阶段,这款基于万亿参数 MoE 架构的下一代模型在代码生成与 Agent 能力上实现了显著提升。本文全面解读其技术细节与发展前瞻。