Model Update
6 minutes 分钟阅读
DeepSeek Insights Team

DeepSeek V3.1 Terminus:面向生产的多语言智能体

DeepSeek V3.1 Terminus:升级后的构建指南

发布速览

DeepSeek V3.1 Terminus 于 2025 年 9 月 22 日上线,在 8 月 21 日的 DeepSeek V3.1 版本基础上完成针对性打磨。DeepSeek 已将 App、Web 与 API 全面升级至 Terminus,因此现有智能体无需额外迁移即可直接继承这一批改进。

多语言体验升级

此次 Terminus 聚焦多语言质量,显著提升跨语言场景中的对齐效果。模型保持 128K Token 的上下文窗口,并通过解码优化降低跨语言问答中的幻觉。对于面向全球市场的团队,这些改动能够减少为不同语种重复调试提示词的时间。

智能体表现

多项基准验证了此次发布的成效:Terminus 在 SWE-bench Multilingual 上取得 57.8(上一版为 54.5),在 MixInstruct 2/8-shot 上达到 62.9(上一版为 59.2)。此外,SWE Verified 分数提升至 68.4,HumanEval Pass@1 达到 91.2,显示出更强的推理能力,可支撑更长的智能体链路。

构建工具箱

核心架构依旧是 685B 参数的 Mixture-of-Experts 设计,单次推理约激活 37B 参数。Terminus 保留 Swift(偏速度)与 Think(偏深度)双推理模式,并内置数据集与向量管理功能,使检索与微调在同一控制面中协同,方便直接接入现有流水线。

部署与获取

DeepSeek 在 Hugging Face 上以 MIT 许可证发布了 Terminus 的 BF16、FP8(E4M3)和 FP32 精度检查点,并在 ModelScope 提供中国大陆镜像。团队可以根据精度与成本要求选择不同的加速硬件完成部署、微调或蒸馏。

行动建议

  • 结合 2025 年 9 月 5 日生效的 Terminus、Swift、Think 新计费方案,重新评估 API 预算。
  • 在投产前重新执行多语言问答与指令遵循测试,确认新的解码策略表现稳定。
  • 下载最新 Terminus 检查点,为后续的微调或评估流程做好准备。

相关文章

月之暗面正式发布 Kimi K2.6,将 Code Preview 分支升级为通用可用模型,支持 12 小时自主编码、300 智能体协同、全栈生成。本文解读版本变化、实际意义以及落地用法。
关于 Kimi K2.6,真正值得追问的不是它能做什么,而是它明显在为怎样的模型搭建舞台。把 12 小时长跑、300 智能体 Swarm、上下文压缩器当作承重的基础设施来读,K3 的形态就显出来了。
月之暗面于 2026 年 4 月 13 日正式确认 Kimi K2.6 Code Preview 进入内测阶段,这款基于万亿参数 MoE 架构的下一代模型在代码生成与 Agent 能力上实现了显著提升。本文全面解读其技术细节与发展前瞻。