Model Update
6 minutes 分钟阅读
DeepSeek Insights Team
DeepSeek V3.1 Terminus:面向生产的多语言智能体
DeepSeek V3.1 Terminus:升级后的构建指南
发布速览
DeepSeek V3.1 Terminus 于 2025 年 9 月 22 日上线,在 8 月 21 日的 DeepSeek V3.1 版本基础上完成针对性打磨。DeepSeek 已将 App、Web 与 API 全面升级至 Terminus,因此现有智能体无需额外迁移即可直接继承这一批改进。
多语言体验升级
此次 Terminus 聚焦多语言质量,显著提升跨语言场景中的对齐效果。模型保持 128K Token 的上下文窗口,并通过解码优化降低跨语言问答中的幻觉。对于面向全球市场的团队,这些改动能够减少为不同语种重复调试提示词的时间。
智能体表现
多项基准验证了此次发布的成效:Terminus 在 SWE-bench Multilingual 上取得 57.8(上一版为 54.5),在 MixInstruct 2/8-shot 上达到 62.9(上一版为 59.2)。此外,SWE Verified 分数提升至 68.4,HumanEval Pass@1 达到 91.2,显示出更强的推理能力,可支撑更长的智能体链路。
构建工具箱
核心架构依旧是 685B 参数的 Mixture-of-Experts 设计,单次推理约激活 37B 参数。Terminus 保留 Swift(偏速度)与 Think(偏深度)双推理模式,并内置数据集与向量管理功能,使检索与微调在同一控制面中协同,方便直接接入现有流水线。
部署与获取
DeepSeek 在 Hugging Face 上以 MIT 许可证发布了 Terminus 的 BF16、FP8(E4M3)和 FP32 精度检查点,并在 ModelScope 提供中国大陆镜像。团队可以根据精度与成本要求选择不同的加速硬件完成部署、微调或蒸馏。
行动建议
- 结合 2025 年 9 月 5 日生效的 Terminus、Swift、Think 新计费方案,重新评估 API 预算。
- 在投产前重新执行多语言问答与指令遵循测试,确认新的解码策略表现稳定。
- 下载最新 Terminus 检查点,为后续的微调或评估流程做好准备。