行业观察
10分钟 分钟阅读
AI 观察员

Kimi K2.5 正式发布:原生视觉与智能体蜂群的全面进化

原生多模态的新高度

月之暗面(Moonshot AI)今日正式发布 Kimi K2.5,这不仅是一次版本迭代,更是通向通用人工智能(AGI)的重要一步。K2.5 在 Kimi K2 的基础上,经过约 15万亿(15T) 混合视觉与文本 Token 的持续预训练,构建了纯正的原生多模态架构(Native Multimodal)。

Kimi K2.5 与 Claude Opus 4.5 性能对比

图:Kimi K2.5 与 Claude Opus 4.5 在核心能力上的对比,展现了其在多模态与推理领域的强劲实力。

这种架构上的突破,赋予了 K2.5 对物理世界极强的感知力,使其在视觉编程(Coding with Vision)智能体蜂群(Agent Swarm)办公生产力三大维度实现了颠覆性升级。

1. 视觉编程 (Coding with Vision):眼见为码

Kimi K2.5 被官方定义为"迄今为止最强的开源编程模型",尤其在前端开发领域展现了统治力。

  • 视觉交互转化为代码:K2.5 能够将简单的对话直接转化为完整的前端界面,并精准实现交互布局和丰富的动画效果(如滚动触发特效)。
  • 视频即代码:超越了静态图像,K2.5 能通过推理视频内容来重建网站。例如,它可以观看一段网站交互视频,然后还原出其背后的代码逻辑与样式。
  • 大规模视觉-文本联合预训练:这种能力源于大规模的联合预训练,使得视觉理解与文本编码能力同步提升,消除了传统模型中视觉与逻辑的割裂感。

在内部评测中,K2.5 解决了复杂的迷宫寻路问题,通过 BFS 算法在 450 万像素的迷宫中找到最短路径,并生成了可视化的解题过程,证明了其强大的视觉推理能力。

2. Agent Swarm:智能体蜂群思维 (Research Preview)

这是本次更新中最具科幻色彩的功能。Kimi K2.5 发布了 Agent Swarm(智能体蜂群) 的研究预览版,标志着 AI 从"单兵作战"向"军团协同"的范式转移。

  • 自我指挥的蜂群:K2.5 能够自主指挥多达 100 个子智能体(Sub-agents)
  • 海量并发执行:在处理复杂任务时,它可以编排多达 1500 个协同步骤。
  • 效率倍增:相比单智能体模式,Swarm 模式将端到端执行时间减少了 4.5倍
  • PARL 技术:背后的核心是并行智能体强化学习(Parallel-Agent Reinforcement Learning),训练编排者(Orchestrator)将任务分解为并行子任务。

例如,在"寻找100个细分领域的头部创作者"任务中,K2.5 Swarm 能自动创建100个研究员子智能体并行搜索,最后汇总成一份包含300个档案的结构化电子表格,效率惊人。

3. 极致的办公生产力

K2.5 将智能体能力带入真实的知识工作场景,能够处理高密度、大规模的办公输入。

  • 全能输出:直接生成专业的文档、电子表格、PDF 和演示文稿幻灯片。
  • 超长上下文处理:轻松驾驭 100 页以上的文档或 10,000 字以上的论文写作。
  • 复杂操作:支持在 Word 中添加批注、在 Excel 中构建数据透视表、在 PDF 中编写 LaTeX 公式。

在内部的 AI Office Benchmark 中,K2.5 的表现相比上一代思考模型(K2 Thinking)提升了 59.3%,真正实现了从"玩具"到"工具"的跨越。

性能霸榜:全面超越

在各项权威基准测试中,K2.5 展现了对标甚至超越拥有"思考模式"的顶级闭源模型的实力(包括 Gemini 3 Pro, GPT-5.2, Claude Opus 4.5 等):

基准测试 (Benchmark)领域表现亮点
HLE-Full推理强于 DeepSeek-V3.2
SWE-Bench Verified编程解决率 80.9%,超越开源界限
MMMU Pro视觉视觉多模态理解能力顶尖,接近 Claude Opus 4.5 水平
BrowseComp搜索Agent Swarm 模式下表现大幅提升

如何体验

目前 Kimi K2.5 已全线登陆以下平台,提供四种模式(Instant, Thinking, Agent, Agent Swarm):

  1. Kimi.com 网页版
  2. Kimi 智能助手 App
  3. Kimi 开放平台 (API)
  4. Kimi Code:全新的终端代码工具,支持 VSCode、Cursor 等集成。

注:Agent Swarm 模式目前处于 Beta 阶段,向高级付费用户提供免费试用。

这一波更新无疑将 AI 的竞争维度从单纯的"文本对话"拉升到了"视觉行动"与"群体智能"的新高度。对于开发者和专业用户来说,Kimi K2.5 提供的不仅仅是更强的模型,而是一整套解决复杂问题的新武器。

相关文章

Kimi K2.7 Code 已正式发布。本文围绕 Kimi K2.7 和 Kimi Code,解读这次更新的模型定位、256K 长上下文、强制思考模式、多模态输入、Agent 编程能力、价格与适合的开发场景。
Kimi Code 已升级到 Kimi K2.7 Code。本文面向开发者,讲解 Kimi Code 的定位、kimi-k2.7-code API 调用、Claude Code 环境变量、Cline 和 RooCode 配置步骤,以及 Kimi K2.7 编程任务的成本控制与提示词模板。
如果 Kimi 已经给你生成了一个公开网站链接,它本身就可以用于分享。本文说明什么时候直接使用 Kimi 链接,什么时候导出代码,以及如何把网站部署到自己的域名或托管平台。