原生多模态的新高度

月之暗面（Moonshot AI）今日正式发布 Kimi K2.5，这不仅是一次版本迭代，更是通向通用人工智能（AGI）的重要一步。K2.5 在 Kimi K2 的基础上，经过约 15万亿（15T） 混合视觉与文本 Token 的持续预训练，构建了纯正的原生多模态架构（Native Multimodal）。

Kimi K2.5 与 Claude Opus 4.5 性能对比

图：Kimi K2.5 与 Claude Opus 4.5 在核心能力上的对比，展现了其在多模态与推理领域的强劲实力。

这种架构上的突破，赋予了 K2.5 对物理世界极强的感知力，使其在视觉编程（Coding with Vision）、智能体蜂群（Agent Swarm） 和办公生产力三大维度实现了颠覆性升级。

1. 视觉编程 (Coding with Vision)：眼见为码

Kimi K2.5 被官方定义为"迄今为止最强的开源编程模型"，尤其在前端开发领域展现了统治力。

视觉交互转化为代码：K2.5 能够将简单的对话直接转化为完整的前端界面，并精准实现交互布局和丰富的动画效果（如滚动触发特效）。
视频即代码：超越了静态图像，K2.5 能通过推理视频内容来重建网站。例如，它可以观看一段网站交互视频，然后还原出其背后的代码逻辑与样式。
大规模视觉-文本联合预训练：这种能力源于大规模的联合预训练，使得视觉理解与文本编码能力同步提升，消除了传统模型中视觉与逻辑的割裂感。

在内部评测中，K2.5 解决了复杂的迷宫寻路问题，通过 BFS 算法在 450 万像素的迷宫中找到最短路径，并生成了可视化的解题过程，证明了其强大的视觉推理能力。

2. Agent Swarm：智能体蜂群思维 (Research Preview)

这是本次更新中最具科幻色彩的功能。Kimi K2.5 发布了 Agent Swarm（智能体蜂群） 的研究预览版，标志着 AI 从"单兵作战"向"军团协同"的范式转移。

自我指挥的蜂群：K2.5 能够自主指挥多达 100 个子智能体（Sub-agents）。
海量并发执行：在处理复杂任务时，它可以编排多达 1500 个协同步骤。
效率倍增：相比单智能体模式，Swarm 模式将端到端执行时间减少了 4.5倍。
PARL 技术：背后的核心是并行智能体强化学习（Parallel-Agent Reinforcement Learning），训练编排者（Orchestrator）将任务分解为并行子任务。

例如，在"寻找100个细分领域的头部创作者"任务中，K2.5 Swarm 能自动创建100个研究员子智能体并行搜索，最后汇总成一份包含300个档案的结构化电子表格，效率惊人。

3. 极致的办公生产力

K2.5 将智能体能力带入真实的知识工作场景，能够处理高密度、大规模的办公输入。

全能输出：直接生成专业的文档、电子表格、PDF 和演示文稿幻灯片。
超长上下文处理：轻松驾驭 100 页以上的文档或 10,000 字以上的论文写作。
复杂操作：支持在 Word 中添加批注、在 Excel 中构建数据透视表、在 PDF 中编写 LaTeX 公式。

在内部的 AI Office Benchmark 中，K2.5 的表现相比上一代思考模型（K2 Thinking）提升了 59.3%，真正实现了从"玩具"到"工具"的跨越。

性能霸榜：全面超越

在各项权威基准测试中，K2.5 展现了对标甚至超越拥有"思考模式"的顶级闭源模型的实力（包括 Gemini 3 Pro, GPT-5.2, Claude Opus 4.5 等）：

基准测试 (Benchmark)	领域	表现亮点
HLE-Full	推理	强于 DeepSeek-V3.2
SWE-Bench Verified	编程	解决率 80.9%，超越开源界限
MMMU Pro	视觉	视觉多模态理解能力顶尖，接近 Claude Opus 4.5 水平
BrowseComp	搜索	Agent Swarm 模式下表现大幅提升

如何体验

目前 Kimi K2.5 已全线登陆以下平台，提供四种模式（Instant, Thinking, Agent, Agent Swarm）：

Kimi.com 网页版
Kimi 智能助手 App
Kimi 开放平台 (API)
Kimi Code：全新的终端代码工具，支持 VSCode、Cursor 等集成。

注：Agent Swarm 模式目前处于 Beta 阶段，向高级付费用户提供免费试用。

这一波更新无疑将 AI 的竞争维度从单纯的"文本对话"拉升到了"视觉行动"与"群体智能"的新高度。对于开发者和专业用户来说，Kimi K2.5 提供的不仅仅是更强的模型，而是一整套解决复杂问题的新武器。

Kimi K2.5 正式发布：原生视觉与智能体蜂群的全面进化

原生多模态的新高度

1. 视觉编程 (Coding with Vision)：眼见为码

2. Agent Swarm：智能体蜂群思维 (Research Preview)

3. 极致的办公生产力

性能霸榜：全面超越

如何体验

热门 Kimi K2 路径

Kimi K2.7 Code

Kimi Code

Kimi Code 指南

Kimi K3 状态

相关文章