机器之心报道
机器之心编辑部
Cursor 终于迈出了训练大型语言模型的重要一步。
Cursor 2.0 现已正式发布!
就在刚刚,Cursor 推出了两项重磅更新:第一个编码模型 Composer,以及一个支持多个智能体并行协作的新界面。


这一进展极具意义。尽管 Cursor 一直备受欢迎,但它的定位往往被称为「AI 时代的 VS Code」,原因在于其早前仅能依赖于 Claude、GPT 等第三方模型。这一局限性既是 Cursor 的起点,也是其发展的障碍。
Composer 的发布被视为 Cursor 突破这一瓶颈的“独立宣言”,同时也象征着 Cursor 正式从“AI 外壳”转变为“AI 原生平台”。
自主研发的模型 Composer
Composer 是一款前沿的模型,虽然在智能水平上未必赶上 GPT-5 等顶尖模型,但其生成速度却是其他同类智能模型的四倍。

在基准测试中,Composer 展现了行业领先的编码智能,其生成速度达到每秒 250 个 token——大约是市场上领先快速推理模型的两倍,远超同类前沿系统的四倍。(注:Cursor 将模型分为几个类别进行发布比较,包括“最佳开源”(如 Qwen Coder、GLM 4.6)、“快速前沿”(如 Haiku 4.5、Gemini Flash 2.5)、“2025 年 7 月前沿”(年中可用的最强模型)和“最佳前沿”(涵盖 GPT-5 和 Claude Sonnet 4.5)。在与中端前沿系统智能水平相当的同时,Composer 还在所有测试类别中创造了有记录以来的最高生成速度。)

这个模型的设计目标是实现低延迟的智能体编码,通常在30秒内完成大多数任务。早期的用户反馈表明,它在快速迭代方面表现出色,用户对其在多步骤编码任务上的处理能力表示信任。
官方指出,Composer通过一系列强大的工具进行训练,其中包括覆盖整个代码库的语义搜索,这让它在理解和处理复杂代码时显得尤为出色。


在训练的过程中,Composer利用一套生产级的搜索和编辑工具,以便高效地解决各种复杂问题。
该模型的开发灵感源自Cursor团队在创建Cursor Tab(自家研发的补全模型)时积累的经验。
开发者们发现,他们希望使用一种既智能又能互动的模型,这样才能保持编码时的专注和流畅。因此,在研发过程中,他们测试了一个名为Cheetah的原型智能体,以深入理解快速智能体模型的潜力。Composer则是在此基础上的更智能化升级版,以足够的速度支持交互式编码体验,让整个过程始终保持愉悦和顺畅。

从架构的角度来看,Composer属于混合专家(MoE)模型,能够生成和理解长上下文信息。它通过在多样化的开发环境中进行强化学习,专门为软件工程进行了优化。每次训练迭代中,模型都会接收问题描述,并被要求给出最佳解答,无论是代码的修改、方案的设计,还是提供信息性的回答。模型不仅能使用读取和编辑文件等简单工具,还能调用更为强大的功能,例如终端命令和面向整个代码库的语义搜索。
Cursor 2.0:重新定义智能开发环境的未来
为了评估进展,团队建立了一套尽量贴近软件开发者真实需求的评测体系。新推出的基准测试 Cursor Bench 由 Cursor 的工程师和研究人员提交的真实智能体请求构成,配有经过人工整理的最佳解决方案。此项评测不仅关注智能体的准确性,同时还评估其在遵循代码库现有抽象和软件工程实践方面的能力。

通过强化学习,团队能够更有针对性地优化模型,提升其在软件工程领域的效率。考虑到响应时间是交互式开发的核心,他们鼓励模型在工具使用上做出高效的选择,并在可能的情况下实现最大程度的并行处理。同时,他们通过减少冗余回复和避免无依据的声明来训练模型。在这一过程中,模型还自发掌握了一些实用技能,比如执行复杂的搜索、修复 linter 错误,以及编写和运行单元测试。

Cursor 的开发团队已经在日常工作中全面采用 Composer,这证明了其成熟性和稳定性。
目前,Composer 已完整融合进 Cursor 2.0,这是公司智能开发环境的一次重要升级。
多智能体界面
Cursor 的界面设计也经历了变革。
根据其博客的介绍,此版本更加专注,完全围绕“智能体”展开,而非传统的文件结构。这样,用户能够专注于期望的结果,智能体则处理复杂的细节。在需要深入代码时,用户可以随时在新布局中打开文件,或者切换回经典的 IDE 界面。

Cursor 2.0 能够有效并行运行多个智能体,彼此之间互不干扰。这得益于 git worktree 和远程机器的支持。Cursor 还表示:“我们发现,让多个模型并行处理同一问题,通过选择最佳解,能显著提高最终结果,尤其是在面对更具挑战性的任务时。”

在 every.to 的博客中,分享了一些测试案例。例如,您可以在上方的示例中看到,三个不同的模型同时执行相同的任务:Composer 1 Alpha 被运行了两次,而 Grok Code 则执行了一次。

该博客提到:“如今,开发者能够同时操作多个 AI 智能体,每个智能体负责项目的不同模块,这些模块被称为工作树(work tree)。这就好比一组实习生,各自负责文章的不同部分,并同步向我汇报进展。”
此外,Cursor 官方也指出,在他们愈发依赖智能体进行编程时,面临了两个新的瓶颈:代码审查和变更测试。
Cursor 2.0 正在致力于解决这两个问题。它能够更迅速地审查智能体的变更,并在必要时深入到代码中进行检查。
与此同时,他们还开发了原生的浏览器工具,使得 Cursor 能够测试其工作成果,并进行持续迭代,直到达到理想的最终效果。

基础设施
要高效训练大型 MoE 模型,必须在基础设施和系统研究方面投入大量精力。团队基于 PyTorch 和 Ray 构建了定制化的训练基础设施,以支持大规模环境下的异步强化学习。他们通过结合 MXFP8 MoE 内核与专家并行及混合分片数据并行,在原生低精度下进行模型训练,从而以极小的通信开销扩展训练至数千张 NVIDIA GPU。此外,采用 MXFP8 训练能够在无需后续量化的情况下,实现更快的推理速度。
在进行强化学习时,团队希望模型能够调用 Cursor Agent 框架中的任意工具。这些工具可以用于编辑代码、进行语义搜索、使用 grep 查找字符串,以及执行终端命令。考虑到 Cursor 的规模,为了让模型高效地调用这些工具,需要在云端并发运行成千上万的隔离沙盒编码环境。为了支持这一工作负载,团队对现有的 Background Agents 基础设施进行了改造,重新编写虚拟机调度器,以适应训练运行的突发性和规模。因此,他们成功实现了强化学习环境与生产环境的无缝对接。
网友点评
作为一款颇受关注的 AI 编程工具,Cursor 的此次重大版本更新无疑吸引了众多目光。
早期体验的开发者们纷纷给予积极评价。比如,every.to 的博客就汇总了多位开发者的反馈意见,其中既有赞誉,也有批评。
网友热议Cursor 2.0:开发者反馈与幽默互动


在X平台上,许多用户也开始分享自己的使用体验。

一些用户甚至开玩笑说,希望Cursor 2.0能够帮助他们创建AGI。

更多相关链接:
https://x.com/cursor_ai/status/1983567619946147967
https://cursor.com/blog/2-0
https://every.to/vibe-check/vibe-check-cursor-2-0-and-composer-1-alpha
https://cursor.com/cn/changelog/2-0
视频参考链接:https://mp.weixin.qq.com/s/SOYp-wIq3YE_DbgppqhALg
Please specify source if reproducedCursor 2.0重磅发布,自研模型Composer引领全新潮流,打破传统「壳」的界限! | AI工具导航
