机器之心报道
机器之心编辑部
最后,Cursor 选择了自主训练大型语言模型的道路。
Cursor 2.0 终于上线了!
刚刚,Cursor 发布了两项重要更新:首个编码模型 Composer 以及一个全新的多智能体并行协作界面。


这一举措具有深远的意义。虽然 Cursor 在用户中享有盛誉,但它被贴上了「AI 时代的 VS Code」的标签,因为其一直依赖于 Claude、GPT 等外部模型。这不仅是 Cursor 的起步阶段,也是其发展的局限。
Composer 的推出可以视为 Cursor 打破这一局限的“独立宣言”,标志着其正式转型为一个“AI 原生平台”,而非仅仅是“AI 外壳”。
自研模型 Composer
Composer 是一款前沿的模型,尽管在智能程度上未能超越 GPT-5 等顶尖模型,但其生成速度却是同类模型的四倍,领先于市场。

在基准测试中,Composer 展示了尖端的编码智能,其生成速度达到每秒 250 个 token,约为领先快速推理模型的两倍,是同类领先系统的四倍。(注:Cursor 在发布时将模型分类为多个类型:“最佳开源”(如 Qwen Coder、GLM 4.6)、“快速前沿”(Haiku 4.5、Gemini Flash 2.5)、“2025 年 7 月前沿”(年中可用的最强模型)以及“最佳前沿”(包括 GPT-5 和 Claude Sonnet 4.5)。Composer 在与中端前沿系统智能水平相媲美的同时,在所有测试类别中取得了有史以来的最高生成速度。)
Composer:编码助手的智能革命

该智能模型的设计初衷在于实现低延迟的智能体式编码,绝大多数回合能够在短短30秒内完成。早期用户反馈其高效的迭代能力,让他们在多步骤编码任务中倍感信赖。
官方指出,Composer通过强大的工具集进行训练,这些工具包括涵盖整个代码库的语义搜索,因而在理解和处理大规模代码方面展现出显著的优势。


具体而言,Composer在训练过程中会运用一套适用于生产的搜索与编辑工具,旨在高效应对各类复杂问题。
该模型的开发灵感源自Cursor团队在创造Cursor Tab(自研的补全模型)时所获得的经验。
他们观察到,开发者通常期望使用既聪明又能提供交互体验的模型,以确保编码过程的专注与流畅。研发的过程中,他们还测试了一个名为Cheetah的原型智能体模型,以更深入地了解高速智能体模型的效果。Composer作为该模型的智能升级版,以其卓越的速度支持交互式体验,令编码过程愉悦而顺畅。

从架构角度来看,Composer属于混合专家(MoE)模型,能够支持长上下文内容的生成与理解。它通过在不同开发环境中进行强化学习,针对软件工程进行了专门的优化。在每次训练迭代中,模型接收问题描述,并被要求生成最佳的响应,无论是代码修改、方案设计还是信息性回答。该模型不仅可以使用简单的文件读取与编辑工具,还能调用更高级的功能,如终端命令和面向整个代码库的语义搜索。
为了评估进展情况,开发团队设计了一套与软件开发者实际需求高度契合的评测体系。新推出的基准测试Cursor Bench,基于Cursor工程师和研究人员所提交的真实智能请求,辅以人工精心整理的最佳解答。该评测不仅着眼于智能体的准确性,同时还考量其对现有代码库的抽象理解能力以及软件工程实践的遵循程度。

通过强化学习,他们得以专注于模型的优化,以提升其在软件工程中的效率。考虑到响应速度对交互式开发至关重要,团队鼓励模型高效运用各类工具,并在条件允许时最大化并行处理的能力。此外,团队还通过减少冗余回复和避免无依据的表述来进一步训练模型。在这一过程中,模型还自主掌握了一些实用的技能,比如复杂搜索、修复linter错误,以及编写与执行单元测试。

Cursor的工程团队已经在日常开发中使用Composer,这一事实充分证明了其成熟与稳定性。
目前,Composer已经全面融入Cursor 2.0中,这标志着该智能开发环境的一次重大革新。
多智能体界面的崭新体验
Cursor的界面设计也迎来了全新的变化。
根据其博客的介绍,此版本更加专注,完全围绕“智能体”展开,而不再沿用传统的文件结构。用户可以专注于希望达成的结果,智能体则负责处理繁杂的细节。需要深入代码时,用户也能够便捷地打开文件,或切换回经典的IDE界面。

Cursor 2.0支持多个智能体的并行运行,彼此之间不会产生干扰。这得益于对git worktree或远程机器的支持。Cursor也指出:“我们甚至发现,让多个模型同时处理同一问题并选择最佳方案,显著提升了最终结果,尤其是在处理更复杂的任务时。”

在 every.to 的博客中分享了一些测试示例。比如在下方的展示里,顶部区域展示了三种不同的模型在执行同一任务的情况:Composer 1 Alpha 被运行了两次,而 Grok Code 则被调用了一次:

博客中提到:“如今,开发者能够并行运行多个 AI 智能体,每个智能体负责不同的任务部分,这些部分统称为工作树(work tree)。可以想象成一群实习生分别负责文章的不同章节,并同时向我汇报进展。”
此外,Cursor 官方也指出,在越来越多地使用智能体进行编码的过程中,他们发现了两个新的挑战:代码审查和变更测试。
为了应对这些挑战,Cursor 2.0 开始着手解决这两个问题,支持更迅速地评审智能体的更改,并在必要时深入分析代码。
与此同时,他们还开发了原生浏览器工具,以便 Cursor 能够对其工作进行测试,并不断迭代,直到得到正确的最终结果。

基础设施
高效训练大型 MoE 模型需要在基础设施和系统研究方面进行大量的投入。团队基于 PyTorch 和 Ray 构建了定制的训练基础设施,以支持在大规模环境下进行异步强化学习。他们通过将 MXFP8 MoE 内核与专家并行和混合分片数据并行相结合,利用原生低精度训练模型,从而以极低的通信开销扩展训练至数千张 NVIDIA GPU。此外,采用 MXFP8 训练还可以在无需后续量化的情况下实现更快速的推理速度。
在进行强化学习时,团队希望模型能够调用 Cursor Agent 框架中的各种工具。这些工具可以用于编辑代码、进行语义搜索、使用 grep 查找字符串,以及运行终端命令。考虑到 Cursor 的规模,为了让模型高效使用这些工具,团队需要在云端并发运行数十万份隔离的沙盒编码环境。为此,他们对现有的 Background Agents 基础设施进行了改造,重写了虚拟机调度器,以适应训练运行的突发性与规模,从而实现了 RL 环境与生产环境的无缝衔接。
网友点评
作为备受瞩目的 AI 编程工具,Cursor 的这次重大版本更新自然吸引了众多关注。
参与早期体验的开发者纷纷给予积极评价。每个开发者的反馈都有所不同,every.to 博客也收集整理了多位开发者的意见,其中不乏赞扬与批评之声:
网友热议Cursor 2.0版本更新,反响不一


在X平台上,众多用户也纷纷分享了他们的使用体验。

有趣的是,已经有用户开玩笑地提议用Cursor 2.0来构建AGI。

相关链接:
https://x.com/cursor_ai/status/1983567619946147967
https://cursor.com/blog/2-0
https://every.to/vibe-check/vibe-check-cursor-2-0-and-composer-1-alpha
https://cursor.com/cn/changelog/2-0
视频链接:https://mp.weixin.qq.com/s/SOYp-wIq3YE_DbgppqhALg
Please specify source if reproducedCursor 2.0重磅发布!全新自研模型Composer引领行业变革 | AI工具导航
