一个月前我还在借助别人的模型,今天却成功推出了自己的基座大模型。
全球开发者为之热衷的AI编程工具Cursor,今天宣布了一项重大消息。
2025年10月29日,Cursor 2.0正式问世,其最大优势不在于新增的功能,而是——他们终于推出了自己的编程大模型Composer。
毫无疑问,这不再是简单地使用GPT或Claude的外壳。这一次,Cursor真正踏上了自主创新之路。
30秒完成复杂任务,速度提升400%
让我们先来看看数据。
Composer:编程速度与质量的双重突破
Composer的代码生成速度达到每秒250个tokens,这一表现使其比目前最快的推理模型(如GPT-5和Claude Sonnet 4.5)快出近两倍,相较于其他模型更是快了四倍之多。
然而,速度并非唯一的亮点,质量同样没有妥协。
根据Cursor官方的说法,Composer能够在短短30秒内完成大多数复杂的编程任务,即使面对大型、结构复杂的代码库,依旧能够展现出卓越的推理和理解能力。
这一性能数据源于Cursor开发的内部测试工具“Cursor Bench”,该系统基于真实开发者的使用场景进行评估。它不仅检验代码的正确性,还关注模型对抽象层次、风格规范及工程实践的遵循情况。
测试结果表明,Composer在推理和任务泛化能力方面已经达到了与中等前沿模型相媲美的水平。
换句话说,速度快,同时保持高效智能。
通过强化学习与MoE架构,助力模型在真实环境中成长
如此令人惊叹的表现,究竟是如何实现的呢?
Cursor的研究科学家Sasha Rush对此给出了答案:核心在于强化学习。
"我们通过强化学习对一个大型的MoE模型进行训练,使其更接近实际的编程任务,同时也确保了处理速度的迅捷。"
然而,问题来了:强化学习只有在真实环境中才能得到有效发挥。
如果Composer仅仅在虚拟数据集上进行代码调整,它根本无法判断这些代码是否存在缺陷,或者测试是否能够通过。因此,Cursor决定让模型直接“上阵”——在完整的Cursor环境中实际运行、调用工具并执行命令,通过真实的互动来获得最佳的反馈信号。
创新训练方式提升模型性能
具体而言:
- 在训练过程中,模型能够直接操作完整的代码库,运用一整套的生产工具,如文件编辑、语义搜索及终端命令等。
- 在面对复杂的工程挑战时,模型需要自己编写代码、进行测试并修复问题
- 每一次训练都对应着一个特定的任务,例如编写代码的修改、制定方案,或解释某段代码的逻辑。
事实表明,强化学习确实提升了Composer的性能。
它已掌握了如何灵活选择工具,并高效进行并行处理。随着训练的深入,模型甚至展现出了涌现行为——能够自动运行单元测试、修正代码格式问题,甚至自主完成多步的代码搜索和调试流程。
Cursor 2.0:不仅速度更快,更能理解开发者需求
除了Composer作为其主要引擎,Cursor 2.0还推出了众多令人瞩目的更新:
多Agent并行协作
最多可同时运作8个Agent,每个Agent在独立的代码库副本中进行工作,互不干扰。你可以让多个Agent针对同一个问题进行尝试,最后选择最佳方案。
原生浏览器工具(正式版)
该模型具备自我检测、调试和迭代代码的能力,能够一直优化,直到获得完美的结果。此外,企业团队也可以利用这一强大功能。
语音生成代码
无需动手敲击键盘,只需口述即可。通过这种方式,您可以将想法直接转化为代码,并且还可以自定义特定关键词,以便启动Agent的执行。
沙盒终端(正式版)
在macOS系统中,Agent命令默认在一个安全的沙盒环境下执行,具备对工作区的读取与写入权限,但并不允许访问互联网。
团队命令
在Cursor的仪表板上,团队能够为成员设置特定的自定义命令和规则,所有团队成员将自动应用这些设置,无需依赖本地文件的存储。
优化后的代码审核
如今,用户可以轻松地查看Agent在多个文件中所作的所有更改,而不必频繁切换不同的文件。
此次改进的关键在于:转变为“以Agent为中心”的思维方式。Cursor已经不仅仅是一个普通的代码编辑器,而是一个真正适用于实际操作的人工智能编程平台。
最大的疑问:Composer真的完全是自主研发吗?
尽管Composer的表现让人赞叹,但Cursor却始终没有明确解答一个关键问题:
关于Composer模型来源的悬而未决之谜
强化学习的确是一个重要的议题,但请明确模型的基础到底是什么。
有开发者在Hacker News平台上提出了质疑:
“Composer缺乏透明度的情况实在让人无法理解。他们提到采用了强化学习,却未说明模型的其他训练细节——究竟是自主预训练的,还是基于现有模型进行修改?在公开更多信息或有人能够独立验证之前,我对这些说法持怀疑态度。”
Cursor的研究员Sasha Rush近期在Hacker News上积极参与讨论,但对于“基础模型的来源”这一问题,她始终未能给予直接的回应。
在被具体询问“Composer是否是对某个开源模型进行微调?”时,Rush给出的回答是:
“我们更关注的是强化学习的后续训练阶段,我们认为这才是将模型打造成强大互动智能体的最佳方法。”
不过,有一点可以确认的是,Cursor过去确实开发了自己的内部模型。据资料显示,
Cheetah是Composer的早期版本,团队曾利用它来评估生成速度及系统集成效果。
至于正式版的Composer究竟是基于Cheetah,还是在开源模型的基础上进行了改造……
这一点还需时间来验证。
总结感言
此次Cursor的推出,最为聪慧之处在于其并没有单纯与GPT或Claude在参数规模上进行比拼,而是
充分利用了其在应用领域的独特产品优势
。让Composer能够在与用户相同的环境下运行,真正融入开发者的日常工作流程。这种“模型与产品”的深度结合,或许才是人工智能编程工具发展的最终方向。
至于Composer是否确实是“自主研发”,或许并不是最为关键的问题。
更重要的是,它是否能够真正提升开发者的编码效率和体验?
参考资料:
- Cursor官方博客
- Hacker News讨论
Please specify source if reproducedCursor 2.0震撼登场:首款自主研发编程模型Composer,代码生成速度提升四倍! | AI工具导航










