编辑 | Tina
今天,谷歌正式推出了 Gemini CLI,这是其 AI 助手在终端环境中的新版本。这一工具的最大亮点在于其极为丰厚的免费使用额度:它允许每分钟进行 60 次、每天总共 1,000 次的模型调用。
1 免费额度“开挂”,让 Claude 感到压力山大?
在今年 2 月发布的 Claude Code 和 4 月的 OpenAI Codex CLI 后,谷歌在 6 月也推出了 Gemini CLI。至此,三大 AI 研究机构都相继推出了各自的“终端智能体”工具。这类 CLI 工具不仅能够读取和修改文件,还能在终端内代表用户执行各种命令。
许多人可能曾认为这样的终端工具会一直局限于小众市场,但现在看来,这显然低估了其潜力——不少开发者每月在 Claude Code 上的支出高达数百甚至数千美元,显示出这个“冷门市场”实际上远比预想中庞大且重要。
与 Claude Code 相比,谷歌在定价方面显得相当慷慨:
只需使用个人 Google 账号登录,即可免费获得 Gemini Code Assist 许可。这将解锁 Gemini 2.5 Pro 模型和百万 token 的上下文窗口。在此次预览阶段,谷歌提供了业内最宽松的调用配额:每分钟最多可以进行 60 次请求,每天最多 1000 次,全部免费。
目前看来,社区对 Gemini CLI 的关注主要集中在它庞大的免费额度上。评论者们直言:“这真是太过分了,这无疑会给 Anthropic 带来巨大的压力。”“确实如此——如果这些调用限制是真的且免费,这将标志着真正的竞争开始。”
与 Claude Code 不同的是,Gemini CLI 以及 OpenAI Codex CLI 都是开源的(采用 Apache 2.0 许可证)。并且在不到一天的时间内,Gemini CLI 就获得了 15.1k 的星标。
Gemini CLI 提供了一系列强大的功能,涵盖了代码编写、问题调试、项目管理、文档查询及代码解析等方面。此外,它还与 MCP(模型上下文协议)服务器连接,具备了 Agentic AI 的能力。
这一命令行工具的显著好处在于,它能够与任何代码编辑器或 IDE 一同使用,而不需要依赖特定的插件;同时,它还允许多个实例并行运行。许多开发者也认为,命令行的交互方式能大幅提升工作效率。
支持的操作系统包括 Mac、Linux(包括 ChromeOS)和 Windows。与 Claude Code 或 Codex 不同的是,Gemini CLI 在 Windows 上实现了原生支持,无需依赖 Windows 子系统(WSL)。用户可以通过在项目根目录创建名为 gemini.md 的文本文件,来自定义上下文和参数。谷歌的高级工程师 Tayor Mullen 表示,当 CLI 识别出“值得长期保存的细节”时,会自动将其写入该文件。
由于整体开源,用户也能直接查看其系统提示词。
如往常一样,这些系统提示词不仅明确了工具的行为,同时也提供了简洁明了的使用指南。例如,它对代码注释的策略是:
注释:请审慎添加注释,重点阐明“为什么”要这样做,特别是在处理复杂逻辑时,而非单纯解释“做了什么”。只有在显著提升可读性或用户明确要求时,才添加有价值的注释。请勿修改与更改无关的注释,也不要通过注释与用户进行交流或说明你的更改。
系统默认的技术栈也值得关注。
若用户未指定技术偏好,系统默认建议如下:
-
Web 前端:推荐使用 React(JavaScript/TypeScript)结合 Bootstrap CSS,以及遵循 Material Design 设计规范;
-
后端 API:建议使用 Node.js + Express.js 或 Python + FastAPI;
-
全栈应用:推荐 Next.js(React/Node.js)结合 Bootstrap + Material Design,或 Python(Django/Flask)与 React/Vue.js 前端;
-
命令行工具(CLI):建议使用 Python 或 Go;
-
移动 App:推荐使用 Compose Multiplatform(Kotlin)或 Flutter(Dart),支持跨平台开发,同时也兼容 Jetpack Compose(Android)或 SwiftUI(iOS)原生开发;
-
3D 游戏:推荐使用 HTML/CSS/JavaScript + Three.js;
-
2D 游戏:推荐使用 HTML/CSS/JavaScript。
2 胜过专用,Gemini CLI 依靠什么?
Gemini CLI 引入了谷歌最尖端的编码与推理模型 Gemini 2.5 Pro,具备代码理解、文件操作、命令执行及动态故障排查等多种能力,从而全面提升命令行的使用体验。用户能够用自然语言编写代码、调试问题,并优化工作流程。
更为重要的是,Gemini CLI 还可以通过 MCP 接入其他谷歌服务,在终端内生成图像或视频,打造从编码到创作的一体化体验。
在发布会上展示的一体化演示及其背后的技术理念,实际上揭示了 Gemini CLI 的核心定位——它不仅是一个编写代码的工具,更是一个连接多模态智能、打通编码与创作的“终端智能体”。这一理念也体现在其所依赖的 Gemini 2.5 Pro 模型选择上。
值得注意的是,Gemini 2.5 Pro并非专门为代码编写而设计的“专用代码模型”,而是一个具备广泛能力的通用模型。那为什么谷歌没有像一些竞争对手一样,为Gemini CLI特别开发一个定制的代码模型呢?在一场深入访谈中,产品负责人Connie Fan与研究负责人Danny Tarlow分享了他们的见解。
Connie Fan指出,虽然某些特定的任务可以从专用模型中获益,例如Cursor训练的代码补全模型在特定场景下表现卓越,但她强调,现实中的大多数开发工作往往超越了单纯的编码需求。
例如,她提到了一种经典的“vibe check”请求:“帮我制作一个关于泰勒·斯威夫特的歌曲排行榜应用”——这不仅要求模型具备编码能力,还需理解上下文、常识,甚至具备某种UI/UX审美。“这些常识反映了用户的真实编程需求,”她总结道,“大多数通用任务并不依赖于单一的代码模型。”
Danny Tarlow进一步指出:“代码专用模型的真正含义是什么?‘代码’的概念已不仅限于代码本身,它涵盖了软件开发过程中的各个环节,涉及多种信息来源,有的与代码有关,有的则没有。如果单纯增强代码能力而忽视其他能力,反而可能限制模型的整体表现。我们更倾向于在通用模型的基础上实现协同发展,寻求不同能力的融合与平衡,创造出一种‘通才型’模型,这才是更理想的发展方向。”
实际上,越来越多的开发者开始注意到Gemini 2.5 Pro在代码生成和理解方面的显著进步。
在Claude长期主导的讨论氛围中,很多人开始问“Gemini要逆袭了吗?”或“谷歌要翻盘了吗?”在社交媒体上,有用户分享了一些开发体验:在一个约50万行代码的大型项目中,Claude Code生成的代码质量“远不如cline + Gemini 2.5 Pro”,而要实现同样的效果,Claude需要开发者全程盯着。
还有开发者表示,在Trae上使用Gemini 2.5 Pro编程的完成率显著超越Claude 3.7。也有开发者反馈,Gemini修复bug的速度明显快于Claude Code。
有一个3D渲染处理的bug,让Claude Code修了两个小时都未解决,而询问Gemini 2.5 Pro后,只用了5分钟就搞定了。对于那些看似难度较高的问题,可以先让Gemini写出详细的说明书,然后再让Claude Code根据说明进行实现,这种组合方式也许会非常有效。
这些反馈显示,过去一年,谷歌在代码能力方面的提升已经进入了“质变期”。Gemini编码产品负责人Connie Fan指出,Gemini 2.5 Pro之所以获得良好口碑,主要得益于两个方面的系统演进:“数据”和“方法论”。
从数据的视角来看,“代码仓库上下文”变得至关重要。如今,模型的目标不再是简单的代码补全,而是理解并修改分布在多个文件、涉及多个模块的大型代码库:“模型需要能够完成那些你如果花一小时坐下来,在熟悉的代码仓库上下文中亲自去做的复杂改动。”
为了让模型真正理解这些上下文,谷歌开始系统性地挖掘内部工程师的资源。
其中包括像Jeff Dean这样的人物,“他们代表了一种‘能力新等级’的标准,”Connie直言,“我们拥有世界上最聪明、最出色、有时也最有主见的十几万工程师。”通过他们在不同编程语言、技术栈和经验水平上的反馈,谷歌能够覆盖更广泛的使用场景,提高模型在“专业开发者细腻口味”上的匹配能力。“过去我们并未很好地利用这一点,而现在我们真正开始这样做,并且效果非常显著。”
从研究的角度看,Gemini团队没有将所有的希望寄托于“单一大上下文窗口”的方案,而是探索双重路径:一方面持续扩展上下文长度,另一方面发展具备自主搜索与推理能力的agentic编程模型,该模型以代理形式与用户互动,甚至具备一定程度的自主性。
正如研究负责人Danny Tarlow所描述:
“如果我们把你(人类开发者)放入一个大型代码库中,你会如何操作?你会用代码搜索、查看文件结构、点来点去,阅读一些代码再搜索其他信息。agentic模型正是模拟了这种操作方式。”
更有趣的是,当模型成功处理一个百万行代码库时,用户会体验到一种“魔法般”的惊奇。而这正是Gemini 2.5 Pro所追求的方向:不仅仅是模拟人类的工作方式,更是突破人类经验的限制,发展出“非人类”的全新解决方案。
正因如此,越来越多的开发者开始关注谷歌在这场AI编程竞赛中的回归。尽管Gemini是否会“翻盘”尚未可知,但“赶超”的信号正变得愈发清晰。
参考链接:
https://www.youtube.com/watch?v=jwbG_m-X-gE
声明:本文为AI前线整理,不代表平台观点,未经许可禁止转载。
今日好文推荐
离开百川去创业!8个人用2个多月肝出一款热门Agent产品,创始人:Agent技术有些玄学
React被指“沦为Vercel打工仔”,力推框架只为圈钱?核心成员亲自回应却遭群嘲
印度裔AI负责人删掉Karpathy 90%遗留代码,马斯克Robotaxi终上线!用户体验:不要小费,还可能倒给你钱
AI正在淘汰“中间层”!昆仑万维方汉:要么冲进前10%,要么学会“向下兼容”
活动推荐
6月27~28日的AICon北京站将继续聚焦AI技术的前沿突破与产业落地,围绕AI Agent构建、多模态应用、大模型推理性能优化、数据智能实践、AI产品创新等热门议题,深入探讨技术与应用融合的最新趋势。欢迎持续关注,和我们一起探索AI应用的无限可能!
探索AI技术的未来:AICon北京站的热议话题
在即将到来的8日,AICon北京站将聚焦于人工智能领域内的前沿发展与实际应用。此次会议将围绕多个热门主题展开深入讨论,包括AI Agent的构建、多模态应用的整合、大模型的推理性能优化、数据智能的实际运用以及AI产品的创新等。
与会者将共同探讨技术与应用之间的最新融合趋势。这是一个不可错过的机会,期待您与我们一起深入挖掘AI应用所带来的无限可能性!
Please specify source if reproduced谷歌 Gemini CLI横扫千军,一天15k星,代码生成实力超越Claude,Cursor也开始紧张了! | AI工具导航




