编程被视为人类与人工智能之间的桥梁。在众多生成式AI的商业应用中,编程因其结构化程度高、效果易于验证及用户付费意愿强烈等特点,成为了最具商业化潜力的领域之一。然而,长期以来,Anthropic的Claude凭借其卓越的编程能力几乎完全主导了这个市场。
目前,Anthropic已主动中止对中国市场的供给,这为国内的大模型企业提供了难得的良机。尤其是Kimi、智谱和Qwen等在长上下文和推理能力上已有深厚积累的公司,抓住了这一机会,展现出自身的实力。
2025年9月5日,Anthropic正式宣布停止向大部分股权由中国资本控制的公司及其子公司提供Claude服务,并在公告中将中国等国列为敌对国家,禁止中资占比超过50%的实体使用其服务。这一决定直接影响到了新加坡、香港等地的一些中资子公司。
面对这一禁令,众多大模型厂商嗅到了国产替代的巨大商机。
在最近的阿里云栖大会上,阿里展示了七款大模型,特别是新版旗舰Qwen3-Max的能力得到了进一步提升。截至目前,其预览版在LMArena的编程能力排行榜上名列第三。
阿里的技术专家深入分析了他们在AI编程领域的战略观点:由于代码的“可验证”特性,它被认为是实现通用人工智能(AGI)的关键领域。因此,阿里的最终目标并不仅限于成为“代码助手”,而是致力于创建能够像人类工程师一样自主完成复杂任务的“自主编程智能体”。
在大厂竞争的夹缝中生存的“六小龙”们,迎来了难得的商业化机遇,Kimi便是其中的一个典范。9月5日禁令发布当天,Kimi K2进行了性能更新,并随后宣布高速版API限时半价,意图明显。
在Anthropic对中国市场实施封杀后,根据全球知名AI编程平台Roo Code的最新评分,Kimi K2不仅是当前排名最高的开源模型,还是前十中速度最快、价格最低的选择。
Roo Code评测结果显示,K2是总评分最高的开源模型。
商汤、京东云等竞争对手同样紧盯市场,迅速推出开发者迁移方案。同时,六小龙中的智谱也在第一时间推出了“一键搬家”服务,并在9月22日推出专为高频开发者打造的GLM Coding Max版本,配合“拼好模”的促销活动。
国产替代的号角已吹响
对于众多国产AI企业而言,Anthropic的禁令如同一声号角,市场争夺战瞬间拉开帷幕。
在禁令发布的同一天,K2进行了多项升级,提升了兼容性、输出速度、编程能力和上下文长度,随后Kimi宣布高速版API限时半价,显然是为了吸引Claude的用户。
其他国产企业也紧随其后:智谱AI宣布为Claude用户提供“一键搬家”服务,并为新用户提供2000万Tokens的免费体验,其开发者专属的GLM-4.5编码包月套餐价格仅为Claude的七分之一。
商汤科技的“日日新SenseNova”也为原Claude用户提供了快速切换服务,并附赠5000万Tokens的体验包,另设API迁移专属顾问和培训服务。
京东云则推出了Claude Code接入京东云JoyBuilder大模型的服务方案,以及JoyCode+JoyBuilder大模型的智能编程解决方案,以帮助开发者顺利过渡。
相比于AI新锐企业,传统互联网巨头的态度显得模糊,甚至有些尴尬。有阿里云的员工曾对观察者网表示:“国内使用Claude的数量不多,目前没有相关宣传计划。”
除了对市场规模的担忧,大厂们低调处理的另一个原因可能是因为在海外布局中普遍依赖Claude的技术。
字节跳动的AI代码编辑器Trae,采用了与抖音和TikTok类似的策略,分别设有国内版和国际版。其国内版本早已无法使用Claude,但国际版仍以Claude作为卖点,如今却面临技术断供的风险。
Trae在新加坡的运营方正面临这一困扰,其运营实体为字节新加坡子公司SPRING,并通过新加坡的法人实体向用户提供OpenAI的GPT和Anthropic的Claude模型。
尽管通过公司结构避免了地缘政治和数据审查的风险,禁令发布后,Trae依然收到了大量退款咨询。
对此,Trae的管理员在官方Discord中表示,Claude仍然可用,并没有瘦身Claude的消息,敦促用户“暂时不要考虑退款”。
除字节外,阿里巴巴的Qcoder和腾讯的CodeBuddy在海外推广时也将Claude作为自己的卖点,可能会面临技术断供的风险。
尽管Anthropic在声明中明确针对中国及中资占比超过51%的实体实施封禁,但对于如何判定51%的中资身份,目前尚无统一标准,而Claude的垄断解释权和维权过程则充满时间成本和法律不确定性。这一禁令的模糊性犹如达摩克利斯之剑,悬在所有中资企业的头上。
这也意味着,Anthropic的封禁不仅给予了国产大模型公司展示自身能力的平台,也促使境内开发者、海外中资企业甚至国际开发者重新审视自己的技术路径。
月之暗面的反击之路
年初时,月之暗面曾遭遇DeepSeek的激烈竞争,几乎跌入低谷。然而,经过半年多的努力,尽管面临DeepSeek及互联网巨头的强劲竞争,Kimi仍在大幅减少推广的情况下保持了用户规模。
这与其在今年7月发布的“王炸”——Kimi K2密不可分,这标志着其在路径上的重大变革。
今年3月,金沙江创投的朱啸虎曾公开质疑,“杨植麟在科研上可以,但我不清楚他如何商业化。月之暗面在国内大模型上是领先的,但长远来看,必须证明自身的价值,至少要追上美国的开源水平。如果能超越开源,团队的价值才真正体现。”
这种来自顶级投资者的质疑几乎为月之暗面的前景蒙上了阴影,并准确预测了未来几个月将面临的艰巨挑战。
除了DeepSeek带来的行业冲击外,2025年的AI赛道竞争也愈加激烈,腾讯积极布局,通过微信生态为元宝铺路,阿里则将Qwen模型融入夸克、钉钉等平台以争夺市场,字节的豆包则通过抖音引流并大幅买量,每个巨头各自占据了一块流量市场。
今年AI竞赛不仅在争夺流量入口,各企业也在产品发布上加大了力度,昆仑万维甚至在一周内推出了6款模型。
与其他同行频繁推出新产品相比,月之暗面反而显得低调。直到今年7月,Kimi悄然上线了最新的K2模型。
K2是一款总参数达到1万亿、拥有384个专家的MoE模型。作为全球首个达到1T参数量的开源模型,其设计独特,极大降低了部署的门槛。K2专注于代码和通用智能体能力,完全开源且兼容OpenAI与Anthropic的API格式,明确对标Claude。
在性能方面,K2模型不仅达到了开源模型中的SOTA成绩,还与顶尖闭源模型相媲美,成为了大模型竞争中的佼佼者。
在具体应用领域,K2模型同样展现出令人满意的效果。
多名程序员和AI从业者向观察者网表示,站在2025年的视角,AI编程产品几乎只有两个选择,即使用Anthropic的Claude3.7/4.0或谷歌的Gemini 2.5 Pro/Gemini Cli,而K2的表现已然达到不相上下,甚至在某些案例中表现更佳。
尽管Kimi不是推理模型,但在曾经令大模型头疼的常识性问题上,K2也展现了其能力的提升。例如,关于6.9和6.11哪个更大、strawberry有几个字母r等曾经的“难题”,以及生成183个“哈”字这样特意为难AI的问题,K2均给出了正确的答案。
Kimi K2的崛起与中国AI编程生态的重塑
几个月前,Kimi K2的问世为朱啸虎曾提出的三个关键性问题提供了清晰的答案。在技术层面上,K2不仅成功追赶,甚至在多个方面超越了美国同类开源模型,凭借登上Roo Code开源榜首的成就,彰显了其强大的实力;在商业化方面,月之暗面也果断放弃了模糊的C端打赏模式,转而聚焦于更具需求刚性的高价值长链路任务领域。
K2的推出及其开源决策,标志着月之暗面公司战略的深刻转变。
去年11月,月之暗面创始人杨植麟曾阐述为何选择大规模投资Kimi。他强调,Kimi的首要任务是确保用户的留存与增长,鉴于技术的不断进步和API价格的逐步降低,获客成本却在不断攀升。通过提前投入资金来解决获客问题,不仅能塑造用户的认知,还能通过用户反馈的数据形成正向的使用循环。
从ChatBot的竞争角度来看,杨植麟的策略并无大碍,但随着DeepSeek在今年1月底的推出,市场格局发生了剧烈的变化。
在以往的买量攒用户、用户使用模型、模型进一步训练提升的循环模式难以持续的背景下,Kimi果断进行战略转变,押注开源,迈向生态建设的道路。
月之暗面的一位研究员坦言:“开源的首要目的在于提升知名度。如果采用闭源模式,绝不会引发如此关注和讨论。”
然而,开源的真正意图并不仅止于此。该研究员指出,“开源借助社区的力量来完善技术生态,同时提升了技术标准,促使我们开发出更优质的模型,这与追求AGI的目标是一致的。”
换句话说,一旦一个模型选择开源,就意味着它必须展现出足够通用的能力,以便第三方能够轻松验证和复现,而不能依靠所谓的调整来掩盖性能。
这一战略的转变背后也蕴含着商业考量。
目前,AI商业化最有潜力的三个方向分别是ChatBot订阅、AI生成图像/视频及AI编程。
对中国用户而言,推动用户为AI聊天大规模付费几乎是不可想象的,ChatBot只是AI流量与数据的入口。
Kimi并非没有进行过商业化尝试,2024年5月,Kimi推出了金额在5.2元至399元之间的打赏功能。最近又有消息称,Kimi即将为Agent功能推出会员订阅服务。
曾经的打赏用户晒出Kimi会员权益
然而,在AI生成图像/视频功能方面,Kimi在推出两个灰测产品后便没有进一步更新,这显然并非其战略重点。因此,专注于编程既能发挥其优势,也形成了可行的商业模式。
清华姚班的优秀学子、OpenAI研究员姚顺雨在近期的访谈中表示对这一赛道的乐观:“我在2022年一直思考:做Coding Agent的确是一个非常重要的方向,为什么没有人去做?”
他进一步指出:“编程是人与AI之间的最佳连接工具,正如人的手一样,拥有手才能使用锤子、剪刀等生产工具,才能开展各种工作,因此现在的模型都在争相提升编程能力。”
同样来自清华的杨植麟虽然未明确表态,但其战略思路可从他过往的发言和经历中得到启示。
在2023年众多企业追求通用能力的“大而全”时,杨植麟在采访中强调“我们将200万字上下文作为首要任务,而不是一味追逐通用榜单。”
Kimi K2模型的设计与开发理念与Coding Agent的方向高度契合。
因此,在当前众多企业追求通用Agent的风潮中,他选择专注于Coding的思路显得一贯。
切入这一赛道的另一核心优势在于占据国产替代生态位,成为“中国的Anthropic”,以拿下Claude留下的市场。
Kimi作为纯国产模型,不仅规避了合规与备案的困扰,且作为该领域的先行者,一旦形成行业生态,即便其他开源模型进入竞争,生态带来的沉没成本将成为Kimi潜在的护城河。
不仅仅是Kimi:巨头与独角兽的“代码豪赌”
当然,专注于Coding这一战略高地的并非只有月之暗面。实际上,这已成为国内顶级大模型厂商的“必争之地”。
以智谱为例,其策略尤为引人注目。作为来自清华、具有强烈“国家队”色彩的AI企业,外界可能预期其路线会相对稳健保守。
然而,智谱在市场竞争中的姿态却出乎意料地激进。其最新推出的“GLM Coding Plan”,旨在构建一个极致开放、兼容的编码生态。在原有支持Claude Code的基础上,新增兼容Roo Code、Cline、Kilo Code等众多主流AI编程工具,并覆盖所有主流IDE环境。
这种“广撒网”的平台化战略,加上最低20元的月付计划和“拼好模”式的拉新优惠,掀起了一场毫不留情的价格战。
这种看似“不计成本”的投入,清楚地表明了智谱的野心:不仅要在技术上与国际尖端模型对标,更要在商业上以最接地气的方式,竭尽全力抢占开发者的心智和市场份额。
低价吸引新用户并不意味着智谱在技术实力上有所欠缺,反而表明国产大模型的技术实力已普遍达到全球领先水平。GLM-4.5凭借1/7的价格解决实际问题的能力已接近Claude Sonnet 4。
在CC-Bench评测体系下,国产开源模型已接近顶级模型水平
在GLM-4.5发布后的多次开源评测中,GLM-4.5与国际主流模型保持了同等的竞争力,其中在WebDev Arena中与全球领先模型并列第二,而在SWE-bench Verified性能上超越Gemini-2.5-Pro和GPT-4.1。在CC-bench的评测中,智谱与DeepSeek、Kimi K2模型相互较量,而对于Qwen-Coder则占据一定优势。
值得注意的是,这并不意味着阿里在AI编程领域的进展滞后,而是表明国内这个领域的竞争愈发激烈。
就在9月24日,阿里在云栖大会上隆重推出了Qwen3-Coder的重大升级。
对于阿里巴巴这样体量的巨头而言,AI编程虽然看似是一个垂直的赛道,但却获得了其坚定不移的战略性投入。这一决策的根本原因在于,阿里深知开发者是其“云”业务的基石与命脉。
阿里云栖大会:AI编程的未来与挑战
在云栖大会的技术分享环节,通义实验室的算法专家深入探讨了他们对人工智能编程的独特见解。他们指出,编程代码是人类与数字世界交流的核心媒介,而AI编程因其具有“可验证”的特性,被看作是实现通用人工智能(AGI)的首要领域。基于这一洞察,阿里巴巴将AI编程的发展分为三个显著阶段:首先是代码补全,其次是代码助手,最终目标是创建能够自主执行复杂任务的“自主编程智能体(Agent)”。
为了实现这一最终愿景,阿里的技术策略十分明确。首先,在预训练阶段,利用超过7.5万亿Tokens的大量高质量代码数据,给模型灌输强大的代码“记忆”;其次,重视超长上下文的处理,以确保模型能够掌握整个代码库;最后,通过反馈学习(Reinforcement Learning),模拟人类从调试和错误中学习的过程,逐步提升模型的性能。这一切的背后,是阿里云自建的强大训练基础设施,能够快速创建数千个虚拟环境,为AI智能体的进化提供了一个理想的实验场。
因此,Qwen3-Coder的更新——更快的推理速度、更高的安全性以及256K的上下文窗口——正是这一战略宏图的具体体现。其开源后在OpenRouter平台的调用量激增1474%,充分证明了这一策略的有效性。
在同一会议上,阿里还推出了Qwen3-Max,这是一款全新的闭源旗舰模型,在解决现实世界问题的SWE-Bench测试中取得了优异成绩。这一成就清晰展现了阿里巴巴的“双管齐下”策略:通过顶级开源模型吸引广泛的开发者,同时利用最强闭源模型为高价值企业客户提供服务,最终将AI编程的投入转化为整个云帝国的增长引擎。
无论是程序员对简化重复工作的迫切需求,还是未来低代码乃至无代码时代所带来的大量编程需求,都指向一个共同的趋势:编程正在演变为AI时代的“通用语言”。在编程领域的布局,实际上不仅是选择一个垂直市场,更是立志成为下一代AI原生应用的基础设施和操作系统,这是一块赢家通吃的战略高地。
历史性的机遇与挑战并存
Anthropic的禁令无意间为中国的AI技术发展带来了前所未有的机遇。
然而,赢得这场反击战或许仅仅是漫长征途的第一步。所有竞争者面临的前路并不平坦,而是布满了更加严峻的“焦土战争”。
首个挑战在于“从惊艳到稳定”的基础设施鸿沟,这对To B市场而言是生死攸关的。在Kimi K2上线的初期,激增的访问量曾导致服务器出现卡顿和延迟。虽然C端用户可能对此有一定的容忍度,但对于企业级服务而言,这种情况就是致命的缺陷。到2025年,AI竞争中模型的性能和稳定性将同等重要。竞争者,无论是财力雄厚的互联网巨头,还是同样具备强大实力的智谱等“小龙”,都在虎视眈眈。每一家公司都必须证明,不仅能够产出“王炸”产品,同时还能提供如水电煤一般可靠的基础设施服务,而这背后是对供应链、工程能力及巨额资金的极限考验。
第二个挑战在于开源后的商业化之路远比预想的更加艰难。以月之暗面、智谱、DeepSeek为代表的开源玩家,虽然赢得了声誉和生态的入场券,但这也意味着将自身最强的武器公之于众。
在商业化的竞争中,这无疑是一场残酷的“左右手互搏”。这些开源模型公司所提供的API服务,不仅面临直接竞争对手的价格战,更要抵御来自各大云服务商低价打包的自家开源模型的威胁。阿里云和腾讯云完全有能力将任何流行的开源模型作为“亏损换市场”的引流产品,以远低于官方API的价格提供服务,从而轻松“截胡”客户。
值得关注的是,Kimi K2发布后,众多海外AI和云平台迅速上线该模型,Perplexity的CEO在社交媒体上表示,基于K2的优异表现,公司将考虑后续利用其进行训练。
因此,所有开源玩家必须比所有“搭便车者”更快地建立起围绕官方API、Agent功能等增值服务的深厚护城河——无论是极致的性能优化、独特的功能,还是强大的解决方案生态。否则,模型的先进性最终可能只是为他人做了嫁衣,自己却陷入了“叫好不叫座”的商业泥潭。
与此不同的是,尽管DeepSeek背靠幻方量化并备受关注,可以持续烧钱,或是拥有强大云业务支持的互联网巨头,许多AI独角兽公司无论是在自我造血还是对投资者负责的角度,实际上都不允许自己无止境地投入生态建设。在技术信仰与商业现实之间找到平衡,是这些明星创业公司面临的最严峻考验。
尽管如此,在Claude禁令带来的窗口期中,无论是AI独角兽本身、他们的投资者,还是迫切需要国产合规替代品的开发者和企业们,都暂时松了一口气。国产大模型的集体崛起,至少证明了中国AI力量在关键时刻能够推出“王炸级”产品的能力。然而,这盏在漫长征途中点亮的指路灯能否持续发光,最终取决于中国的AI玩家们能否在技术之外,赢得一场关于稳定性、生态建设和商业模式的更为艰难的战争。
在这条机遇与挑战并存的道路上,Kimi抢得了先机,但阿里不计代价的投入和智谱的步步紧逼同样不可小觑。中国AI的“王座”依然虚位以待,真正的王者将会在技术、生态与商业的残酷“铁人三项”中诞生。
本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。
Please specify source if reproduced谁将取代Claude,成为中国AI编程的巅峰之者? | AI工具导航



