Claude模型重磅发布:速度翻倍、价格大幅下调,编程实力直追GPT-5!

AI快讯 3hours ago AICAT
0 0
Claude模型重磅发布:速度翻倍、价格大幅下调,编程实力直追GPT-5!

最新消息,Anthropic 发布了 Claude Haiku 4.5 模型。

简单介绍一下,Claude 系列包括三个不同规模的模型:Claude Opus(大杯)、Sonnet(中杯)以及 Haiku(小杯)。

此次更新最引人注目的特点是,小杯的 Claude Haiku 4.5 在保证高性能的同时,速度更快且成本更低

五个月前,Claude Sonnet 4 仍然是最顶尖的模型之一。而现在新发布的 Haiku 4.5 在编码性能上几乎可以与其匹敌,但价格仅为其三分之一,速度却提高了两倍以上。

Claude模型重磅发布:速度翻倍、价格大幅下调,编程实力直追GPT-5!

Chart comparing frontier models on SWE-bench Verified which measures performance on real-world coding tasks

具体而言,在评估 AI 编码能力的测试集 SWE-bench Verified 中,Haiku 4.5 的得分达到了 73%,这意味着它与 Claude Sonnet 4 和 OpenAI 最新的 GPT-5 处于同一水平。

在某些任务上,例如操作计算机,Haiku 4.5 甚至超越了前辈 Sonnet 4。

对于那些需要 AI 处理实时、低延迟任务的应用场景——如聊天助手、客服代表或结对编程助手,Haiku 4.5 兼具卓越的智能与迅速的响应,提供了更优的用户体验。

开发者使用 Claude Code 时也会感受到,Haiku 4.5 使得整个编程流程——从多智能体合作到快速原型开发——变得更加灵活高效。

当然,尽管两周前发布的 Sonnet 4.5 依旧是 Anthropic 的旗舰模型,处于全球编程模型的顶级行列,但 Haiku 4.5 提供了一个替代选择:在性能几乎相当的情况下,价格却更加亲民。

而且模型的用法更为灵活,Sonnet 4.5 能将复杂问题分解为多个小任务,并指挥一批 Haiku 4.5 同时处理,这样的配合相当默契。

Anthropic 对 Haiku 4.5 进行了全面的安全性和对齐性测试。

结果显示,该模型的不当行为发生率较低,且相比前一代 Haiku 3.5 的对齐性显著提升。在自动化对齐评估中,Haiku 4.5 的偏离行为少于 Sonnet 4.5 和 Opus 4.1。

也就是说,它是目前 Anthropic 系列中最安全的模型。

Claude模型重磅发布:速度翻倍、价格大幅下调,编程实力直追GPT-5!

Comparison table of frontier models across popular benchmarks

至于定价方面,Haiku 4.5 的费用为:每百万输入 token 收费 1 美元,每百万输出 token 收费 5 美元。

对比之下,GPT-5 mini 的费用大约为每百万输入 0.25 美元、输出 2.5 美元,Google 的 Gemini 2.5 Flash 也差不多。因此,Haiku 4.5 的价格大约是 GPT-5 mini 或 Flash 的四倍。

不过,相较于 Sonnet 4.5,它便宜了约三倍,而性能几乎没有差异,这对开发者而言无疑是降低成本并提升效率。

但不得不提的是,数学能力并不是它的强项。

知名博主 Dan Shipper 在试用后发现,Haiku 在算数方面有些… 糊涂。

例如在处理 Uber 账单的示例中,Haiku 能够完全找到所有相关邮件,但在计算总额时却出现了错误。更让人哭笑不得的是,当指出错误后,它承认了——但随后又犯了同样的错误。

Dan Shipper 给出了中肯的评价:

探索 Haiku:开发者的理想选择

对于那些正在利用 Sonnet 4.5 开发复杂智能代理应用的开发者或创业者来说,转向 Haiku 绝对是一个值得考虑的选择。这样做不仅能显著降低成本,而且几乎没有性能上的损失。

若你当前正在使用 Gemini 2.5 Flash 或 GPT-5 mini,强烈建议尝试 Haiku。尽管其价格略高,但在需要灵活调用工具和保持自主性的场景下,Haiku 的表现更为优越。

Claude模型重磅发布:速度翻倍、价格大幅下调,编程实力直追GPT-5!

博客链接附上:
https://every.to/vibe-check/vibe-check-claude-haiku-4-5-anthropic-cooked

目前,Claude Haiku 4.5 已在 Claude Code 及多种应用中推广使用。

开发者可以通过 Claude API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 使用 Haiku 4.5,作为 Haiku 3.5 和 Sonnet 4 的直接替代,且价格相对较为优惠。

Claude模型重磅发布:速度翻倍、价格大幅下调,编程实力直追GPT-5!

参考了@zb1992 的提示,我们让 Claude 4.5 Haiku 进行了一次钟表 Demo,整体体验中,代码生成的速度明显提升,最终的产品效果也让人满意。

在接下来的经典推理计算题中,Claude 4.5 Haiku 的响应速度优势更加突出,这正体现了轻量级模型在实际应用中的核心竞争力。

Claude模型重磅发布:速度翻倍、价格大幅下调,编程实力直追GPT-5!

此外,据 The Information 报导,估值达到 1700 亿美元的 Anthropic 最近几周已向投行顾问透露,公司计划通过收购吸引更多技术人才,并拓展编程助手之外的其他功能,毕竟目前编程依然是收入的主要来源。

Claude模型重磅发布:速度翻倍、价格大幅下调,编程实力直追GPT-5!

知情人士透露,考虑到 Anthropic 在为开发者提供编程类 AI 产品方面的成功,未来公司可能会拓展到其他常用软件工具,例如自动化代码漏洞检测工具或辅助软件设计的工具。

另外,有消息称,Anthropic 也可能通过收购开发特定行业的产品,如金融服务、医疗健康或网络安全等领域的工具,但他们更青睐于交易金额在 5 亿美元以下的小型收购项目。

Anthropic的生态布局:提升模型能力与用户福利的双重进步

当前,Anthropic 不仅在增强其模型的性能方面不断努力,同时也在生态系统的建设上积极推进。在人工智能领域,各大公司之间的竞争愈加激烈,最终获益的将是开发者和用户——他们将享受到更为强大的模型、更具吸引力的价格以及更多样化的选择。

作者:莫崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),以便第一时间获取更多精彩内容。

爱范儿|原文链接· ·新浪微博

来源:今日头条
原文标题:Claude「最香」模型发布,速度翻倍价格大砍,编程能力直逼 GPT-5 - 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
Copyrights:AICAT Posted on 2025-11-15 11:16:28。
Please specify source if reproducedClaude模型重磅发布:速度翻倍、价格大幅下调,编程实力直追GPT-5! | AI工具导航
广告也精彩

No comments

No comments...