最新消息,Anthropic 发布了 Claude Haiku 4.5 模型。
简单介绍一下,Claude 系列包括三个不同规模的模型:Claude Opus(大杯)、Sonnet(中杯)以及 Haiku(小杯)。
此次更新最引人注目的特点是,小杯的 Claude Haiku 4.5 在保证高性能的同时,速度更快且成本更低。
五个月前,Claude Sonnet 4 仍然是最顶尖的模型之一。而现在新发布的 Haiku 4.5 在编码性能上几乎可以与其匹敌,但价格仅为其三分之一,速度却提高了两倍以上。
Chart comparing frontier models on SWE-bench Verified which measures performance on real-world coding tasks
具体而言,在评估 AI 编码能力的测试集 SWE-bench Verified 中,Haiku 4.5 的得分达到了 73%,这意味着它与 Claude Sonnet 4 和 OpenAI 最新的 GPT-5 处于同一水平。
在某些任务上,例如操作计算机,Haiku 4.5 甚至超越了前辈 Sonnet 4。
对于那些需要 AI 处理实时、低延迟任务的应用场景——如聊天助手、客服代表或结对编程助手,Haiku 4.5 兼具卓越的智能与迅速的响应,提供了更优的用户体验。
开发者使用 Claude Code 时也会感受到,Haiku 4.5 使得整个编程流程——从多智能体合作到快速原型开发——变得更加灵活高效。
当然,尽管两周前发布的 Sonnet 4.5 依旧是 Anthropic 的旗舰模型,处于全球编程模型的顶级行列,但 Haiku 4.5 提供了一个替代选择:在性能几乎相当的情况下,价格却更加亲民。
而且模型的用法更为灵活,Sonnet 4.5 能将复杂问题分解为多个小任务,并指挥一批 Haiku 4.5 同时处理,这样的配合相当默契。
Anthropic 对 Haiku 4.5 进行了全面的安全性和对齐性测试。
结果显示,该模型的不当行为发生率较低,且相比前一代 Haiku 3.5 的对齐性显著提升。在自动化对齐评估中,Haiku 4.5 的偏离行为少于 Sonnet 4.5 和 Opus 4.1。
也就是说,它是目前 Anthropic 系列中最安全的模型。
Comparison table of frontier models across popular benchmarks
至于定价方面,Haiku 4.5 的费用为:每百万输入 token 收费 1 美元,每百万输出 token 收费 5 美元。
对比之下,GPT-5 mini 的费用大约为每百万输入 0.25 美元、输出 2.5 美元,Google 的 Gemini 2.5 Flash 也差不多。因此,Haiku 4.5 的价格大约是 GPT-5 mini 或 Flash 的四倍。
不过,相较于 Sonnet 4.5,它便宜了约三倍,而性能几乎没有差异,这对开发者而言无疑是降低成本并提升效率。
但不得不提的是,数学能力并不是它的强项。
知名博主 Dan Shipper 在试用后发现,Haiku 在算数方面有些… 糊涂。
例如在处理 Uber 账单的示例中,Haiku 能够完全找到所有相关邮件,但在计算总额时却出现了错误。更让人哭笑不得的是,当指出错误后,它承认了——但随后又犯了同样的错误。
Dan Shipper 给出了中肯的评价:
探索 Haiku:开发者的理想选择
对于那些正在利用 Sonnet 4.5 开发复杂智能代理应用的开发者或创业者来说,转向 Haiku 绝对是一个值得考虑的选择。这样做不仅能显著降低成本,而且几乎没有性能上的损失。
若你当前正在使用 Gemini 2.5 Flash 或 GPT-5 mini,强烈建议尝试 Haiku。尽管其价格略高,但在需要灵活调用工具和保持自主性的场景下,Haiku 的表现更为优越。
博客链接附上:
https://every.to/vibe-check/vibe-check-claude-haiku-4-5-anthropic-cooked
目前,Claude Haiku 4.5 已在 Claude Code 及多种应用中推广使用。
开发者可以通过 Claude API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 使用 Haiku 4.5,作为 Haiku 3.5 和 Sonnet 4 的直接替代,且价格相对较为优惠。
参考了@zb1992 的提示,我们让 Claude 4.5 Haiku 进行了一次钟表 Demo,整体体验中,代码生成的速度明显提升,最终的产品效果也让人满意。
在接下来的经典推理计算题中,Claude 4.5 Haiku 的响应速度优势更加突出,这正体现了轻量级模型在实际应用中的核心竞争力。
此外,据 The Information 报导,估值达到 1700 亿美元的 Anthropic 最近几周已向投行顾问透露,公司计划通过收购吸引更多技术人才,并拓展编程助手之外的其他功能,毕竟目前编程依然是收入的主要来源。
知情人士透露,考虑到 Anthropic 在为开发者提供编程类 AI 产品方面的成功,未来公司可能会拓展到其他常用软件工具,例如自动化代码漏洞检测工具或辅助软件设计的工具。
另外,有消息称,Anthropic 也可能通过收购开发特定行业的产品,如金融服务、医疗健康或网络安全等领域的工具,但他们更青睐于交易金额在 5 亿美元以下的小型收购项目。
当前,Anthropic 不仅在增强其模型的性能方面不断努力,同时也在生态系统的建设上积极推进。在人工智能领域,各大公司之间的竞争愈加激烈,最终获益的将是开发者和用户——他们将享受到更为强大的模型、更具吸引力的价格以及更多样化的选择。
作者:莫崇宇
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),以便第一时间获取更多精彩内容。
爱范儿|原文链接· ·新浪微博
Please specify source if reproducedClaude模型重磅发布:速度翻倍、价格大幅下调,编程实力直追GPT-5! | AI工具导航






