撰稿 | 周愚
编辑 | 邓咏仪
OpenAI的主要竞争者之一,Anthropic,再次引发关注。
在美国时间7月11日,这家由前OpenAI高管创办的人工智能公司,隆重推出了全新的AI模型Claude 2及其网页版测试版本。该网页版可供用户免费使用,并支持中文交流,但目前仅限美国和英国的用户访问。
Anthropic还透露,面向企业的Claude 2 API定价与Claude 1.3保持一致(每生成1000个单词约0.0465美元),并计划在未来几个月内将Claude 2推广至全球市场。
令人瞩目的是,Claude 2此次更新显著扩展了单次输入的长度,达到了10万token,这几乎是当前市场上可用模型中的最高值。10万token意味着Claude 2可以一次处理大约75000个单词,相当于数百页的技术文件,甚至是整本书籍。
此外,模型在编程、数学和推理能力方面也有了显著提升。在Codex HumanEval(Python编程测试)中,Claude的得分从1.3的56.0%提高到了2的71.2%。在小学数学问题(GSM8K)、多学科问答(MMLU)和科学问题(ARC-Challenge)等领域,Claude 2也展现了明显的进步。
数据
与Claude 1.3相似,Claude 2具备文档搜索、总结、代码分析及编程等多种功能。
根据官方网站提供的示例,用户只需上传待分析的文档,并下达相应指令,Claude便会自动阅读并给予反馈。示例中两个pdf文件的总大小接近300k,包含超过83000个token,Claude 2依旧成功完成了任务。
在一次测试中,36氪输入了一份英文文档,并用中文下达指令。Claude 2虽然提供了相对清晰的答案,但明显带有翻译腔,无法达到自然中文对话的流畅度。
分析pdf并回答问题。数据
数据
此外,Anthropic在发布的研究论文中指出,Claude 2具备支持20万token上下文的潜力,但目前尚未对外开放。
为了进一步评估Claude 2的中文能力,36氪向其提出了一道高难度的谐音梗问题。起初,Claude 2显然未能理解问题的真正含义,试图给出符合逻辑的回答。
当36氪提供正确答案——“巴黎世(是)家”后,Claude 2虽然意识到这是个谐音梗,但随即开始了不着边际的回答。
Claude 2的全新功能与发展前景
在代码方面,官方展示了如何用Claude 2为静态地图添加互动效果。用户只需将静态地图的JavaScript文件输入聊天框,Claude 2便能分析代码的功能,并根据用户的需求自动生成新的代码。
同时,36氪也尝试用中文向Claude 2提问,要求其生成一个五子棋游戏的代码。虽然Claude 2能迅速提供可运行的代码,但在判断胜负的逻辑上仍有欠缺。不过,Claude 2也提供了相关的解释,鼓励用户进一步扩展代码。
分析代码功能。
生成新代码。
此次更新所使用的数据集涵盖了网站内容、第三方授权数据以及2023年初用户自愿提供的信息。相较之下,OpenAI的ChatGPT在未联网时,其数据集仍停留在2021年底的状态。
然而,Anthropic的上市负责人Sandy Banerjee在接受TechCrunch采访时指出,Claude 2与1.3在模型架构上并无实质性差别,只是“不断演进的模型开发方法所带来的结果”。
截至目前,Anthropic表示已拥有“数千名客户”及一系列合作伙伴。谷歌作为公司的投资者之一,已经承诺投资3亿美元以换取10%的股权。
此外,Anthropic还透露未来将继续研发大型模型,并预估在接下来的两年内需要大约50亿美元的资金,其中大多数将用于计算资源的提升。
Please specify source if reproducedClaude全新版本来袭:免费使用,记忆力大幅提升! | AI工具导航



