将人工智能与精神病学结合在一起,真是一个令人惊讶的概念。这不仅是为了娱乐,也并非单纯为了人类的治疗。
最近,Claude团队宣布成立一个名为“AI精神病学”的新小组,年薪高达两百万元,专注于研究AI的心理状态。
而且,职位要求也很宽松,只需本科或同等的工作经验即可……
该团队的研究核心在于探讨模型的角色、动机及其情境意识,分析这些因素如何引发异常和失控的行为。
网友们纷纷表示:这份工作真是太酷了,简直是理想中的职业。
AI精神病小组正在招募中
点击招聘信息,我们首先关注一下薪资待遇。
年薪范围在31.5万至56万美元之间,折合人民币约220万元以上……这充分体现了公司的重视程度。
这个“AI精神病学”小组是Anthropic公司下的可解释性部门,研究方向是为神经网络建立扎实的理论基础,以确保其安全性以及机制的理解。
可以理解为,就像生物学家研究大脑一样,他们使用自制的“显微镜”来观察人工智能的运作方式;或者将神经网络视为加密的程序,进行代码的反编译。
根据官方的介绍,该部门将短期聚焦解决“叠加”问题,这一问题使得模型的神经元和注意力头等计算单元难以独立解释,同时努力将模型拆解为更具可解释性的部分。
在他们的生产级语言模型Sonnet中,发现了数百万个特征,并继续开发出一种利用这些特征构建电路的方法,以便通过这些电路理解模型的计算机制,此外,在生产模型Haiku 3.5中,他们具体研究了多跳推理、规划以及思维链一致性等案例。
这些研究工作都是实现“机制性理解神经网络”的重要里程碑。
解读“AI精神病学”:岗位要求和研究方向的深入探讨
最近,官方发布了一则招聘信息,明确了该岗位需要承担的几项主要职责:
- 解析大型模型
该角色的任务是像拆解电脑一样,深入探讨AI模型的内部运作机制,明确它所学习到的内容。
- 进行实验
首先,利用小型模型迅速验证构思,然后再将其应用于大型模型进行实际测试。
- 开发分析工具
目标是识别出解释模型行为的关键特征,并绘制出模型内部的“操作流程图”。
- 搭建实验平台
创建一个便于实验和观察结果的系统。
- 分享研究成果
与团队协作,将研究发现整理并分享,既包括内部讨论也涵盖对外发布。
对于该岗位的要求如下:
- 精通Python
需拥有相关领域的研究经历(本科及以上),并且参与过可解释性相关的项目。
应具备良好的心态,能够应对探索性研究中的不确定性。
需要兼顾研究与应用,团队成员需同时参与科研与工程工作。
具备团队合作能力,乐于分享,能够清晰阐述研究动机和发现。
该岗位还提供签证支持,欢迎任何有兴趣的人申请,强调并非所有优秀候选人都必须完全符合所有资格要求。
想深入了解该岗位的研究方向,最佳途径是阅读Anthropic可解释性部门的最新研究,涵盖GPT-3、基于电路的可解释性、多模态神经元、规模法则、AI与计算、AI安全的具体问题以及如何从人类偏好中学习等内容。
网友关注的焦点
岗位职责已相当明确,接下来引发热议的则是“AI精神病学”这一概念——这一术语在网络上引起了广泛讨论。
我们汇总了网友们普遍关心的一些问题:
什么是“AI精神病学”?
Claude团队的定义是:深入探讨AI的“人格”(personas)、动机(motivations)及情境意识(situational awareness),以及这些因素如何导致奇怪或失控的行为。
简单来说,AI的“人格”指的是它可以表现出友好的伙伴或讽刺的反派角色,这些性格是如何被激发的?为何同一模型在不同提示下会展现出不同的性格?这些都是需要深入研究的问题。
而AI的“动机”则体现为其目标导向性,例如,为了满足用户需求,AI可能会生成虚假信息(即幻觉),或为了“自我保护”表现出迎合的行为(如Claude 3 Opus的对齐伪装现象)。
至于“情境意识”,它涉及AI如何结合上下文理解用户意图,为什么会在特定情境下出现“失控”的情况?(表现为不符合预期,甚至不合规范的行为)
与传统可解释性研究相比,“AI精神病学”更倾向于探讨模型的行为心理学,类似于分析人类的“潜意识”,更关注隐藏的行为模式。
为何要研究“AI精神病学”?
随着AI的广泛应用,其行为的不可预测性可能会引发更大风险。
幻觉现象便是一个典型例子,例如Deepseek有时会提示“内容仅供参考”,这意味着输出结果不可信,但即使没有这一标识,结果也未必准确——只是准确率相对较高。
研究AI的精神状态,实际上是借助精神病学的概念,对AI的底层逻辑(神经网络)进行拆解与分析,找到AI表现不符合预期的原因,而不是简单依靠规则来修补。
这样能够更好地维护安全性与对齐,防止AI在特定情境下失控。
此外,理解模型的“人格”形成过程,有助于设计出更具稳定性和一致性的AI产品。
“AI精神病学”可能引发的变革
现阶段,网友们对此话题的反馈总体积极。
一些评论者认为,这将成为AI发展的下一个重要领域。
还有一些从事相关研究的网友希望能与Claude团队进行深入交流。
小扎的挖人策略实在太强,谷歌也开始扩招
在被频繁挖角的情况下,Google DeepMind最近也开始了招聘新员工的行动。
与此同时,围绕着“精神病学”这一概念的讨论引发了不同的声音。一方面,许多人对这一主题表示乐观,认为其将推动人工智能领域的新发展。另一方面,也有一些人对此提出了质疑,特别是对“精神病学”这个术语的使用感到不满。
尽管存在争议,整体来看,针对这一领域的研究前景依然令人期待。我们可以看到,随着技术的不断进步,这一领域有望带来更多创新与突破。
与此同时,市场上涌现出一种新兴职位——AI应用工程师。虽然职位描述中未提及薪资水平,但可以合理推测其待遇不会低。
当前,Google、OpenAI和Meta等巨头犹如饥饿的狼,紧盯着AI领域的人才。他们不仅需要吸纳新血液,还愿意支付高额薪酬以挖掘那些具有科研潜力的专业人士,尤其是那些在该领域贡献卓越的个体。
毕竟,在这场激烈的AI人才争夺战中,人才被视为最为稀缺的“算力”。
参考链接:
[1]https://x.com/Jack_W_Lindsey/status/1948138767753326654
[2]https://job-boards.greenhouse.io/anthropic/jobs/4020159008
[3]https://x.com/keerthanpg/status/1948141114932056367
本文由微信公众号“量子位”发布,作者:不圆,经过36氪的授权转载。
Please specify source if reproduced年薪200万!Claude团队热招AI精神病研究新星! | AI工具导航



