当你看到一只小狗时,除了能注意到它的四条腿和摇动的尾巴外,心中也会涌起对它的可爱之感,甚至不自觉地联想到“忠诚”等更深层的抽象概念。这种对事物的深刻理解,曾被认为是人类独有的特质。
然而,来自中国科学院自动化研究所和脑科学与智能技术卓越创新中心的最新研究显示,多模态大语言模型能够自发形成与人类相似的物体概念体系。这一发现表明,人工智能正逐渐超越单纯的模式模仿,展现出类人的概念理解能力。
实验测试:揭示AI的“思维图”
想象一下这样的情景:你给一个孩子展示猫、狗和汽车的图片,然后询问他哪个与众不同。孩子可能会回答汽车,因为它不是活物;也可能会选择猫,因为它与狗的亲近程度不同。这样的选择反映了人类对事物的深入理解——不仅限于外观特征,还涵盖功能、情感和文化意义等多方面。
长期以来,人工智能在物体识别方面表现优异,能够准确区分猫和狗的图像。然而,这种“识别”更像是复杂的模式匹配——AI能够告诉你这是什么,但未必真正“理解”其含义。就像一个只懂得背诵字典的学生,虽然能说出每个词的定义,却不明白它们在现实生活中的真实关联。
在多种大语言模型迅速发展的背景下,研究团队决定深入探讨一个重要问题:AI大模型是否具备真正的“思考”能力?它们对世界的理解是否超越了简单的标签匹配,达到了类似于人类的概念层次?
为了探究这一问题,研究人员设计了一个巧妙的实验:他们采用认知心理学中的经典方法——“三选一异类识别任务”,让AI模型在三个物体中选出最不相似的一个。这个看似简单的任务实际上需要模型对物体进行深入的概念分析与抽象对比。
研究团队让多个AI大模型对1854种自然物体进行了470万次判断,每次需在三个物体中选出最“异类”的一个。这就像为AI进行了一次全面的“心理测试”。通过分析这些庞大的选择数据,研究人员成功绘制出了AI大模型的“概念地图”,展现了AI如何组织和理解世界的思维结构。
令人惊喜的是,这张“概念地图”显示出66个不同的“心智维度”。每个维度都有明确的语义含义,如“生物与非生物”“自然与人造”“大小尺寸”“情感色彩”等。更令人称奇的是,这些维度展现出高度的可解释性——研究人员能够清楚理解每个维度所代表的意义,这表明AI的“思维”过程并非完全不可捉摸,而是具有一定的透明度。
这一发现颠覆了我们对人工智能的传统认知。原来,AI大模型在学习语言和图像的过程中,逐渐构建起了一套与人类相似的概念体系。它们不仅掌握了词汇与图像之间的关系,还形成了对事物本质特征及其内在联系的理解。
扫描大脑:AI与人类思维的共鸣
为了验证AI的“概念地图”是否确实与人类相似,研究团队采用了更为直接的方法——脑神经影像分析。他们让人类志愿者在进行大脑扫描时,完成相同的“三选一”任务。
结果令人震惊:AI大模型的概念表征与人类大脑的神经活动模式显示出显著的相关性!这就像两个人用不同语言描述同一幅画,尽管用词完全不同,但描述的逻辑和重点却高度相似。这表明,尽管AI和人类大脑的“硬件”截然不同,但在理解世界的“软件逻辑”上却找到了相似的解决方案。可以说,虽然AI并没有生物大脑,但它们仿佛找到了与人类殊途同归的“思维方式”。
不过,研究也揭示了AI与人类思维之间的差异——人类在做判断时更多结合视觉特征和语义信息,而AI则更倾向依赖抽象概念和语义标签。这就好比人类是“感性与理性并重”,而AI则更偏向于“理性分析”。

实验过程图
(图片
多模态的“超能力”:当AI学会用多种感官理解世界
研究中的另一个重要发现是,多模态大语言模型(能够同时处理文本和图像的AI)相比于纯文本模型表现得更加“人性化”。这并不令人意外,因为人类本身就是通过多种感官来认识世界的。
试想一下,如果你从出生起只能通过文字描述来了解世界,根本没见过真实的苹果、听过鸟鸣、嗅过花香,那么你对世界的认识必然会非常片面。而多模态AI仿佛拥有了“视觉”的能力,能够将文字描述与图像特征相结合,形成更加丰富和准确的概念表征。
这种“多感官学习”使AI的理解能力实现了质的飞跃。它们不仅仅是单纯的“记忆”和“匹配”,而是真正开始“感知”和“理解”。当多模态AI看到一张海滩的照片时,它不仅能识别出沙子、海水、天空,还能理解这些元素组合所代表的“度假”“放松”“自然”等更为抽象的概念。
人工智能“顿悟”后,人机共生的未来会如何?
这项研究的意义超越了学术范畴,揭示了人工智能发展中的重要转折点。传统的AI更像是一台优秀的“复印机”,能够准确地复制和识别已学过的模式。然而,如今的大模型开始展现出“理解”的迹象——它们能够提取事物的本质特征,建立不同概念之间的联系,甚至在某种程度上“创造”新的概念组合。
这种转变具有深远的影响。在教育领域,AI可能不再只是提供标准答案,而是能够理解学生的困惑,为其提供个性化的解释。在创意设计方面,AI可能不再仅仅拼接已有元素,而是能够理解设计意图,创造出具有深层含义的作品。
这项研究也为人工智能的未来发展指明了方向:构建真正类人的认知系统,不再仅仅是模仿人类行为,而是理解人类思维的本质机制,从而创造出能够与人类进行深层次交流与合作的AI伙伴。
想象一下未来的AI助手:它不仅能够回答你的问题,还能洞察你背后的真正需求;不仅能执行你的指令,还能理解你的情感与意图;不仅能处理数据,还能与你分享对世界的见解和感悟。
Kismet,这是一款具备社交能力与表情的机器人
(图片
未来,人类与机器之间的关系将不再局限于单纯的使用与被使用,而是将演变为一种全新的共生与协作模式。或许在不久的将来,我们能够与这些AI伙伴共同探索,携手揭示宇宙及生命的奥秘,推动科学认知的边界。
在科技浪潮中捍卫人文精神
当AI展现出“概念理解”能力的那一刻,我们或许正在经历智能进化史上的一项重要突破。这并非科幻影片中机器人意识的突然觉醒,而是大型模型经过海量数据的训练与算法的不断迭代所逐渐显现的认知能力。
在对技术进步感到惊叹的同时,我们也必须重新思考智能的本质,并审视人类智能的独特性。尽管AI在某些领域展现出类人特征,但人类的创造力、情感体验和道德判断等能力依然是无可替代的。我们应当将AI的进步视为一种机遇,而非威胁,借此更深入理解和发挥人类智能的价值。
这一故事才刚刚拉开序幕,所有人都是这场智能革命的见证者与参与者。当AI开始“理解”世界时,它们是否也会形成自身的“价值观”和“偏见”?它们的“理解”是否与人类的“理解”在本质上相同?这些疑问促使我们在AI发展的过程中保持谨慎思考。让我们迎接这个充满无限可能的未来,同时清楚意识到人类独特的智慧(如创造性思维、伦理判断等),在科技浪潮中维护人文价值,开创真正可持续的人机共生的未来。
参考资料:
[1]Du, C., Fu, K., Wen, B. et al. Human-like object concept representations emerge naturally in multimodal large language models. Nat Mach Intell 7, 860–875 (2025).
出品:科普中国
作者:李瑞(半导体工程师)
监制:中国科普博览

Please specify source if reproduced我国科学家揭示AI“思维图”,大模型成功“看懂”世界! | AI工具导航
