专栏名称: DeepTech深科技

“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面：1、基于科学的发现；2、真正的科技创新；3、深科技应用的创新。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

科学家提出DEL-ToM，用小模型理解他人想法

DeepTech深科技 · 公众号 · 科技媒体 · 2025-07-10 13:56

主要观点总结

本文介绍了研究团队针对人工智能下一阶段演进的技术挑战，即“心智理论”（Theory of Mind）展开的研究。文章提到了研究团队提出的基于动态认知逻辑（Dynamic Epistemic Logic, DEL）与路径评分机制的推理阶段增强框架DEL-ToM，旨在提升小模型在复杂心智测试中的可解释推理能力。文章还介绍了研究团队的两项工作：一是研究大模型心智能力的神经机制，二是探讨小模型在实际应用中的价值及其提升心智能力的潜力。最后，文章强调了心智能力在多个实际场景中的重要性，以及DEL-ToM在推动可信AI方面的潜力。

关键观点总结

关键观点1: 研究团队关注的核心问题是如何让中小规模语言模型具备‘理解人’的基本能力。

研究团队提出了一种基于动态认知逻辑（DEL）与路径评分机制的推理阶段增强框架DEL-ToM，该框架旨在提升小模型在复杂心智测试中的可解释推理能力。

关键观点2: 心智测试任务的难点在于对多层嵌套信念的建模，而非语言理解。

模型不仅需要识别事实，还需理解角色之间的复杂关系，例如角色A认为角色B误解了角色C的行为等。

关键观点3: DEL-ToM框架由信念路径生成器和过程评分模型两个协同模块构成。

信念路径生成器根据文本场景生成可能的信念更新序列，每条路径代表角色对世界状态的动态理解过程。过程评分模型则对每条路径进行评估，最终选择得分最高的路径作为答案来源。

关键观点4: 研究团队强调小模型在实际应用中的价值。

小模型在资源受限的设备和需要高度可解释输出的系统中具有应用价值，如教育机器人、医疗陪护系统和心理健康对话系统等。

关键观点5: 研究团队提出了“ToM-sensitive parameters”的概念。

这一概念指模型中对心智推理结果极其敏感的少量稀疏参数集合。研究团队通过微扰方法精确定位了这些参数，发现它们对模型的“心智”表现至关重要。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博