论文作者提醒说,人工智能大语言模型在心智理论任务上的表现堪比人类不等于它们具有人类般的能力,也不意味着它们能掌握心智理论。
壹号平台该论文介绍,心智理论对人类社交互动十分重要,是人类沟通交流和产生共鸣的关键。之前的研究表明,大语言模型这类人工智能可以解决复杂的认知任务,如多选决策。不过,人们一直不清楚大语言模型在被认为是人类独有能力的心智理论任务中的表现是否也能比肩人类。
论文作者指出,LLaMA2的成功被证明是因为回答的偏见程度较低而不是因为真的对失礼敏感,而GPT看起来的失利其实是因为对坚持结论的超保守态度而不是因为推理错误。
在本项研究中,论文第一作者和共同通讯作者、德国汉堡-埃彭多夫大学医学中心 James W. A. Strachan与同事及合作者一起,选择能测试心理理论不同方面的任务,包括发现错误想法、理解间接言语以及识别失礼。他们随后比较了1907人与两个热门大语言模型家族(GPT和LLaMA2模型)完成任务的能力。他们发现,GPT模型在识别间接要求、错误想法和误导的表现能达到有时甚至超越人类平均水平,而LLaMA2的表现逊于人类水平;在识别失礼方面,LLaMA2强于人类但GPT表现不佳。
712.67MB
查看799.60MB
查看88.5MB
查看329.88MB
查看489.78MB
查看225.66MB
查看326.30MB
查看912.40MB
查看878.91MB
查看754.42MB
查看301.33MB
查看871.57MB
查看604.52MB
查看132.86MB
查看511.61MB
查看395.33MB
查看705.41MB
查看420.97MB
查看138.25MB
查看839.91MB
查看919.63MB
查看871.57MB
查看835.58MB
查看230.61MB
查看415.70MB
查看705.25MB
查看446.34MB
查看550.57MB
查看306.34MB
查看849.28MB
查看494.13MB
查看608.20MB
查看412.92MB
查看439.22MB
查看421.66MB
查看161.11MB
查看901.55MB
查看530.73MB
查看170.23MB
查看520.16MB
查看240.51MB
查看465.20MB
查看138.52MB
查看496.76MB
查看698.26MB
查看470.44MB
查看991.99MB
查看944.65MB
查看794.14MB
查看157.61MB
查看951.20MB
查看936.96MB
查看314.33MB
查看856.61MB
查看899.66MB
查看863.99MB
查看389.14MB
查看141.91MB
查看208.14MB
查看612.37MB
查看598.37MB
查看563.93MB
查看396.18MB
查看923.62MB
查看229.69MB
查看474.66MB
查看390.53MB
查看210.44MB
查看510.58MB
查看950.89MB
查看578.53MB
查看936.27MB
查看878.46MB
查看669.38MB
查看753.62MB
查看199.46MB
查看332.67MB
查看190.26MB
查看436.23MB
查看798.56MB
查看525.54MB
查看885.23MB
查看469.51MB
查看121.84MB
查看599.84MB
查看325.11MB
查看950.33MB
查看584.11MB
查看983.71MB
查看572.59MB
查看793.25MB
查看282.33MB
查看505.14MB
查看447.82MB
查看832.42MB
查看147.43MB
查看451.36MB
查看242.53MB
查看569.59MB
查看876.39MB
查看875.37MB
查看236.55MB
查看644.38MB
查看898.16MB
查看
859成都kn
“伟大的向导者”➐
2025-06-29 21:18:03 推荐
566188****6868
2025-06-28 22:22:01 不推荐
980152****5746
2025-06-28 15:50:12 推荐
3715点
2025-06-29 08:09:42 推荐