强化学习模型或面临重构：研究揭示大脑多巴胺信号新机制-葫芦时刻

依法合规经营，保障用户权益是我们的生命线，对于部分广告发布者为牟取高收益侵犯用户权益行为，我司将通过法律途径追责到底！

强化学习模型或面临重构：研究揭示大脑多巴胺信号新机制

发表于 2025年3月

多巴胺是一种在大脑中起着重要作用的信号分子，影响着我们的情绪、动机、运动等多个方面。这种神经递质对基于奖励的学习至关重要，然而这一功能在许多精神疾病中可能会受到干扰，例如情绪障碍和成瘾等。

近期，由美国麻省理工学院教授安·格雷比尔领导的研究团队发现了一些意想不到的多巴胺信号模式，表明神经科学家可能需要重新审视他们关于大脑强化学习机制的理解。该团队的研究成果已发表在杂志上。

多巴胺在帮助人类和其他动物学习如何识别与正负结果相关的线索和行为方面发挥着关键作用。一个经典的例子就是伊万·巴甫洛夫训练狗通过铃声预测食物的到来。格雷比尔教授，同时也是麻省理工学院麦戈文研究所的研究员，解释道：根据强化学习的传统模型，当动物接收到与奖励相关的线索时，产生多巴胺的神经元最初会对奖励本身做出反应。随着动物逐渐学会了线索与奖励之间的关联，多巴胺的释放时机会发生变化，最终与线索本身（而非奖励）紧密相连。

然而，随着新技术的出现，研究人员能够更精确地分析大脑中多巴胺释放的时机和位置。格雷比尔的团队发现，传统模型并不能完全解释多巴胺的信号模式。早在十多年前，实验室的研究生马克·豪就注意到，与奖励相关的多巴胺信号并非在奖励到来的一刹那才释放，而是在奖励之前，随着老鼠逐渐接近奖励，信号逐步增强。

本文刊登于《海外星云》2025年1期

龙源期刊网正版版权

海外星云

2025年1期

查看本期目录

更多文章来自