数十年来,多巴胺一直被视为大脑的“奖赏”化学物质——在我们得到想要的东西时释放愉悦感。然而,一项新研究揭示,多巴胺还扮演着一个精密的导航系统角色。通过研究处于视觉线索环境中的小鼠,研究人员发现了第二种独特的多巴胺信号,它像一个GPS,实时计算“轨迹误差”,告诉大脑当前是在朝向目标移动还是偏离目标。
研究背景:多巴胺功能的重新定义
长期以来,多巴胺被广泛理解为大脑的“奖赏”化学物质,当遇到与积极结果相关的线索时会激活。但这项由波士顿大学领导的研究团队发表于《自然》(Nature)的新研究表明,视觉线索还会触发第二种截然不同的多巴胺信号——当动物朝向目标移动时该信号增强,偏离目标时则减弱。这种轨迹误差信号甚至随运动速度变化,使其成为实时路线校正的理想机制。
核心发现:两类信号分工明确
研究首次系统地区分了两类共存但功能独立的多巴胺信号:
| 信号类型 | 功能 | 编码内容 | 对应比喻 |
|---|---|---|---|
| 奖赏价值信号 | 动机 | 目标的价值大小 | 目的地 |
| 轨迹误差信号 | 导航 | 当前方向与速度是否正确 | 逐向导航 |
这两种信号在纹状体(基底节的一部分)中空间上重叠但呈正交梯度分布,且在时间上发生于不同时刻。这种分离使大脑能够将两种信息保持清晰:一种负责激励,一种负责引导。
研究方法:光学成像揭示空间编码
研究团队开发了一种新方法,能够光学测量整个纹状体多个区域的多巴胺信号。通过绘制信号分布图,他们发现奖赏价值信号与轨迹误差信号出现在重叠但相互正交的空间梯度上,且发生在不同时间点。这种时空上的分离使得大脑能将两种信息明确区分,分别处理动机与引导功能。
独立运作机制:来自不同感觉运动输入
该GPS样功能独立于经典的奖赏反应运作,利用不同的感觉和运动输入来引导行为。轨迹误差信号可以通过运动本身或视觉流(visual flow)来计算,并且与表征学习到的线索价值的同步多巴胺增加相互独立。研究人员发现,在标准强化学习算法中引入混合感觉运动输入,其奖励预测误差项可以同时再现轨迹误差和线索价值编码——但这两类信号具有不同的状态空间需求,提示它们可能来源于同一个强化学习算法,但输入不同的神经信号。
临床意义:帕金森病、ADHD与成瘾的新视角
理解多巴胺的这一“引导”作用可能为治疗涉及多巴胺功能紊乱的疾病带来革新,包括帕金森病、成瘾、强迫症和注意缺陷多动障碍(ADHD)。
波士顿大学心理与脑科学系助理教授Mark Howe解释道:“在这些疾病中,我们知道多巴胺失衡。如果‘引导’信号较弱,一个人可能难以保持‘在轨道上’完成任务——不是因为他们缺乏动机(奖赏),而是因为大脑没有提供完成旅程所需的持续‘继续前进’的反馈。”
未来研究方向
Howe及其合作者目前正在以特定方式操控这些信号,以探究它们对学习和在线决策的因果影响。他们也在研究这些信号如何影响下游回路成分,最终调控行为。核心问题包括:这些信号如何转化为运动变化?它们对学习、在线决策,或两者兼有,是否至关重要?
研究信息
“Striatum-wide dopamine encodes trajectory errors separated from value” by Eleanor H. Brown, Yihan Zi, Mai-Anh Vu, Safa Bouabid, Jack Lindsey, Chinyere Godfrey-Nwachukwu, Aaquib Attarwala, Ashok Litwin-Kumar, Brian DePasquale & Mark W. Howe. Nature
DOI:10.1038/s41586-025-10083-1
Funding: This work was supported by a Klingenstein-Simons Foundation fellowship, Whitehall Foundation Fellowship, National Institute of Mental Health and the NIH Jointly Sponsored Predoctoral Training Program in the Neurosciences award.
总结
这项研究颠覆了多巴胺仅作为“奖赏分子”的传统认知,揭示了它同时承担着实时导航引导的关键功能。纹状体中多巴胺的“价值信号”与“轨迹误差信号”在时空上分离编码,分别驱动动机与方向校正。这一发现不仅为理解大脑如何利用环境线索引导行为提供了新框架,也为帕金森病、ADHD等以行为引导障碍为特征的疾病指明了潜在的神经机制与治疗靶点。