一项发表于 Nature Neuroscience 的新研究揭示,个体在价值处理上的根本差异,决定了中脑边缘多巴胺系统如何调控决策过程中的评估与再评估。该研究由明尼苏达大学医学院的Adrina Kocharian、A. David Redish和Patrick E. Rothwell团队完成,通过结合经济决策任务、光纤光度法与光遗传学操作,发现伏隔核核心的多巴胺动态不仅反映选择信心,还编码过去和未来的价值,并且这种编码模式存在显著的个体差异。
从“一刀切”到个体差异
主流决策理论通常将决策过程离散化、均质化处理,但实际决策是一个连续过程,包含评估与再评估成分,远超出简单的结果预测。腹侧被盖区至伏隔核的多巴胺信号是决策的重要神经基础,但此前研究多聚焦于奖赏预测误差(reward prediction error, RPE)框架,对于多巴胺如何调控自主、自我引导的决策,以及个体差异如何影响这一过程,知之甚少。
为填补这一空白,研究团队设计了一种经济觅食任务:小鼠需在“提供区”(offer zone)等待不同时长(3-30秒)以获取四种不同口味的食物颗粒(排序为最偏好至最不偏好)。小鼠可自由选择接受(继续等待)或跳过(立即放弃)某个提供。若接受,则进入等待区等待固定延迟后获得所选颗粒;在等待期间,小鼠亦可随时反悔并退出(改变主意)。
发现两类截然不同的决策者
通过分析46只小鼠的行为,研究者惊喜地发现存在两个稳定的亚群:
-
对提供敏感型(offer-sensitive, OS):约43%的小鼠,其决策行为高度依赖提供时长(机会成本)和口味偏好。面对低偏好口味,即使短时间提供也会跳过;面对高偏好口味,则愿意等待更长时间。其行为符合经典的经济决策模型。
-
对提供不敏感型(offer-insensitive, OI):约57%的小鼠,其决策几乎不受提供时长影响,主要依据口味偏好做决定。即使面对高偏好口味,其等待时间也远短于OS小鼠,表现出“急于求成”的模式。
两种表型与性别无关,且在小鼠群体中稳定存在。
多巴胺信号编码“过去”与“未来”价值
利用光纤光度法记录伏隔核核心的多巴胺释放(使用dLight1.3b探针),研究揭示了两个表型间的显著差异:
-
评估阶段(提供区):
-
OS小鼠:多巴胺信号动态编码决策信心。在做出“接受”选择前,信号逐渐上升;做出“跳过”选择前,信号下降。信号幅度与选择的确定性(信心)相关。
-
OI小鼠:多巴胺信号在提供区内缺乏这种选择前的变化,与决策信心关联较弱。
-
-
再评估阶段(等待区/改变主意):
-
OS小鼠:当在等待区内“改变主意”(即退出)时,多巴胺信号出现一个明显的“下降-反弹”模式——首先骤降,然后反弹至基线以上。下降的幅度与已投入的等待时间(沉没成本,即过去价值)成正比;而反弹的幅度与即将错失的剩余等待时间(即未来价值)成正比。这种信号模式在做出“跳过”(即立即放弃,不涉及改变主意)时不存在。
-
OI小鼠:在改变主意时,多巴胺信号仅出现单一的下降,没有反弹。这表明其多巴胺系统主要编码已投入的沉没成本,而缺乏对未来价值的表征。
-
-
结果阶段(获得颗粒时):
-
两类小鼠在获得食物颗粒时,多巴胺信号均反映口味偏好(最偏好颗粒引起最大释放),但OI小鼠的信号幅度与偏好之间的相关性更强。
-
光遗传操作:表型特异性调控
为确立因果关系,研究者向小鼠腹侧被盖区注射光遗传病毒(ChrimsonR用于激活,eNpHR3.0用于抑制),并在伏隔核核心上方植入光纤。关键发现:
-
在提供区内激活OS小鼠的多巴胺末端:导致其决策信心改变(对低偏好口味接受率增加,反应时间加快),但对OI小鼠无影响。
-
在提供区内抑制多巴胺末端(仅对OS小鼠测试):导致其倾向于跳过更多提供。
-
对改变主意的行为无影响:光遗传操作主要影响初始评估(是否接受),而不影响后续的再评估(是否退出)。
这表明,多巴胺在评估阶段的因果作用具有表型特异性,仅对OS小鼠的决策信心具有调控能力。
理论意义与临床启示
该研究的通讯作者Patrick E. Rothwell博士指出:“我们的工作挑战了将多巴胺功能简化为统一RPE信号的简化观点。相反,个体在价值处理上的内在差异,决定了多巴胺信号是反映一个综合的‘决策信心/价值证据’变量,还是更接近一个简单的RPE。这对于理解从物质使用障碍到抑郁症等与决策异常相关的精神疾病具有重要意义。”
关键贡献:
-
概念突破:首次在同一个任务中证明,多巴胺同时编码决策信心(评估)、沉没成本(过去价值)和未来价值(反事实思维)。
-
个体差异:强调了在神经科学研究中考虑个体差异的重要性,避免将群体平均结果误读为普适机制。
-
改变主意(change-of-mind)的神经机制:提供了首个直接证据,表明多巴胺的“下降-反弹”信号是放弃已投入努力(退出)的神经签名,而非一般性的放弃行为。
未解问题:
-
两种表型的起源是什么?是遗传、发育还是经验依赖的?
-
多巴胺信号差异是源于上游输入(如伏隔核、前额叶皮层)的差异,还是多巴胺神经元本身的特性?
-
能否通过行为或药理干预将OI小鼠转变为OS模式?
专家点评
BioGuider特邀评论员、决策神经科学专家李佳(音译)教授评论:“这项研究巧妙地结合了经济决策任务与高时空分辨率的神经记录/操控技术,最重要的发现是识别并深入刻画了两种自然存在的决策表型。在经典强化学习框架中,RPE是学习驱动力,但本研究提示,部分个体(OS小鼠)的多巴胺系统在决策时可能不仅在学习,还在进行一种‘在线’的、证据积累式的信心计算。这为理解强迫性行为、成瘾中常见的‘不顾负面后果’的决策模式提供了新的神经计算视角。”
文献来源:
Kocharian, A., Redish, A.D. & Rothwell, P.E. Individual differences in decision-making shape how mesolimbic dopamine regulates choice confidence and change-of-mind. Nat Neurosci 28, 1883–1896 (2025). https://doi.org/10.1038/s41593-025-02015-z
数据与代码可用性:
-
数据与代码:OSF平台 (https://doi.org/10.17605/OSF.IO/62EWS)