当前位置: 主页 > 神经科学 > 学习记忆

“犯错”是大脑的硬连策略:类脑模型揭示错误预测神经元与探索-利用

2026-04-01 13:28 泉水 生物行 阅读 0

大脑为何天生会犯错?——新研究揭示,错误并非缺陷,而是演化赋予的“探索性”机制。 达特茅斯学院、麻省理工学院与纽约州立大学石溪分校团队在 Nature Communications 发表的研究,构建了一个基于生物学原理(而非动物数据拟合)的类脑计算模型,模拟视觉分类学习任务。模型不仅以与动物几乎相同的速度与波动模式学会任务,其内部神经活动也与真实动物脑记录惊人吻合。更意外的是,模型自发产生了约20%的“不和谐神经元”,其活动模式强烈预测错误的发生——当这些神经元活跃时,模型更可能做出错误判断。返回动物数据后发现,这些神经元真实存在于动物脑中,此前却被忽略。研究者提出:这类神经元可能通过故意偏离已有知识,在稳定环境中偶尔引入“变异”,使大脑在环境变化时能灵活适应(“探索”)。该模型现正被开发为神经药物筛选与脑疾病机制研究的计算平台,有望加速治疗精神疾病与神经退行性疾病的药物发现。

类脑模型:从“模仿数据”到“生长认知”

传统脑模型常通过深度学习在动物数据上训练以拟合行为。本研究反其道而行之:基于已知的神经回路(皮层-纹状体-脑干-强直性活动神经元TAN)与神经递质(谷氨酸、乙酰胆碱)作用规则,构建一个自下而上的模型。认知与行为并非“编程”进去,而是从回路相互作用中涌现

模型结构:微观“基元”与宏观环路

1. 微观基元(primitives)

  • 模拟局部皮层回路:兴奋性神经元接收视觉输入(谷氨酸能),连接到抑制性神经元,形成“赢家通吃”结构——符合真实皮层抑制性微环路的组织原则。

2. 宏观环路

  • 皮层:处理信息;

  • 纹状体:学习行动与结果关联;

  • 脑干:基础唤醒;

  • TAN(强直性活动神经元):释放乙酰胆碱,为系统注入随机噪声,促使模型在早期尝试不同策略(探索),而非固化于某种反应。

学习过程:从探索到利用

  • 初始阶段:TAN驱动探索,模型行为多变,正确率低;

  • 学习进行:皮层-纹状体连接强化,逐渐抑制TAN的随机性,系统转向“利用”(基于已学知识稳定选择)。

  • 神经节律:学习过程中,皮层与纹状体在β频带(约15-30 Hz)的同步活动增强,且同步峰值出现在正确判断时刻——与动物脑电(EEG)记录一致。

意外发现:“不和谐神经元”预测错误

在分析模型内部活动时,研究者发现约20%的神经元在模型即将做出错误判断时出现特征性活动模式。他们将这些神经元命名为“不和谐神经元”(incongruent neurons)。起初以为模型存在“缺陷”,但当回到真实动物数据中检查时,发现同样的神经元活动模式确实存在,只是此前未被注意。

功能假说:错误是“探索”的种子

研究者提出,这些神经元可能通过在稳定环境中偶尔引入错误,防止大脑陷入僵化。当环境变化时,这些“错误种子”可成为新策略的起点——这种“探索-利用”平衡是智能系统(无论是生物还是人工)高效学习的基础。

“学习规则很有价值,但环境会变。一个只遵循已知知识的脑,在环境变化时可能陷入困境。尝试替代方案——即使是错的——可能为发现新策略打开大门。”麻省理工学院皮考尔研究所Earl K. Miller教授解释道。

应用前景:神经药物筛选与疾病建模

研究团队已成立Neuroblox.ai公司,将该模型发展为药物发现平台:

  • 机制理解:模拟精神分裂症、帕金森病等疾病中特定回路(如多巴胺/乙酰胆碱失调)的效应;

  • 药物筛选:在模型中测试候选药物对网络动力学与行为的影响,再进入动物实验,降低临床前开发成本与风险;

  • 个性化建模:未来可根据患者脑成像数据构建个体化模型,预测治疗响应。

未来方向

  • 扩展模型至更多脑区(如杏仁核、海马)与神经调质(如多巴胺、血清素);

  • 在模型中“诱导”疾病状态(如TAN活性异常),模拟强迫症或注意缺陷多动障碍(ADHD)的表型;

  • 将模型应用于探索“元学习”与“认知灵活性”的神经机制。


参考信息
Reference: “Biomimetic model of corticostriatal micro-assemblies discovers a neural code” by Anand Pathak et al., 2025, Nature Communications.
DOI: 10.1038/s41467-025-67076-x

发表评论