摘要一项受基因组压缩海量信息能力启发的新AI算法,为大脑功能和潜在技术应用提供了新见解。研究人员发现,该算法在执行图像识别和视频游戏等任务时,几乎与经过全面训练的AI网络一样有效。 通过模仿基因组如何用有限数据编码复杂行为,该模型突显了高效信息压缩的进化优势。这些发现为开发能够在智能手机等小型设备上运行的先进、轻量级AI系统提供了新思路。 关键事实
研究背景从某种意义上说,我们每个人从出生起就具备了行动的能力。许多动物在出生后不久就能完成惊人的壮举,比如蜘蛛织网、鲸鱼游泳。但这些与生俱来的能力从何而来? 显然,大脑在其中扮演了关键角色,因为它包含了控制复杂行为所需的数万亿神经连接。然而,基因组只能存储这些信息的一小部分。这一悖论困扰了科学家数十年。如今,冷泉港实验室(CSHL)的Anthony Zador教授和Alexei Koulakov教授利用人工智能提出了一个可能的解决方案。 研究内容当Zador首次遇到这个问题时,他提出了一个新的视角:“如果基因组有限的容量正是让我们如此聪明的原因呢?如果这是一个特性,而不是缺陷呢?”换句话说,也许我们能够智能行动并快速学习,正是因为基因组的限制迫使我们适应。 这是一个大胆的想法,但难以证明。毕竟,我们无法将实验室实验扩展到数十亿年的进化过程中。于是,基因组瓶颈算法的概念应运而生。 在AI领域,新一代模型的诞生只需按下按钮。Zador、Koulakov以及CSHL的博士后Divyansha Lachi和Sergey Shuvaev着手开发了一种计算机算法,能够将大量数据压缩成一个简洁的包——就像我们的基因组可能压缩形成功能性大脑回路所需的信息一样。 随后,他们将该算法与经过多轮训练的AI网络进行了对比测试。令人惊讶的是,这种未经训练的新算法在执行图像识别等任务时,几乎与最先进的AI一样有效。他们的算法甚至在《太空入侵者》等视频游戏中表现出色,仿佛天生就懂得如何玩。 研究意义这是否意味着AI很快就能复制我们的自然能力?Koulakov表示:“我们还没有达到那个水平。大脑的皮层结构可以容纳约280太字节的信息——相当于32年的高清视频。而我们的基因组只能容纳约1小时的信息。这意味着AI的压缩技术还无法与基因组相媲美。” 尽管如此,该算法实现了迄今为止AI中未见的高压缩水平。这一特性可能在技术领域有令人印象深刻的应用。研究的主要作者Shuvaev解释道:“例如,如果你想在手机上运行一个大型语言模型,该算法可以通过在硬件上逐层展开模型来实现。” 这种应用可能意味着更先进的AI和更快的运行速度。而这一切,仅用了35亿年的进化时间。 关于这项AI、遗传学和进化研究
原始研究:开放访问。“Encoding innate ability through a genomic bottleneck” by Anthony Zador et al. PNAS (责任编辑:泉水) |