源: 哥伦比亚大学 哥伦比亚大学瓦格洛斯内外科医学院的研究人员使用一种新的人工智能方法,可以准确预测任何人类细胞内基因的活动,从根本上揭示细胞的内部机制。 本期《自然》杂志上描述了该系统,它可能会改变科学家理解从癌症到遗传疾病的一切事物的工作方式。 ![]() “预测性的可推广计算模型允许以快速准确的方式揭示生物过程。这些方法可以有效地进行大规模计算实验,促进和指导传统的实验方法,“系统生物学教授、新论文的资深作者 Raul Rabadan 说。 传统的生物学研究方法擅长揭示细胞如何执行其工作或对干扰做出反应。但他们无法预测细胞如何工作或细胞如何对变化做出反应,例如致癌突变。 “拥有准确预测细胞活动的能力将改变我们对基本生物过程的理解,”Rabadan 说。 “它将使生物学从一门描述看似随机过程的科学转变为一门可以预测控制细胞行为的基础系统的科学。” 近年来,来自细胞的大量数据的积累和更强大的 AI 模型开始将生物学转变为一门更具预测性的科学。 2024 年诺贝尔化学奖授予研究人员,以表彰他们在使用 AI 预测蛋白质结构方面的开创性工作。但事实证明,使用 AI 方法来预测细胞内基因和蛋白质的活动更加困难。 新的 AI 方法可预测任何细胞中的基因表达 在这项新研究中,Rabadan 和他的同事试图使用 AI 来预测哪些基因在特定细胞中是活跃的。这种关于基因表达的信息可以告诉研究人员细胞的身份以及细胞如何执行其功能。 “以前的模型是根据特定细胞类型的数据进行训练的,通常是癌细胞系或其他与正常细胞几乎没有相似的东西,”Rabadan 说。 Rabadan 实验室的研究生 习 Fu 决定采取不同的方法,根据从正常人体组织获得的数百万个细胞的基因表达数据训练机器学习模型。 输入包括基因组序列和数据,这些数据显示基因组的哪些部分是可访问和表达的。 整体方法类似于 ChatGPT 和其他流行的“基础”模型的工作方式。这些系统使用一组训练数据来识别基础规则、语言语法,然后将这些推断的规则应用于新情况。 “这是完全相同的事情:我们在许多不同的细胞状态中学习语法,然后我们进入特定状态——它可能是一种疾病,也可能是正常的细胞类型——我们可以尝试看看我们从这些信息中预测模式的能力如何,”Rabadan 说。 Fu 和 Rabadan 很快就招募了一个合作者团队,包括共同第一作者 Alejandro Buendia(现在是斯坦福大学的博士生,以前在 Rabadan 实验室工作)和卡内基梅隆大学的 Shentong Mo 来训练和测试新模型。 在对来自 130 多万个人类细胞的数据进行训练后,该系统变得足够准确,可以预测它从未见过的细胞类型的基因表达,产生的结果与实验数据非常吻合。 新的 AI 方法揭示了儿科癌症的驱动因素 接下来,研究人员展示了他们的 AI 系统的力量,他们要求它揭示仍然隐藏的患病细胞的生物学特性,在这种情况下,是一种遗传形式的儿科白血病。 “这些孩子遗传了一个突变的基因,目前尚不清楚这些突变到底在做什么,”Rabadan 说,他也是哥伦比亚大学赫伯特欧文综合癌症中心癌症基因组学和表观基因组学研究项目的联合负责人。 借助人工智能,研究人员预测这些突变会破坏决定白血病细胞命运的两种不同转录因子之间的相互作用。实验室实验证实了 AI 的预测。了解这些突变的影响可以揭示驱动这种疾病的特定机制。 人工智能可以揭示基因组中的“暗物质” 新的计算方法还应该允许研究人员开始探索基因组的“暗物质”——这个术语借自宇宙学,指的是基因组的绝大多数,它不编码已知的基因——在癌症和其他疾病中的作用。 “在癌症患者中发现的绝大多数突变都位于基因组的所谓黑暗区域。这些突变不会影响蛋白质的功能,并且大部分尚未被探索。Rabadan 说。 “我们的想法是,使用这些模型,我们可以观察突变并阐明基因组的那一部分。” Rabadan 已经与哥伦比亚大学和其他大学的研究人员合作,探索从脑癌到血癌的不同癌症,学习正常细胞的调节语法,以及细胞在癌症发展过程中的变化。 这项工作还为了解癌症以外的许多疾病开辟了新的途径,并可能确定新治疗的靶点。通过向计算机模型呈现新的突变,研究人员现在可以深入了解和预测这些突变如何影响细胞。
紧随生物学人工智能的其他最新进展之后,Rabadan 将这项工作视为主要趋势的一部分:“这确实是生物学的一个新时代,非常令人兴奋;将生物学转变为预测科学。 |