科学家发现,"纯 "数学分支中的一个关键函数可以预测基因突变导致功能变化的频率。
这些由所谓的位数总和函数制定的规则,也支配着蛋白质折叠、计算机编码和物理学中某些磁性状态的某些方面。
"这项研究的主要作者瓦伊巴哈夫-莫汉蒂(Vaibhav Mohanty)是哈佛医学院和麻省理工学院的理论物理学家、博士和医学博士候选人。
每一种基因型--特定基因的DNA字母--都会产生一种表型或最终结果:一种新的蛋白质,甚至是一种调控另一组基因的行为。一个特定的基因型在其表型发生变化之前,可以累积多次突变;这种中性突变的累积是进化的主要方式。
"我们想了解,实际表型对突变的稳健程度如何?莫汉蒂说。"事实证明,我们观察到的这种稳健性相当高。换句话说,构成 DNA 密码的许多 "字母 "或碱基对会在输出发生变化之前发生变化。
由于这种鲁棒性不仅出现在遗传学中,也出现在物理学和计算机科学等领域,莫汉蒂和他的同事怀疑其根源可能在于可能序列的基础数学。他们将这些可能序列设想为一个多维立方体,即所谓的超立方体,在这个无法可视化的立方体上的每个点都是一个可能的基因型。莫汉提说,具有相同表型的基因型最终应该聚集在一起。问题是,这些聚类会形成什么形状?
答案原来可以在数论中找到,数论是与正整数的性质有关的数学领域。结果发现,表型对突变的平均稳健性是由所谓的数字总和函数定义的。这意味着,将立方体上代表每个基因型的数字相加,就能得出基因型的平均健壮性。
"莫汉蒂说:"假设有五种基因型可以映射到一种特定的表型。因此,举例来说,有五个字母序列的DNA,每个序列都有不同的突变,但都能编码相同的蛋白质。
研究人员发现,将用于表示这五个序列的数字相加,就能得出这些基因型在表型发生变化之前发生突变的平均次数。
这导致了第二个有趣的发现:这些数字的总和绘制在一张图上,就形成了所谓的 Blancmange 曲线,这是一种以法国甜点命名的分形曲线(看起来像一个花式模制布丁)。
莫汉蒂说:"在分形曲线中,如果你把曲线放大,它看起来和你把它缩小时一模一样,而且你还可以继续无限放大、无限放大、无限放大,结果都是一样的。
莫汉提说,这些发现揭示了一些关于纠错的有趣秘密。例如,研究人员所研究的自然系统处理错误的方式往往与人类在设置数据存储(如数字信息、CD 或 DVD)时处理错误的方式不同。在这些技术实例中,所有错误都被平等对待,而生物系统则倾向于对某些序列进行更多的保护。
莫汉蒂说,这对于基因序列来说并不奇怪,因为在基因序列中可能有几个关键序列,而其他序列对于主要基因功能来说则更为边缘化。
莫汉提说,了解这些中性突变的动态最终可能对预防疾病非常重要。病毒和细菌进化迅速,在此过程中会积累许多中性突变。如果有一种方法可以防止这些病原体在所有杂乱无章的基因突变中发现针尖大的有益突变,研究人员也许就能阻止病原体变得更具传染性或对抗生素产生抗药性等。
研究人员于7月26日在《英国皇家学会界面期刊》上发表了他们的研究成果。
(责任编辑:泉水) |