作者:路易斯·蒙托利乌, 《对话》 20多年前,人类基因组首次被测序。虽然第一个版本充满了代表缺失DNA序列的“洞”,但基因组在连续几轮中逐渐得到改进。每一个都提高了基因组的质量,并由此解决了大部分阻碍我们完整阅读遗传物质的空白。 研究人员在从头到尾读取基因组时面临的根本困难是其中存在大量的重复序列。我们人类拥有的20,000个左右的基因仅占整个基因组的2% 。其余 98% 基本上由这些重复序列家族、称为转座子和反转录转座子的移动元件以及(在较小但功能上重要的程度上)基因表达调控序列组成。这些功能就像开关一样,决定基因何时何地打开和关闭。 2022年3月,基因组的重大修订发表在《科学》杂志上。一个名为“T2T”(端粒到端粒,染色体末端)的国际研究人员联盟使用了一种基于一种细胞类型 (CHM13) 的新策略,该细胞只保留每条染色体的一个副本。 结合最新的 DNA 测序技术,研究人员成功向人类基因组添加了约 2 亿个字母,解决了 1 号至 22 号染色体上的大部分漏洞。 唯一被遗漏的是我们人类拥有的所有染色体中最小的:Y。它是男性独有的染色体,也是最复杂的,具有各种重复序列。 Y染色体终于完整了我们每个人的细胞中都有46 条染色体,成对排列。实际上有 23 对染色体,22 对常染色体(1 至 22)和一对性染色体(可以是 X 或 Y)。 我们从每对染色体中继承了一条来自父亲的染色体和一条来自母亲的染色体。大多数女性具有 46XX 染色体配置——最后一对染色体 23,由两个 X 染色体拷贝组成。大多数男性具有 46XY 染色体配置,这意味着性染色体对由 X 和 Y 染色体组成。 Y染色体仅存在于男性中,包含负责男性性器官发育的基因,特别是主基因SRY,它会触发一系列事件,最终将最初的未分化性腺转化为产生精子的睾丸。在缺乏SRY基因的情况下(如 46XX 雌性),这种原始性腺最终发育成卵巢,并在卵巢中产生卵子。 T2T 联盟解决了阻碍 Y 染色体序列完成的技术问题,并在此过程中发现了 40 个以前未知的蛋白质编码基因。正如《自然》杂志上的一篇文章所详述的那样,这使得人类基因组的总长度增加了 3000 万个字母,现在将有 32.3 亿个字母。该研究的作者已向整个研究界提供了名为 T2T-CHM13+Y 的新参考基因组。 除了 Y 染色体的完整序列之外,《自然》杂志还发表了第二项研究,涉及过去 183,000 年来人类的 43 条 Y 染色体序列。他们的分析揭示了 Y 染色体在进化过程中的大小和结构的巨大多样性。除其他外,研究人员还发现了大序列倒置——DNA片段被翻转并颠倒插入。 我们对 Y 染色体有了更多了解,这是个好消息。大约一年前,我们看到了另一项科学突破,该突破将许多细胞中 Y 染色体的普遍缺失与男性的预期寿命短于女性联系起来。很明显,基因中隐藏着更有价值的信息。 泛基因组倡议这两项新研究显着增加了我们对人类 DNA 的了解,解决了我们尚未发现的关于基因组中最小但最复杂的染色体的问题。它们是继泛基因组计划之后推出的,该计划旨在捕捉人类中存在的遗传变异性。虽然我们基因组的很大一部分是相同的,但我们之间的差异约为 0.1%。这相当于任意两个人之间存在超过 300 万对字母的差异。 通过泛基因组计划,我们将不再拥有单个参考基因组,而是数百个将更可靠地说明我们遗传相似性和差异的参考基因组。除此之外,这应该可以帮助我们更容易地检测与数千种先天性疾病相关的基因突变。 (责任编辑:泉水) |