解锁暗基因组以识别新的药物靶点

第一个人类基因组于 2004 年发表,而完成整个基因组测序则用了 13 年。科学界因绘制出基因组中的所有人类基因图而异常兴奋。当时科学家们预计,人类基因组有25,000 到 40,000 个基因编码。然而,这个数字后来被证明过高。现在科学家们认为人类基因组有大约 19,000-20,000 个基因。这仅占遗传物质的 2%。那么,这自然引出一个重要问题:如何认知被称为暗基因组的剩下的98%的人类基因组?

科学界对于暗基因组知之甚少,但认为包括重复序列、增强子和非编码 RNA 在内的基因调控元件都被编码在这些区域中。由于药物发现和生物医学研究的重点一直是识别并调节与疾病表型相关的蛋白质编码基因,这限制了对暗基因组的研究。然而,一些暗基因组物质的研究报告提出,基因调控元件比实际的蛋白质编码基因占据更多的序列空间,并且在蛋白质编码基因之外发现了许多单核苷酸多态性 (SNP)。这些发现表明,大量非常有价值的信息和潜在的药物靶点隐藏在暗基因组中。科学家们正在使用如 CRISPR-Cas9 基因编辑系统等强大的工具来探测暗基因组,破坏特定区域并观察对人类细胞所产生的结果。使用其他高通量工具也有助于确定暗基因组特定区域的作用。据估计,迄今为止,暗基因组编码蛋白质中有超过 200,000 个序列可能在疾病发展过程中被破坏。这并不意外,因为在小鼠神经元、特定鱼类和寄生虫的基因组中已发现了 RNA 和蛋白质编码序列。

最近一项研究表明,暗基因组中的基因编码对疾病的发展有直接影响。剑桥大学的研究人员对暗基因组进行了探测,以识别双相情感障碍和精神分裂症的新靶点,并于 2021 年底发表了他们的发现。这两种疾病的遗传率约为 70%,因此它们已被证明具有很强的遗传性。然而,迄今为止,对已知基因的常规分析无法解释强大的遗传力。因此,研究人员对暗基因组进行探测以确定这些疾病的相关因素。由于精神分裂症和双相情感障碍主要发生在人类身上,并与认知相关,研究人员在被称为人类加速区 (HAR) 的基因组特定区域中寻找新的开放阅读框 (nORF)。 HAR 似乎是新进化的具有人类特异性的基因组区域。

该研究确定了 3,000 多个开放阅读框 nORF,其中约 56 个与精神分裂症相关,40 个与双相情感障碍相关。研究人员猜想其中某些 nORF 编码蛋白质可以作为药物靶点。 开放阅读框nORF 序列也在转座因子 (TE) 中被发现,表明 nORF 产物在基因调控中发挥作用。有趣的是, nORF 编码的特定肽的表达水平变化与包括精神病和自杀在内的特定表型相关。这表明,可以进一步研究特定的 nORF 以开发疾病管理疗法。暗基因组区域和药物靶点的研究仍处于早期阶段,了解nORF 编码蛋白在疾病发展中的重要性并将 nORF 表达与特定疾病的遗传力相关联非常重要。

如果开放阅读框 nORF 编码蛋白质被证明是真正的药物开发目标,那么加速对暗基因组的研究可能会为迄今为止仍困扰科学家的疾病遗传原因问题提供答案。

参考文献:

1https://www.genome.gov/human-genome-project

2https://www.nature.com/articles/538275a

3https://bioengineeringcommunity.nature.com/posts/d

4https://www.nature.com/articles/s41380-021-01405-6