2001 年人类基因组测序“草案”的发布是一个重要时刻。 它引发了我们对认知的深刻转变 遗传学 人类。 它为生物学研究和疾病治疗的显着进步铺平了道路。
然而,有些部分没有获得排序,其他信息是不正确的。 整整二十年后,我们得到了一个新版本。 它由一个国际研究人员联盟作为预印本出版。 它尚未经过同行评审,但最终似乎“完整”。
测序:为什么我们花了这么长时间?
由于技术限制,人类基因组的测序仅限于基因组的“常染色质”部分,即我们基因组的 92%,其中发现了大多数基因。实际上,这是RNA和蛋白质等基因产品生产中最活跃的部门。
新的测序预计将填补剩余的空白,完整地提供我们 DNA 代码的全部 3.055 亿个碱基对(“字母”)。数据公开,希望其他研究人员能够利用它来进一步研究。
异色部分
许多新测序的材料是基因组的“异染色质”部分,它比常染色质基因组更加“紧密”,并且包含许多高度重复的序列,很难准确读取。
曾经认为这些区域不包含任何重要的遗传信息,但现在已知它们包含参与基本过程的基因,例如胚胎发育过程中器官的形成。 在 200 亿个新测序的碱基对中,大约有 115 个基因有望参与蛋白质的生产。
两个关键因素使这一伟大成就成为可能:
一个很特别的细胞
新发表的基因组序列是使用源自一种非常罕见的组织的人类细胞创建的,称为 水形轮. 当受精卵失去其母亲赋予它的所有遗传物质时发生的一种情况。 大多数细胞包含每条染色体的两个拷贝,一个来自每个亲本,而来自每个亲本的染色体构成不同的 DNA 序列。 一个完整的葡萄胎细胞 他只有两份父亲的染色体,每对染色体的基因序列都是相同的。
这使得全基因组测序变得更容易组合在一起。
测序技术的许多进步
经过数十年的缓慢进展后,人类基因组计划在 2001 年达到了转折点,为一种名为“霰弹枪测序”。它涉及将基因组分解成大约 200 个碱基对的非常小的片段,将它们克隆到细菌内部以破译它们的序列,然后将它们像一个巨大的拼图游戏一样重新组合在一起。
这就是原始测序草案仅涵盖基因组常染色质区域的主要原因:只有这些区域才能使用“猎枪”进行可靠测序。
最新的序列是使用两种新的互补DNA测序技术获得的。一款是由 太平洋生物 并允许您以非常高的精度对更长的 DNA 片段进行测序。
第二种,开发者 牛津纳米孔, 产生很长一段连续的 DNA 序列。 这些新技术使拼图的碎片长度达到数千甚至数百万个碱基对,使它们更容易组装。
这些新信息有可能增进我们对人类生物学的理解,包括染色体如何发挥作用和维持其结构。它还将提高我们对具有潜在染色体异常的唐氏综合症等遗传疾病的了解。
来吧,但现在基因组已经完全测序了!
不。 甚至现在也不行。
一个明显的遗漏是 Y 染色体,因为用于编译测序的葡萄胎细胞仅包含两个相同的 X 染色体拷贝。但这项工作正在进行中,研究人员预测他们的方法也可以准确地对 Y 染色体进行测序,尽管具有高度重复的序列。
然而,还有一段路要走
虽然对人类细胞的(几乎)完整基因组进行测序是一个真正令人印象深刻的里程碑,但这只是充分了解人类遗传多样性的几个关键步骤之一。 下一步工作将是研究不同种群的基因组(完整的葡萄胎细胞是欧洲人)。