历时 20年终成正果,全部人类基因组测序完成


 

  【英国《新科学家》周刊网站 5 月 28日报道】题∶20 年后,终于对人类基因组进行了完全测序。

 

  我们终于对全部人类基因组进行了测序。这一次是真的。

 

 

  科学家 20年前宣布,他们读取了一个人的全部脱氧核糖核酸(DNA),其实他们漏掉了少许。现在,由于读取 DNA的方法有了极大改善,科学家终于可以从头到尾读取全部基因组了

 

  美国华盛顿大学的埃文·艾克勒说∶"2001 年时,我是最初的人类基因组计划的一员,而且我尤其关注难以读取的部分,看到有人最终完成了这件事,我非常满意,尽管已经过去了 20 年。"

 

  新基因组包含额外的 2 亿个碱基对(也被称为 DNA的"字母"),增加了 2000 多个基因。

 

  我们的基因塑造了我们。人类拥有数万个基因,但确切数字还是未知数,且在一定程度上取决于你如何计数。它们被储存在位于细胞中心的长长的 DNA分子中。基因信息以4种沿 DNA分子排列成链、被称为碱基(C、G、T和 A)的分子的形式存在。

 

  人类基因组包含 30 多亿个"字母"。 2001 年,科学家大张旗鼓地公布了首批完整序列∶一个由人类基因组测序国际公司公布,另一个由美国塞莱拉基因组公司公布。人类基因组测序项目始于1990年。

 

  由于当时不得不将基因组分成小块进行读取,然后重新组装到一起,事实证明无法将一些高度重复的片段放回原位,这有点像一幅所有拼块都很相似的拼图。

 

  在接下来的 3年里,人类基因组测序国际公司填补了一些空缺。2004年,该公司宣布自己已竭尽所能。遗传学家继续改进这一供参考的基因组,但主要手段是提高现有序列的精确度,而非增加新序列。仍有约 8% 的序列要么缺失了,要么可能是错误的。

 

 

  新版本基因组由"端粒到端粒"联盟绘制。该联盟由美国加利福尼亚大学圣克鲁斯分校的卡伦·米加和国家人类基因组研究所的亚当·菲利皮领导。2018年,他们加入了一个对基因组的较大片段(长度超过 10 万个碱基)进行测序的团队,这使他们能填补某些缺失部分。

 

  他们选择从一个被称为 CHM13 的细胞系中读取 DNA。该细胞系来自水泡状胎块-----一种妊娠失败情况,即子宫中的卵子在不知为何失去其基因组后受精。由此产生的细胞只含有正常胚胎的一半DNA,因此精子的 DNA 会被复制。这种细胞会像肿瘤一样危险地生长,必须将其清除。可以在实验室中培养这种细胞。

 

  菲利皮说∶"独特之处在于,它不是任何曾经活过的人的基因组。"DNA 来自单个精子,因此是一个潜在父亲被复制了的一半基因组。

 

  普通人类细胞的每段 DNA 都有两个往往存在重大差异的副本,一个来自母亲,另一个来自父亲。这使得对 DNA进行精确测序变得更加困难,因为要搞清什么是测序过程中的失误、什么是真正的差异,是一件棘手之事。使用 CHM13 避免了这个问题,因为两个副本几乎完全相同。

 

  为了组装基因组的序列,研究团队结合了两种技术。一种是能读取非常长(超过 100 万个"字母")的片段的测序技术,另一种是精确度极高、因而能处理差别极小的片段——比如同一基因的多个副本———的技术。

 

  人类的 DNA 储存在被称为染色体的大分子上。大部分难以读取的 DNA位于被称为着丝粒的中心点周围。此外,有些染色体是不对称的,其所含的一对"手臂"比另一对短一些。短臂包含很多难以读取的 DNA。

 

 

(对人类基因组进行测序是一项复杂的工作)

 

  2020 年7 月,该团队突破第一关,公布了完整的决定性别的人类X染色体。现在,他们公布了完整的人类基因组。

 

  新版本给上一个版本增加了近 2 亿个"字母",还有与已知基因几乎相同的 2226 个片段。据估计,在这些新基因中,有 115 个为合成蛋白质提供遗传密码。

 


【吉卡提示】本平台分享的图文信息,仅供大家参考学习,不作为医疗诊断依据。如有需要,请咨询专业人士或前往医疗机构进行就医。


【版权声明】吉卡生物所发布的图片来源摄图网和网络,文章来源于参考消息报-英国《新科学家》,如内容涉及版权等问题,请立即联系管理员,我们会予以更改或删除相关文章,保证您的权利。

 

关键词:


友情链接:

Links