?
英國維康桑格研究所的人類基因組序列切片可視化圖。圖片來源:James King-Holmes/Science Photo Library
本報訊?20年前,當人類基因組計劃誕生、生物技術(shù)公司Celera Genomics宣布對人類基因組進行測序時,這個序列尚未真正完整,其中缺失了約15%的序列。技術(shù)上的限制使得研究人員無法計算出某些DNA片段是如何結(jié)合在一起的,特別是那些有許多重復(fù)堿基對的片段。
隨著時間推移,科學(xué)家解開了其中一些謎團,但遺傳學(xué)家自2013年以來用作研究參考的最新人類基因組序列仍然缺少8%。
現(xiàn)在,大約30個機構(gòu)組成的國際合作組織——端粒到端粒聯(lián)盟(T2T)的研究人員填補了這些空白。
據(jù)《自然》報道,在近日發(fā)表于預(yù)印本平臺BioRxiv的論文中,美國加利福尼亞大學(xué)圣克魯茲分校基因組學(xué)研究人員Karen Miga和同事報告稱,他們已經(jīng)對剩余的部分基因組進行了測序,其中發(fā)現(xiàn)了大約115個編碼蛋白質(zhì)的新基因。目前基因數(shù)量達到19969個。
被命名為T2T-CHM13的新測序的基因組,在2013年版的人類基因組序列上一次性增加了近2億個堿基對。
這次測序,研究人員沒有使用從人身上提取的DNA,而是使用了來源于一種被稱為完全性葡萄胎(當精子使一個沒有細胞核的卵子受精時在人體內(nèi)形成的組織)的細胞系。由此產(chǎn)生的細胞只含有來自父親的染色體,因此研究人員不必區(qū)分來自不同人群的兩組染色體。
Miga表示,如果沒有太平洋生物科學(xué)公司的新測序技術(shù),這一壯舉或許不可能實現(xiàn)。這一新測序技術(shù)可一次性激光掃描包含多達2萬個堿基對的從細胞中分離的DNA長片段。而傳統(tǒng)測序方法一次只能讀取包含幾百個堿基對的DNA片段,研究人員要像拼拼圖一樣將它們重新組裝起來。
然而,T2T-CHM13并不是人類基因組的“最終版”。T2T團隊在分辨染色體上的一些區(qū)域時遇到了困難,估計大約0.3%的基因組可能含有錯誤。此外,形成葡萄胎的精子細胞攜帶X染色體,研究人員還沒有對Y染色體(通常會觸發(fā)男性生物學(xué)發(fā)育)進行測序。
T2T-CHM13只代表一個人類的基因組。但T2T已經(jīng)與一個名為人類泛基因組參考聯(lián)盟的組織合作,該組織的目標是在未來3年內(nèi)對全世界300多個人類基因組進行測序。
Miga說,合作研究小組將使用T2T-CHM13作為參考,以了解基因組的哪些部分在個體之間存在差異。他們還計劃對包含雙親染色體的整個基因組進行測序。(徐銳)
相關(guān)論文信息:
https://doi.org/10.1101/2021.05.26.445798
《中國科學(xué)報》 (2021-06-07 第1版 要聞)