人類基因序列從2001年開始由6國科學家共同參與,至今已經有22年的時間,科學家經過這麼長時間的研究破譯人類基因的組成部分,截止目前人類完整的基因組終於首次破譯成功,這將對人類的生長發育和疾病有一個更深層次的了解,是一大進步。
歷時22年,研究人員終於從頭到尾破譯了完整的人類基因組序列。被譽為生命科學「登月計劃」的人類基因組測序再次取得重大進展:國際科學團隊端粒到端粒聯盟(T2T)發表了第一個完整的、無間隙的人類基因組序列,首次揭示了高度相同的節段重複基因組區域及其在人類基因組中的變異。這是對標準人類參考基因組,即2013年發布的參考基因組序列(GRCh38)的「重大升級」。當地時間31日,《科學》雜誌連發6篇論文報告這一成就。
2001年2月12日,由6國科學家共同參與的國際人類基因組計劃首次公布人類基因組圖譜及初步分析結果;2003年4月15日,公布了人類基因組序列草圖。然而,由於技術限制,當初的人類基因組計劃留下了大約8%的「空白」間隙。這部分很難被測序,由高度重複、複雜的DNA塊組成,其中包含功能基因以及位於染色體中間和末端的著絲粒和端粒。實際上,核心的挑戰在於,基因組的某些區域反覆重複相同的鹼基。重複的區域包括著絲粒和核糖體DNA等,過去無法按照正確的順序組裝一些被切碎的片段。這就像擁有相同的拼圖碎片一樣,科學家們不知道哪塊碎片在哪裡,因此基因組圖中留下了很大的空白。
如今,研究人員通過新的納米機器設備與核心技術,實現了新的無間隙版本T2T-CHM13,由30.55億個鹼基對和19969個蛋白質編碼基因組成。增加了近2億個鹼基對的新DNA序列,包括99個可能編碼蛋白質的基因和其中近2000個需要進一步研究的候選基因。
一直到2020年夏天,該團隊已經拼上了兩條染色體。最終,通過長時間的研究與團隊合作,該團隊成功實現了對每個染色體進行了測序,包含了編碼用於製造核糖體的RNA的基因的多個拷貝,總共400個。2021年6月,這份研究成果首次發表在預印版平台bioRxiv上。經過同行評議等,如今一系列論文登上了《Science》(科學)雜誌。今天,新的基因組序列研究成果,是科研人員必不可少的第一步,也是實現商業化的重要一步。