中國學者首次建立從端粒到端粒的中國人全基因組香港新聞網12月29日電 端粒到端粒(T2T)聯盟組裝的參考基因組T2T-CHM13,是有史以來第一個具有卓越質量的完整單倍體人類基因組。但遺憾的是,基因組計劃發展到現在,仍然沒有中國人自己的參考基因組。 據科技日報報道,日前,北京大學人民醫院高占成教授研究團隊、中國科學院北京基因組研究所康禹教授研究團隊在《基因組蛋白質組與生物信息學報》雜誌發表研究論文,首次在世界範圍內成功完成從端粒到端粒的中國人全基因組,獲得包括Y染色體在內的高質量真實人類二倍體、完整無間隙的全基因組參考序列(44+XY)——“唐堯”基因組,其DNA序列具有明確的漢族中國人遺傳特征。 圖為高占成與研究生在細胞培養間觀察細胞生長狀態。(北京大學官網) 據悉,樣本來自一名生活在山西省一個古老村莊的健康男性,經核型檢測,未見染色體結構異常。研究團隊將該參考基因組命名為“T2T-YAO”,因為這個採樣點位於幾千年前的堯帝遺址附近,這個地區是明代洪洞移民的起點。這場遷徒持續了近半個世紀,大量移民遍佈中國各地並進入東南亞。因此,T2T-YAO基因組有望成為漢族人群的全面代表。 根據祖源分析,YAO基因組的大部分來自東亞。其Y染色體單倍群鑒定為O-F2137,是中國主要的Y單倍群O-M122的主要後代群之一。 研究團隊使用merqury(評估基因組質量的重要工具)來評估T2T-YAO,並分析其完整性、組裝錯誤和單倍型之間的切換錯誤。其中T2T-YAO的質量值(QV)達到了參考質量的準確度,母本與父本分別達到了Q70.49和Q72.28,選擇父母本中QV較高的常染色體及性染色體組成一套單倍體參考基因組,其質量達到了Q74.69。 研究發現,與基準基因組HG002相比,T2T-YAO表現出較少的錯誤重復、交換錯誤和較短的折疊區域,且T2T-YAO擁有更完整的rDNA(核糖體DNA)序列。與CHM13相比,YAO的單倍體間具有更多的序列共享性和更高的同一性。這意味著與漢族人群相比,不同族群之間存在更大的基因組距離。而不同單倍型間有10%的序列是獨特的,代表了大部分個體間的基因組多樣性。 研究團隊還成功完成T2T-YAO的所有十個SAACs(近端著絲粒染色體短臂)區域,SAACs的成對比對揭示了異源染色體上幾乎有相同的序列存在,形成了具有大量倒位、重復和易位的同源嵌合體,特別是在chr13、14、21和22之間。對十個SAACs區域的k-mer(一段長度為k的DNA片段)進行聚類,他們發現同源染色體的短臂顯示出幾乎相同的位置,但不同異源染色體的長臂彼此遠離。 研究發現,YAO-Y基因結構與既往報道一致,兩端包含偽常染色體區(PARs)、X轉座區、擴增序列、異染色質衛星區和X簡並區。擴增子存在於擴增區域,與CHM13-Y中觀察到的模式相似。 該研究報告了一個完整、準確的中國漢族參考基因組T2T-YAO,能應用於未來的醫學研究和臨床實踐中,為精準醫療夯實了基礎。(完) 【編輯:丘志彬】
|