父母孕育出的生命,還能截然分清哪些遺傳信息來自父親,哪些來自母親嗎?以我國科學(xué)家為主導(dǎo),一個中外科學(xué)家聯(lián)合團(tuán)隊首次采用全新方式,對狨猴這一非人靈長類模式動物的全基因組數(shù)據(jù)進(jìn)行了組裝和分析,獲得了兩套完美的同源染色體(分別來自父親和母親)基因組,為高質(zhì)量基因組分析找到了新方法,也為進(jìn)入“完美基因組”時代提供了一個范例。該成果近期發(fā)表于國際權(quán)威學(xué)術(shù)期刊《自然》雜志。
從“馬賽克”變成“清一色”
眾所周知,正常人的體細(xì)胞內(nèi)有46條23對染色體?!暗珎鹘y(tǒng)方法在測序后只能組裝出22條常染色體,以及X、Y兩條性染色體,總共只有24條。”論文第一作者、深圳華大生命科學(xué)研究院與丹麥哥本哈根大學(xué)聯(lián)合培養(yǎng)的博士生楊琛濤說,由于染色體分子太大,所以測序時無法直接測整條染色體,只能分段測得數(shù)據(jù),再通過算法將這些數(shù)據(jù)組裝起來。
靈長類動物的染色體是成對存在的,一條來自父親,一條來自母親,成對的兩條常染色體演化起源相同、序列相似,但又存在遺傳差異。楊琛濤說,在DNA測序數(shù)據(jù)組裝時,算法有時無法區(qū)分DNA上某些有差異的區(qū)域,只能隨機(jī)保留其中一條的數(shù)據(jù)。因此,目前大多數(shù)基因組研究往往只能得到一套父母本遺傳信息混合的基因組,類似于由兩種顏色拼成的馬賽克圖案。
能不能將這些被算法混淆不清的基因組信息弄清楚呢?“我們在狨猴基因組測序中首次嘗試了新方法?!闭撐墓餐谝蛔髡摺⑸钲谌A大生命科學(xué)研究院副研究員周旸介紹,他們同時為狨猴及其父母進(jìn)行了基因組測序,“利用被測個體的父母本的測序數(shù)據(jù)進(jìn)行遺傳信息區(qū)分,我們的算法可以完美地將兩條同源染色體分別組裝出來?!弊罱K,兩套染色體級別的父母本單倍體基因組的單堿基精確度分別達(dá)到99.996%和99.998%。
▲子代個體的兩套染色體一套來自于母親,一套來自于父親。傳統(tǒng)組裝策略獲得的是遺傳信息混合的基因組,新策略則可通過父母本特異的序列得到遺傳自父母本的兩套完整的基因組數(shù)據(jù)。(楊琛濤 周旸/繪)
透露狨猴演化獨特信息
“這是一個很大的進(jìn)步,相關(guān)方法未來可以應(yīng)用到更多物種的分析中?!睏铊硎?,如果考慮到所有類型的遺傳變異,目前一般得出的雜合率結(jié)果被遠(yuǎn)遠(yuǎn)低估了。
另外,研究團(tuán)隊發(fā)現(xiàn),來自父親的種系突變是來自母親的兩倍,這可能與卵細(xì)胞和精子的形成過程中細(xì)胞發(fā)生復(fù)制分裂的次數(shù)不同有關(guān)。
研究團(tuán)隊還在對狨猴生物學(xué)進(jìn)行分析時,獲得不少有趣的發(fā)現(xiàn)。
例如,他們發(fā)現(xiàn),狨猴的Y染色體上比人多出了一段雄性特異性序列,而且一些參與人類精子形成的基因在狨猴中丟失或者失去功能。又如,狨猴的Y染色體上一些對精子形成過程至關(guān)重要的基因發(fā)生了丟失或假基因化。這一現(xiàn)象可能與狨猴一夫一妻制的婚配方式導(dǎo)致雄性個體精子競爭的降低有關(guān)。
研究團(tuán)隊還發(fā)現(xiàn),在人和狨猴之間,大部分與大腦相關(guān)的基因是高度保守的。這在一定程度上解釋了為何狨猴可以作為研究人類神經(jīng)疾病模式物種的遺傳學(xué)基礎(chǔ)。
此外,他們也發(fā)現(xiàn)了一些與狨猴身體大小、繁殖特征、飲食習(xí)慣相關(guān)的基因受到了正選擇?!霸谶@些基因中,有些基因與其體型縮小有關(guān),有些基因則與狨猴特殊的以樹膠為食的習(xí)性有關(guān)?!敝軙D說。
助力精細(xì)疾病研究
“2021年是人類參考基因組草圖序列公布20周年,但如何構(gòu)建參考基因組序列仍是當(dāng)前基因組研究的重點攻關(guān)領(lǐng)域?!闭撐耐ㄓ嵶髡撸钲谌A大生命科學(xué)研究院、中國科學(xué)院昆明動物研究所及丹麥哥本哈根大學(xué)的張國捷教授認(rèn)為,基因組中包含大量與健康、疾病和表型相關(guān)序列,對這些序列的研究有賴于基因組序列的準(zhǔn)確度。
近幾年,隨著基因組序列功能研究的日益深入,生命科學(xué)界對獲得更高質(zhì)量基因組的需求不斷增加?!拔覀儗Χ扼w物種完美基因組序列提出了新的標(biāo)準(zhǔn),即二倍體細(xì)胞中的兩套基因組應(yīng)分別獨立組裝到染色體水平并含有極少的測序漏洞。通過本次研究,我們論證了實現(xiàn)這一目標(biāo)的可行性?!睆垏荼硎?,高質(zhì)量的狨猴基因組也為利用該物種作為動物模型的醫(yī)學(xué)研究提供了重要遺傳數(shù)據(jù)。
未來20年,精準(zhǔn)醫(yī)學(xué)是人類基因組學(xué)的一個主要發(fā)展方向。該研究顯示出了新測序組裝技術(shù)的極大潛力,它可為科學(xué)家提供非常精準(zhǔn)的基因組數(shù)據(jù)支持,在此基礎(chǔ)上,科學(xué)家可以進(jìn)行更為精細(xì)的疾病相關(guān)研究。