近日,由中科院海洋所張國(guó)范研究組獨(dú)立完成的論文“Construction of a chromosome-level genome and variation map for the Pacific oyster Crassostrea gigas(長(zhǎng)牡蠣染色體水平基因組和變異圖譜構(gòu)建)”在國(guó)際學(xué)術(shù)期刊Molecular Ecology Resources(《分子生態(tài)資源》)在線發(fā)表。該研究首次構(gòu)建了長(zhǎng)牡蠣染色體水平基因組和貝類中第一張包含SNP、INDEL和CNV的綜合序列變異圖譜,發(fā)現(xiàn)長(zhǎng)牡蠣基因組中存在高比例的長(zhǎng)片段重復(fù)序列,CNV結(jié)構(gòu)變異可導(dǎo)致個(gè)體間平均21%的區(qū)域差異,更新了長(zhǎng)牡蠣基因組資源和對(duì)基因組復(fù)雜性的認(rèn)知。
長(zhǎng)牡蠣(Crassostrea gigas),俗稱太平洋牡蠣,是世界重要的養(yǎng)殖貝類,具有重要的經(jīng)濟(jì)和生態(tài)價(jià)值。張國(guó)范研究組長(zhǎng)期從事貝類養(yǎng)殖和育種相關(guān)工作,并一直致力于牡蠣基因資源挖掘和分子育種研究。2012年在Nature發(fā)表的牡蠣第一張基因組圖譜得到廣泛應(yīng)用,引領(lǐng)并開(kāi)啟了水產(chǎn)物種基因組學(xué)相關(guān)研究。張國(guó)范研究組之后一直對(duì)牡蠣基因資源進(jìn)行維護(hù)和更新。隨著新一代測(cè)序技術(shù)的普及和對(duì)長(zhǎng)牡蠣染色體水平基因組需求的增加,研究組于2019年正式啟動(dòng)長(zhǎng)牡蠣染色體水平基因組構(gòu)建工作。
本研究利用高覆蓋第三代測(cè)序(PacBio,~200×)結(jié)合HIC技術(shù),并利用遺傳連鎖圖譜進(jìn)行輔助,對(duì)一個(gè)中國(guó)青島的長(zhǎng)牡蠣進(jìn)行從頭組裝,獲得基因組總長(zhǎng)度為587M,包含10條染色體水平scaffold序列,ContigN50達(dá)到3.1M,ScaffoldN50達(dá)到60M,組裝完整性和連續(xù)性均有較大提高。發(fā)現(xiàn)基因組中高比例的長(zhǎng)片段重復(fù)在基因進(jìn)化中發(fā)揮了重要作用,同時(shí)也是導(dǎo)致之前基于二代測(cè)序技術(shù)組裝的長(zhǎng)牡蠣基因組碎片化的主要原因?;?95個(gè)野生長(zhǎng)牡蠣的重測(cè)序數(shù)據(jù)分析,構(gòu)建了長(zhǎng)牡蠣綜合變異圖譜,包含480萬(wàn)個(gè)高質(zhì)量SNP,60萬(wàn)個(gè)INDEL和4.9萬(wàn)個(gè)CNV。這些新的數(shù)據(jù)資源對(duì)牡蠣比較基因組學(xué)、分子育種和適應(yīng)進(jìn)化等研究具有重要意義。美國(guó)南加州大學(xué)Dennis Hedgecock教授團(tuán)隊(duì)成員Xiaoshen Yin博士對(duì)該基因組進(jìn)行了分析,發(fā)現(xiàn)和連鎖圖譜一致性達(dá)到90%以上,明顯的組裝錯(cuò)誤不到0.1%,肯定了其較高的組裝質(zhì)量(Yin et al, 2020)。
本研究得到國(guó)家自然科學(xué)基金、山東省科技創(chuàng)新重大專項(xiàng)、中科院海洋大科學(xué)研究中心重點(diǎn)部署項(xiàng)目、國(guó)家貝類產(chǎn)業(yè)技術(shù)體系專項(xiàng)基金等資助。中科院海洋所高性能計(jì)算中心對(duì)部分生物信息分析提供了技術(shù)支持。亓海剛副研究員為論文第一作者,李莉研究員和張國(guó)范研究員為通訊作者。
論文鏈接:onlinelibrary.wiley.com/doi/abs/10.1111/1755-0998.13368。