10月18日,中國(guó)科學(xué)院遺傳與發(fā)育生物學(xué)研究所植物基因組學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室梁承志研究組開(kāi)發(fā)的分子育種整合組學(xué)知識(shí)庫(kù)水稻子庫(kù)在線發(fā)表于學(xué)術(shù)期刊《核酸研究》(Nucleic Acids Research)。文章題目為MBKbase for rice: an integrated omics knowledgebase for molecular breeding in rice。
種質(zhì)資源是作物遺傳改良的基礎(chǔ)。近年來(lái)高通量測(cè)序技術(shù)的發(fā)展已為解析作物種質(zhì)材料的遺傳變異和基因功能提供了大量的組學(xué)數(shù)據(jù)。單分子測(cè)序技術(shù)的發(fā)展也幫助構(gòu)建了重要作物的多個(gè)參考基因組,為高質(zhì)量泛基因組的構(gòu)建提供了基礎(chǔ)。整合這些組學(xué)數(shù)據(jù)將大大有利于對(duì)其的重復(fù)利用和深度挖掘。預(yù)期隨著高通量表型采集技術(shù)的發(fā)展,育種大數(shù)據(jù)體量將不斷增加,數(shù)據(jù)的整合和分析將越來(lái)越困難,因而建立一個(gè)通用的育種組學(xué)大數(shù)據(jù)整合分析平臺(tái)對(duì)作物基因功能研究人員和育種工作者都至關(guān)重要。
梁承志團(tuán)隊(duì)多年來(lái)在高質(zhì)量基因組組裝和注釋的基礎(chǔ)上,致力于構(gòu)建一個(gè)整合的作物組學(xué)知識(shí)庫(kù)。該知識(shí)庫(kù)旨在揭示種質(zhì)材料的基因型以及跟表型信息在群體中的關(guān)聯(lián),設(shè)計(jì)了各類育種相關(guān)的組學(xué)數(shù)據(jù)的存儲(chǔ)規(guī)范,適用于整合多物種種質(zhì)信息、多參考基因組和泛基因組,尤其是海量的群體基因組重測(cè)序數(shù)據(jù)的存儲(chǔ)和展示。目前該知識(shí)庫(kù)的水稻子庫(kù)展示了兩個(gè)參考基因組和基因信息(另一個(gè)參考基因組數(shù)據(jù)也將很快公開(kāi))及近7000余份全球水稻重測(cè)序數(shù)據(jù),大量水稻種質(zhì)資源信息數(shù)據(jù),400多萬(wàn)條表型記錄值,1.3萬(wàn)個(gè)已知基因的功能注釋等。在這些重測(cè)序的水稻種質(zhì)資源遺傳信息中,蘊(yùn)含著大量的可用于改造水稻品質(zhì)、增加抗性、提高產(chǎn)量的優(yōu)良等位基因。通過(guò)在線用戶自定義基因分型與表型數(shù)據(jù)的關(guān)聯(lián)展示,首次實(shí)現(xiàn)了在線基因型到表型大數(shù)據(jù)的可視化實(shí)時(shí)展示。該知識(shí)庫(kù)在基因型水平上進(jìn)行多功能軟件開(kāi)發(fā),實(shí)現(xiàn)了基于基因型的種質(zhì)篩選、個(gè)體比較、變異分析、基因型在線注釋等復(fù)雜功能。此外,該知識(shí)庫(kù)具備數(shù)據(jù)的動(dòng)態(tài)擴(kuò)展功能,適于收集和導(dǎo)入新的作物群體重測(cè)序數(shù)據(jù),并能夠與原有數(shù)據(jù)集進(jìn)行整合分析。水稻子庫(kù)的建立也為其他作物比如大豆、小麥和玉米奠定了一個(gè)良好的基礎(chǔ)。
論文第一作者為梁承志研究組博士生彭驊,梁承志為通訊作者。數(shù)據(jù)庫(kù)開(kāi)發(fā)得到基因組分析平臺(tái)的大力支持和幫助。數(shù)據(jù)庫(kù)設(shè)備也得到植物基因組學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室的支持。該研究得到中科院戰(zhàn)略性先導(dǎo)科技專項(xiàng)(A)“分子模塊設(shè)計(jì)育種創(chuàng)新體系”等的資助。