6月21日,Nucleic Acids Research 期刊在線發(fā)表中國科學(xué)院分子植物科學(xué)卓越創(chuàng)新中心/植物生理生態(tài)研究所張一婧研究組與中科院遺傳與發(fā)育生物學(xué)研究所童依平研究組合作完成的題為CGT-seq: epigenome-guided de novo assembly of the core genome for divergent populations with large genome 的方法學(xué)論文。該工作開發(fā)并優(yōu)化實(shí)驗(yàn)與計(jì)算流程,實(shí)現(xiàn)低成本組裝小麥等大基因組作物的核心基因組。
博士研究生齊美芳、李子娟和劉春梅為共同第一作者,水稻實(shí)驗(yàn)材料及數(shù)據(jù)獲得植生生態(tài)所研究員林鴻宣的幫助。相關(guān)工作得到中科院A類先導(dǎo)及自然科學(xué)基因項(xiàng)目的資助。
植物高度的遺傳多態(tài)性為分子育種提供了豐富的遺傳資源,確定重要農(nóng)藝性狀的根本方法在于比較不同群體或比較栽培種和野生種間遺傳多態(tài)性與表型的關(guān)聯(lián)。然而,很多經(jīng)濟(jì)物種經(jīng)歷了長期的馴化,基因組復(fù)雜而龐大。例如,目前普遍種植的小麥?zhǔn)?倍體,全基因組有17Gb,另外,廣泛栽培的大麥、棉花、玉米、花生和大豆都具有Gb尺度的基因組,即便是覆蓋度要求較低的重測序?qū)嶒?yàn)都需要極高的成本。而且,還存在不少未測序的大基因組經(jīng)濟(jì)物種,全基因組測序成本非常高,特別是對于群體水平的研究全基因組測序不現(xiàn)實(shí)。怎樣有效刻畫大基因組多態(tài)性群體的遺傳多樣性是一個(gè)挑戰(zhàn)性的工作。由于很多研究并不需要知道基因組所有的堿基序列,所以人們針對大基因組物種開發(fā)了各種低成本的替代測序技術(shù)。其基本原理通常是對全基因組序列進(jìn)行選擇性測序,但是這些方法普遍對已有的基因組序列信息要求高,而對于遺傳變異大的群體,依賴參考基因組的技術(shù),包括外顯子測序,甚至全基因組重測序,都會顯著低估多態(tài)性。因而,開發(fā)不依賴參考基因組直接捕獲基因及調(diào)控區(qū)序列的簡化基因組測序方法對于研究多態(tài)性高的群體具有重要價(jià)值。該方法的理論依據(jù)在于調(diào)控基因活性的重要表觀修飾普遍富集在基因及啟動子區(qū)(圖A-B),通過免疫共沉淀技術(shù)及優(yōu)化拼接方案從而有效獲得基因及附近序列(圖C)。對小麥中國春品種進(jìn)行核心基因組組裝獲得的片段與基因區(qū)域高度吻合(圖D),能夠高效挖掘新基因(圖E-F)、調(diào)控區(qū)域(圖G)及多態(tài)性位點(diǎn)(圖H-J)。該方法已申請專利,其優(yōu)勢在于不依賴參考基因組序列,直接捕獲基因及調(diào)控區(qū)序列,從而極大地降低群體核心基因組拼接的成本,有力地提高大基因組物種的分子遺傳與群體遺傳學(xué)研究效率。
小麥等大基因組作物核心基因組低成本組裝及新基因挖掘研究獲進(jìn)展