5月28日,中國(guó)農(nóng)業(yè)科學(xué)院作物科學(xué)研究所聯(lián)合國(guó)內(nèi)多家科研單位,構(gòu)建了用于水稻基因組選擇的大規(guī)模中國(guó)栽培稻群體數(shù)據(jù)集,提出了配套的全基因組預(yù)測(cè)深度學(xué)習(xí)模型DeepCCR,為育種者快速、高效地培育優(yōu)良品種提供了有利工具。相關(guān)研究成果在線發(fā)表在《植物生物技術(shù)雜志(Plant Biotechnology Journal)》上。
基因組選擇能夠利用訓(xùn)練群體構(gòu)建的育種模型,實(shí)現(xiàn)對(duì)育種材料的表型預(yù)測(cè),可大幅度縮短育種周期,且減少育種投入。但由于構(gòu)建訓(xùn)練群體的投入較高,一定程度上制約了基因組選擇技術(shù)的應(yīng)用和推廣。
研究團(tuán)隊(duì)連續(xù)兩年在我國(guó)六個(gè)稻作區(qū)的七個(gè)代表性生態(tài)鑒定點(diǎn)對(duì)4015份水稻品種(系)進(jìn)行產(chǎn)量相關(guān)性狀的表型考察,形成了第一個(gè)具有廣泛遺傳代表性的中國(guó)栽培稻群體數(shù)據(jù)集。隨后,研究團(tuán)隊(duì)以該數(shù)據(jù)集為基礎(chǔ)構(gòu)建了一種基于卷積神經(jīng)網(wǎng)絡(luò)與雙向長(zhǎng)短期記憶相結(jié)合的深度學(xué)習(xí)方法DeepCCR,用于預(yù)測(cè)不同種植地點(diǎn)的表型值,并幫助育種家評(píng)估特定材料的最適合種植地點(diǎn)。同時(shí),為了便于育種者使用該模型,研究團(tuán)隊(duì)建立了網(wǎng)絡(luò)在線服務(wù)(www.ai-breeder.com),用戶只需提交標(biāo)準(zhǔn)的 FASTQ 或 VCF 文件,系統(tǒng)就會(huì)自動(dòng)提供10 個(gè)產(chǎn)量相關(guān)性狀在不同地點(diǎn)的預(yù)測(cè)結(jié)果,該研究為我國(guó)水稻高效育種提供了一個(gè)有效的數(shù)據(jù)利用、分析和共享平臺(tái)。
作科所副研究員馬小定、博士生王浩和北京博凱森生物科技有限公司吳盛陽(yáng)為本文共同第一作者,作科所韓龍植研究員、閆燊助理研究員和安徽省農(nóng)科院水稻研究所周坤能研究員為論文的共同通訊作者。該研究得到了國(guó)家重點(diǎn)研發(fā)計(jì)劃、科技創(chuàng)新2030-重大項(xiàng)目和中國(guó)農(nóng)業(yè)科學(xué)院科技創(chuàng)新工程項(xiàng)目的資助。
原文鏈接:https://onlinelibrary.wiley.com/doi/10.1111/pbi.14384