近日,中國農(nóng)業(yè)科學(xué)院生物所創(chuàng)新團(tuán)隊(duì)聯(lián)合攻關(guān)開發(fā)了基于人工智能的水稻染色質(zhì)開放性在線預(yù)測(cè)模型,為水稻染色質(zhì)開放性及其轉(zhuǎn)錄調(diào)控研究提供了新思路。相關(guān)成果發(fā)表在《遺傳學(xué)和基因組學(xué)雜志(Journal of Genetics and Genomics)》上。
染色質(zhì)物理狀態(tài)由DNA折疊和縮合決定,一般分為常染色質(zhì)和異染色質(zhì)兩種狀態(tài),但兩者并不是靜態(tài)不變的,而是隨著生長發(fā)育、環(huán)境響應(yīng)等變化動(dòng)態(tài)調(diào)整。染色質(zhì)開放性(chromatin accessibility)反映了染色質(zhì)轉(zhuǎn)錄活躍程度,結(jié)合其它表觀遺傳修飾如DNA甲基化等信息,可以提供全基因組的基因表達(dá)調(diào)控信息。因此,識(shí)別染色質(zhì)開放性區(qū)域?qū)斫饣虮磉_(dá)調(diào)控如何協(xié)調(diào)生長發(fā)育與對(duì)環(huán)境刺激的響應(yīng)至關(guān)重要。由于受實(shí)驗(yàn)技術(shù)所限,大量染色質(zhì)開放性區(qū)域至今仍未得到完全鑒定,因此開發(fā)基于人工智能的預(yù)測(cè)方法顯得尤為重要。
本研究通過分別使用正常和熱處理?xiàng)l件下秈粳稻的染色質(zhì)開放性數(shù)據(jù),進(jìn)行智能預(yù)測(cè)模型(Smart Model for Open Chromatin region prediction, SMOC)構(gòu)建。在秈粳稻模型之間的交叉驗(yàn)證中,預(yù)測(cè)數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)的皮爾森相關(guān)系數(shù)均在0.97以上。與其它機(jī)器學(xué)習(xí)方法進(jìn)行性能比較發(fā)現(xiàn)SMOC具有更優(yōu)性能。此外,染色質(zhì)開放性和DNA甲基化6mA的關(guān)聯(lián)分析結(jié)果表明,染色質(zhì)開放性可能與6mA協(xié)同調(diào)控基因表達(dá)。本研究開發(fā)建立了一個(gè)染色質(zhì)開放性智能預(yù)測(cè)模型(http://www.elabcaas.cn/smoc/index.html),可以快捷地進(jìn)行染色質(zhì)開放性預(yù)測(cè)。為染色質(zhì)開放性區(qū)域鑒定和信息挖掘提供新的研究思路,結(jié)合之前建立的水稻智能數(shù)據(jù)庫eRice(2020)、作物表觀遺傳智能預(yù)測(cè)模型SMEP(2021)等,初步形成鏈條式智能算法開發(fā)和模型構(gòu)建,將為今后作物智能設(shè)計(jì)育種提供新的數(shù)據(jù)資源和工具。
生物所博士生郭位軍、碩士生劉汗青、王一凡及已畢業(yè)博士生張平賢為該論文共同第一作者,普莉研究員、田健研究員和谷曉峰研究員為共同通訊作者。相關(guān)工作得到國家自然科學(xué)基金、中央級(jí)公益性科研機(jī)構(gòu)基本科研業(yè)務(wù)費(fèi)等項(xiàng)目資助。
原文鏈接:
https://www.sciencedirect.com/science/article/pii/S1673852722000522?via%3Dihub