華中農(nóng)業(yè)大學(xué)趙書紅教授團隊在Nature子刊《Communications Biology》雜志上在線發(fā)表了題為“A gene prioritization method based on a swine multi-omicsknowledgebase and a deep learning model”的研究成果。本研究發(fā)布了國際上首個豬整合組學(xué)知識庫ISwine,創(chuàng)建了一個基于卷積神經(jīng)網(wǎng)絡(luò)模型和多組學(xué)信息的候選基因評分推薦系統(tǒng),打通了從GWAS結(jié)果的顯著標(biāo)記到候選基因推薦的“最后一公里”。
單一組學(xué)的分析(如GWAS)往往止步于標(biāo)記和表型間的“相關(guān)”,難以揭示“因果”,中心法則告訴我們遺傳信息從DNA轉(zhuǎn)錄到RNA,再翻譯生成各種蛋白質(zhì),行使特定的生物功能,一個完整的生物過程需要多個組學(xué)的參與。近年來,豬的多組學(xué)信息呈超指數(shù)型增長,如何解讀海量異質(zhì)性的多組學(xué)數(shù)據(jù),整合來自不同研究的多組學(xué)信息來解析遺傳變異與重要經(jīng)濟性狀間的關(guān)系面臨著極大的挑戰(zhàn)。
為解決上述問題,團隊收集了公共數(shù)據(jù)庫中近乎所有的豬基因組數(shù)據(jù)、轉(zhuǎn)錄組數(shù)據(jù)以及性狀相關(guān)的文獻(xiàn)組數(shù)據(jù)。通過清洗、分析、以及結(jié)構(gòu)化等過程,將這些數(shù)據(jù)以基因組變異數(shù)據(jù)庫、基因表達(dá)數(shù)據(jù)庫以及QTX數(shù)據(jù)庫的形式收錄到ISwine中。其中基因表達(dá)數(shù)據(jù)庫是豬中第一個基于轉(zhuǎn)錄組數(shù)據(jù)的表達(dá)譜數(shù)據(jù)庫,基因變異數(shù)據(jù)庫是豬中最大的變異信息數(shù)據(jù)庫, NCBI在2018年停止了對豬dbSNP數(shù)據(jù)庫的更新,ISwine將為豬遺傳育種研究人員提供豐富的基因組變異信息和完備的單倍型信息。另外,ISwine根據(jù)不同組學(xué)特點提供了用戶界面友好的瀏覽、檢索、可視化、交互和下載模塊,用戶可以節(jié)約大量的分析時間和費用,方便快捷的利用這些海量的組學(xué)信息,例如直接輸入GWAS結(jié)果或候選基因列表,ISwine會基于卷積神經(jīng)網(wǎng)絡(luò)模型和多組學(xué)信息針對目標(biāo)性狀推薦“高分”候選基因。該策略可拓展應(yīng)用到其他物種,為多組學(xué)信息在遺傳和育種中的應(yīng)用提供了新思路。
華中農(nóng)業(yè)大學(xué)和武漢理工大學(xué)計算機科學(xué)與技術(shù)學(xué)院聯(lián)合培養(yǎng)的博士后付玉華為論文第一作者。華中農(nóng)業(yè)大學(xué)趙書紅教授、劉小磊副教授和武漢理工大學(xué)袁曉輝教授為文章共同通訊作者,上述研究工作得到了國家自然科學(xué)基金等項目的資助。
ISwine知識庫:http://iswine.iomics.pro
ISwine使用示例:http://iswine.iomics.pro/pig-iqgs/commonView?viewName=Tutorial
原文鏈接:https://www.nature.com/articles/s42003-020-01233-4