3月18日,北京市農林科學院玉米研究中心分子檢測團隊在國際知名植物學期刊Frontiers in Plant Science在線發(fā)表題為“Variety Discrimination Power: An Appraisal Index for Loci Combination Screening Applied to Plant Variety Discrimination”的研究論文,提出了品種識別率的概念并定義其三種統計方法,作為植物品種鑒定分子標記位點組合篩選的評價指標。
分子標記技術是分子育種和分子檢測等應用領域的主流鑒定方法,為了降低該技術的試驗成本、提高數據分析效率,分子標記組合的篩選評估已成為數據分析的關鍵步驟。本研究結合植物品種分子鑒定需求和標記組合篩選特點,提出了位點組合評價指標——品種識別率(VDP)的概念及其三種統計方法:概率型品種識別率(P-VDP)、比對型品種識別率(C-VDP)、絕對型品種識別率(R-VDP),并用漸變品種差異模擬數據和真實SSR、SNP數據測試不同方法對品種差異靈敏度,分析品種閾值設定對不同方法的影響,驗證不同方法對數據缺失的敏感度。
本研究結果表明,在識別模擬數據品種差異方面,對于向一個品種趨同的樣本總體,品種識別率有靈敏度而累積個體識別率(TDP)只在部分樣本總體有效;對于向多個品種趨同的樣本總體,R-VDP靈敏度最高,P-VDP和C-VDP靈敏度相同且次之,TDP沒有靈敏度(圖1);在識別真實數據品種差異時, R-VDP對高粱、小麥、玉米、水稻數據開始出現下降趨勢的位點數量分別為20、7、100、100,P-GDP和C-GDP的統計值完全一致,同樣對上述四個物種數據開始出現下降趨勢的位點數量分別為6、4、9、19,TDP的則為6、4、4、11(圖2);在品種閾值設定方面,不同位點數構成的位點組合的R-VDP值對閾值調整的響應均衡,C-VDP對閾值調整的響應則不均勻,響應程度隨位點組合的位點數減少而增加;在數據缺失影響方法,數據缺失對位點組合評價方法均會造成欠估計的影響,系統誤差從小到大依次為TDP、C-VDP、R-VDP。
圖1、位點組合四種評價方法對品種差異漸變模擬數據的靈敏度
圖2、位點組合四種評價方法對位點數量漸變真實數據的靈敏度
在植物品種鑒定領域,品種識別率比累積個體識別率更適合作為位點組合的評價指標;在數據缺失可控且對品種差異靈敏度高要求的前提下,品種識別率可采用R-VDP方法;在數據缺失不可控且對品種差異靈敏度低要求的前提下,品種識別率可采用C-VDP方法;在對品種識別率的概念做理論推導時,品種識別率可采用P-VDP方法。為了進一步推進位點組合評估方法的應用,我們開發(fā)了一個簡便、通用、兼容多種標記類型的分析工具“VDPtools”(圖3),用于計算指定位點組合的TDP、P-GDP、C-VDP和R-VDP,該工具可在Windows運行環(huán)境下使用。
VDPtools的下載鏈接為:https://github.com/caurwx1/VDPtools。
圖3、VDPtools工具主界面
楊揚博士、田紅麗博士為論文第一作者,趙久然研究員和王鳳格研究員為通訊作者。相關工作得到了國家重點研發(fā)計劃、北京學者計劃的支持。
原文鏈接:https://www.frontiersin.org/articles/10.3389/fpls.2021.566796/full