章細英,孔祥瑞
(福建省農(nóng)業(yè)科學院茶葉研究所,福建 福安 355015)
茶樹種質(zhì)資源作為開展茶樹種質(zhì)創(chuàng)制、育種和新產(chǎn)品開發(fā)的重要基礎,是茶葉科技創(chuàng)新和產(chǎn)業(yè)可持續(xù)發(fā)展的重要依托[1]。所以,茶樹種質(zhì)資源的研究始終是茶學研究的重要組成部分。早期的研究基于茶樹生長的復雜生態(tài)環(huán)境、長期演化及自然選擇等明確了茶樹種質(zhì)資源的涵蓋范圍。之后,研究的重點則集中于收集、保存與保護方面[2]。隨著分析手段的不斷發(fā)展,圍繞茶樹種質(zhì)逐漸形成了茶樹種質(zhì)評價鑒定、核心種質(zhì)構建等的細化研究方向[3,4]。尤其是近幾年,各大組學和交叉學科的飛速發(fā)展更對茶樹種質(zhì)資源的研究起到了積極的推動作用。
共詞分析作為一種新的文獻評價方法,可以定量化探討特定學科領域的研究現(xiàn)狀,通過不同詞對之間的關系來反映各主題之間的內(nèi)在聯(lián)系[5]。本文應用共詞分析對近20年我國國內(nèi)茶樹種質(zhì)資源研究主題進行歸納分析,以期揭示該領域的主題結構及熱點領域,不僅有助于了解茶樹種質(zhì)資源的最新研究進展,也可為該領域的深入研究提供參考。
從CNKI的全部文獻中,以主題“茶樹”,詞頻并含“種質(zhì)資源”為檢索條件進行高級檢索,時間范圍設定為1997年-2017年,并以Refworks格式導出TXT格式題錄,及文獻來源為學術期刊,共獲得相關研究文獻記錄218條。
所有數(shù)據(jù)統(tǒng)計分析均在R3.4及SPSS 19中完成。
利用R軟件文本處理函數(shù)寫成用于生成關鍵詞共詞矩陣的腳本,根據(jù)齊普夫第二定律T=[-1+(1+8I1)0.5]/2及經(jīng)驗判斷(其中I1為出現(xiàn)1次的詞的數(shù)量)[6],凡是詞頻大于3(T=3)的都選入,利用這一方法可以得到22個關鍵詞(表1)。
表1 國內(nèi)茶樹種質(zhì)資源研究論文高頻關鍵詞
將相異矩陣導入SPSS 19進行聚類分析,選擇Ward法、Phi方度量計數(shù)、Z得分標準化,聚類結果見圖1,近20年茶樹種質(zhì)資源領域的研究可分為4個類團。各類間的距離映射到0~25之間,反映這些關鍵詞之間的親疏程度,將“親緣關系”較近的關鍵詞重新組合起來,能反映出這些關鍵詞所代表的主題結構,從而獲得目前茶樹種質(zhì)資源研究的熱點。
多維尺度分析是將多維空間的研究對象簡化到低維空間(通常為二維)進行定位、分析和歸類,同時保留對象間原始關系的分析方法[9]。關鍵詞的多維尺度分析,其實質(zhì)是利用關鍵詞之間平面“距離”的緊密程度對研究問題進行聚類,可全面反映某一研究領域主要研究方向與熱點,并以直觀的視覺距離來找到本研究領域內(nèi)客觀存在的通用屬性。將上述相異矩陣通過SPSS統(tǒng)計軟件的Scale-多維尺度分析功能(multidimensional scale,ALSCAL),選取平面對稱的圖形(square symmetric)描述茶樹種質(zhì)資源研究關鍵詞的數(shù)據(jù)結構,用序數(shù)數(shù)值(ordinal)作為數(shù)據(jù)測度水平的指標,進行二維尺度分析,得到可視化結果(圖2)。
表2 國內(nèi)茶樹種質(zhì)資源研究論文高頻關鍵詞相異矩陣(局部)
圖1 高頻詞Ward法聚類結果樹狀圖Fig.1 High frequency word clustering results treeusing Ward method
圖2 多維尺度分析結果Fig.2 Derived stimulus configuration using Euclidean distance model
由圖2可知,EST-SSR、RAPD、ISSR與遺傳多樣性、親緣關系聚在一起,核心種質(zhì)、鑒定、篩選、多樣性與生化成分聚在一起,這與聚類分析結果相似。
通過聚類分析和多維尺度分析,可將國內(nèi)茶樹種質(zhì)資源研究熱點分為4個方面,即應用EST-SSR、RAPD、ISSR分子標記技術進行遺傳多樣性和親緣關系分析,分析方法涉及到聚類分析和主成分分析;野生茶樹種質(zhì)資源的開發(fā)利用;基于生化成分進行種質(zhì)的多樣性分析,并實現(xiàn)篩選鑒定,從而獲得核心種質(zhì);涉及到分子標記技術的抗寒與功能性成分育種。
茶樹種質(zhì)資源的遺傳多樣性分析是種質(zhì)資源遺傳利用的基礎,一方面對資源的保存起指導作用,同時也是雜交育種親本選擇的重要依據(jù)。目前在茶樹種質(zhì)資源遺傳多樣性分析中常用的分子標記主要是EST-SSR、RAPD和ISSR,其中SSR類標記應用最多[9-11],但不足之處是鑒定結果會因使用的標記數(shù)量不同而有較大變幅,使得不同研究間很難獲得高度吻合的研究結論。而親緣關系分析面臨的最大難題也與此類同。
分析方法方面,常見的就是應用PowerMarker等軟件進行Nei’s多樣性指數(shù)、等位位點頻率等的簡單統(tǒng)計[12-14],及基于歐氏遺傳距離和主成分分析的聚類分析,一方面分析結果無法得到進一步科學合理的驗證,另一方面,這些研究結果大多在理論指導上很難有實際的應用價值,使得現(xiàn)有研究很難深入進行。
我國作為茶樹(camelliasinensis)的物種起源中心[15],占有茶樹種質(zhì)資源的豐富程度在世界范圍內(nèi)具有絕對優(yōu)勢。依據(jù)茶樹種質(zhì)資源描述規(guī)范,茶樹種質(zhì)主要分為野生資源、地方品種、選育品種、品系和遺傳材料等[16]。其中,野生資源屬未知程度最高,且極具深入挖掘價值的重要茶樹種質(zhì)組成部分。雖然在本研究中可以推斷出野生資源開發(fā)利用是國內(nèi)茶樹種質(zhì)資源研究中的熱點領域,但是詳細查閱近20年來的研究資料之后,發(fā)現(xiàn)實際上這方面取得的研究進展十分有限,甚至很少見到有系統(tǒng)開發(fā)利用的報道。
茶葉生化與品質(zhì)相關分析的研究已經(jīng)有很多報道,隨著分析技術的不斷發(fā)展,GC-MS、LC-MS等的大量使用,使得茶葉生化成分分析逐漸向高通量方向發(fā)展,所以相應地出現(xiàn)了基于生化成分的茶樹種質(zhì)資源多樣性分析,這在資源篩選鑒定方面已經(jīng)有大量的報道和成功應用案例[17-19]。特別是功能性成分成為育種目標之后,基于生化成分的種質(zhì)資源多樣性分析變得更受重視,也就成了除基于分子標記的遺傳多樣性分析之后篩選核心種質(zhì)的不二選擇。隨著組學聯(lián)合分析方法的不斷完善,這一技術將會在種質(zhì)篩選鑒定和品種選育中發(fā)揮更為重要的作用。
作為種質(zhì)資源研究的最終回歸點,茶樹育種對茶樹種質(zhì)資源研究起決定作用,所以在共詞分析中會顯示為種質(zhì)研究的熱點,這完全符合實際情況。就該分析結果而言,兒茶素、花青素顯然已經(jīng)成為茶學研究的熱點,且品種選育已經(jīng)涉及到分子標記技術,表明功能性成分品種的選育已經(jīng)成為我國茶樹育種的重要研究方向[20,21],且分子標記作為輔助選擇手段也已開始被加以重視利用。
共詞聚類分析的方法可以定量化探討特定學科領域的研究現(xiàn)狀,通過不同詞對之間的關系來反映各主題之間的內(nèi)在聯(lián)系,但是,這種方法由于存在關鍵詞標引的限制,只能抽取文獻自擬的關鍵詞進行分析,且國內(nèi)有多數(shù)報道都發(fā)表在國外的期刊上,容易出現(xiàn)詞匯離散問題,致使無法反映全部主題內(nèi)容。因此,共詞聚類方法用于分析某一領域研究熱點仍需進一步完善。