茹淑瑛,江 鋒,葉永安
中醫(yī)證候是一個(gè)非線性的、多維多階的復(fù)雜巨系統(tǒng)。近年來證候規(guī)范化研究表明[1],提取證素,尋找應(yīng)證組合規(guī)律,建立以證候要素為核心的辨證新體系是證候規(guī)范化的有效途徑。
隨著醫(yī)學(xué)研究不斷深入,數(shù)據(jù)資料變得越來越復(fù)雜,雖有粗糙集、模糊集理論、神經(jīng)網(wǎng)絡(luò)和決策樹等先進(jìn)技術(shù)方法的運(yùn)用,但仍處在探索階段。由于自身的缺點(diǎn)和局限性,使研究均沒有獲得突破性進(jìn)展。而傳統(tǒng)的多元統(tǒng)計(jì)分析方法,可用于探討高維數(shù)據(jù)的內(nèi)在規(guī)律,是定量分析事物間復(fù)雜關(guān)系的一種綜合的數(shù)理統(tǒng)計(jì)分析方法,可用于分析多個(gè)因素對(duì)結(jié)果的單獨(dú)及聯(lián)合作用,與中醫(yī)證素研究較為切合。由于電子計(jì)算機(jī)的日益普及化,大型統(tǒng)計(jì)軟件如SAS、SPSS的廣泛流行,多元統(tǒng)計(jì)分析方法變得易于被研究者掌握,由于其算法比較成熟、統(tǒng)計(jì)結(jié)果易解釋而被廣泛應(yīng)用于中醫(yī)證素研究中[2]。以下是常見的多元統(tǒng)計(jì)分析方法及其在中醫(yī)證素研究中的應(yīng)用情況。
事先不知道應(yīng)將樣品或指標(biāo)分為幾類,根據(jù)樣品或變量的相似程度歸組并類,屬探索性分析。分為Q型聚類(樣品聚類),是指將n個(gè)樣品歸類,找出樣品間共性的分類方法;R型聚類(指標(biāo)聚類)是指將m個(gè)指標(biāo)歸類,通過將指標(biāo)降維從而選擇有代表性的指標(biāo)的方法。因其能將隨機(jī)現(xiàn)象歸類,已被廣泛運(yùn)用到中醫(yī)證素研究中來。如李力等[3]對(duì)802例圍絕經(jīng)期綜合征患者四診信息采用聚類分析,成功提取了該病常見中醫(yī)證候要素。陳婉珉等[4]亦在100例帕金森患者的基本證素及其分布規(guī)律研究中引入了聚類分析。
主成分分析與因子分析均是尋求少數(shù)幾個(gè)變量(或因子)來綜合反映全部變量(或因子)的大部分信息,變量雖然比原始變量減少,但包含的信息量可占原始信息的85%以上,而且這些新變量彼此互不相關(guān),消除了多重共線性[5],在證素研究中應(yīng)用廣泛。如胡起超等[6]根據(jù)主成分分析法提取183例老年性癡呆患者的12個(gè)公因子,得出老年性癡呆最常見的證候要素為陰虛、血虛、氣虛、痰、火、血瘀;主要涉及臟腑為腎肝心脾。金香蘭等[7]通過因子分析得出了高血壓病的主要證候要素,說明采用因子分析法對(duì)高血壓病進(jìn)行證素研究是可行的。
判別分析利用原有的分類信息,得到體現(xiàn)這種分類的函數(shù)關(guān)系式,然后利用該函數(shù)去判斷未知樣品屬于哪一類。經(jīng)典的判別分析方法有費(fèi)歇爾判別法和貝葉斯法等。Logistic回歸是研究二分類觀察結(jié)果與一些影響因素之間關(guān)系的一種多變量分析方法。上述兩種分析方法均是根據(jù)判別對(duì)象若干個(gè)指標(biāo)的觀測(cè)結(jié)果判定其應(yīng)屬于哪一類的統(tǒng)計(jì)方法,在證素研究中也很常見。宋毅等[8]探索針刺干預(yù)缺血性中風(fēng)病證候動(dòng)態(tài)變化規(guī)律,并分析依據(jù)缺血性中風(fēng)病辨證“決策樹”的4個(gè)證型的貝葉斯判別函數(shù)式的辨證效果,提出精簡(jiǎn)后的判別函數(shù)式判別效能基本與精簡(jiǎn)前相同,具有臨床應(yīng)用價(jià)值。而Logistic回歸多用于疾病危險(xiǎn)因素的篩選和病因?qū)W分析。如楊朝陽等[9]用 Logistic回歸分析得出陽虛、血熱和頑痰是“毒癮”復(fù)發(fā)的重要誘因。熊紅萍等[10]對(duì)340例代謝綜合征患者五臟證素和病性證素進(jìn)行Logistic回歸分析,得出當(dāng)存在痰和陰虛的病理變化時(shí),易患代謝綜合征。
典型相關(guān)分析是利用綜合變量對(duì)之間的相關(guān)關(guān)系來反映2組指標(biāo)之間的整體相關(guān)性的多元統(tǒng)計(jì)分析方法。其較以往的簡(jiǎn)單回歸優(yōu)勢(shì)在于不必依賴于經(jīng)驗(yàn)判斷,將證素變量與客觀指標(biāo)看作2組變量,消除了證素判斷主觀性對(duì)結(jié)果的影響。目前在中醫(yī)證素研究中應(yīng)用此種方法者還不多見。劉華等[11]從腦積水17個(gè)證候要素與11個(gè)證候要素靶位,通過典型相關(guān)分析得出5對(duì)綜合變量能反映原2組變量的信息,瘀在腦積水證候中占有較大的相關(guān)性,水與靶位多呈負(fù)相關(guān),為該病的證候規(guī)范化研究提供了依據(jù)。
隨著醫(yī)學(xué)科學(xué)研究的不斷深入,越來越多的多元統(tǒng)計(jì)分析方法被應(yīng)用到中醫(yī)證素研究中來。由于中醫(yī)證素研究的復(fù)雜性和其他統(tǒng)計(jì)方法一樣,任何一種多元統(tǒng)計(jì)分析方法單獨(dú)運(yùn)用,均會(huì)暴露出一定的問題,現(xiàn)解析如下。
聚類分析首先需憑借經(jīng)驗(yàn)來確定合理的類別數(shù)即確定分成幾類比較合適,其結(jié)果解釋也需要密切結(jié)合專業(yè)知識(shí),這就對(duì)研究結(jié)果的客觀性造成某種程度的破壞;其次聚類前應(yīng)對(duì)變量作預(yù)處理,剔除無效變量和缺失值過多的變量,從而造成其進(jìn)一步分析的結(jié)果不能反映已舍棄變量的情況;再次聚類分析不能使同一指標(biāo)在不同類中體現(xiàn),而中醫(yī)的一個(gè)癥狀可以在不同的證型中出現(xiàn)。這些都是聚類分析在中醫(yī)證素研究中的不足。
主成分的個(gè)數(shù)確定依賴于累計(jì)貢獻(xiàn)率大小,到底多大比例合適需具體問題具體分析,同樣具有一定的主觀性。而因子分析是建立在數(shù)據(jù)正態(tài)假設(shè)基礎(chǔ)上,如果偏離正態(tài)假設(shè),其結(jié)果可能并不可靠,同時(shí)用何種方法進(jìn)行因子旋轉(zhuǎn),亦需根據(jù)專業(yè)意義來確定。
判別分析多建立于“歷史經(jīng)驗(yàn)”基礎(chǔ)之上,樣本的原始分類必須準(zhǔn)確無誤,否則得不到可靠的判別函數(shù),判別分析中所用的樣本資料視為總體的估計(jì),所以要求樣本要足夠大,并有較好的代表性。Logistic回歸分析對(duì)線性可分的樣本不宜使用,所有統(tǒng)計(jì)都建立在大樣本基礎(chǔ)上,因此也要求有足夠的樣本含量。
基于上述問題,有研究者提出兩種或幾種統(tǒng)計(jì)方法的聯(lián)合運(yùn)用,這樣既有助于消除不同統(tǒng)計(jì)方法的缺陷,又可以提高分析結(jié)果的可靠性。如運(yùn)用主成分分析和因子分析對(duì)變量進(jìn)行降維處理,消除證候指標(biāo)間的共線性,然后采用判別分析和回歸分析作進(jìn)一步分析。我們課題組也試圖對(duì)多中心大樣本收集的臨床數(shù)據(jù)在聚類研究基礎(chǔ)上,初步確定證候要素類別,再采用因子分析對(duì)證候要素進(jìn)行進(jìn)一步探討,得出載荷因子較大的癥狀來判定證候要素,以確定各個(gè)癥狀在證候中的貢獻(xiàn)度以及證候要素之間的組合規(guī)律。
多種統(tǒng)計(jì)分析方法的聯(lián)合應(yīng)用,雖然有助于對(duì)大量中醫(yī)辨證信息的簡(jiǎn)化處理和其中潛在規(guī)律的挖掘,提高證素研究的可靠性、客觀性,但由于證素具有“內(nèi)實(shí)外虛”、“動(dòng)態(tài)時(shí)空”、“多維界面”的特征[12],使研究結(jié)果仍然與臨床實(shí)際難以完全吻合。中醫(yī)學(xué)又是一門經(jīng)驗(yàn)性很強(qiáng)的醫(yī)學(xué),完全脫離專家經(jīng)驗(yàn)一味追求客觀又容易與臨床脫節(jié),故有必要用專業(yè)知識(shí)判斷、指導(dǎo)或修正數(shù)理統(tǒng)計(jì)結(jié)果。數(shù)理統(tǒng)計(jì)只是中醫(yī)證素研究的一個(gè)中間環(huán)節(jié),單純從統(tǒng)計(jì)方法入手,證素研究似乎很難找到突破口。越來越多的研究表明,只有從大樣本的臨床數(shù)據(jù)入手,選擇幾種統(tǒng)計(jì)方法聯(lián)合運(yùn)用,結(jié)合專家經(jīng)驗(yàn),才能使證素研究獲得實(shí)質(zhì)性進(jìn)展。于是我們課題組試圖對(duì)前期“十五”攻關(guān)、“十一五”重大專項(xiàng)課題前瞻性、多中心調(diào)查收集的1003例慢性乙型肝炎四診信息資料,通過聚類、因子分析對(duì)資料進(jìn)行數(shù)據(jù)挖掘,初步取得慢乙肝證素特征,再通過德爾菲法三輪專家咨詢修正、補(bǔ)充,以期最后明確該病證素診斷標(biāo)準(zhǔn)及應(yīng)證組合規(guī)律,做到有史知識(shí)、專家決策、信息運(yùn)算的整合,既保證研究結(jié)果的相對(duì)客觀,又避免單純數(shù)據(jù)挖掘?qū)е虏糠纸Y(jié)果與臨床實(shí)際背離的現(xiàn)象。希望通過上述嘗試能夠加快中醫(yī)證候規(guī)范化之路。
[1] 朱文鋒,晏峻峰.證素辨證新體系的內(nèi)容及科學(xué)意義[J].醫(yī)學(xué)與哲學(xué),2005,26(1):69-70.
[2] 華琳,閆巖,張建.多元統(tǒng)計(jì)學(xué)方法在醫(yī)學(xué)資料分析中的應(yīng)用[J].中國醫(yī)學(xué)理論與實(shí)踐,2006,16(1):21.
[3] 李力,王天芳.基于聚類分析的圍絕經(jīng)期綜合征中醫(yī)證候與證候要素的研究[J].中國中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志,2011,17(8):855-856.
[4] 陳婉珉,鄭春葉,等.100例帕金森病患者中醫(yī)證候要及證型分布規(guī)律[J].中醫(yī)雜志,2011,52(3):214-217.
[5] 王芳.主成分分析與因子分析的異同比較及應(yīng)用[J].統(tǒng)計(jì)教育,2003,(5):14.
[6] 胡起超,于濤,等.老年性癡呆中醫(yī)證候及病因病機(jī)探析[J].陜西中醫(yī),2010,31(5):576-577.
[7] 金香蘭,張?jiān)蕩X,等.運(yùn)用因子分析探討原發(fā)性高血壓病證候要素[J].北京中醫(yī)藥大學(xué)學(xué)報(bào),2011,34(2):131-134.
[8] 宋毅,裴建,等.針刺干預(yù)缺血性中風(fēng)病證候動(dòng)態(tài)化及相關(guān)研究[J].中西醫(yī)結(jié)合學(xué)報(bào),2009,7(4):334-341.
[9] 楊朝陽,李燦東,等.吸毒人群“毒癮”復(fù)發(fā)的中醫(yī)病理因素研究[J].中國藥物依賴性雜志,2011,20(3):208-209.
[10] 熊紅萍,李燦東,等.代謝綜合征的中醫(yī)易患因素[J].中華中醫(yī)藥雜志,2010,25(11):1858-1859.
[11] 劉華,雷春燕,等.腦積水證候要素與靶位的分析[J].中華中醫(yī)藥雜志,2011,26(4):792-795.
[12] 張志斌,王永炎,呂愛平.論證候要素及證候靶點(diǎn)應(yīng)證組合辨證[J].中醫(yī)雜志,2006,47(6):483-485.