李思洋,朱芝嫻,董 杰
(南京中醫(yī)藥大學(xué)附屬醫(yī)院 南京 210001)
咳喘是呼吸道系統(tǒng)疾病的一種最基本的癥狀,可見(jiàn)于多種呼吸系統(tǒng)的疾病中,比如常見(jiàn)的呼吸道感染、支氣管哮喘、肺心病、職業(yè)性肺病以及肺結(jié)核、肺癌等。隨著氣候環(huán)境的惡化以及當(dāng)今社會(huì)生活習(xí)慣的改變,呼吸系統(tǒng)疾病的發(fā)病率逐年升高,而小青龍湯作為經(jīng)驗(yàn)方劑常被用于治療呼吸系統(tǒng)疾病[1]。隨著祖國(guó)醫(yī)學(xué)走上世界舞臺(tái),越來(lái)越多的國(guó)內(nèi)外學(xué)者關(guān)注于中醫(yī)藥治療疾病的分子機(jī)制,這就需要我們探明各種中藥成分的潛在藥理學(xué)基礎(chǔ)。本文中我們使用了一種基于信號(hào)通路模式的方法,將小青龍湯中所涉及的化合物成分以及相關(guān)基因的效能進(jìn)行了評(píng)分比較,并對(duì)該方在治療咳喘中發(fā)揮主要藥理作用的成分進(jìn)行預(yù)測(cè)。此研究方法可以作為探索和規(guī)范中藥現(xiàn)代化應(yīng)用的一種新思路。
小青龍湯最早見(jiàn)于東漢張仲景所著中醫(yī)經(jīng)典著作《傷寒論》,主治外感風(fēng)寒、內(nèi)停水飲。《傷寒論》第40條曰:“傷寒表不解,心下有水氣,干嘔,發(fā)熱而咳,或渴,或利,或噎,或小便不利,少腹?jié)M,或喘者,小青龍湯主之?!钡?1條曰:“傷寒心下有水氣,咳而微喘,發(fā)熱不渴。服湯已渴者,此寒去欲解也,小青龍湯主之?!睆闹倬霸目矗∏帻垳靼Y應(yīng)以咳喘為宜,至于咳和喘孰輕孰重,則臨床表現(xiàn)不一。在后續(xù)多本著作中均有記載,如《宋·太平惠民和劑局方》、明·方賢著《奇效良方》等,甚至日本的“漢方藥”中亦有小青龍湯。該方也是目前臨床應(yīng)用比較多的方劑之一[2]。但小青龍湯及其類(lèi)方的相關(guān)文獻(xiàn)報(bào)道仍主要集中在中醫(yī)方證研究、臨床治療和整體動(dòng)物藥效學(xué)評(píng)價(jià)等,少量的藥理學(xué)研究也僅限于對(duì)其中麻黃堿、偽麻黃堿、甲基麻黃堿、芍藥苷、肉桂酸等若干含量較高的成分進(jìn)行定性、定量分析,尚未見(jiàn)對(duì)小青龍湯進(jìn)行系統(tǒng)性的化學(xué)成分辨識(shí)研究報(bào)道[3]。
中藥中通常包含了大量的化學(xué)物質(zhì),所以如果能夠系統(tǒng)性的研究某首方劑或者某味中藥,尋找到復(fù)方當(dāng)中的有效單體成分,對(duì)于闡明中藥治療疾病的機(jī)理意義重大。為此,許多研究人員試圖建立一種研究策略來(lái)探索各種藥物成分如何影響藥物的效用[4]。目前已有多種方法用于分析藥物成分和預(yù)測(cè)藥物效用。這些方法大致可分為兩種,第一種是將化合物的生物活性與其化學(xué)結(jié)構(gòu)和化學(xué)特征聯(lián)系起來(lái),被稱(chēng)作定量結(jié)構(gòu)活性相關(guān)性的研究(Quantitative Structure-Activity Relationship analysis)[5]。但是應(yīng)用此種方法的缺陷是目前不能獲得非常準(zhǔn)確的中藥藥物結(jié)構(gòu)信息。第二種是將復(fù)雜化學(xué)系統(tǒng)的生物活性與其化學(xué)組成相聯(lián)系,被稱(chēng)為定量組份活性相關(guān)性的研究(Quantitative Composition-Activity Relationship analysis)[6,7]。但是這種方法缺乏精確的計(jì)算模型來(lái)量化化學(xué)成分與其生物活性的關(guān)系。
本研究中我們使用一種基于通路模式的分析方法(見(jiàn)圖1)[4],從藥物組成中分析活性成分,并預(yù)測(cè)其基因靶點(diǎn),在其中尋找疾病發(fā)病機(jī)制中起著重要作用的基因靶點(diǎn)。再?gòu)倪x定的基因相關(guān)的KEGG通路經(jīng)過(guò)數(shù)據(jù)挖掘進(jìn)行檢索,從而排定各基因在疾病發(fā)病過(guò)程中的重要性,提示這些活性成分可能在小青龍湯治療咳喘中發(fā)揮主要作用。
圖1 藥物活性成分和靶基因預(yù)測(cè)流程
中藥的成分復(fù)雜,要想系統(tǒng)了解某首方劑的藥理基礎(chǔ),首先要收集該藥方中各味草藥包含的所有化合物信息。這里我們所選用的小青龍湯方中包含了8味中草藥,通過(guò)查詢中醫(yī)藥資料庫(kù)@Taiwan(http://tcm.cmu.edu.tw/zh-tw/index.php)收集了他們各自目前已知的所有化合物成分(共335個(gè),見(jiàn)附表1)。
為了確定上述這些化合物成分中哪些是對(duì)于治療咳喘有作用的活性成分以及預(yù)測(cè)其相應(yīng)的靶基因,我們首先通過(guò)搜索CTD數(shù)據(jù)庫(kù)(http://ctdbase.org)找到可以與這些化合物有相互作用的相關(guān)基因。CTD數(shù)據(jù)庫(kù)收錄了幾乎所有FDA批準(zhǔn)藥物和PubMed收錄的小分子化合物及其作用的相關(guān)基因和信號(hào)通路。由于有些化合物比較罕見(jiàn),CTD數(shù)據(jù)庫(kù)中并沒(méi)有錄入或者沒(méi)有提供相關(guān)信息,我們?nèi)サ暨@些化合物。最終我們?cè)贑TD數(shù)據(jù)庫(kù)中發(fā)現(xiàn)上述335個(gè)化合物中有詳細(xì)分子結(jié)構(gòu)、基因和相關(guān)通路的共有50個(gè)。這50個(gè)化合物能夠與被機(jī)體細(xì)胞識(shí)別并產(chǎn)生基因的變化,說(shuō)明其具有潛在藥物活性。進(jìn)一步分析50個(gè)化合物的相關(guān)基因有5 133個(gè)(詳見(jiàn)附表2),這些基因涉及的信號(hào)通路有11 740條。
上一步驟中所發(fā)掘出來(lái)的50個(gè)化合物的所有相關(guān)基因可以排出一個(gè)候選的靶基因列表。在這個(gè)列表中,我們記錄下所有的這些基因和他們的出現(xiàn)次數(shù)。由于有很多基因是偶然發(fā)生,因此可以說(shuō)其和疾病聯(lián)系不大,需要設(shè)定一個(gè)最低閾值來(lái)將這些基因排除。因此我們利用DAVID生物分析系統(tǒng)(https://david.ncifcrf.gov/)對(duì)哮喘相關(guān)基因進(jìn)行富集[8,9]。將基因出現(xiàn)頻次相同的作為一組,每組基因號(hào)通過(guò)ENTREZ_GENE_ID進(jìn)行校正后,以“哮喘”為關(guān)鍵詞,由系統(tǒng)計(jì)算每組基因與疾病的相關(guān)性(由P值反映)。將基因與疾病相關(guān)性最為密切的一組基因的頻次設(shè)定為閾值,出現(xiàn)頻次小于閾值的基因?qū)⒈簧釛?。通過(guò)設(shè)定閾值篩選之后剩余的基因便可以進(jìn)行通路信息的收集和研究了。這里我們通過(guò)搜索KEGG數(shù)據(jù)庫(kù)(http://www.genome.jp/kegg/)將每一個(gè)基因?qū)?yīng)所有的通路找出來(lái)。每一個(gè)基因?qū)?yīng)一個(gè)通路的數(shù)據(jù)集。在這些數(shù)據(jù)集中,如果某些通路單獨(dú)或成組地多次出現(xiàn),那么這一對(duì)或一組信號(hào)通路便應(yīng)該與我們所感興趣的疾病有著莫大的關(guān)聯(lián)[4]。同時(shí),我們?nèi)藶榈貙⑴c咳喘明顯不相關(guān)的信號(hào)通路提出,保留與肺部疾病,細(xì)胞生長(zhǎng)和周期以及免疫相關(guān)的信號(hào)通路。在一定的支持度和置信度設(shè)定下,利用clementine 12.0統(tǒng)計(jì)軟件的Apriori模型對(duì)信號(hào)通路進(jìn)行關(guān)聯(lián)分析。這些在強(qiáng)雙向關(guān)聯(lián)規(guī)則下的通路被認(rèn)為是高度相關(guān)的,并組成了我們所謂疾病通路模式。
通過(guò)疾病通路模式便可以計(jì)算出一種相關(guān)基因的得分。而如果一個(gè)基因處于更多上述的強(qiáng)雙向關(guān)聯(lián)規(guī)則中,那么它理應(yīng)在疾病的發(fā)病機(jī)制中發(fā)揮更重要的效用,此時(shí)它的得分便更高。假設(shè)強(qiáng)關(guān)聯(lián)規(guī)則中存在兩個(gè)、三個(gè)...k個(gè)信號(hào)通路相關(guān),或單個(gè)疾病相關(guān)信號(hào)通路的高頻出現(xiàn)。疾病通路模式中單個(gè)、兩個(gè)、三個(gè)...k個(gè)信號(hào)通路關(guān)聯(lián)規(guī)則包含的通路數(shù)目分別為N1、N2、N3...Nk。
則某基因得分的計(jì)算公式為:
其中hi表示在某一項(xiàng)關(guān)聯(lián)規(guī)則中涉及的所有通路中,該基因所對(duì)應(yīng)的通路個(gè)數(shù)。通過(guò)這個(gè)計(jì)算得分的辦法,便可以將之前找到的基因根據(jù)在咳喘中的重要程度進(jìn)行量化,而得分高于0的這些基因便是后面所謂的候選靶基因,并做成候選靶基因列表。
為了衡量各種化合物的效用,我們定義了一個(gè)效能指標(biāo)。該指標(biāo)包括功能性與特異性兩個(gè)方面。功能性方面,我們假設(shè)某種化合物涵蓋了越多的上述得分較高的候選靶基因,那么其功能就越好。使用函數(shù)計(jì)算。m為化合物對(duì)應(yīng)的基因集中含有的候選靶基因數(shù),S是所有靶基因得分之和,IJ表示候選靶基因列表中的第 j個(gè)基因是否是化合物對(duì)應(yīng)的基因集中含有的基因,是則為1,否則為0,Sgj是第j個(gè)基因的基因得分。特異性方面,我們假設(shè)化合物對(duì)應(yīng)的基因集中不在上述候選靶基因列表中的基因越少,特異性就越高。因此,可以使用函數(shù)計(jì)算特異性。N是該化合物相關(guān)基因的總數(shù)量,而Ngt是相關(guān)基因中包含在上述候選靶基因列表中的數(shù)量。最終得到的功效指標(biāo)定義為當(dāng)一個(gè)化合物的相關(guān)基因與候選靶基因列表完全重合的話,那么其 func=1、spec=1,EI的得分也是最高分1。 func和spec的下降,都會(huì)造成EI的分值下降。依據(jù)EI的進(jìn)行排名,便可整理出方劑中高得分的那些化合物即為所要尋找的有效成分。這些最后得出的有效成分與上面所得到的靶基因一起便可以看作是小青龍湯在治療咳喘病中潛在的基礎(chǔ)藥理機(jī)制。
首先通過(guò)查找中藥數(shù)據(jù)庫(kù)@Taiwan,將小青龍湯中單味藥所包含的小分子化合物列出(以芍藥為例如表1所示)。藥物成分所包涵的各種化合物相關(guān)基因數(shù)量非常龐大,因此需要通過(guò)挖掘通路模式來(lái)進(jìn)行篩選。我們將50個(gè)化合物所有的相關(guān)基因羅列出來(lái),共5 133個(gè)。將這些基因根據(jù)他們的發(fā)生頻數(shù)進(jìn)行排列。如同我們?cè)趫D2中所展示出來(lái)的,發(fā)生頻數(shù)高的基因數(shù)量是相對(duì)很少的,而可能因?yàn)榕既灰蛩匕l(fā)生一次兩次的這些基因卻數(shù)量龐大。進(jìn)一步使用DAVID生物分析系統(tǒng)對(duì)這些基因進(jìn)行富集分析[10]。即選擇該系統(tǒng)中“GENETIC_ASSOCIATION_DB_DISEASE_CLASS”的分析,以“哮喘”為關(guān)鍵詞,從而找出與我們要研究的哮喘以及肺部相關(guān)疾病高度相關(guān)的基因。該系統(tǒng)所提供的這種分析方法可以計(jì)算出這些基因的一個(gè)相關(guān)性指標(biāo)P值(P值越低,說(shuō)明關(guān)系越密切)。隨著基因發(fā)生頻數(shù)的降低,基因與哮喘的發(fā)生關(guān)系越來(lái)越密切(-InP值越高),最后發(fā)現(xiàn)在頻數(shù)為4處的這組基因與哮喘關(guān)系最為密切,如圖3所示。發(fā)生頻率在4以下的基因與哮喘關(guān)系逐漸疏遠(yuǎn)。所以我們將頻數(shù)4設(shè)為閾值,即將基因頻數(shù)為3或以下的基因舍棄。通過(guò)這種方式對(duì)所有的這5 133個(gè)基因進(jìn)行篩選,最終得到了106個(gè)候選基因。
表1 芍藥中的化合物單體成分
將通過(guò)篩選得到的106個(gè)候選基因在KEGG數(shù)據(jù)庫(kù)搜索,其中有著詳細(xì)通路信息的基因有98個(gè)。這些基因的所有相關(guān)通路均記錄在附表3中。這98個(gè)基因所對(duì)應(yīng)的化合物也減少到47個(gè)。利用這些基因在KEGG數(shù)據(jù)庫(kù)中所查到的通路信息,并設(shè)定了對(duì)應(yīng)的支持度0.09與置信度0.9后,我們得到了包括了25個(gè)單項(xiàng)目通路、1個(gè)雙項(xiàng)關(guān)聯(lián)規(guī)則與6個(gè)多項(xiàng)關(guān)聯(lián)規(guī)則的通路模式(見(jiàn)表2)。
通過(guò)上面步驟所挖掘得出的通路模式,我們便可以計(jì)算所有這98個(gè)候選基因的基因得分(見(jiàn)附表4)。表3以CASP3基因?yàn)槔故玖烁鶕?jù)公式計(jì)算基因得分的過(guò)程。其中有75個(gè)基因的得分在0分以上。將基因得分在前20的基因列在表4中,得分最高的三種基因分別為MAPK1、MAPK3與RELA。這些高得分的基因便被認(rèn)為與咳喘高度相關(guān),同時(shí)也有可能就是小青龍湯在治療咳喘時(shí)所作用的靶基因。
經(jīng)過(guò)之前的篩選最后剩下來(lái)的候選化合物只剩下47個(gè)(見(jiàn)附表5)。根據(jù)這些化合物相關(guān)基因的基因得分,我們可以計(jì)算出這些化合物的功能函數(shù)值 func與特異函數(shù)值spec,并最終得出他們的效能指數(shù)EI。表5以蘿卜硫苷(Glucoraphanin)為例,展示了化合物效能的計(jì)算過(guò)程。將這些化合物的EI值進(jìn)行排名后我們?cè)诒?中列出了其中的前十名,以及包含了這些化合物成分的草藥。其中效能最高的3種化合物為Paeonol(丹皮酚)、Glycyrol(甘草醇)、Geraniin(老鸛草素)。
本文中我們使用了一種基于所謂通路模式的方法對(duì)小青龍湯治療咳喘的有效成分及其發(fā)揮藥效的靶基因進(jìn)行了預(yù)測(cè)。通過(guò)使用數(shù)據(jù)挖掘的方式搜集所有的成分、相關(guān)基因、通路等等大量的信息。再使用諸如戴維富集分析等方法設(shè)定一定的閾值來(lái)對(duì)所有的信息進(jìn)行篩選,將很多偶然發(fā)生的基因和無(wú)關(guān)的信號(hào)通路剔除。最終得到需要的化合物成分和靶基因,并作為最后的預(yù)測(cè)結(jié)果。
圖2 50個(gè)化合物對(duì)應(yīng)的相關(guān)基因出現(xiàn)的頻數(shù)
圖3 通過(guò)DAVID生物分析系統(tǒng)進(jìn)行基因的富集分析
表2 疾病相關(guān)的通路模式
在我們最后得到的結(jié)果中,有一些在以前的相關(guān)研究中已經(jīng)報(bào)道過(guò)。比如我們計(jì)算的出EI分值較高,在所有化合物排名第九的山柰酚(Kaempferol),就被發(fā)現(xiàn)可以通過(guò)調(diào)節(jié)NF-κB信號(hào)通路可以減輕流感造成的呼吸系統(tǒng)損傷,同時(shí)有效降低了小鼠肺損傷模型血液中腫瘤壞死因子(TNF)、白細(xì)胞介素6(IL-6)的含量,二者也正是我們所預(yù)測(cè)小青龍湯發(fā)揮藥效靶基因(即基因得分排名前二十)[11]。同樣的結(jié)論在一些慢性阻塞性肺疾病和慢性支氣管炎的研究中也有報(bào)道[12,13]。當(dāng)然這些呼吸系統(tǒng)的疾病均包含在中醫(yī)的咳證與喘證中[14]。而沒(méi)有文獻(xiàn)報(bào)道的這些化合物與靶基因也可能成為以后對(duì)于小青龍湯治療咳喘的基礎(chǔ)藥理機(jī)制研究的方向。
本研究中也獲得了一些既與小青龍湯中的小分子化合物相關(guān)聯(lián),又與咳喘發(fā)生相關(guān)的基因,小青龍湯對(duì)咳喘的治療作用可能依賴于這些信號(hào)分子和相關(guān)信號(hào)通路,如絲裂原活化蛋白激酶(MAPK)信號(hào)通路。實(shí)際上,已經(jīng)有研究發(fā)現(xiàn),一些中藥方劑主要是通過(guò)抑制MAPK信號(hào),改善小鼠咳喘癥狀[15]。
表3 CASP3(ID:836)基因得分
表4 排序前二十的相關(guān)基因
表5 蘿卜硫苷(Glucoraphanin)效能(EI)計(jì)算
當(dāng)然這種研究方法也有很多缺陷,比如所建立的通路模式缺乏生物學(xué)價(jià)值。這種通路模式其實(shí)是通過(guò)數(shù)據(jù)挖掘的方式,從大量的信息中統(tǒng)計(jì)出來(lái)的,它更多的是符合統(tǒng)計(jì)學(xué)意義,而在生物學(xué)上還不能找到合適的解釋。所以尋找其生物學(xué)意義也可作為后面研究的一個(gè)重點(diǎn)和方向。并且由于所研究化合物的詳細(xì)成分組成和基因資料并不完全,研究過(guò)程中排除的很多化合物在治療疾病的過(guò)程中可能也起到了很重要的作用,但以現(xiàn)在的資料儲(chǔ)備水平我們也不得而知了。另外在本研究的基礎(chǔ)上,還需進(jìn)一步進(jìn)行動(dòng)物實(shí)驗(yàn),探索本研究中預(yù)測(cè)為治療效能較高的化合物單獨(dú)或者聯(lián)合使用,闡明其是否能夠治療或改善哮喘癥狀。
表6 效能指數(shù)EI前十名的化合物
總的來(lái)說(shuō),這項(xiàng)研究通過(guò)數(shù)據(jù)挖掘這一利用當(dāng)今網(wǎng)絡(luò)大數(shù)據(jù)的方法,成功預(yù)測(cè)了小青龍湯治療咳喘病的很多有效成分及其作用的靶基因。未來(lái),如果可以使用這種方法探索更多的傳統(tǒng)中藥名方,那對(duì)于中藥治療基礎(chǔ)藥理研究的標(biāo)準(zhǔn)化有著重要意義。
1 張立山,戴雁彥.小青龍湯應(yīng)用之我見(jiàn).中華中醫(yī)藥雜志,2008,23(09):847-848.
2 朱曉宏.小青龍湯現(xiàn)代藥理研究及臨床應(yīng)用概況.國(guó)醫(yī)論壇,2007,22(6):52-53.
3 范驍輝,肖舜,艾妮,等.基于網(wǎng)絡(luò)方劑學(xué)的小青龍湯類(lèi)方功效物質(zhì)組研究.中國(guó)中藥雜志,2015,40(13):2634-2638.
4 Dai W,Chen J,Lu P,et al.Pattern-based prediction of active drug components and gene targets from H1N1 influenza's treatment with maxingshigan-yinqiaosan formula.Mol Biosyst,2013,9(3):375-85.
5 Burbidge R,Trotter M,Buxton B,et al.Drug design by machine learning:support vector machines for pharmaceutical data analysis.Comput Chem,2001,26(1):5-14.
6 Wang Y,Wang X,Cheng Y.A computational approach to botanical drug design by modeling quantitative composition-activity relationship.Chem Biol Drug Des,2006,68(3):166-172.
7 Cheng Y,Wang Y,Wang X.A causal relationship discovery-based approach to identifying active components of herbal medicine.Comput Biol Chem,2006,30,148-154.
8 Huang da W,Sherman B T,Lempicki R A.Bioinformatics enrichment tools:paths toward the comprehensive functional analysis of large gene lists.Nucleic Acids Res,2009,37(1):1-13.
9 Huang da W,Sherman B T,Lempicki R A.Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources.Nat Protoc,2009,4(1):44-57.
10 Chen L,Tai J,Zhang L,et al.Global risk transformative prioritization for prostate cancer candidate genes in molecular networks.Mol Biosyst,2011,7(9):2547-2553.
11 李妍,王春富,張瑞華,等.山柰酚通過(guò)下調(diào)NF-κB信號(hào)通路減輕豬源甲型H9N2流感病毒所致小鼠急性肺損傷.中國(guó)病理生理雜志,2017,33(2):315-321.
12 劉禹翔,王峰,曲敬來(lái),等.小青龍湯對(duì)慢性阻塞性肺疾病急性發(fā)作期患者細(xì)胞因子及肺功能的影響.新中醫(yī),2013,45(7):24-26.
13 孟學(xué)峰,范曄,薛連峰.小青龍湯加味改善慢性支氣管炎急性發(fā)作期患者血清IL-6和TNF-α的研究.中醫(yī)研究,2009,22(6):27-29.
14 王有奎.呼吸病的中醫(yī)診治與調(diào)理.北京:人民軍醫(yī)出版社,2007.
15 羅永峰,吳壯,徐軍.天龍咳喘靈改善慢性哮喘小鼠氣道重塑的機(jī)制.遼寧中醫(yī)雜志,2011,38(2):357-359.