合作進(jìn)化理論在醫(yī)藥領(lǐng)域中的應(yīng)用展望

2012-01-23 12:12:26余煒，萬毅

中國藥業(yè) 2012年2期

余煒，萬毅

(安徽中醫(yī)學(xué)院，安徽合肥 230038)

合作進(jìn)化是對進(jìn)化論的借喻，主張將生物個體合作行為的形成看做是一種進(jìn)化過程。為進(jìn)行關(guān)于合作的研究，1984年美國密西根大學(xué)的羅伯特·艾克斯羅德(Robert Axelord)組織了一場“囚徒困境”博弈模型的計算機(jī)比賽，比賽的思路很簡單:所有參加這個計算機(jī)競賽的人都扮演“囚徒困境”游戲中一個囚犯的角色，他們把自己的策略編入計算機(jī)程序，然后將程序分成不同組，開始“囚徒困境”游戲，每個人都要在合作與背叛之間作出選擇[1]。雖然Axelrod是一名政治學(xué)家，但其研究結(jié)果被認(rèn)為是對“直接互惠”理論的有力驗證。此后，以他的研究為基礎(chǔ)，出現(xiàn)了大量為合作進(jìn)化過程建模的文獻(xiàn)。筆者擬先對該理論的經(jīng)典內(nèi)容進(jìn)行概述，然后對該理論在醫(yī)藥領(lǐng)域的可能應(yīng)用予以展望。

1 概述

合作進(jìn)化理論對于合作的解釋，重點在于對博弈的前提假設(shè)從兩個方面進(jìn)行了調(diào)整:一是將一次性博弈變?yōu)闅v時性的重復(fù)性博弈，即讓博弈發(fā)生的背景從“無時間觀念”轉(zhuǎn)變?yōu)閾碛幸粋€時間過程，博弈可以重復(fù)地進(jìn)行;二是改變“完全理性”的假設(shè)，提出參與博弈的個體可能存在利他的動機(jī)偏好，或者是在信息能力方面存在欠缺。

合作進(jìn)化研究即是將上述兩個方面的調(diào)整合二為一。合作進(jìn)化模型為合作中的個體提供了一種與個體本身無關(guān)的策略優(yōu)化機(jī)制，這種機(jī)制使得他們能夠從完全理性的策略分析中解脫出來，而只需要不斷放棄那些無效率的策略，并不斷使那些成功的策略得以擴(kuò)散。所謂失敗和成功，也與個體的理性無關(guān)，而是基于這些個體或策略之間的生存競爭——適者生存，不適者淘汰[2]。通過剖析連續(xù)的“囚徒困境”模型，下面對幾種常見的競爭策略[2]簡略地加以介紹。

“一報還一報”策略(tit for tat):該對策具體規(guī)則是，對策者在第一步采取合作，然后采用對方上一步的選擇，他在對方每次背叛之后只背叛一次。即以合作開局，此后采取“以其人之道還治其入之身”的策略。

“道寧”(downing)規(guī)則:“道寧”規(guī)則是一個特別有趣的規(guī)則。它不只是“一報還一報”的變形，而是試圖了解對方，并在了解的基礎(chǔ)上作出能得到長期的最好的選擇。具體規(guī)則是，如果對方似乎不對“道寧”的行為作出反應(yīng)的話，“道寧”將試著背叛;如果對方作出反應(yīng)的話，“道寧”就合作。為了判斷對方的反應(yīng)，“道寧”估計對方在它合作之后合作的概率和在它背叛之后合作的概率。每走一步，它便對這兩個條件概率作出新的估計，然后在假設(shè)它已經(jīng)正確估計對方的情況下，作出自己長期支付最小化的選擇。如果這兩個條件概率具有相似的值，那么“道寧”將決定背叛，因為對方似乎不管“道寧”合作與否都做同樣的事。相反，如果對方傾向于在“道寧”合作之后合作而不是“道寧”背叛之后合作，對方就是有反應(yīng)的，那么“道寧”就將計算出對于有反應(yīng)的對手最好是合作。在一定條件下，“道寧”甚至確定最好的策略是交替地合作、背叛。在博弈最初，“道寧”不知道對方的這兩個條件概率值，故先假設(shè)它們都是0.5，在博弈進(jìn)行之中，有實際的信息出現(xiàn)時它就不用這個估計了。這是一個相當(dāng)復(fù)雜的決策規(guī)則，但是它有一個缺陷。由于初始假設(shè)對方是不反應(yīng)的，“道寧”在頭兩步是肯定背叛的。這頭兩次背叛會遭到許多其他規(guī)則的懲罰，往往事情就糟在這個壞的開頭上。

“喬斯”策略(jose):“喬斯”是“—報還一報”的變形。具體規(guī)則是，首先像“一報還一報”一樣，它總是在對方背叛之后立即背叛。但它10次會有1次是在對方合作之后背叛，而不是在對方合作之后總是合作。因此，它試圖偷偷地偶爾占對方的便宜。

“總是背叛”策略(always betray):具體規(guī)則是，無論對策者的選擇如何，其在每一步都背叛。

“永久報復(fù)”策略(enduringly revenge):其規(guī)則是，對策者首先采取合作，直到對手背叛，之后一直用背叛來報復(fù)對手。

“檢驗者”策略(tester):“檢驗者”是由大衛(wèi)·格萊特斯汀(David Gianstein)提出的。該策略具有欺負(fù)人的內(nèi)在屬性，但是，一旦對方表示出不可欺負(fù)性，它就停止。具體規(guī)則是，為了檢驗對方的反應(yīng)，它在第一步就背叛，如果對方背叛，它就趕快抱歉，回之以合作，然后在其余的步驟中采用“一報還一報”。如果對方對它的第一步背叛不反應(yīng)，它就在第二步和第三步合作，但此后它就每隔一步背叛一次。

“改進(jìn)的道寧”策略:“道寧”在初始假設(shè)時假設(shè)對方是不反應(yīng)的，因此在頭兩步是肯定背叛的，結(jié)果遭致許多其他規(guī)則的懲罰。與“道寧”策略不同的是“改進(jìn)的道寧”則在初始假設(shè)時對方是有反應(yīng)的，因此在開始時就選擇合作。

2 在醫(yī)藥領(lǐng)域中的應(yīng)用

2.1 藥物臨床試驗

借助于合作進(jìn)化理論，臨床研究申辦者可以分析以往的臨床藥理研究基地數(shù)據(jù)，輔助遴選合作的臨床試驗中心。另外，可以通過合作進(jìn)化理論來誘導(dǎo)合適的受試者行為，提高受試者的試驗用藥依存性，降低退出率和破盲率。同時，可以協(xié)助分析受試者情況，完善知情同意告知流程，優(yōu)化告知結(jié)果。未來多中心的臨床研究的比重會逐步加大，應(yīng)用合作進(jìn)化理論可以輔助管理多中心臨床觀察項目，協(xié)助監(jiān)察員及稽查員更加有效地開展工作，保證臨床試驗質(zhì)量水平?？稍诓煌行膭討B(tài)評估受試者的合作情況，及時采取干預(yù)措施，保證臨床項目的依序?qū)嵤?可以嘗試建立不同地區(qū)受試者的偏好選擇模型，提升受試者招募質(zhì)量和管理水平。在申辦和研究者層面，可以提高申辦者和研究者的合作水平，更加有效地彼此交換意見，提升臨床研究水平。對于不同類別的研究項目，也可以建立不同疾病譜的受試者行為參考模型，通過行為策略的詳細(xì)分析逐步加以完善。

2.2 醫(yī)藥客戶關(guān)系管理

2.2.1 非處方藥(OTC)客戶關(guān)系管理

未來非處方藥藥店的一個重要機(jī)會就是參與社區(qū)的慢性病管理。合作進(jìn)化理論可以針對不同的慢性病患者進(jìn)行疾病全過程管理，幫助慢性病患者提高長期用藥依從性，并且可以建立良好的醫(yī)患合作關(guān)系，增加藥店的社區(qū)價值和全新的競爭力。在藥店的經(jīng)營方面，合作進(jìn)化理論可以輔助完善上游供貨單位的品類管理和下游目標(biāo)客戶的價值管理，通過打造恰當(dāng)?shù)暮献鬟M(jìn)化路徑，完成良好價值鏈體系的建設(shè)。

2.2.2 處方藥客戶關(guān)系管理

首先，合作進(jìn)化將改變傳統(tǒng)的客戶分類方法，實現(xiàn)真正意義上的實時動態(tài)分類?？蓪鹘y(tǒng)的靜態(tài)處方量分類和準(zhǔn)靜態(tài)的價值分類擴(kuò)展為動態(tài)的合作進(jìn)化分類，實時根據(jù)代表拜訪情況劃定客戶類型，提升了應(yīng)對變化環(huán)境的敏感度。大部分臨床醫(yī)生都可以按照其日常行為模式進(jìn)行合作進(jìn)化的歸類，進(jìn)一步明確其不同的價值選擇。在結(jié)合傳統(tǒng)的處方量和銷售額的客戶分類基礎(chǔ)上，有效地以合作進(jìn)化分類為補(bǔ)充，使得客戶分類更加科學(xué)合理。另外，對于潛在客戶，新的分類方法更有助于從行為控制的角度開發(fā)客戶和管理客戶，并通過持續(xù)的互動來構(gòu)建較優(yōu)的合作狀態(tài)。其次，合作進(jìn)化將滲透到客戶生涯全過程管理的各個層面。通過匹配客戶職業(yè)生涯不同分期的主體策略選擇，建立動態(tài)的客戶生涯行為合作模型。再次，合作進(jìn)化理論使得代表拜訪的動態(tài)監(jiān)控更加具有可操作性。通過整合新的客戶分類維度，將日常的代表拜訪歸類為完整可分析的數(shù)據(jù)鏈，結(jié)合不同合作策略的選擇、反饋、優(yōu)化的循環(huán)路徑，完整覆蓋整個拜訪過程。在建立初步的客戶合作進(jìn)化模型基礎(chǔ)上，可以通過后臺候選最優(yōu)拜訪策略并對一線代表拜訪給予建議。通過計算機(jī)模擬，篩選出較優(yōu)的拜訪策略供代表參考，通過恰當(dāng)?shù)男袨橐龑?dǎo)來建立同客戶的共贏合作。最后，可利用現(xiàn)代數(shù)據(jù)挖掘技術(shù)，為客戶行為建立相關(guān)的分析模型。一方面可以輔助完成重要客戶(醫(yī)療機(jī)構(gòu)及政府機(jī)構(gòu))的行為追蹤分析，篩選合適的應(yīng)對策略，構(gòu)建良好合作基礎(chǔ)和未來合作關(guān)系;另一方面，不同于傳統(tǒng)分類的原因分析(傳統(tǒng)分析通常是觀察到某些客戶的處方量變化后，通過被動推測或者主動接觸的方法分析可能原因)，采取新的合作競爭分類法可以在日常的動態(tài)行為對應(yīng)策略演化中逐步明確真實的原因(可能客戶自己都未能意識到的原因也會逐步顯露)。基于此，企業(yè)可以在正確原因分析的基礎(chǔ)上，結(jié)合合作進(jìn)化模型來優(yōu)化不同的客戶管理，培養(yǎng)和誘導(dǎo)良好的合作關(guān)系。

2.3 構(gòu)建良好的醫(yī)患關(guān)系

醫(yī)患關(guān)系的緊張正日益干擾著正常的診療程序，也使得醫(yī)療行業(yè)從業(yè)者心理負(fù)擔(dān)日益加重。借助合作進(jìn)化理論，一方面可以對門診或住院患者進(jìn)行動態(tài)歸類，輔助選擇合適的合作進(jìn)化策略，提高患者依從性和滿意度;另一方面，對可能的風(fēng)險做到動態(tài)預(yù)警，并推薦合適的策略供臨床醫(yī)生選擇實施，以提前進(jìn)行有效干預(yù)，實現(xiàn)風(fēng)險的有效管理。

2.4 醫(yī)學(xué)教育和科研

常規(guī)的醫(yī)學(xué)學(xué)院教育不是筆者關(guān)注重點，故不展開敘述。筆者重點關(guān)注的是醫(yī)學(xué)和藥學(xué)繼續(xù)教育領(lǐng)域。當(dāng)前的繼續(xù)教育存在著諸多問題，如何更好地同被教育者建立良好的學(xué)習(xí)關(guān)系，更有效地提高繼續(xù)教育及相關(guān)培訓(xùn)的臨床和社會價值，亟需先進(jìn)理念的指導(dǎo)和幫助。合作進(jìn)化理論可以輔助醫(yī)生和藥師的合作關(guān)系建立，配合各級別、各專項領(lǐng)域?qū)W會更加高效地收集本學(xué)科醫(yī)生及藥師的教育培訓(xùn)反饋，動態(tài)考核繼續(xù)教育成果。在前期工作基礎(chǔ)上，利用數(shù)據(jù)挖掘，構(gòu)建相關(guān)學(xué)員的合作進(jìn)化模型，為提高繼續(xù)教育質(zhì)量發(fā)揮重要作用。

合作進(jìn)化模型在科研領(lǐng)域的應(yīng)用類似于臨床試驗中的應(yīng)用，可在前述的思路基礎(chǔ)上加以展開和深化，此處不再贅述。值得注意的是，有人[3]依據(jù)合作進(jìn)化規(guī)則建立了科研的合作進(jìn)化模型，為我們在醫(yī)藥科研領(lǐng)域應(yīng)用合作進(jìn)化理論提供了有益的借鑒。

3 結(jié)語

筆者衷心希望，此文可以啟迪一些對合作進(jìn)化理論感興趣的有識之士，使其能夠投身到合作進(jìn)化理論對于醫(yī)藥領(lǐng)域應(yīng)用的實踐中去，通過搭建理論和實踐的橋梁，共同攜手，積極地全面推進(jìn)合作進(jìn)化理論在醫(yī)藥領(lǐng)域中的應(yīng)用，共同促進(jìn)醫(yī)藥領(lǐng)域各方良好合作關(guān)系的建立和醫(yī)藥相關(guān)領(lǐng)域的和睦發(fā)展。

[1][美]羅伯特·艾克斯羅德.對策中的制勝之道——合作的進(jìn)化[M].羅堅忠.上海:上海人民出版社，1996:23.

[2]Macy M W.Walking out of social traps:a stochastic learning model for Prisoner's Dilemmap[J].Rationality and Society，1989，1(2):197 － 219.

[3]劉新梅，李玉曼.科研合作制度的進(jìn)化解釋——一個基于利益分配的合作進(jìn)化模型[J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究，2001(4):96－99.