余 煒,萬 毅
(安徽中醫(yī)學(xué)院,安徽 合肥 230038)
合作進(jìn)化是對進(jìn)化論的借喻,主張將生物個體合作行為的形成看做是一種進(jìn)化過程。為進(jìn)行關(guān)于合作的研究,1984年美國密西根大學(xué)的羅伯特·艾克斯羅德(Robert Axelord)組織了一場“囚徒困境”博弈模型的計算機(jī)比賽,比賽的思路很簡單:所有參加這個計算機(jī)競賽的人都扮演“囚徒困境”游戲中一個囚犯的角色,他們把自己的策略編入計算機(jī)程序,然后將程序分成不同組,開始“囚徒困境”游戲,每個人都要在合作與背叛之間作出選擇[1]。雖然Axelrod是一名政治學(xué)家,但其研究結(jié)果被認(rèn)為是對“直接互惠”理論的有力驗證。此后,以他的研究為基礎(chǔ),出現(xiàn)了大量為合作進(jìn)化過程建模的文獻(xiàn)。筆者擬先對該理論的經(jīng)典內(nèi)容進(jìn)行概述,然后對該理論在醫(yī)藥領(lǐng)域的可能應(yīng)用予以展望。
合作進(jìn)化理論對于合作的解釋,重點在于對博弈的前提假設(shè)從兩個方面進(jìn)行了調(diào)整:一是將一次性博弈變?yōu)闅v時性的重復(fù)性博弈,即讓博弈發(fā)生的背景從“無時間觀念”轉(zhuǎn)變?yōu)閾碛幸粋€時間過程,博弈可以重復(fù)地進(jìn)行;二是改變“完全理性”的假設(shè),提出參與博弈的個體可能存在利他的動機(jī)偏好,或者是在信息能力方面存在欠缺。
合作進(jìn)化研究即是將上述兩個方面的調(diào)整合二為一。合作進(jìn)化模型為合作中的個體提供了一種與個體本身無關(guān)的策略優(yōu)化機(jī)制,這種機(jī)制使得他們能夠從完全理性的策略分析中解脫出來,而只需要不斷放棄那些無效率的策略,并不斷使那些成功的策略得以擴(kuò)散。所謂失敗和成功,也與個體的理性無關(guān),而是基于這些個體或策略之間的生存競爭——適者生存,不適者淘汰[2]。通過剖析連續(xù)的“囚徒困境”模型,下面對幾種常見的競爭策略[2]簡略地加以介紹。
“一報還一報”策略(tit for tat):該對策具體規(guī)則是,對策者在第一步采取合作,然后采用對方上一步的選擇,他在對方每次背叛之后只背叛一次。即以合作開局,此后采取“以其人之道還治其入之身”的策略。
“道寧”(downing)規(guī)則:“道寧”規(guī)則是一個特別有趣的規(guī)則。它不只是“一報還一報”的變形,而是試圖了解對方,并在了解的基礎(chǔ)上作出能得到長期的最好的選擇。具體規(guī)則是,如果對方似乎不對“道寧”的行為作出反應(yīng)的話,“道寧”將試著背叛;如果對方作出反應(yīng)的話,“道寧”就合作。為了判斷對方的反應(yīng),“道寧”估計對方在它合作之后合作的概率和在它背叛之后合作的概率。每走一步,它便對這兩個條件概率作出新的估計,然后在假設(shè)它已經(jīng)正確估計對方的情況下,作出自己長期支付最小化的選擇。如果這兩個條件概率具有相似的值,那么“道寧”將決定背叛,因為對方似乎不管“道寧”合作與否都做同樣的事。相反,如果對方傾向于在“道寧”合作之后合作而不是“道寧”背叛之后合作,對方就是有反應(yīng)的,那么“道寧”就將計算出對于有反應(yīng)的對手最好是合作。在一定條件下,“道寧”甚至確定最好的策略是交替地合作、背叛。在博弈最初,“道寧”不知道對方的這兩個條件概率值,故先假設(shè)它們都是0.5,在博弈進(jìn)行之中,有實際的信息出現(xiàn)時它就不用這個估計了。這是一個相當(dāng)復(fù)雜的決策規(guī)則,但是它有一個缺陷。由于初始假設(shè)對方是不反應(yīng)的,“道寧”在頭兩步是肯定背叛的。這頭兩次背叛會遭到許多其他規(guī)則的懲罰,往往事情就糟在這個壞的開頭上。
“喬斯”策略(jose):“喬斯”是“—報還一報”的變形。具體規(guī)則是,首先像“一報還一報”一樣,它總是在對方背叛之后立即背叛。但它10次會有1次是在對方合作之后背叛,而不是在對方合作之后總是合作。因此,它試圖偷偷地偶爾占對方的便宜。
“總是背叛”策略(always betray):具體規(guī)則是,無論對策者的選擇如何,其在每一步都背叛。
“永久報復(fù)”策略(enduringly revenge):其規(guī)則是,對策者首先采取合作,直到對手背叛,之后一直用背叛來報復(fù)對手。
“檢驗者”策略(tester):“檢驗者”是由大衛(wèi)·格萊特斯汀(David Gianstein)提出的。該策略具有欺負(fù)人的內(nèi)在屬性,但是,一旦對方表示出不可欺負(fù)性,它就停止。具體規(guī)則是,為了檢驗對方的反應(yīng),它在第一步就背叛,如果對方背叛,它就趕快抱歉,回之以合作,然后在其余的步驟中采用“一報還一報”。如果對方對它的第一步背叛不反應(yīng),它就在第二步和第三步合作,但此后它就每隔一步背叛一次。
“改進(jìn)的道寧”策略:“道寧”在初始假設(shè)時假設(shè)對方是不反應(yīng)的,因此在頭兩步是肯定背叛的,結(jié)果遭致許多其他規(guī)則的懲罰。與“道寧”策略不同的是“改進(jìn)的道寧”則在初始假設(shè)時對方是有反應(yīng)的,因此在開始時就選擇合作。
借助于合作進(jìn)化理論,臨床研究申辦者可以分析以往的臨床藥理研究基地數(shù)據(jù),輔助遴選合作的臨床試驗中心。另外,可以通過合作進(jìn)化理論來誘導(dǎo)合適的受試者行為,提高受試者的試驗用藥依存性,降低退出率和破盲率。同時,可以協(xié)助分析受試者情況,完善知情同意告知流程,優(yōu)化告知結(jié)果。未來多中心的臨床研究的比重會逐步加大,應(yīng)用合作進(jìn)化理論可以輔助管理多中心臨床觀察項目,協(xié)助監(jiān)察員及稽查員更加有效地開展工作,保證臨床試驗質(zhì)量水平??稍诓煌行膭討B(tài)評估受試者的合作情況,及時采取干預(yù)措施,保證臨床項目的依序?qū)嵤?可以嘗試建立不同地區(qū)受試者的偏好選擇模型,提升受試者招募質(zhì)量和管理水平。在申辦和研究者層面,可以提高申辦者和研究者的合作水平,更加有效地彼此交換意見,提升臨床研究水平。對于不同類別的研究項目,也可以建立不同疾病譜的受試者行為參考模型,通過行為策略的詳細(xì)分析逐步加以完善。
2.2.1 非處方藥(OTC)客戶關(guān)系管理
未來非處方藥藥店的一個重要機(jī)會就是參與社區(qū)的慢性病管理。合作進(jìn)化理論可以針對不同的慢性病患者進(jìn)行疾病全過程管理,幫助慢性病患者提高長期用藥依從性,并且可以建立良好的醫(yī)患合作關(guān)系,增加藥店的社區(qū)價值和全新的競爭力。在藥店的經(jīng)營方面,合作進(jìn)化理論可以輔助完善上游供貨單位的品類管理和下游目標(biāo)客戶的價值管理,通過打造恰當(dāng)?shù)暮献鬟M(jìn)化路徑,完成良好價值鏈體系的建設(shè)。
2.2.2 處方藥客戶關(guān)系管理
首先,合作進(jìn)化將改變傳統(tǒng)的客戶分類方法,實現(xiàn)真正意義上的實時動態(tài)分類??蓪鹘y(tǒng)的靜態(tài)處方量分類和準(zhǔn)靜態(tài)的價值分類擴(kuò)展為動態(tài)的合作進(jìn)化分類,實時根據(jù)代表拜訪情況劃定客戶類型,提升了應(yīng)對變化環(huán)境的敏感度。大部分臨床醫(yī)生都可以按照其日常行為模式進(jìn)行合作進(jìn)化的歸類,進(jìn)一步明確其不同的價值選擇。在結(jié)合傳統(tǒng)的處方量和銷售額的客戶分類基礎(chǔ)上,有效地以合作進(jìn)化分類為補(bǔ)充,使得客戶分類更加科學(xué)合理。另外,對于潛在客戶,新的分類方法更有助于從行為控制的角度開發(fā)客戶和管理客戶,并通過持續(xù)的互動來構(gòu)建較優(yōu)的合作狀態(tài)。其次,合作進(jìn)化將滲透到客戶生涯全過程管理的各個層面。通過匹配客戶職業(yè)生涯不同分期的主體策略選擇,建立動態(tài)的客戶生涯行為合作模型。再次,合作進(jìn)化理論使得代表拜訪的動態(tài)監(jiān)控更加具有可操作性。通過整合新的客戶分類維度,將日常的代表拜訪歸類為完整可分析的數(shù)據(jù)鏈,結(jié)合不同合作策略的選擇、反饋、優(yōu)化的循環(huán)路徑,完整覆蓋整個拜訪過程。在建立初步的客戶合作進(jìn)化模型基礎(chǔ)上,可以通過后臺候選最優(yōu)拜訪策略并對一線代表拜訪給予建議。通過計算機(jī)模擬,篩選出較優(yōu)的拜訪策略供代表參考,通過恰當(dāng)?shù)男袨橐龑?dǎo)來建立同客戶的共贏合作。最后,可利用現(xiàn)代數(shù)據(jù)挖掘技術(shù),為客戶行為建立相關(guān)的分析模型。一方面可以輔助完成重要客戶(醫(yī)療機(jī)構(gòu)及政府機(jī)構(gòu))的行為追蹤分析,篩選合適的應(yīng)對策略,構(gòu)建良好合作基礎(chǔ)和未來合作關(guān)系;另一方面,不同于傳統(tǒng)分類的原因分析(傳統(tǒng)分析通常是觀察到某些客戶的處方量變化后,通過被動推測或者主動接觸的方法分析可能原因),采取新的合作競爭分類法可以在日常的動態(tài)行為對應(yīng)策略演化中逐步明確真實的原因(可能客戶自己都未能意識到的原因也會逐步顯露)。基于此,企業(yè)可以在正確原因分析的基礎(chǔ)上,結(jié)合合作進(jìn)化模型來優(yōu)化不同的客戶管理,培養(yǎng)和誘導(dǎo)良好的合作關(guān)系。
醫(yī)患關(guān)系的緊張正日益干擾著正常的診療程序,也使得醫(yī)療行業(yè)從業(yè)者心理負(fù)擔(dān)日益加重。借助合作進(jìn)化理論,一方面可以對門診或住院患者進(jìn)行動態(tài)歸類,輔助選擇合適的合作進(jìn)化策略,提高患者依從性和滿意度;另一方面,對可能的風(fēng)險做到動態(tài)預(yù)警,并推薦合適的策略供臨床醫(yī)生選擇實施,以提前進(jìn)行有效干預(yù),實現(xiàn)風(fēng)險的有效管理。
常規(guī)的醫(yī)學(xué)學(xué)院教育不是筆者關(guān)注重點,故不展開敘述。筆者重點關(guān)注的是醫(yī)學(xué)和藥學(xué)繼續(xù)教育領(lǐng)域。當(dāng)前的繼續(xù)教育存在著諸多問題,如何更好地同被教育者建立良好的學(xué)習(xí)關(guān)系,更有效地提高繼續(xù)教育及相關(guān)培訓(xùn)的臨床和社會價值,亟需先進(jìn)理念的指導(dǎo)和幫助。合作進(jìn)化理論可以輔助醫(yī)生和藥師的合作關(guān)系建立,配合各級別、各專項領(lǐng)域?qū)W會更加高效地收集本學(xué)科醫(yī)生及藥師的教育培訓(xùn)反饋,動態(tài)考核繼續(xù)教育成果。在前期工作基礎(chǔ)上,利用數(shù)據(jù)挖掘,構(gòu)建相關(guān)學(xué)員的合作進(jìn)化模型,為提高繼續(xù)教育質(zhì)量發(fā)揮重要作用。
合作進(jìn)化模型在科研領(lǐng)域的應(yīng)用類似于臨床試驗中的應(yīng)用,可在前述的思路基礎(chǔ)上加以展開和深化,此處不再贅述。值得注意的是,有人[3]依據(jù)合作進(jìn)化規(guī)則建立了科研的合作進(jìn)化模型,為我們在醫(yī)藥科研領(lǐng)域應(yīng)用合作進(jìn)化理論提供了有益的借鑒。
筆者衷心希望,此文可以啟迪一些對合作進(jìn)化理論感興趣的有識之士,使其能夠投身到合作進(jìn)化理論對于醫(yī)藥領(lǐng)域應(yīng)用的實踐中去,通過搭建理論和實踐的橋梁,共同攜手,積極地全面推進(jìn)合作進(jìn)化理論在醫(yī)藥領(lǐng)域中的應(yīng)用,共同促進(jìn)醫(yī)藥領(lǐng)域各方良好合作關(guān)系的建立和醫(yī)藥相關(guān)領(lǐng)域的和睦發(fā)展。
[1][美]羅伯特·艾克斯羅德.對策中的制勝之道——合作的進(jìn)化[M].羅堅忠.上海:上海人民出版社,1996:23.
[2]Macy M W.Walking out of social traps:a stochastic learning model for Prisoner's Dilemmap[J].Rationality and Society,1989,1(2):197 - 219.
[3]劉新梅,李玉曼.科研合作制度的進(jìn)化解釋——一個基于利益分配的合作進(jìn)化模型[J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2001(4):96-99.