汪秉宏, 周 濤, 周昌松
(1.中國(guó)科學(xué)技術(shù)大學(xué)近代物理系,合肥 230026;2.上海理工大學(xué)復(fù)雜系統(tǒng)科學(xué)研究中心,上海 200093;3.電子科技大學(xué)互聯(lián)網(wǎng)科學(xué)中心,成都 610054;4.香港浸會(huì)大學(xué)物理系,香港;5.香港浸會(huì)大學(xué)非線性研究中心,香港)
在自然界、工程、經(jīng)濟(jì)和社會(huì)的各個(gè)領(lǐng)域都有大量復(fù)雜體系.十二五提出的可持續(xù)和諧發(fā)展的長(zhǎng)遠(yuǎn)規(guī)劃對(duì)復(fù)雜體系,尤其是對(duì)與人相關(guān)的復(fù)雜系統(tǒng)的研究提出了前所未有的要求.特別是近十幾年來(lái),科學(xué)研究的一個(gè)巨大變化,就是越來(lái)越多地對(duì)復(fù)雜體系進(jìn)行系統(tǒng)層次的綜合統(tǒng)計(jì)物理學(xué)分析.這一趨勢(shì)的形成由科學(xué)研究在幾個(gè)方面長(zhǎng)期積累的合力引起,包括:a.復(fù)雜性研究的進(jìn)展.幾十年以來(lái),非線性和復(fù)雜性統(tǒng)計(jì)物理研究通過(guò)模型的理論研究發(fā)展了一套概念和方法來(lái)分析耦合體系中復(fù)雜的涌現(xiàn)行為,比如人和動(dòng)物的集群行為.這些行為只出現(xiàn)在系統(tǒng)層次,為分離的系統(tǒng)單元所不具有.這些理論進(jìn)展導(dǎo)致了科學(xué)概念的革命性變化,出現(xiàn)了新興的學(xué)科方向,如系統(tǒng)生物學(xué)等.特別是過(guò)去10多年來(lái)統(tǒng)計(jì)物理從傳統(tǒng)研究相對(duì)獨(dú)立的多粒子體中標(biāo)度與普適現(xiàn)象轉(zhuǎn)移到研究大規(guī)模復(fù)雜體系中各單元或子系統(tǒng)之間相互作用的復(fù)雜結(jié)構(gòu)關(guān)系,形成了一個(gè)跨學(xué)科的、影響至深的復(fù)雜網(wǎng)絡(luò)領(lǐng)域.b.海量數(shù)據(jù)采集和處理技術(shù)的發(fā)展.計(jì)算機(jī)技術(shù)的進(jìn)步使得大規(guī)模的數(shù)據(jù)采集取得突飛猛進(jìn)的變化,提供了大量研究復(fù)雜體系結(jié)構(gòu)與演化的實(shí)證數(shù)據(jù),如計(jì)算機(jī)網(wǎng)絡(luò)、萬(wàn)維網(wǎng)、交通運(yùn)輸網(wǎng)等.大量有關(guān)人類(lèi)個(gè)體和集體行為的數(shù)據(jù)也為定量研究復(fù)雜社會(huì)體系提供了前所未有的契機(jī).
目前正處于一個(gè)統(tǒng)計(jì)物理大革新的時(shí)代,許多史無(wú)前例的、事關(guān)社會(huì)經(jīng)濟(jì)發(fā)展的復(fù)雜體系正迫切等待發(fā)展新的統(tǒng)計(jì)物理分析手段和理論模型來(lái)對(duì)它們進(jìn)行全面深入的認(rèn)識(shí).復(fù)雜體系的系統(tǒng)層次統(tǒng)計(jì)物理研究雖然已成潮流,然而它卻面臨巨大的挑戰(zhàn).最大的問(wèn)題是理論模型及計(jì)算研究與大規(guī)模真實(shí)數(shù)據(jù)之間還存在一個(gè)巨大的鴻溝.復(fù)雜性統(tǒng)計(jì)理論模型往往沒(méi)有考慮到許多真實(shí)體系,特別是與人個(gè)體或群體有關(guān)的生命和社會(huì)體系是變化過(guò)程中經(jīng)過(guò)選擇優(yōu)化的結(jié)果,對(duì)它們的多重約束在這樣一個(gè)優(yōu)化問(wèn)題中沒(méi)有得到足夠的重視和認(rèn)識(shí).其次,作為開(kāi)放系統(tǒng),它與環(huán)境交換能量和物質(zhì)的邊界條件對(duì)優(yōu)化結(jié)果的選擇起到至關(guān)重要的作用.這些是研究真實(shí)復(fù)雜體系的真正挑戰(zhàn)所在.當(dāng)模型的構(gòu)建和分析沒(méi)有足夠考慮這些重要方面時(shí),理論結(jié)果往往與真實(shí)系統(tǒng)很難相符,甚至于不相關(guān).對(duì)這些內(nèi)在約束和外在邊界條件的了解有賴于對(duì)具體的復(fù)雜體系進(jìn)行細(xì)致深入的實(shí)驗(yàn)實(shí)證研究.
雖然技術(shù)的進(jìn)步為在系統(tǒng)層次觀測(cè)和收集數(shù)據(jù)提供了前所未有的機(jī)會(huì),大規(guī)模的數(shù)據(jù)積累也非常之快.然而,有組織、有針對(duì)性地從實(shí)驗(yàn)實(shí)證數(shù)據(jù)探索系統(tǒng)的內(nèi)外約束條件還處于初步階段.因而,如何分析應(yīng)用這些數(shù)據(jù)來(lái)全面理解真實(shí)系統(tǒng)的行為卻進(jìn)展甚微.關(guān)鍵的問(wèn)題是缺乏有效的理論框架,所獲得的數(shù)據(jù)在數(shù)量上可能很大,卻不一定有很強(qiáng)的針對(duì)性,信息比較散雜.數(shù)據(jù)中大量貌似雜亂可往往包含有用的系統(tǒng)組織信息,由于缺乏有效的理論指導(dǎo),在數(shù)據(jù)挖掘中很可能當(dāng)作噪聲被丟棄了.所得的系統(tǒng)信息不易串聯(lián)在一起形成有效的關(guān)于體系在受到多重約束和邊界條件下的組織圖像.如在認(rèn)知神經(jīng)科學(xué)領(lǐng)域,大腦自發(fā)的復(fù)雜活動(dòng)通常作為噪聲處理,大大限制了對(duì)這樣一個(gè)動(dòng)態(tài)復(fù)雜體系結(jié)構(gòu)和功能的認(rèn)識(shí).經(jīng)濟(jì)、社會(huì)領(lǐng)域的數(shù)據(jù)積累也往往缺乏系統(tǒng)的理論指導(dǎo).
由于對(duì)這些根本性的挑戰(zhàn)還缺乏比較全面深入的認(rèn)識(shí),復(fù)雜體系的統(tǒng)計(jì)物理研究還處于初步階段.我國(guó)有不少學(xué)者在復(fù)雜性一般模型和理論方面展開(kāi)了比較活躍的研究,但還缺乏有意識(shí)、有組織和有規(guī)模的在理論和數(shù)據(jù)有機(jī)結(jié)合上的系統(tǒng)化發(fā)展.因此,很有必要基于當(dāng)前國(guó)內(nèi)研究團(tuán)隊(duì)的分布,組織國(guó)內(nèi)的科研合作力量,把理論研究和實(shí)證分析緊密結(jié)合起來(lái),縮小理論及計(jì)算研究與大模型實(shí)驗(yàn)實(shí)證數(shù)據(jù)之間的鴻溝,從而在根本上推動(dòng)我國(guó)在復(fù)雜系統(tǒng)統(tǒng)計(jì)物理這一新興領(lǐng)域的進(jìn)步,在國(guó)際學(xué)術(shù)競(jìng)爭(zhēng)中占一席之地,甚至處于領(lǐng)軍位置.
下面將對(duì)人類(lèi)行為、復(fù)雜網(wǎng)絡(luò)、信息挖掘等3種復(fù)雜系統(tǒng)的統(tǒng)計(jì)物理研究最新進(jìn)展和主要問(wèn)題分別進(jìn)行詳細(xì)闡述和分析.
人類(lèi)行為具有高度的復(fù)雜性.研究人類(lèi)行為中的規(guī)律,對(duì)于經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、管理學(xué)的研究和應(yīng)用有著極為重要的價(jià)值.長(zhǎng)期以來(lái),對(duì)人類(lèi)社會(huì)行為的研究主要為心理學(xué)所關(guān)注,通過(guò)心理學(xué)實(shí)驗(yàn)的方法,研究人類(lèi)在各種環(huán)境下的心理反應(yīng)是其主要的研究手段.
最近數(shù)十年來(lái),人們?cè)趶?fù)雜系統(tǒng)研究領(lǐng)域內(nèi)取得了令人矚目的成就.復(fù)雜系統(tǒng)的研究具有著天然的綜合性和交叉性,它所涉及的問(wèn)題幾乎遍及人們所研究的絕大多數(shù)領(lǐng)域,不但包括物理學(xué)、生物學(xué)等自然科學(xué)學(xué)科,也包括了經(jīng)濟(jì)學(xué)、社會(huì)學(xué)等社會(huì)科學(xué)學(xué)科.隨著對(duì)復(fù)雜系統(tǒng)研究的不斷深入,該領(lǐng)域的研究對(duì)各種社會(huì)學(xué)科的滲透越來(lái)越強(qiáng)烈,其理論影響和實(shí)際應(yīng)用也越來(lái)越廣泛.近年來(lái),對(duì)人類(lèi)行為的統(tǒng)計(jì)研究已經(jīng)成為復(fù)雜系統(tǒng)中的一個(gè)重要議題.
不同于傳統(tǒng)心理學(xué)實(shí)驗(yàn)方法,復(fù)雜系統(tǒng)研究者對(duì)于人類(lèi)行為的研究主要通過(guò)統(tǒng)計(jì)物理方法.通過(guò)對(duì)大量人類(lèi)行為事件進(jìn)行定量統(tǒng)計(jì),研究其中所隱藏的統(tǒng)計(jì)性規(guī)律,并根據(jù)所研究的問(wèn)題,提出基本假設(shè),建立理論模型,來(lái)探索這些規(guī)律的產(chǎn)生機(jī)制和可能的動(dòng)力學(xué)影響.基于這樣的研究方法,近年來(lái)人們發(fā)現(xiàn)了人類(lèi)行為中所存在的大量特殊現(xiàn)象和規(guī)律,這些發(fā)現(xiàn)引發(fā)了人們更深一步地探索人類(lèi)社會(huì)行為的熱潮.特別是從2005年以來(lái),僅在《Nature》、《Science》、《PNAS》、《PRL》等強(qiáng)影響因子期刊上就已經(jīng)發(fā)表了30余篇文章.
以往一些對(duì)社會(huì)、經(jīng)濟(jì)系統(tǒng)的研究中,常常把單個(gè)人的行為簡(jiǎn)化為可以使用泊松過(guò)程描述的穩(wěn)態(tài)隨機(jī)過(guò)程.這種假設(shè)必然導(dǎo)致的推論是人的行為的時(shí)間統(tǒng)計(jì)特征應(yīng)該是較為均勻的,兩個(gè)相繼行為之間存在極大時(shí)間間隔的概率很小.但是,自2005年以來(lái),通過(guò)對(duì)電子郵件發(fā)送與回復(fù)、郵件通信等人類(lèi)行為的時(shí)間間隔的實(shí)際統(tǒng)計(jì),人們發(fā)現(xiàn)這些行為存在與上述假設(shè)極為不同的特性[1-2]:長(zhǎng)時(shí)間靜默與短期內(nèi)高頻率的爆發(fā)同時(shí)呈現(xiàn)在這些人類(lèi)行為中,其時(shí)間間隔分布存在滿足反比冪函數(shù)的胖尾,也就是說(shuō),這些行為的發(fā)生過(guò)程是不能用泊松過(guò)程描述的.這一出人意料的研究結(jié)論提示人們,人類(lèi)的個(gè)體行為可能存在復(fù)雜的動(dòng)力學(xué)機(jī)制,而隨之而來(lái)的一個(gè)重要問(wèn)題是這種非泊松特性在人類(lèi)行為中是不是普遍存在,人們對(duì)這一問(wèn)題進(jìn)行了極為廣泛的研究.
通過(guò)各種不同的數(shù)據(jù)收集方法,人們的研究涉及市場(chǎng)交易[3-6]、網(wǎng)站瀏覽[7-8]、電影點(diǎn)播[9]、欣賞網(wǎng)絡(luò)音樂(lè)[10]、手機(jī)通訊[11]、在游戲及虛擬社區(qū)中的行為[12-13]、計(jì)算機(jī)指令的使用行為[14]等,包含了商業(yè)行為、娛樂(lè)行為、日常使用習(xí)慣等眾多的人類(lèi)行為.在這些行為中,普遍發(fā)現(xiàn)有類(lèi)似的偏離泊松過(guò)程的特性.這些現(xiàn)象顯示出,除了受到生理周期強(qiáng)烈影響的部分行為外,時(shí)間間隔統(tǒng)計(jì)所顯示的非泊松特性可能是在人類(lèi)行為中普遍存在的.
除了時(shí)間間隔分布,部分人類(lèi)行為事件前后時(shí)間間隔的相關(guān)性也得到了研究者的注意.研究發(fā)現(xiàn),這些人類(lèi)行為相鄰時(shí)間間隔的相關(guān)性并不明顯,而其它同樣存在爆發(fā)性和長(zhǎng)期靜默性的自然現(xiàn)象(如地震等)卻常常存在正的相關(guān)性[15].這一項(xiàng)研究初步把人類(lèi)行為和其它復(fù)雜系統(tǒng)中的行為特性進(jìn)行了比較,暗示可能存在統(tǒng)一的深層機(jī)制.
上述統(tǒng)計(jì)特性說(shuō)明人類(lèi)的眾多行為不能使用泊松過(guò)程來(lái)描述,那么一個(gè)重要的問(wèn)題是這種胖尾分布行為特征的來(lái)源是什么.目前一種重要的解釋是基于任務(wù)隊(duì)列理論的[1,16-18],它把人的各種日常行為視作處理一系列的任務(wù),并根據(jù)日常生活經(jīng)驗(yàn)假設(shè)對(duì)這些待處理任務(wù)進(jìn)行優(yōu)先級(jí)劃分.首先處理高優(yōu)先級(jí)者,指出這種具有優(yōu)先權(quán)的行為模式是造成胖尾分布的重要原因.這種基于任務(wù)隊(duì)列的理論模型可以合理地解釋很多人類(lèi)行為中的非泊松特性,例如電子郵件和水陸郵件的發(fā)送等,而且可以相當(dāng)容易地推廣到存在多個(gè)個(gè)體之間交互的情況[19],在解釋人類(lèi)行為時(shí)間統(tǒng)計(jì)胖尾分布特征方面取得了很大的成功.
此外,由于人類(lèi)行為的復(fù)雜性,影響人類(lèi)行為的因素是多種多樣的,所以,有部分研究從不同于任務(wù)隊(duì)列的方面出發(fā),提出了多種非排隊(duì)論模型.例如,有的工作考慮了人類(lèi)行為中的記憶效應(yīng)[20],有的研究了行為的周期性和季節(jié)性對(duì)非泊松機(jī)制的影響[21],近期的一種理論從多重泊松分布的角度解釋了人類(lèi)的行為特性[22].
最后,國(guó)際上有少數(shù)工作研究了人類(lèi)行為的非泊松特性對(duì)網(wǎng)絡(luò)傳播、通訊等動(dòng)力學(xué)過(guò)程的影響.例如,發(fā)現(xiàn)相比于一般的泊松特性,這種非泊松特性可以給系統(tǒng)帶來(lái)一些特殊性質(zhì),如更快的傳播速度等[23].由于這一領(lǐng)域發(fā)展時(shí)間很短,在這一問(wèn)題上還有海量的工作等待開(kāi)展.
除了發(fā)現(xiàn)人類(lèi)行為的時(shí)間間隔分布中廣泛存在有非泊松特性,最近也發(fā)現(xiàn)在人類(lèi)行為的空間分布中也存在有非泊松特性等復(fù)雜現(xiàn)象.2006年,通過(guò)統(tǒng)計(jì)帳單傳遞[24],人們間接地發(fā)現(xiàn)了人類(lèi)的旅行行程分布存在接近于冪律的胖尾.2008年,Gonzalez等[25]通過(guò)統(tǒng)計(jì)移動(dòng)電話用戶在不同基站區(qū)域的漫游過(guò)程,更進(jìn)一步地研究了人的旅行行程分布,同樣發(fā)現(xiàn)該分布具有無(wú)標(biāo)度特性,與早期的結(jié)果基本一致.更為直接的基于GPS數(shù)據(jù)的統(tǒng)計(jì)結(jié)論[26]也支持人類(lèi)行程分布中存在無(wú)標(biāo)度特性.此外,在生物學(xué)觀測(cè)方面也發(fā)現(xiàn)大量的動(dòng)物物種的運(yùn)動(dòng)具有類(lèi)似冪律形式的行程分布[27-29].由于這種冪律形式的行程分布存在較高頻率的遠(yuǎn)程運(yùn)動(dòng),它無(wú)法通過(guò)經(jīng)典的隨機(jī)行走進(jìn)行描述.這種行程分布的廣泛性,使得人們需要去思考它背后的動(dòng)力學(xué)機(jī)制是什么.雖然對(duì)于動(dòng)物行為中的冪律行程分布已經(jīng)提出了覓食效率優(yōu)化[30-31]、嗅覺(jué)梯度機(jī)制[32]、確定性行走[33]等,目前對(duì)人類(lèi)這種行程分布模式產(chǎn)生機(jī)制的解釋方面的研究仍然是空白.另一方面,由于這類(lèi)非泊松特性常常會(huì)使得系統(tǒng)出現(xiàn)若干特殊性質(zhì),那么這種人類(lèi)行為的空間分布上的非泊松特性同樣可能影響到城市交通、人流控制、緊急避險(xiǎn)等系統(tǒng)的運(yùn)作,可能會(huì)使其帶有若干特殊性質(zhì),這些問(wèn)題目前尚未被研究,也值得研究者的注意.
人類(lèi)行為的特性,不僅幫助人們更好地了解自己的行為特征,進(jìn)一步挖掘這些統(tǒng)計(jì)數(shù)據(jù)背后所隱藏的人類(lèi)特性,還關(guān)系到了人們對(duì)于多個(gè)方向的模擬和理解,其中討論最多的,應(yīng)屬人類(lèi)動(dòng)力學(xué)對(duì)于疾病在人群中傳播的影響.在這里主要從時(shí)間和空間兩個(gè)方向來(lái)介紹人類(lèi)行為對(duì)于傳播速度、波及范圍、預(yù)防策略等的影響.
經(jīng)典疾病傳播模型都基于一些有悖于人類(lèi)真實(shí)行為的假設(shè):a.人活動(dòng)的時(shí)間間隔相同,即所有人都均勻地在每個(gè)時(shí)間步活動(dòng)一次,這里的“活動(dòng)”,是指?jìng)鞑セ蚩祻?fù)的行為;b.所有人活動(dòng)的頻率在群體中是無(wú)差別的,即每個(gè)個(gè)體的活動(dòng)密度一樣.然而,參考前文人類(lèi)時(shí)間間隔實(shí)證統(tǒng)計(jì)發(fā)現(xiàn),這些假設(shè)與人類(lèi)行為具有的陣發(fā)性、記憶性和活躍性有著很大的出入.
為關(guān)注人類(lèi)活動(dòng)的陣發(fā)性對(duì)于病毒傳播的影響,Vázquez等用人們查收E-mail的兩組數(shù)據(jù),分別為3 188個(gè)用戶之間發(fā)送的129 135封郵件,1 729 165個(gè)用戶之間互發(fā)的39 046 030封郵件,在實(shí)證數(shù)據(jù)的網(wǎng)絡(luò)上,根據(jù)真實(shí)時(shí)間間隔,模擬了網(wǎng)絡(luò)上計(jì)算機(jī)病毒的傳播情況[23].以天和小時(shí)為單位的統(tǒng)計(jì)結(jié)果,都表明人類(lèi)行為的時(shí)間間隔滿足冪律分布,會(huì)極大程度上減慢病毒的傳播.人類(lèi)活動(dòng)的陣發(fā)性對(duì)于病毒傳播具有明顯的延遲作用.
文獻(xiàn)[34]也運(yùn)用SIR模型通過(guò)模擬,討論了時(shí)間分布的陣發(fā)性對(duì)于傳播過(guò)程的影響,設(shè)置了存在等待時(shí)間的模型,并得到結(jié)論:時(shí)間的異質(zhì)性越強(qiáng),病毒存活的概率越小.
在人類(lèi)活動(dòng)時(shí)間間隔滿足陣發(fā)性的基礎(chǔ)上,為探討時(shí)間序列的記憶性對(duì)傳播過(guò)程的影響,Karsai等基于電話網(wǎng)絡(luò)的實(shí)證數(shù)據(jù),時(shí)間跨度為9個(gè)月,在規(guī)模為N=4.6×106的網(wǎng)絡(luò)上模擬傳播[35].通過(guò)對(duì)比網(wǎng)絡(luò)是否含權(quán)重、網(wǎng)絡(luò)是否有向、通話時(shí)間分布是否有記憶性,模擬結(jié)果表明,人類(lèi)行為時(shí)間和空間上的異質(zhì)性會(huì)一定程度地減慢傳播過(guò)程.
時(shí)間的異質(zhì)性又體現(xiàn)在個(gè)體與群體兩個(gè)層面上,也有工作進(jìn)一步比較了兩者對(duì)于疾病傳播速度的影響[36].所謂群體層面的時(shí)間異質(zhì)性,是指每個(gè)人活動(dòng)的時(shí)間序列間隔平均,而人與人之間的頻率有較大差別,滿足冪律分布.但是個(gè)體層面的時(shí)間異質(zhì)性,表現(xiàn)為人與人之間活動(dòng)的頻率相同,而單人活動(dòng)的時(shí)間間隔滿足冪律分布.群體層面上時(shí)間的異質(zhì)性對(duì)傳播速度的影響非常大,相比之下,個(gè)體層面上的對(duì)傳播影響很小.
為了揭示人類(lèi)的行程分布對(duì)于傳播過(guò)程的影響,Ni等利用連接概率與度成正比,與歐氏距離成反比的機(jī)制,構(gòu)造網(wǎng)絡(luò),并在網(wǎng)絡(luò)上模擬傳播過(guò)程[37].研究發(fā)現(xiàn),行程分布的幾何特征越鮮明,即人們更傾向于去到距離自己歐氏距離比較近的地方,病毒傳播所波及的范圍就越小,持續(xù)時(shí)間也就越短.
相比于個(gè)體形成分布的活動(dòng)特征,更多人關(guān)注宏觀意義上人類(lèi)的長(zhǎng)程旅行對(duì)于病毒在城市間擴(kuò)散的影響.早在2004年,Hufnagel等就在美國(guó)航空網(wǎng)絡(luò)上,假設(shè)人口密度隨機(jī)分布,建立了SARS病毒傳播的模型[38].該模型考慮了局部病毒傳播和城市間由于飛行造成病毒傳播兩種因素,模擬出的結(jié)果與實(shí)證很好地吻合,并提出了有效預(yù)防及抑制疾病傳播的策略.針對(duì)以上模擬及解析結(jié)果,Hufnagel等還提出了相應(yīng)的預(yù)防策略.通過(guò)模擬,比較了減少局部地區(qū)個(gè)體接觸和減少長(zhǎng)程出行兩種預(yù)防策略.得出孤立城市,即減少城市間的長(zhǎng)程旅行可以更有效地防治疾病擴(kuò)散,并給出了集中早期進(jìn)行疫苗注射的顯著效果[38].此后,2006年Colizza等專(zhuān)門(mén)就人類(lèi)長(zhǎng)程出行的拓?fù)浣Y(jié)構(gòu)對(duì)于病毒擴(kuò)散造成的影響進(jìn)行了研究[39].為了進(jìn)一步探究網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)對(duì)于疾病人數(shù)分布的影響,還提出了病毒分布熵的概念,來(lái)刻畫(huà)病毒流行的地區(qū)異質(zhì)性.通過(guò)與實(shí)際網(wǎng)絡(luò)病毒傳播情況的對(duì)比,發(fā)現(xiàn)以前很多刻畫(huà)人類(lèi)行程拓?fù)浣Y(jié)構(gòu)的模型在細(xì)節(jié)上還需改進(jìn).
該領(lǐng)域興起也引起了國(guó)內(nèi)研究者的注意.目前,中國(guó)科學(xué)技術(shù)大學(xué)復(fù)雜系統(tǒng)課題組、上海理工大學(xué)管理學(xué)院、上海交通大學(xué)自動(dòng)化系等都已經(jīng)有相關(guān)的研究論文在國(guó)內(nèi)外學(xué)術(shù)期刊上發(fā)表.這些工作可以簡(jiǎn)述如下.
在實(shí)證方面,中國(guó)科學(xué)技術(shù)大學(xué)復(fù)雜系統(tǒng)課題組的周濤等與韓國(guó)成均館大學(xué)及瑞典皇家學(xué)院合作研究了電影點(diǎn)播中的人類(lèi)行為模式以及與個(gè)體活動(dòng)性之間的關(guān)系[9,40];洪偉等研究了人類(lèi)短消息通訊中的時(shí)間間隔分布[41],發(fā)現(xiàn)了多種無(wú)標(biāo)度特性;上海理工大學(xué)課題組的張寧、李楠楠和周濤合作分析了魯迅、錢(qián)學(xué)森等名人的郵件通訊數(shù)據(jù)[42-43];上海交通大學(xué)的胡海波等人研究了網(wǎng)絡(luò)在線音樂(lè)的收聽(tīng)行為[10].在理論模型方面,中國(guó)科學(xué)技術(shù)大學(xué)的韓筱璞等提出可自適應(yīng)調(diào)節(jié)的興趣機(jī)制來(lái)解釋人類(lèi)行為的非泊松特性[44-45].此外,上海理工大學(xué)方面還發(fā)表了針對(duì)人類(lèi)動(dòng)力學(xué)的中文綜述[46];上海理工大學(xué)的郭進(jìn)利等和中國(guó)科學(xué)技術(shù)大學(xué)的周濤等合作編寫(xiě)出版了專(zhuān)著《人類(lèi)行為動(dòng)力學(xué)模型》[47];中國(guó)科學(xué)技術(shù)大學(xué)的周濤、韓筱璞、汪秉宏也在世界科學(xué)出版社出版的專(zhuān)著《Science Matters:Humanities as Complex Systems》中撰寫(xiě)了關(guān)于人類(lèi)動(dòng)力學(xué)研究的一個(gè)專(zhuān)門(mén)章節(jié)[48].
由于該領(lǐng)域的發(fā)展時(shí)間短暫,目前仍存在大量問(wèn)題有待于深入研究.
a.已有的實(shí)證統(tǒng)計(jì)主要針對(duì)個(gè)體行為,但仍然存在大量的個(gè)體行為特性未被研究,已有的研究結(jié)果難以根據(jù)統(tǒng)計(jì)特性區(qū)分個(gè)體行為的主要類(lèi)別,而針對(duì)團(tuán)體行為的實(shí)證研究更幾乎是空白.事實(shí)上,人類(lèi)的行為常常受到社會(huì)關(guān)系的影響,這方面定量的實(shí)證研究仍然非常欠缺.另外,一些最近發(fā)展的理論,例如人類(lèi)動(dòng)力學(xué)的普適類(lèi)假說(shuō),受到了新的實(shí)證數(shù)據(jù)的挑戰(zhàn),更清晰和令人信服的圖景需要更多和更深入的實(shí)證分析.
b.除了人類(lèi)的個(gè)體行為,目前所做的一些最新統(tǒng)計(jì)也發(fā)現(xiàn),一些社會(huì)團(tuán)體的宏觀行為也具有類(lèi)似的非泊松特性,如國(guó)家之間戰(zhàn)爭(zhēng)的時(shí)間間隔分布等.由于目前的實(shí)證統(tǒng)計(jì)有限,對(duì)于社會(huì)團(tuán)體而言,這些特性在多大范圍內(nèi)存在,是否與人類(lèi)個(gè)體行為具有相似的生成機(jī)制,都仍然是未知問(wèn)題,需要進(jìn)行深入的研究.
c.在研究人類(lèi)行為的空間分布方面,目前的實(shí)證數(shù)據(jù)都是根據(jù)帳單、手機(jī)漫游等數(shù)據(jù)間接獲得,缺少對(duì)人類(lèi)行為空間分布的直接觀察,而其產(chǎn)生機(jī)制和動(dòng)力學(xué)效應(yīng)方面的研究目前幾乎沒(méi)有.
d.目前的理論模型研究,雖然已經(jīng)提出了多種唯相機(jī)制來(lái)解釋人類(lèi)行為中的非泊松特性,但是這些機(jī)制難以覆蓋全部人類(lèi)行為中的非泊松特性現(xiàn)象,需要提出新的更具有普適性的模型.
e.人類(lèi)行為特性對(duì)各種社會(huì)系統(tǒng)動(dòng)力學(xué)效應(yīng)的影響研究,盡管已經(jīng)出現(xiàn)了少數(shù)成果,但因涉及問(wèn)題眾多,導(dǎo)致許多研究空白,大量工作需要深入進(jìn)行.例如人類(lèi)行為的空間分布特性是如何影響城市交通等.
過(guò)去的10多年,人們見(jiàn)證了由一個(gè)影響深遠(yuǎn)的交叉學(xué)科“復(fù)雜網(wǎng)絡(luò)”的出現(xiàn)帶來(lái)的復(fù)雜系統(tǒng)研究上的重大革新(見(jiàn)文獻(xiàn)[49-50]).在很多真實(shí)世界中的復(fù)雜系統(tǒng)中,系統(tǒng)基本元素之間相互作用構(gòu)成了復(fù)雜的拓?fù)溥B接[51-53].來(lái)自不同學(xué)科領(lǐng)域的這些復(fù)雜網(wǎng)絡(luò)既不是規(guī)則連接也不是隨機(jī)連接,而是具備兩個(gè)共同的特性.這兩個(gè)共同的特性分別是由較短路徑長(zhǎng)度所描述的小世界特性[54]和具有很大連接(度)的中心節(jié)點(diǎn)的無(wú)標(biāo)度特點(diǎn)[55].
復(fù)雜網(wǎng)絡(luò)領(lǐng)域的主要方向是圖理論分析工具的發(fā)展以及將這些工具應(yīng)用于刻畫(huà)不同領(lǐng)域里的復(fù)雜系統(tǒng)[49-50].在復(fù)雜網(wǎng)絡(luò)領(lǐng)域的研究方法中,復(fù)雜系統(tǒng)的基本元素是由節(jié)點(diǎn)來(lái)表示,元素之間的相互作用是由邊來(lái)表示,而元素和相互作用的一些細(xì)節(jié)特點(diǎn)通常被忽略.
在對(duì)復(fù)雜系統(tǒng)的研究中,上述過(guò)度簡(jiǎn)化的研究方式限制了方法的效能.一個(gè)很大的挑戰(zhàn)是,對(duì)整個(gè)網(wǎng)絡(luò)的全局統(tǒng)計(jì)量(如平均路徑長(zhǎng)度、簇系數(shù)等)進(jìn)行測(cè)量時(shí),網(wǎng)絡(luò)的結(jié)構(gòu)并不能夠真正決定系統(tǒng)的行為.例如,由腦皮層區(qū)域之間長(zhǎng)程連接所構(gòu)成的大腦網(wǎng)絡(luò)的小世界和無(wú)標(biāo)度特點(diǎn)[56-57]確實(shí)能對(duì)大腦的功能表現(xiàn)提供一些視角,但是要想對(duì)大腦功能作出更重要的深入理解需要基于對(duì)神經(jīng)元和復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)的重要特性綜合之后對(duì)大腦的動(dòng)力學(xué)進(jìn)行深入細(xì)致的分析.
將網(wǎng)絡(luò)的結(jié)構(gòu)和復(fù)雜系統(tǒng)行為聯(lián)系起來(lái)的重要一步是對(duì)在網(wǎng)絡(luò)上發(fā)生的動(dòng)力學(xué)過(guò)程進(jìn)行研究[50,58].在很多復(fù)雜系統(tǒng)的動(dòng)力學(xué)研究中,特別是對(duì)于神經(jīng)系統(tǒng)[59-60],復(fù)雜網(wǎng)絡(luò)振子同步作為共同行為自組織現(xiàn)象的重要機(jī)制已經(jīng)成為深入探索的一個(gè)重要課題(見(jiàn)文獻(xiàn)[61]).
在振子同步性問(wèn)題上,研究的焦點(diǎn)集中考慮網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)方面,特別是小世界和無(wú)標(biāo)度特性的影響上[61-71].在整個(gè)網(wǎng)絡(luò)的全局同步方面,很多工作要么考慮全同振子實(shí)現(xiàn)的完全同步或者是非全同振子由于鎖相實(shí)現(xiàn)的協(xié)作振動(dòng)[61].之前已經(jīng)有很多研究主要使用主穩(wěn)定性方程來(lái)探索完全同步狀態(tài)的穩(wěn)定性,而在這個(gè)方法中,根本不考慮振子的特殊屬性,而是將網(wǎng)絡(luò)同步性與網(wǎng)絡(luò)的特征譜掛鉤[65-70].文獻(xiàn)主體部分是通過(guò)對(duì)權(quán)重和耦合強(qiáng)度的拓?fù)浣Y(jié)構(gòu)進(jìn)行調(diào)整來(lái)加強(qiáng)振子的全局同步性[61,67-71].
雖然完全同步非常方便進(jìn)行穩(wěn)定性分析,但是它不是真實(shí)的復(fù)雜系統(tǒng)中最自然的狀態(tài).相反,大尺度的強(qiáng)同步對(duì)應(yīng)的是系統(tǒng)病態(tài)情況,如社會(huì)災(zāi)難、癲癇發(fā)作,真實(shí)系統(tǒng)是不希望出現(xiàn)這些狀態(tài)的.真實(shí)系統(tǒng)特別是神經(jīng)系統(tǒng),為了實(shí)現(xiàn)正常功能需要不同層次的同步,使得系統(tǒng)通過(guò)分割成不同動(dòng)力學(xué)模塊在各自的子系統(tǒng)里實(shí)現(xiàn)特殊的功能.同時(shí),這些專(zhuān)門(mén)的模塊間相互作用有效地實(shí)現(xiàn)了分割處理的信息整合.
最近,網(wǎng)絡(luò)研究中將網(wǎng)絡(luò)分成不同拓?fù)淠K的研究方法已經(jīng)引起了廣泛關(guān)注[72-75].除了小世界和無(wú)標(biāo)度特性,模塊化是真實(shí)網(wǎng)絡(luò)另一個(gè)普適特征.例如在神經(jīng)系統(tǒng)中,數(shù)十億神經(jīng)元被耦合形成不同層次的(從單神經(jīng)元連接組成的神經(jīng)柱,由不同神經(jīng)柱連接再形成的功能區(qū)域)模塊網(wǎng)絡(luò).通過(guò)模塊之間不同層次上的合作同步,模塊結(jié)構(gòu)為系統(tǒng)實(shí)現(xiàn)功能的分類(lèi)和整合提供了一個(gè)天然基礎(chǔ).雖然關(guān)于模塊研究的最近一些工作仍然考慮完全同步態(tài)的穩(wěn)定性問(wèn)題[76],但是主流趨勢(shì)已經(jīng)轉(zhuǎn)移來(lái)研究系統(tǒng)在并未完全同步時(shí)動(dòng)力學(xué)模塊的形成,這個(gè)方法同時(shí)用于探測(cè)網(wǎng)絡(luò)結(jié)構(gòu)模塊[77-81].
值得注意的是,很多之前著名的研究仍然將網(wǎng)絡(luò)隨時(shí)間變化的動(dòng)力學(xué)(如網(wǎng)絡(luò)演化[49])和動(dòng)力學(xué)行為在網(wǎng)絡(luò)上的表現(xiàn)(如同步,信息傳播[50,58])分開(kāi)考慮.然而在大量真實(shí)的復(fù)雜網(wǎng)絡(luò)系統(tǒng)中,結(jié)構(gòu)與動(dòng)力學(xué)的相互影響是至關(guān)重要的.不只是結(jié)構(gòu)決定了動(dòng)力學(xué)斑圖,反過(guò)來(lái)動(dòng)力學(xué)也使得結(jié)構(gòu)進(jìn)行了與之相適應(yīng)的調(diào)整,后者在眾所周知的神經(jīng)系統(tǒng)的學(xué)習(xí)機(jī)制中表現(xiàn)得尤為明顯.很多真實(shí)系統(tǒng)自組織了網(wǎng)絡(luò)結(jié)構(gòu),并且在兩者共同演化中實(shí)現(xiàn)了對(duì)功能的優(yōu)化.有些工作開(kāi)始關(guān)注在適應(yīng)性網(wǎng)絡(luò)上來(lái)對(duì)結(jié)構(gòu)和功能的相互影響進(jìn)行分析[82-84].
綜上所述,在振子網(wǎng)絡(luò)的理論分析和模型研究中的主要挑戰(zhàn)一方面是刻畫(huà)復(fù)雜同步斑圖的復(fù)雜性程度與網(wǎng)絡(luò)不同層次結(jié)構(gòu)之間的關(guān)聯(lián),另一方面是探索在各個(gè)層次里通過(guò)結(jié)構(gòu)模塊和動(dòng)力學(xué)模塊的相互影響實(shí)現(xiàn)兩者的自組織.這個(gè)方向的探索剛剛起步,將長(zhǎng)期影響對(duì)可以用振子及其同步來(lái)根本表現(xiàn)其功能的真實(shí)復(fù)雜系統(tǒng),特別是神經(jīng)系統(tǒng)的理解[59-60].
由幾百億個(gè)神經(jīng)元通過(guò)極其復(fù)雜的、多層次連接而形成的大腦皮層神經(jīng)系統(tǒng)是自然界中所知的最為復(fù)雜的動(dòng)力學(xué)網(wǎng)絡(luò)體系.它的結(jié)構(gòu)與動(dòng)力學(xué)直接關(guān)系到大腦的各種功能及相應(yīng)的精神疾病和認(rèn)知障礙.最近10多年來(lái),由于腦造影技術(shù)的進(jìn)步,人們已在系統(tǒng)層次對(duì)大腦的連接及活動(dòng)積累了非常多的有益數(shù)據(jù).如何分析理解這些數(shù)據(jù)從而了解大腦大規(guī)模的復(fù)雜結(jié)構(gòu)、動(dòng)態(tài)活動(dòng)及認(rèn)知功能之間的關(guān)系,必將是未來(lái)研究大腦蓬勃發(fā)展的新方向.
在過(guò)去幾十年內(nèi),非線性與復(fù)雜性物理科學(xué)的各種理論和方法得到長(zhǎng)足的發(fā)展,并將其應(yīng)用于神經(jīng)科學(xué)領(lǐng)域.特別是復(fù)雜網(wǎng)絡(luò)方法的應(yīng)用已經(jīng)勾勒出一個(gè)關(guān)于大腦的新圖景,使得可以從解剖學(xué)上的神經(jīng)連接層面以及動(dòng)力學(xué),也就是大腦功能上的區(qū)域相互關(guān)聯(lián)層面上來(lái)研究這個(gè)復(fù)雜的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)[58,85-86].在大腦的系統(tǒng)層面上,根據(jù)之前的研究[26,87],由哺乳動(dòng)物腦區(qū)間的長(zhǎng)程連接所構(gòu)成的腦皮層網(wǎng)絡(luò)已經(jīng)展示出小世界和無(wú)標(biāo)度特性.這個(gè)發(fā)現(xiàn)的意義是巨大的,它暗示著每個(gè)腦區(qū)的活動(dòng)都可能同時(shí)被其它腦區(qū)的活動(dòng)影響.由測(cè)量到的不同腦區(qū)活動(dòng)相關(guān)性所得到的大腦功能區(qū)之間相互作用的功能網(wǎng)絡(luò)也展示了這個(gè)復(fù)雜的大腦斑圖,這一點(diǎn)甚至當(dāng)大腦處于靜息態(tài),也就是說(shuō)大腦在沒(méi)有外感覺(jué)輸入,只有完全自發(fā)的自組織活動(dòng)的狀態(tài)下也同樣存在[88-90].傳統(tǒng)的認(rèn)知神經(jīng)科學(xué)在過(guò)去的10多年也開(kāi)始轉(zhuǎn)而研究大腦自發(fā)活動(dòng)在功能上的影響[91].然而,認(rèn)知科學(xué)方面的分析還是主要局限在考慮由少量腦區(qū)所組成的自下而上(前饋)或者自上而下的(反饋)機(jī)制[60].與只研究少量腦區(qū)相比,從復(fù)雜網(wǎng)絡(luò)角度同時(shí)研究神經(jīng)系統(tǒng)中各部分的相互作用將會(huì)帶來(lái)關(guān)于動(dòng)力學(xué)和功能的相互關(guān)系方面更多的信息,但是該如何解讀這些信息又是需要考慮的問(wèn)題.
大腦的復(fù)雜網(wǎng)絡(luò)假設(shè)呼喚著新的方法來(lái)揭示出大腦大尺度的功能網(wǎng)絡(luò)和認(rèn)知過(guò)程的關(guān)聯(lián).如今基于網(wǎng)絡(luò)的分析和測(cè)量工具不足以應(yīng)付研究復(fù)雜的大尺度動(dòng)力學(xué)相互作用斑圖,并將它們與只在50~100ms的短時(shí)間窗口里發(fā)生的各種認(rèn)知過(guò)程相聯(lián)系.現(xiàn)在這些復(fù)雜的大腦網(wǎng)絡(luò)特征分析只是局限于討論網(wǎng)絡(luò)的全局統(tǒng)計(jì)量,如簇系數(shù)、平均路徑長(zhǎng)度等.而對(duì)于功能網(wǎng)絡(luò)的分析也主要是考慮在長(zhǎng)時(shí)間尺度下統(tǒng)計(jì)意義上的腦區(qū)活動(dòng)相互作用斑圖.普適網(wǎng)絡(luò)理論對(duì)于結(jié)構(gòu)和動(dòng)力學(xué)關(guān)系的探索只是局限在一些理想的情況下,如復(fù)雜網(wǎng)絡(luò)中振子同步問(wèn)題已經(jīng)被大量研究(見(jiàn)文獻(xiàn)[77-81]).但是,這些研究主要是集中在全局同步上[61-64,92-94],也就是整個(gè)網(wǎng)絡(luò)的完全同步.通過(guò)理論的穩(wěn)定性分析可知,大尺度完全同步并不允許信息的分割處理,這一點(diǎn)與神經(jīng)系統(tǒng)中需要信息的分隔處理與整合的恰當(dāng)平衡相抵觸,因而與神經(jīng)系統(tǒng)的疾病狀態(tài)相對(duì)應(yīng),如癲癇發(fā)作[92-94].
因此,對(duì)大腦復(fù)雜的連接結(jié)構(gòu)、活動(dòng)的統(tǒng)計(jì)分析和模擬研究的挑戰(zhàn)是如何把復(fù)雜網(wǎng)絡(luò)和復(fù)雜動(dòng)力學(xué)系統(tǒng)的一般理論同真實(shí)神經(jīng)系統(tǒng)的特異性有機(jī)結(jié)合,發(fā)展新的理論方法并把它應(yīng)用到真實(shí)的數(shù)據(jù)分析和模型的建立上.這需要從事復(fù)雜性統(tǒng)計(jì)物理研究的學(xué)者與神經(jīng)科學(xué)家之間的緊密合作.
隨著因特網(wǎng)的迅猛發(fā)展,接入因特網(wǎng)的服務(wù)器數(shù)量[95]和World Wide Web上網(wǎng)頁(yè)[96]的數(shù)目都呈現(xiàn)出快速增長(zhǎng)的態(tài)勢(shì).用戶可得信息量的激增使得人們的生活變得多元化,但與此同時(shí),也帶來(lái)了信息過(guò)載的問(wèn)題.例如,Netflix上有數(shù)萬(wàn)部電影,Amazon上有數(shù)百萬(wàn)本書(shū),Del.icio.us上面有超過(guò)10億的網(wǎng)頁(yè)收藏.如此多的信息,別說(shuō)找到自己感興趣的部分,即使是瀏覽一遍標(biāo)題也是不可能的.信息過(guò)載,簡(jiǎn)單來(lái)說(shuō),就是信息量的激增使得信息的利用率反而降低.高效準(zhǔn)確的信息推薦技術(shù),特別是針對(duì)不同用戶不同喜好的個(gè)性化推薦技術(shù),是解決信息過(guò)載問(wèn)題最有前途的方案[97].另外需要注意的是鏈路預(yù)測(cè)技術(shù),這是一種不完整信息重構(gòu)的有效手段.下面,將從信息推薦理論和算法,以及鏈路預(yù)測(cè)理論和算法兩方面進(jìn)行敘述.
個(gè)性化推薦系統(tǒng),本質(zhì)上講是根據(jù)用戶對(duì)相關(guān)產(chǎn)品的歷史評(píng)價(jià),代替用戶評(píng)估他尚未接觸的產(chǎn)品的一種工具[98].這些產(chǎn)品包括書(shū)、電影、CD、網(wǎng)頁(yè),甚至可以是飯店、音樂(lè)、繪畫(huà)等.個(gè)性化推薦系統(tǒng)作為一個(gè)獨(dú)立的概念,在20世紀(jì)90年代已經(jīng)被提出.由于Web 2.0技術(shù)的發(fā)展和成熟,用戶可以方便地針對(duì)網(wǎng)上服務(wù)提供反饋信息,這些反饋信息可以反映用戶的喜好,從而被網(wǎng)絡(luò)服務(wù)提供商用來(lái)進(jìn)行推薦.因此,最近幾年,個(gè)性化推薦系統(tǒng)的研究得以迅猛發(fā)展.
雖然早在1992年開(kāi)發(fā)的Tapestry系統(tǒng)就己經(jīng)是真正意義上的信息推薦系統(tǒng)了,但推薦系統(tǒng)的概念直到1997年才由Resnick和Varian正式定義[98],推薦技術(shù)也才逐步發(fā)展為一個(gè)獨(dú)立的研究領(lǐng)域.《Communications of ACM》分別于1992年和1997年出版了兩期推薦系統(tǒng)的專(zhuān)刊,國(guó)際著名期刊《Journal of Information Technology and Tourism》、《ACM Transactions on Information System》、《ACM Transactions on Computer-Human Interaction》、《International Journal of Electronic Commerce》、《IEEE Intelligent Systems》、《AI Communications》等也分別于2003年、2004年、2005年、2007年出版了推薦系統(tǒng)的專(zhuān)刊.除這些專(zhuān)刊外,多個(gè)頂級(jí)的國(guó)際會(huì)議,如CHI、ACM SIGIR、ECAI、AAAI、ReColl等都設(shè)立專(zhuān)門(mén)的推薦系統(tǒng)的工作組.由于推薦系統(tǒng)的重要地位,ACM SIGIR設(shè)立了專(zhuān)門(mén)的推薦系統(tǒng)會(huì)議,其第一屆會(huì)議于2007年在美國(guó)明尼蘇達(dá)大學(xué)召開(kāi),第二屆會(huì)議于2008年在瑞士洛桑理工大學(xué)召開(kāi).
一般而言,信息推薦系統(tǒng)通常包括3個(gè)組成要素[97]:推薦候選對(duì)象、用戶和推薦方法.其中,推薦方法是整個(gè)推薦系統(tǒng)中最核心、最關(guān)鍵的部分,在很大程度上決定了推薦系統(tǒng)的性能.目前,針對(duì)推薦方法的分類(lèi)也有好幾種,其中多數(shù)研究者將推薦技術(shù)分為3類(lèi):基于協(xié)同的推薦(協(xié)同過(guò)濾)、基于內(nèi)容的推薦和混合推薦技術(shù).
a.協(xié)同過(guò)濾系統(tǒng).協(xié)同過(guò)濾系統(tǒng)是最早被提出并得到廣泛應(yīng)用的推薦系統(tǒng),其核心思想可以分為兩部分[99].首先,利用用戶的歷史信息計(jì)算用戶之間的相似性;然后,利用與目標(biāo)用戶相似性較高的鄰居對(duì)其它產(chǎn)品的評(píng)價(jià)來(lái)預(yù)測(cè)目標(biāo)用戶對(duì)特定產(chǎn)品的喜好程度.系統(tǒng)根據(jù)這一喜好程度來(lái)對(duì)目標(biāo)用戶進(jìn)行推薦.協(xié)同過(guò)濾推薦系統(tǒng)最大的優(yōu)點(diǎn)是對(duì)推薦對(duì)象沒(méi)有特殊的要求,能處理音樂(lè)、電影等難以進(jìn)行文本結(jié)構(gòu)化表示的對(duì)象.Grundy被認(rèn)為是第一個(gè)投入應(yīng)用的協(xié)同過(guò)濾系統(tǒng)[100],該系統(tǒng)通過(guò)建立用戶興趣模型給用戶推薦相關(guān)的書(shū)籍;Tapestry郵件處理系統(tǒng)人工確定用戶之間的相似度[101];GroupLens建立用戶信息群,群內(nèi)的用戶可以發(fā)布自己的信息,依據(jù)社會(huì)信息過(guò)濾系統(tǒng)計(jì)算用戶之間的相似性,進(jìn)而向群內(nèi)的其他用戶進(jìn)行協(xié)同推薦[102];Ringo利用社會(huì)信息過(guò)濾方法向用戶推薦音樂(lè)[103].其它利用協(xié)同過(guò)濾方法進(jìn)行推薦的系統(tǒng)還有Amazon的書(shū)籍推薦系統(tǒng)[104]等.雖然協(xié)同過(guò)濾推薦系統(tǒng)得到了廣泛應(yīng)用,但是也面臨很多問(wèn)題,如新用戶或新產(chǎn)品推薦問(wèn)題(冷啟動(dòng)問(wèn)題)、打分稀疏性問(wèn)題、算法可擴(kuò)展性問(wèn)題等.
b.基于內(nèi)容的推薦.基于內(nèi)容的推薦不是依據(jù)用戶對(duì)項(xiàng)目的評(píng)價(jià)意見(jiàn),而是依據(jù)用戶已經(jīng)選擇的產(chǎn)品內(nèi)容信息來(lái)計(jì)算用戶和產(chǎn)品之間的匹配度,進(jìn)而進(jìn)行相應(yīng)的推薦.基于內(nèi)容的推薦算法的根本之處在于信息獲取和信息過(guò)濾[105],關(guān)鍵在于內(nèi)容信息的獲取和匹配.因?yàn)槲谋拘畔@取與過(guò)濾方面的研究較為成熟,多數(shù)基于內(nèi)容的推薦系統(tǒng)都建立在對(duì)產(chǎn)品的文本分析上.在大多數(shù)的基于內(nèi)容的推薦系統(tǒng)中,產(chǎn)品內(nèi)容常常被描述成關(guān)鍵詞.Fab系統(tǒng)[106]就是一個(gè)典型的例子,它用一個(gè)網(wǎng)頁(yè)中最重要的100個(gè)關(guān)鍵詞來(lái)表征這個(gè)網(wǎng)頁(yè);而Syskill &Webert系統(tǒng)[107]則用128個(gè)信息量最多的詞表示一個(gè)文件,系統(tǒng)根據(jù)文本相似性推薦與用戶過(guò)去喜歡的產(chǎn)品最為相似的產(chǎn)品[106-107].基于內(nèi)容的推薦系統(tǒng)中,用戶的配置文件構(gòu)建與更新是其中最為核心的部分之一,也是目前研究人員關(guān)注的焦點(diǎn).例如Somlo和Howe[108]以及Zhang等[109]提出了利用自適應(yīng)過(guò)濾技術(shù)更新用戶配置文件;Chang等[110]通過(guò)區(qū)分長(zhǎng)期感興趣與短期感興趣的關(guān)鍵詞,賦予短期感興趣的關(guān)鍵詞更高的權(quán)重,在此基礎(chǔ)上建立新的關(guān)鍵詞更新樹(shù),從而大大減少了更新配置文件的代價(jià).Degemmis等[111]利用WordNet構(gòu)建基于語(yǔ)義學(xué)的用戶配置文件,配置文件通過(guò)機(jī)器學(xué)習(xí)和文本分類(lèi)算法得到,里面包含了用戶喜好的語(yǔ)義信息,而不僅僅是關(guān)鍵詞集.基于內(nèi)容的推薦系統(tǒng)不可避免地受到信息獲取技術(shù)的約束,例如自動(dòng)提取多媒體數(shù)據(jù)(圖形、視頻流、聲音流等)的內(nèi)容特征具有技術(shù)上的困難,使得這方面的相關(guān)應(yīng)用受到了很大限制.
c.混合推薦技術(shù).如前所述,協(xié)同過(guò)濾和基于內(nèi)容的推薦算法在投入實(shí)際運(yùn)營(yíng)的時(shí)候都有各自的缺陷.因此,實(shí)際運(yùn)營(yíng)的推薦系統(tǒng)常將兩種甚至多種推薦算法進(jìn)行結(jié)合,即采用混合推薦算法.針對(duì)實(shí)際數(shù)據(jù)的研究顯示這些混合推薦系統(tǒng)普遍具有比上述獨(dú)立的推薦系統(tǒng)更好的準(zhǔn)確率[112-114].建立混合推薦系統(tǒng)的方法之一是獨(dú)立地實(shí)現(xiàn)協(xié)同過(guò)濾和運(yùn)用基于內(nèi)容的推薦算法,然后將兩種推薦結(jié)果結(jié)合起來(lái),利用預(yù)測(cè)打分的線性組合進(jìn)行推薦[115];又或者,只推薦某一時(shí)刻在某一個(gè)評(píng)價(jià)指標(biāo)下表現(xiàn)更好的算法的結(jié)果.例如,Daily Learner系統(tǒng)[116]就選擇在某一時(shí)刻更可信的結(jié)果進(jìn)行推薦,而文獻(xiàn)[117]選擇一個(gè)與用戶過(guò)去的打分相一致的結(jié)果進(jìn)行推薦.另外常見(jiàn)的方法是在一種推薦算法的框架中嵌入另外的算法作為某一個(gè)輔助部分.例如,Melville等[118]利用基于文本分析的方法在協(xié)同過(guò)濾系統(tǒng)中用戶的打分向量上增加一個(gè)附加打分,附加分高的用戶的信息優(yōu)先推薦給其他用戶;Aciar等[119]利用文本挖掘技術(shù)分析用戶對(duì)產(chǎn)品的評(píng)論信息,提出基于知識(shí)和協(xié)同過(guò)濾的混合推薦系統(tǒng).
除了上面3類(lèi)方法以外,多種數(shù)據(jù)分析技術(shù),如數(shù)據(jù)分類(lèi)、數(shù)據(jù)聚類(lèi)、Bayesian網(wǎng)絡(luò)、關(guān)聯(lián)規(guī)則、K-means方法、神經(jīng)網(wǎng)絡(luò)、線性回歸、最大熵方法、云模型、多示例學(xué)習(xí)等均被用于推薦系統(tǒng),此處不再贅述.此外,用戶的行為特征、個(gè)性化的領(lǐng)域知識(shí)等也被用于個(gè)性化推薦系統(tǒng).
鏈路預(yù)測(cè)(link prediction)問(wèn)題是指通過(guò)對(duì)已知網(wǎng)絡(luò)結(jié)構(gòu)的分析,包括一些可能的節(jié)點(diǎn)的其它信息,來(lái)評(píng)估尚不相連的兩個(gè)點(diǎn)之間產(chǎn)生鏈接的可能性,進(jìn)而實(shí)現(xiàn)預(yù)測(cè)[120].該問(wèn)題具有重要的應(yīng)用價(jià)值,并且可以對(duì)網(wǎng)絡(luò)科學(xué)的理論研究,特別是網(wǎng)絡(luò)演化規(guī)則和節(jié)點(diǎn)相似性指標(biāo)的評(píng)判問(wèn)題起到重要的貢獻(xiàn).下面從實(shí)際應(yīng)用和理論意義兩個(gè)方面敘述.
很多生物網(wǎng)絡(luò),例如蛋白質(zhì)相互作用網(wǎng)絡(luò)和新陳代謝網(wǎng)絡(luò),節(jié)點(diǎn)之間是否存在鏈路,或者說(shuō)是否存在相互作用,需要通過(guò)大量實(shí)驗(yàn)結(jié)果進(jìn)行推斷.僅以蛋白質(zhì)相互作用網(wǎng)絡(luò)為例,酵母菌蛋白質(zhì)之間80%的相互作用不為人們所知[121],而對(duì)于人類(lèi)自身,知道的僅有可憐的0.3%[122-123].由于揭示這類(lèi)網(wǎng)絡(luò)中隱而未現(xiàn)的鏈接需要耗費(fèi)高額的實(shí)驗(yàn)成本,如果能夠在已知結(jié)構(gòu)的基礎(chǔ)上設(shè)計(jì)出足夠精確的鏈路預(yù)測(cè)算法,再利用預(yù)測(cè)的結(jié)果指導(dǎo)試驗(yàn),就有可能非常明顯地降低試驗(yàn)成本并加快揭開(kāi)這類(lèi)網(wǎng)絡(luò)真實(shí)面目的步伐.實(shí)際上,社會(huì)網(wǎng)絡(luò)分析中也會(huì)遇到數(shù)據(jù)不全的問(wèn)題,這時(shí)候鏈路預(yù)測(cè)同樣可以作為準(zhǔn)確分析社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)的有力輔助工具[124-125].除了幫助分析數(shù)據(jù)缺失的網(wǎng)絡(luò),鏈路預(yù)測(cè)算法還可以用于分析演化網(wǎng)絡(luò).舉例來(lái)說(shuō),近幾年在線社會(huì)網(wǎng)絡(luò)發(fā)展非常迅速[126],鏈路預(yù)測(cè)可以基于當(dāng)前的網(wǎng)絡(luò)結(jié)構(gòu)去預(yù)測(cè)哪些現(xiàn)在尚未結(jié)交的用戶“應(yīng)該是朋友”,并將此結(jié)果作為“朋友推薦”發(fā)送給用戶.如果預(yù)測(cè)足夠準(zhǔn)確,顯然有助于提高相關(guān)網(wǎng)站在用戶心目中的地位.另外,鏈路預(yù)測(cè)的思想和方法,還可以用于在已知部分節(jié)點(diǎn)類(lèi)型的網(wǎng)絡(luò)(partially labeled networks)中預(yù)測(cè)未標(biāo)簽節(jié)點(diǎn)的類(lèi)型——這可以用于判斷一篇學(xué)術(shù)論文的類(lèi)型[127]或者判斷一個(gè)手機(jī)用戶是否產(chǎn)生了切換運(yùn)營(yíng)商(如從移動(dòng)到聯(lián)通)的念頭[128],以及用于糾正觀察到的網(wǎng)絡(luò)結(jié)構(gòu)中可能存在的錯(cuò)誤[129],因?yàn)楹芏鄻?gòu)建生物網(wǎng)絡(luò)的實(shí)驗(yàn)中存在曖昧不清甚至自相矛盾的數(shù)據(jù)[130].
鏈路預(yù)測(cè)的研究可以從理論上幫助認(rèn)識(shí)復(fù)雜網(wǎng)絡(luò)演化的機(jī)制.針對(duì)同一個(gè)或者同一類(lèi)網(wǎng)絡(luò),很多模型都提供了可能的網(wǎng)絡(luò)演化機(jī)制[50,131].由于刻畫(huà)網(wǎng)絡(luò)結(jié)構(gòu)特征的統(tǒng)計(jì)量非常多,很難比較不同的機(jī)制孰優(yōu)孰劣,鏈路預(yù)測(cè)機(jī)制有望為演化網(wǎng)絡(luò)提供一個(gè)簡(jiǎn)單統(tǒng)一且較為公平的比較平臺(tái),從而大大推動(dòng)復(fù)雜網(wǎng)絡(luò)演化模型的理論研究.另外,如何刻畫(huà)網(wǎng)絡(luò)中節(jié)點(diǎn)的相似性也是一個(gè)重大的理論問(wèn)題[132],這個(gè)問(wèn)題和網(wǎng)絡(luò)聚類(lèi)等應(yīng)用息息相關(guān)[133].類(lèi)似地,相似性的度量指標(biāo)數(shù)不勝數(shù),只有能夠快速準(zhǔn)確地評(píng)估某種相似性定義是否能夠很好刻畫(huà)一個(gè)給定網(wǎng)絡(luò)節(jié)點(diǎn)間的關(guān)系,才能進(jìn)一步研究網(wǎng)絡(luò)特征對(duì)相似性指標(biāo)選擇的影響.在這個(gè)方面,鏈路預(yù)測(cè)可以起到核心技術(shù)的作用.鏈路預(yù)測(cè)問(wèn)題本身也帶來(lái)了有趣且有重要價(jià)值的理論問(wèn)題,也就是通過(guò)構(gòu)造網(wǎng)絡(luò)系綜并藉此利用最大似然估計(jì)的方法進(jìn)行鏈路預(yù)測(cè)的可能性和可行性研究.這方面的研究對(duì)于鏈路預(yù)測(cè)本身以及復(fù)雜網(wǎng)絡(luò)研究理論基礎(chǔ)的建立和完善,可以起到推動(dòng)和借鑒的作用.
近幾年,基于節(jié)點(diǎn)相似性的鏈路預(yù)測(cè)框架受到了廣泛的關(guān)注,在該框架中,兩個(gè)節(jié)點(diǎn)之間相似性(或者相近性)越大,就認(rèn)為它們之間存在鏈接的可能性越大.盡管這個(gè)框架非常簡(jiǎn)單,但是相似性定義本身內(nèi)涵豐富,它既可以是非常簡(jiǎn)單的共同鄰居的個(gè)數(shù),也可以是包含了復(fù)雜數(shù)學(xué)物理內(nèi)容的諸如隨機(jī)游走的平均通訊時(shí)間[134]或者矩陣森林?jǐn)?shù)目[135].因此,這個(gè)簡(jiǎn)單的框架事實(shí)上提供了無(wú)窮無(wú)盡的可能性.Liben-Nowell和Kleinberg[136]將相似性指標(biāo)分為基于節(jié)點(diǎn)和基于路徑兩類(lèi),并分析了若干指標(biāo)對(duì)社會(huì)合作網(wǎng)絡(luò)中鏈路預(yù)測(cè)的效果.他們發(fā)現(xiàn),在僅考慮節(jié)點(diǎn)鄰居信息的若干指標(biāo)中,Adamic-Adar參數(shù)[137]表現(xiàn)最好.周濤、呂琳媛和張翼成[138]在6種不同網(wǎng)絡(luò)中比較了9種局部相似性指標(biāo)在鏈路預(yù)測(cè)中的效果,并提出了兩種新指標(biāo):資源分配指標(biāo)(resource allocation index)和局部路徑指標(biāo)(local path index).研究發(fā)現(xiàn),新提出來(lái)的這兩種指標(biāo)具有明顯好于包括Adamic-Adar參數(shù)在內(nèi)的9種已知指標(biāo)的預(yù)測(cè)能力.最近其它小組的研究結(jié)果顯示,新提出來(lái)的相似性指標(biāo)在進(jìn)行群落劃分和含權(quán)網(wǎng)絡(luò)權(quán)重設(shè)置[139]的時(shí)候也比原有指標(biāo)好.呂琳媛、金慈航和周濤[140]進(jìn)一步在噪音強(qiáng)度可控的網(wǎng)絡(luò)模型與真實(shí)網(wǎng)絡(luò)中細(xì)致分析了局部路徑指標(biāo)的性能,發(fā)現(xiàn)這個(gè)指標(biāo)具有與依賴于網(wǎng)絡(luò)全局結(jié)構(gòu)信息的指標(biāo)(如Katz參數(shù)[141])可匹敵的預(yù)測(cè)能力,甚至在噪聲較大的情況下可以比Katz參數(shù)預(yù)測(cè)得更加準(zhǔn)確.局部路徑指標(biāo)是一個(gè)計(jì)算量非常小的局部參數(shù),其應(yīng)用前景可觀.劉偉平和呂琳媛[142]比較研究了一些基于隨機(jī)游走的相似性指標(biāo),并提出了兩種局部隨機(jī)游走指標(biāo),他們發(fā)現(xiàn)有限步的隨機(jī)游走反而可以給出超過(guò)全局收斂后的預(yù)測(cè)精度,而最優(yōu)的游走步數(shù)受到網(wǎng)絡(luò)平均距離的強(qiáng)烈影響.另外,Huang等的實(shí)驗(yàn)結(jié)果暗示[143],在得到節(jié)點(diǎn)間的直接相似性后,利用協(xié)同過(guò)濾技術(shù)對(duì)相似性指標(biāo)進(jìn)行一輪加權(quán)處理,一般而言可以得到更好的結(jié)果.
最近,最大似然估計(jì)方法被嘗試應(yīng)用于鏈路預(yù)測(cè)中.Clauset,Moore和Newman[144]認(rèn)為很多網(wǎng)絡(luò)的連接可以看作某種內(nèi)在層次結(jié)構(gòu)的反映.基于此,他們提出了一種最大似然估計(jì)的算法進(jìn)行鏈路預(yù)測(cè),這種方法在處理具有明顯層次組織的網(wǎng)絡(luò),如恐怖襲擊網(wǎng)絡(luò)和草原食物鏈,具有較好的精確度.Guimera和Sales-Pardo[129]假設(shè)觀察到的網(wǎng)絡(luò)是一個(gè)隨機(jī)分塊模型(stochastic block model[145])的一次實(shí)現(xiàn),在該模型中節(jié)點(diǎn)被分作若干的集合,兩個(gè)節(jié)點(diǎn)間連接的概率只和相應(yīng)的集合有關(guān).Guimera和Sales-Pardo[129]提出了基于隨機(jī)分塊模型的最大似然估計(jì)方法,將其用于鏈路預(yù)測(cè),可以得到比Clauset,Moore和Newman更好的結(jié)果.
另外一個(gè)需要特別注意的趨勢(shì),是隨著一些原來(lái)從事復(fù)雜網(wǎng)絡(luò)研究的學(xué)者對(duì)鏈路預(yù)測(cè)問(wèn)題的關(guān)注,很多復(fù)雜網(wǎng)絡(luò),特別是社會(huì)網(wǎng)絡(luò)分析中遇到的理論與方法被應(yīng)用到鏈路預(yù)測(cè)中.例如呂琳媛和周濤[146]發(fā)現(xiàn)在針對(duì)某些含權(quán)網(wǎng)絡(luò)進(jìn)行鏈路預(yù)測(cè)的時(shí)候,權(quán)重很小的邊反而起到了比高權(quán)重邊更大的作用,這與社會(huì)網(wǎng)絡(luò)研究中廣為人知的“弱連接理論”[147]有深刻的關(guān)聯(lián).Leskovec,Huttenlocher和Kleinberg[148]則注意到了近期“社會(huì)平衡理論”的定量化研究成果[149-150],并在此啟發(fā)下設(shè)計(jì)了可以預(yù)測(cè)網(wǎng)絡(luò)中的正負(fù)(友敵)鏈接的算法.
由于一方面受阻于網(wǎng)絡(luò)節(jié)點(diǎn)外在屬性在獲取上的難度,另一方面受益于復(fù)雜網(wǎng)絡(luò)研究的快速發(fā)展,鏈路預(yù)測(cè)問(wèn)題的主要研究熱點(diǎn)逐漸從依賴于節(jié)點(diǎn)屬性的方法轉(zhuǎn)移到只利用網(wǎng)絡(luò)結(jié)構(gòu)信息的方法上.顯然,后者在理論上也更優(yōu)美簡(jiǎn)潔.不過(guò),這個(gè)方面的研究主要集中在社會(huì)網(wǎng)絡(luò)上,尚欠對(duì)于大量算法在各種不同網(wǎng)絡(luò)中預(yù)測(cè)能力的系統(tǒng)分析和總結(jié).另外,目前還沒(méi)有算法性能和網(wǎng)絡(luò)結(jié)構(gòu)特征之間關(guān)系的較深入的研究.對(duì)于比較復(fù)雜的網(wǎng)絡(luò),例如含權(quán)網(wǎng)絡(luò)、有向網(wǎng)絡(luò)和多部分網(wǎng)絡(luò)的討論雖然有,但非常少,也不系統(tǒng),相關(guān)的研究應(yīng)該是近幾年該方向的主流.
網(wǎng)絡(luò)系綜理論和與之關(guān)聯(lián)的網(wǎng)絡(luò)熵的概念以及最大似然估計(jì)方法有望推動(dòng)形成復(fù)雜網(wǎng)絡(luò)的統(tǒng)計(jì)力學(xué)理論基礎(chǔ).這方面研究存在一個(gè)問(wèn)題是熵的精確計(jì)算復(fù)雜性非常大,對(duì)于大規(guī)模網(wǎng)絡(luò)而言往往不能實(shí)現(xiàn).最近的一些鏈路預(yù)測(cè)算法已經(jīng)應(yīng)用了網(wǎng)絡(luò)系綜和最大似然的概念,但是這些算法計(jì)算復(fù)雜性很大,精確性也不是很高[129],例如文獻(xiàn)[144]的方法目前只能處理數(shù)千節(jié)點(diǎn)的網(wǎng)絡(luò),且其預(yù)測(cè)效果對(duì)于不具有明確層次結(jié)構(gòu)的網(wǎng)絡(luò)并不好.作者認(rèn)為以下兩個(gè)問(wèn)題應(yīng)該是目前國(guó)際上相關(guān)研究小組比較關(guān)注的:一是如何以網(wǎng)絡(luò)系綜理論為基礎(chǔ),建立網(wǎng)絡(luò)鏈路預(yù)測(cè)的理論框架,并產(chǎn)生對(duì)實(shí)際預(yù)測(cè)有指導(dǎo)作用的理論結(jié)論,例如通過(guò)對(duì)網(wǎng)絡(luò)結(jié)構(gòu)的統(tǒng)計(jì)分析估算可預(yù)測(cè)的極限,指導(dǎo)選擇不同的預(yù)測(cè)方法等;二是如何設(shè)計(jì)高效的算法來(lái)處理大規(guī)模網(wǎng)絡(luò)的鏈路預(yù)測(cè)問(wèn)題.網(wǎng)絡(luò)系綜理論和鏈路預(yù)測(cè)的深度結(jié)合很可能成為西北大學(xué)研究組最近關(guān)注的焦點(diǎn).
最近10年,復(fù)雜網(wǎng)絡(luò)研究在很多科學(xué)分支,包括物理、生物、計(jì)算機(jī)等領(lǐng)域掀起高潮[151],其中相當(dāng)一部分研究立足于揭示網(wǎng)絡(luò)演化的內(nèi)在驅(qū)動(dòng)因素.僅以無(wú)標(biāo)度網(wǎng)絡(luò)(scale-free networks)為例[152],已經(jīng)報(bào)道的可以產(chǎn)生冪律度分布的機(jī)制就包括了富者愈富(rich-get-richer)機(jī)制[56]、好者變富(goodget-richer)機(jī)制[153]、優(yōu)化設(shè)計(jì)(optimal design)驅(qū)動(dòng)[154]、哈密頓動(dòng)力學(xué)(Hamiltonian dynamics)驅(qū)動(dòng)[155]、聚生(merging and regeneration)機(jī)制[156]、穩(wěn)定性限制(stability constraints)驅(qū)動(dòng)[157]等.可是,由于刻畫(huà)網(wǎng)絡(luò)結(jié)構(gòu)特征的統(tǒng)計(jì)指標(biāo)非常多,很難比較和判定什么樣的機(jī)制能夠更好再現(xiàn)真實(shí)網(wǎng)絡(luò)的生長(zhǎng)特性.利用鏈路預(yù)測(cè)有望建立簡(jiǎn)單的比較平臺(tái),能夠在知道目標(biāo)網(wǎng)絡(luò)演化情況的基礎(chǔ)上量化比較各種不同機(jī)制對(duì)于真實(shí)生長(zhǎng)行為的預(yù)測(cè)能力,從而可以大大推動(dòng)復(fù)雜網(wǎng)絡(luò)演化機(jī)制的相關(guān)研究.Guimera和Sales-Pardo在提到網(wǎng)絡(luò)重建(network reconstruction)的時(shí)候已經(jīng)表達(dá)了相近的思想,但是這方面的研究尚未見(jiàn)報(bào)道.盡管有論文討論了如何將鏈路預(yù)測(cè)的方法和思想與一些應(yīng)用問(wèn)題,例如部分標(biāo)號(hào)網(wǎng)絡(luò)的節(jié)點(diǎn)類(lèi)型預(yù)測(cè)[158]與信息推薦問(wèn)題[159]、相聯(lián)系的可能性與方法問(wèn)題.但是,目前尚缺乏對(duì)于大規(guī)模真實(shí)數(shù)據(jù)在應(yīng)用層面的深入分析和研究.這方面的研究不僅僅具有實(shí)用價(jià)值,而且有助于揭示鏈路預(yù)測(cè)這個(gè)問(wèn)題本身存在的優(yōu)勢(shì)與局限性.
[1] Barabási A L.The origin of bursts and heavy tails in human dynamics[J].Nature,2005,435(7039):207-211.
[2] Oliveira J G,Barabási A L.Human dynamics:Darwin and Einstein correspondence patterns[J].Nature,2005,437(7063):1251.
[3] Plerou V,Gopikrishnan P,Amaral L A N,et al.Economic fluctuations and anomalous diffusion[J].Phys Rev E,2000,62(3):3023-3026.
[4] Masoliver J,Montero M,Weiss G H.Continuous-time random-walk model for financial distributions[J].Physical Review E,2003,67(2):021112.
[5] Politi M,Scalas E.Fitting the empirical distribution of intertrade durations[J].Physica A,2008,387(8/9):2025-2034.
[6] Jiang Z Q,Chen W,Zhou W X.Scaling in the distribution of intertrade durations of Chinese stocks[J].Physica A,2009,387(23):5818-5825.
[7] Dezs?Z,Almaas E,Lukács A,et al.Dynamics of information access on the web[J].Physical Review E,2006,73(6):066132.
[8] Goncalves B,Ramasco J J.Human dynamics revealed through Web analytics[J].Physical Review E,2008,78(2):026123.
[9] Zhou T,Kiet H A T,Kim B J,et al.Role of activity in human dynamics[J].Europhysics Letters,2008,82(2):28002.
[10] Hu H B,Han D Y.Empirical analysis of individual popularity and activity on an online music service system[J].Physica A,2008,387(23):5916-5921.
[11] Candia J,González M C,Wang P,et al.Uncovering individual and collective human dynamics from mobile phone records[J].Journal of Physics A:Mathematical and Theoretical,2008,41(22):224015.
[12] Henderson T,Nhatti S.Modelling user behavior in networked games[C]//Proc 9th ACM Int Conf on Multimetia.New York:ACM Press,2001:212.
[13] Grabowski A,Kruszewska N,Kosiński R A.Dynamic phenomena and human activity in an artificial society[J].Physical Review E,2008,78(6):066110.
[14] Baek S K,Kim T Y,Kim B J.Testing apriority-based queue model with Linux command histories[J].Physica A,2008,387(14):3660-3668.
[15] Goh K I,Barabási A L.Burstiness and memory in complex systems[J].Europhysics Letters.2008,81(4):48002.
[16] Vázquez A.Exact results for the Barabási model of human dynamics[J].Physical Review Letters,2005,95(24):248710.
[17] Vázquez A,Oliveira J G,Dezs?Z,et al.Modeling bursts and heavy tails in human dynamics[J].Physical Review E,2006,73(3):036127.
[18] Gabrielli A,Caldarelli G.Invasion percolation and critical transient in the Barabási model of human dynamics[J].Physical Review Letters,2007,98(20):208701.
[19] Oliveira J G,Vázquez A.Impact of interactions on human dynamics[J].Physica A,2009,388(2/3):187-192.
[20] Vázquez A.Impact of memory on human dynamics[J].Physica A,2007,373:747-752.
[21] Cesar A,Hidalgo R.Conditions for the emergence of scaling in the inter-event time of uncorrelated and seasonal systems[J].Physica A,2006,369(2):877-883.
[22] Malmgren R D,Stouffer D B,Motter A E,et al.A Poissonian explanation for heavy tails in E-mail communication[J].PNAS,2008,105(47):18153-18158.
[23] Vázquez A,Rácz B,Lukács A.Impact of non-Poissonian activity patterns on spreading processes[J].Physical Review Letters,2007,98(15):158702.
[24] Brockmann D,Hufnagel L,Geisel T.The scaling laws of human travel[J].Nature,2006,439(7075):462-465.
[25] Gonzalez M C,Hidalgo C A,Barabási A L.Understanding individual human mobility patterns[J].Nature,2008,453(7196):779-782.
[26] Rhee I,Shin M,Hong S,et al.On the levy-walk nature of human mobility[C]//Proceedings of INFOCOM 2008.Phoenix:IEEE Press,2008:924-932.
[27] Bartumeus F,Peters F,Pueyo S,et al.Helical Lévy walks:adjusting searching statistics to resource availability in microzooplankton[J].PNAS,2003,100(22):12771-12775.
[28] Ramos-Fernandez G,Mateos J L,Miramontes O,et al.Lévy walk patterns in the foraging movements of spider monkeys(Ateles geoffroyi)[J].Behavioral Ecology and Sociobiology,2004,55(3):223-230.
[29] Sims D W,Southall E J,Humphries N E,et al.Scaling laws of marine predator search behaviour[J].Nature,2008,451(7182):1098-1102.
[30] Viswanathan G M,Buldyrev S V,Havlin S,et al.Optimizing the success of random searches[J].Nature,1999,401(6756):911-914.
[31] Bartumeus F,Catalan J,F(xiàn)ulco U L,et al.Optimizing the encounter rate in biological interactions:Lévy versus Brownian strategies[J].Physical Review Letters,2002,88(9):097901.
[32] Reynolds A M.Scale-free movement patterns arising from olfactory-driven foraging[J].Physical Review E,2005,72(4):041928.
[33] Santos M C,Boyer D,Miramontes O,et al.Origin of power-law distributions in deterministic walks:the influence of landscape geometry[J].Physical Review E,2007,75(6):061114.
[34] Zanette D H.Dynamics of rumor propagation on smallworld networks[J].Phy Rev E,2002,65(4):041908.
[35] Karsai M,Kivel?M,Pan R K,et al.Small but slow world:how network topology and burstiness slow down spreading[J].Phy Rev E,2011,83(2):025102.
[36] Yang Z,Cui A X,Zhou T.Impact of heterogeneous human activities on epidemic spreading[J].Physica A,2010,390(23/24):4543-4548.
[37] Ni S,Weng W.Impact of travel patterns on epidemic dynamics in heterogeneous spatial metapopulation networks[J].Phys Rev E,2009,79(1):016111.
[38] Hufnagel L,Brockmann D,Geisel T.Forecast and control of epidemics in a globalized world[J].PNAS,2004,101(42):15124-15219.
[39] Colizza V,Barrat A,Barthelemy M,et al.The role of the airline transportation network in the prediction and predictability of global epidemics[J].PNAS,2006,103(7):2015-2020.
[40] 周濤.在線電影點(diǎn)播中的人類(lèi)動(dòng)力學(xué)模式[J].復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2008,5(1):1-5.
[41] Hong W,Han X P,Zhou T,et al.Heavy-tailed statistics in short-message communication[J].Chin Phys Lett,2009,26(2):28902.
[42] 李楠楠,張寧,周濤.人類(lèi)通信模式中基于時(shí)間統(tǒng)計(jì)的實(shí)證研究[J].復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2008,5(3):43-47.
[43] Li N N,Zhang N,Zhou T.Empirical analysis on temporal statistics of human correspondence patterns.[J].Physica A,2008,387(25):6391-6394.
[44] 韓筱璞,周濤,汪秉宏.基于自適應(yīng)調(diào)節(jié)的人類(lèi)動(dòng)力學(xué)模型[J].復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2007,4(4):1-5.
[45] Han X P,Zhou T,Wang B H.Modeling human dynamics with adaptive interest[J].New Journal of Physics,2008,10(7):073010.
[46] 李楠楠,周濤,張寧.人類(lèi)動(dòng)力學(xué)基本概念與實(shí)證分析[J].復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2008,5(2):15-24.
[47] 郭進(jìn)利,周濤,李季明,等.人類(lèi)動(dòng)力學(xué)模型[M].香港:上海系統(tǒng)科學(xué)出版社,2008.
[48] Zhou T,Han X P,Wang B H.Towards the understanding of human dynamics[M]//Burguete M, Lam eds L.Science Matters—Humanities as Complex Systems.Singapore:World Scientific Publishing,2008:207-233.
[49] Albert R,Barabási A L.Statistical mechanics of complex networks[J].Rev Mod Phys,2002,74(1):47-97.
[50] Boccaletti S,Latora V,Moreno Y,et al.Complex networks:structure and dynamics[J].Physics Reports,2006,424(4/5):175-308.
[51] Jeong H,Mason S P,Barabási A L,et al.Lethality and centrality in protein networks[J].Nature,2001,411(6833):41-42.
[52] Jeong H,Tombor B,Albert R,et al.The large-scale organization of metabolic networks[J].Nature,2000,407(6804):651-654.
[53] Adamic L A,Huberman B A.Power-law distribution of the eorld wide web[J].Science,2000,287(5461):2115.
[54] Watts D J,Strogatz S H.Collective dynamics of smallworld networks[J].Nature,1998,393(6684):440-442.
[55] Barabási A L,Albert R.Emergence of scaling in random networks[J].Science,1999,286(5439):509-512.
[56] Scannell J W,Burns G A P C,Hilgetag C C,et al.The connectional organization of the cortico-thalamic system of the cat[J].Cerebral Cortex,1999,9(3):277-299.
[57] Sporns O,Chialvo D R,Kaiser M,et al.Organization,development and function of complex brain networks[J].Trends in Cognitive Sciences,2004,8(9):418-425.
[58] Motter A E,Matias M A,Kurths J,et al.Dynamics on complex networks and applications[J].Physica D,2006,224(1/2):0612068.
[59] Engel A K,F(xiàn)ries P,Singer W.Dynamic predictions:oscillations and synchrony in top-down processing[J].Nature Reviews Neuroscience,2001,2(10):704-716.
[60] Fries P.Amechanismfor cognitive dynamics:neuronal communication through neuronal coherence[J].Trends in Cognitive Sciences,2005,9(10):474-480.
[61] Arenas A,Díaz-Guilera A,Kurths J,et al.Synchronization in complex networks[J].Physics Reports,2008,469(3):93-153.
[62] Kori H,Mikhailov A S.Entrainment of randomly coupled oscillator networks by apacemaker[J].Phys Rev Lett,2004,93(25):254101.
[63] Kori H,Mikhailov A S.Strong effects of network architecture in the entrainment of coupled oscillator systems[J].Phys Rev E,2006,74(6):066115.
[64] Kiss I Z,Rusin C G,Kori H,et al.Engineering complex dynamical structures:sequential patterns and desynchronization[J].Science,2007,316(5833):1886-1889.
[65] Barahona M,Pecora L M.Synchronization in smallworld systems[J].Phys Rev Lett,2002,89(5):054101.
[66] Nishikawa T,Motter A E,Lai Y C,et al.Heterogeneity in oscillator networks:are smaller world easier to synchronize[J].Phys Rev Lett,2003,91(1):014101.
[67] Hwang D U,Chavez M,Amann A,et al.Synchronization in complex networks with age ordering[J].Phys Rev Lett,2005,94(13):138701.
[68] Chavez M,Hwang D U,Amann A,et al.Synchronization is enhanced in weighted complex networks[J].Phys Rev Lett,2005,94(21):218701.
[69] Zhao M,Zhou T,Wang B H,et al.Enhanced synchronizability by structural perturbations[J].Phys Rev E,2005,72(5):057102.
[70] Lu Y F,Zhao M,Zhou T,et al.Enhance synchronizability via age-based coupling[J].Phys Rev E,2007,76(5):057103.
[71] Donetti L,Hurtado P I,Munoz M A.Entangled networks,synchronization,and optimal network topology[J].Phys Rev lett,2005,95(18):188701.
[72] Newman M E J,Girvan M.Finding and evaluating community structure in networks[J].Phys Rev E,2004,69(2):026113.
[73] Palla G,Derényi I,F(xiàn)arkas I,et al.Uncovering the overlapping community structure of complex networks in nature and society[J].Nature,2005,435(7043):814-818.
[74] Danon L,Díaz-Aguilera A,Duch J,et al.Comparing community structure identification[J].Journal of Statistical Mechanics:Theory and Experiment,2005,2005(9):P09008.
[75] Farkas I,ábel D,Palla G,et al.Weighted network modules[J].New Journal of Physics,2007,9(6):180.
[76] Huang L,Park K,Lai Y C,et al.Abnormal synchronization in complex clustered networks[J].Phys Rev Lett,2006,97(16):164101.
[79] Boccaletti S,Ivanchenko M,Latora V,et al.Detecting complex network modularity by dynamical clustering[J].Phys Rev E,2007,75(4):045102.
[80] Oh E,Rho K,Hong H,et al.Modular synchronization in complex networks[J].Phys Rev E,2005,72(4):047101.
[81] Oh E,Choi C,Kahng B,et al.Modular synchronization in complex networks with a gauge Kuramoto model[J].Europhys Lett,2008,83(6):68003.
[82] Ito J,Kaneko K.Spontaneous structure formation in a network of chaotic units with variable connection strengths[J].Phys Rev Lett,2001,88(2):028701.
[83] Gross T,Dommar D L C,Blasius B.Epidemic dynamics on an adaptive network[J].Phys Rev Lett,2006,96(20):208701.
[84] Zhou C S,Kurths J.Dynamical weights and enhanced synchronization in adaptive complex networks[J].Phys Rev Lett,2006,96(16):164102.
[85] Bassett D S,Bullmore E.Small-world brain networks[J].The Neuroscientist,2006,12(6):521-523.
[86] Bullmore E,Sporns O.Complex brain networks:graph theoretical analysis of the structural and functional systems[J].Nature Reviews Neuroscience,2009,10(3):186-198.
[87] Kaiser M,Hilgetag C C.Edge vulnerability in neural and metabolic networks[J].Biological Cybernetics,2004,90(5):311-317.
[88] Stam C J.Functional connectivity patterns of human magnetoencephalographic recordings:a small-world network[J].Neurosci Lett,2004,355(1/2):25-28.
[89] Stam C J,de Bruin E A.Scale-free dynamics of global functional connectivity in the human brain[J].Human Brain Mapping,2004,22(2):97-109.
[90] Salvador R,Suckling J,Coleman M R,et al.Neurophysiological architecture of functional magnetic resonance images of human brain[J].Cereb Cortex,2005,15(9):1332-1342.
[91] Fox M D,Snyder A Z,Vincent J L,et al.The human brain is intrinsically organized into dynamic,anticorrelated functional networks[J].PNAS,2005,102(27):9673-9678.
[92] Womelsdorf T,Schoffelen J M,Oostenveld R,et al.Modulation of neuronal interactions through neuronal synchronization[J].Science,2007,316(5831):1609-1612.
[93] Saalmann Y B,Pigarev I N,Vidyasagar T R.Neural mechanisms of visual attention:how top-down feedback highlights relevant locations[J].Science,2007,316(5831):1612-1615.
[94] Buschman T J,Miller E K.Top-down versus bottomup control of attention in the prefrontal and posterior parietal cortices[J].Science,2007,315(5820):1860-1862.
[95] Zhang G Q,Zhang G Q,Yang Q F,et al.Evolution of the Internet and its cores[J].New Journal of Physics,2008,10(12):123027
[96] Broder A,Kumar R,Moghoul F,et al.Graph structure in the web[J].Computer Networks,2000,33(1):309-320
[97] Adomavicius G,Tuzhilin A.Toward the next generation of recommender systems:a survey of the state-of-the-art and possible extensions[J].IEEE Transactions on Knowledge and Data Engineering,2005,17(6):734-749.
[98] Resnick P,Varian H R.Recommender systems[J].Communications of the ACM,1997,40(3):56-58.
[99] Herlocker J L,Konstan J A,Terveen L G,et al.Evaluating collaborative filtering recommender systems[J].ACM Transactions on Information Systems,2004,22(1):5-53.
[100] Rich E.User modeling via stereotypes[J].Cognitive Science,1979,3(4):329-354.
[101] Goldberg D,Nichols D,Oki B M,et al.Using collaborative filtering to weave an information tapestry[J].Communications of the ACM,1992,35(12):61-70.
[102] Konstan J A,Miller B N,Maltz D,et al.GroupLens:applying collaborative filtering to usenet news[J].Communications of the ACM,1997,40(3):77-87.
[103] Shardanand U,Maes P.Social information filtering:algorithms for automating“word of mouth”[C]//CHI’95 Proceedings of the SIGCHI Conference on Human Factors in Computing Systems.New York:ACM Press,1995:210-217.
[104] Linden G,Smith B,York J.Amazon.com recommendations:item-to-item collaborative filtering[J].IEEE Internet Computing,2003,7(1):76-80.
[105] Belkin N,Croft B.Information filtering and information retrieval[J].Communications of the ACM,1992,35(12):29-37.
[106] Balabanovic M,Shoham Y.Fab:content-based,collaborative recommendation[J].Communications of the ACM,1997,40(3):66-72
[107] Pazzani M,Billsus D.Learning and revising user profiles:the identification of interesting web sites[J].Machine Learning,1997,27(3):313-331
[108] Somlo G L,Howe A E.Adaptive lightweight text filtering[J].Lecture Notes in Computer Science,2001,2189:319-329
[109] Zhang Y,Callan J,Minka T.Novelty and redundancy detection in adaptive filtering[C]//Proceedings of the 25th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2002:81-88.
[110] Chang Y I,Shen J H,Chen T I.A data mining-based method for the incremental update of supporting personalized information filtering[J].Journal of Information Science and Engineering,2008,24(1):129-142
[111] Degemmis M,Lops P,Semeraro G.A contentcollaborative recommender that exploits WordNetbased user profiles for neighborhood formation[J].User Modeling and User-Adapted Interaction,2007,17(3):217-255
[112] 高瀅,齊紅,劉杰,等.結(jié)合似然關(guān)系模型和用戶等級(jí)的協(xié)同過(guò)濾推薦算法[J].計(jì)算機(jī)研究與發(fā)展,2007,44(6):1044-1052.
[113] Yoshii K,Goto M,Komatani K,et al.An efficient hybrid music recommender system using an incrementally trainable probabilistic generative model[J].IEEE Transactions on Audio Speech and Language Processing,2008,16(2):435-447.
[114] Girardi R,Marinho L B.A domain model of Web recommender systems based on usage mining and collaborative filtering[J].Requirements Engineering,2007,12(1):23-40.
[115] Pazzani M J.A framework for collaborative,contentbased,and demographic filtering[J].Artificial Intelligence Review,1999,13(5/6):393-408.
[116] Billsus D,Pazzani M J.User modeling for adaptive news access[J].User Modeling and Qser-Adapted Interaction,2000,10(2/3):147-180.
[117] Tran T,Cohen R.Hybrid recommender systems for electronic commerce[C]//Proc Knowledge-Based Electronic Markets.Palo Alto:AAAI Press,2000:78-83.
[118] Melville P,Mooney R J,Nagarajan R.Content-boosted collaborative filtering for improved recommendations[C]//Proceedings of the 2001 SIGIR Workshop on Recommender Systems.Palo Alto:AAAI Press,2002:187-192.
[119] Aciar S,Zhang D,Simoff S,et al.Informed recommender:basing recommendations on consumer product reviews[J].IEEE Intelligent Systems,2007,22(3):39-47.
[120] Getoor L,Diehl C P.Link mining:a survey[J].ACM SIGKDD Explorations Newsletter,2005,7(2):3-12.
[121] Yu H,Braun P,Yildinm M A,et al.High-quality binary protein interaction map of the yeast interactome network[J].Science,2008,322(5898):104-110.
[122] Stumpf M P H,Thorne T,de Silva E,et al.Estimating the size of the human interactome[J].PNAS,2008,105(19):6959-6964.
[123] Amaral L A N.A truer measure of our ignorance[J].PNAS,2008,105(19):6795-6796.
[124] Schafer J L,Graham J W.Missing data:our view of the state of the art[J].Psychological Methods,2002,7(2):147-177.
[125] Kossinets G.Effects of missing data in social networks[J].Social Networks,2006,28(3):247-268.
[126] Kumar R,Novak J,Tomkins A.Structure and evolution of online social networks[C]//Proceedings of the 12th ACM SIGKDD International Conference on Knowledge Discovery and Data mining.New York:ACM Press,2006:611-617.
[127] Gallagher B,Tong H,Eliassi-Rad T,et al.Using ghost edges for classification in sparsely labeled networks[C]//Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.New York:ACM Press,2008:256-264.
[128] Dasgupta K,Singh R,Viswanathan B,et al.Social ties and their relevance to churn in mobile telecom networks[C]//Proceedings of the 11th International Conference on Extending Database Technology:Advances in Database Technology.New York:ACM Press,2008:668-677.
[129] Guimera R,Sales-Pardo M.Missing and spurious interactions and the reconstruction of complex networks[J].PNAS,2009,106(52):22073-22078.
[130] von Mering C,Krause R,Snel B,et al.Comparative assessment of large-scale data sets of protein-protein interactions[J].Nature,2002,417(6887):399-403.
[131] Dorogovtsev S N,Mendes J F F.Evolution of networks[J].Advances in Physics,2002,51(4):1079-1187.
[132] Leicht E A,Holme P,Newman M E J.Vertex similarity in networks[J].Phys Rev E,2006,73(2):026120.
[133] Pan Y,Li D H,Liu J G,et al.Detecting community structure in complex networks via node similarity[J].Physica A,2010,389(14):2849-2857.
[134] Fouss F,Pirotte A,Renders J M,et al.Random-walk computation of similarities between nodes of a graph with application to collaborative recommendation[J].IEEE Transactions on Knowledge and Data Engineering,2007,19(3):355-369.
[135] Chebotarev P,Shamis E.The matrix-forest theorem and measuring relations in small social groups[J].Automation and Remote Control,1997,58(2):1505-1514.
[136] Liben-Nowell D,Kleinberg J.The link-prediction problem for social networks[J].Journal of the American Society for Information Science and Technology,2007,58(7):1019-1031.
[137] Adamic L A,Adar E.Friends and neighbors on the web[J].Social Networks,2003 25(3):211-230.
[138] Zhou T,LüL Y,Zhang Y C.Predicting missing links via local information[J].The European Physical Journal B,2009,71(4):623-630.
[139] Wang Y L,Zhou T,Shi J J,et al.Emipirical analysis of dependence between stations in Chinese railway network[J].Physica A,2009,388(14):2949-2955.
[140] LüL Y,Jin C H,Zhou T.Similarity index based on local paths for link prediction of complex networks[J].Phys Rev E,2009,80(4):046122.
[141] Katz L.A new status index derived from sociometric analysis[J].Psychometrika,1953,18(1):39-43.
[142] Liu W P,LüL Y.Link prediction based on local random walk[J].Europhys Lett,2010,89(5):58007.
[143] Huang Z,Li X,Chen H C.Link prediction approach to collaborative filtering[C]//Proceedings of the 5th ACM/IEEE-CS Joint Conference on Digital Libraries.New York:ACM Press,2005:141-142.
[144] Clauset A,Moore C,Newman M E J.Hierarchical structure and the prediction of missing links in networks[J].Nature,2008,453(7191):98-101.
[145] Holland P W,Laskey K B,Leinhardt S.Stochastic blockmodels:first steps[J].Social Networks,1983,5(2):109-137.
[146] LüL Y,Zhou T.Link prediction in weighted networks:the role of weak ties[J].Europhys Lett,2010,89(1):18001.
[147] Granovetter M S.The strength of weak ties[J].American Journal of Sociology,1973,78(6):1360-1380.
[148] Leskovec J,Huttenlocher D,Kleinberg J.Predicting positive and negative links in online social networks[C]//Proceedings of the 19th International Conference on World Wide Web.New York:ACM Press,2010:641-650.
[149] Antal T,Krapivsky P,Redner S.Dynamics of social balance on networks[J].Phys Rev E,2005,72(3):036121.
[150] Marvel S,Strogatz S,Kleinberg J.Energy landscape of social balance[J].Phys Rev Lett,2009,103(19):198701.
[151] Barabási A L.Scale-free networks:a decade and beyond[J].Science,2009,325(5939):412-413.
[152] Caldarelli G.Scale-free networks:complex webs in nature and technology[M].New York:Oxford Press,2007.
[153] Garlaschelli D,Capocci A,Caldarelli G.Self-organized network evolution coupled to extremal dynamics[J].Nature Physics,2007,3(11):813-817.
[154] Valverde S,Cancho R F,Sole R V.Scale-free networks from optimal design[J].Europhys Lett,2002,60(4):512.
[155] Baiesi M,Manna S S.Scale-free networks from a hamiltonian dynamics[J]Phys Rev E,2003,68(4):047103.
[156] Kim B J,Trusina A,Minnhagen P,et al.Self organized scale-free networks from merging and regeneration[J].The European Physical Journal B,2005,43(3):369-372.
[157] Perotti J I,Billoni O V,Tamarit F A,et al.Emergent self-organized complex network topology out of stability constraints[J].Phys Rev Lett,2009,103(10):108701.
[158] Sen P,Namata G,Bilgic M,et al.Collective classification in network data[J].AI Magazine,2008,29(3):93-106.
[159] Zhou T.Statistical mechanics of information systems:information filtering on complex networks[D].Fribourg:University of Fribourg,2010.