徐家越,盧才武,黃玉森
(1.西安建筑科技大學(xué)管理學(xué)院,西安 710055;2.西安建筑科技大學(xué)礦山系統(tǒng)工程研究所,西安 710055)
人工智能(artificial intelligence,AI)是計(jì)算機(jī)學(xué)科的重要分支.作為一門綜合性的交叉學(xué)科和邊緣學(xué)科[1],自1955年在美國達(dá)特莫斯大學(xué)(University of Dartmouth)首次提出以來[2],就得到社會(huì)各界的廣泛關(guān)注.從概念提出至今,人工智能的發(fā)展先后經(jīng)歷了形成期、知識(shí)應(yīng)用期和綜合集成期三個(gè)階段.在人工智能發(fā)展過程中,各個(gè)領(lǐng)域的學(xué)者們都創(chuàng)造出大量突出的研究成果.
在形成初期(1956-1970年),美國形成了多個(gè)人工智能研究組織,并在機(jī)器學(xué)習(xí)、定理證明、問題求解、LISP語言及模式識(shí)別方面取得了引人注目的成就.如機(jī)器學(xué)習(xí)方面,Rosenblat[3]研制出一種能將神經(jīng)元用于識(shí)別的系統(tǒng)感知機(jī),可在較簡單結(jié)構(gòu)中表現(xiàn)出智能系統(tǒng)的屬性.在定理證明方面,Newell和Simon[4]編制出一種稱為“邏輯理論機(jī)”的數(shù)學(xué)定理證明程序,該程序證明了Russell編寫的《數(shù)學(xué)原理》一書中的38條定理.隨后Robinson[5]提出第一定理——?dú)w結(jié)定理,為定理及其證明做出了突破性的貢獻(xiàn).在專家系統(tǒng)方面,美國斯坦福大學(xué)(Stanford University)的教授Feigenbaum[6]領(lǐng)導(dǎo)其研究小組合作研制了DENDRAL專家系統(tǒng),使得人工智能的研究以推理算法為主轉(zhuǎn)變?yōu)橐灾R(shí)為主.
20世紀(jì)70年代開始,人工智能領(lǐng)域的研究在世界各地風(fēng)生水起,涌現(xiàn)了大批重要的研究成果.這一時(shí)期是專家系統(tǒng)(ES)快速發(fā)展的時(shí)期,被廣泛用于各個(gè)領(lǐng)域,如醫(yī)學(xué)、地質(zhì)學(xué)、計(jì)算機(jī)視覺和機(jī)器人等,同時(shí)在知識(shí)表示、不精確推理和人工智能語言等方面也取得重大進(jìn)展.美國麻省理工學(xué)院(MIT)著名學(xué)者M(jìn)insky[7]提出一種知識(shí)理論框架,為后續(xù)專家系統(tǒng)的發(fā)展提供了理論基礎(chǔ).Shortliff[8]研制出世界第一個(gè)醫(yī)學(xué)專家系統(tǒng)——MYCIN系統(tǒng),用于診斷和治療血液感染等疾病.英國赫特福德大學(xué)(University of Hertfordshire)教授Clocksin編著的《PROLOG語言編程》一書,介紹了這一屬于專家系統(tǒng)的重要編程語言.著名的專家系統(tǒng)學(xué)者沃特曼(Waterman D A)出版的《專家系統(tǒng)指南》(A Guide to Expert Systems),則對(duì)專家系統(tǒng)的概念、組成、建立過程、建立工具、應(yīng)用領(lǐng)域等做了深入淺出的系統(tǒng)介紹與論述.
20世紀(jì)80年代至今,是人工智能發(fā)展的綜合集成期.計(jì)算智能的出現(xiàn)彌補(bǔ)了人工智能在數(shù)學(xué)理論和計(jì)算上的不足,豐富了人工智能的理論框架,使人工智能進(jìn)入新的發(fā)展時(shí)期.在該階段,人們重新對(duì)神經(jīng)網(wǎng)絡(luò)和其他如遺傳算法等計(jì)算智能算法產(chǎn)生了濃厚的興趣.對(duì)帶有“隱含”層或反饋的更加復(fù)雜的神經(jīng)網(wǎng)絡(luò)的研究,取得了重大進(jìn)展,使其可以用于處理時(shí)態(tài)結(jié)構(gòu)[9].同時(shí),20世紀(jì)90年代誕生了研究人工智能的多代理方法,并建造了應(yīng)用于多個(gè)領(lǐng)域的類動(dòng)物機(jī)器人,為人工生命領(lǐng)域的建立做出了不可磨滅的貢獻(xiàn)[10].直至2016年,人工智能領(lǐng)域迎來了第三次發(fā)展熱潮.無論是在學(xué)術(shù)界,還是在產(chǎn)業(yè)界,人工智能都被世界主要發(fā)達(dá)國家視作國際競爭的關(guān)鍵所在,這些國家都在加緊出臺(tái)與人工智能相關(guān)的規(guī)劃和政策,并對(duì)核心技術(shù)、頂尖人才、標(biāo)準(zhǔn)規(guī)范等進(jìn)行強(qiáng)化部署.
在此背景下,如何準(zhǔn)確了解世界人工智能研究究竟處于何種階段?其發(fā)展有何特點(diǎn),具有何種發(fā)展趨勢與走向?這無疑是我們極為關(guān)注的話題.本研究通過對(duì)過去9年(2010年-2018年)國內(nèi)外人工智能領(lǐng)域的研究文獻(xiàn)進(jìn)行系統(tǒng)地知識(shí)圖譜分析,以求對(duì)上述疑問做出更加直觀的解答.
近年來,在計(jì)算機(jī)信息技術(shù)的推動(dòng)下,我國文獻(xiàn)計(jì)量學(xué)的研究逐步由手工統(tǒng)計(jì)向計(jì)算機(jī)輔助統(tǒng)計(jì)分析過渡,呈現(xiàn)出自動(dòng)化與智能化的特點(diǎn)[11].在眾多科學(xué)文獻(xiàn)計(jì)量軟件中,美國德雷塞爾大學(xué)(Drexel University)陳超美教授開發(fā)的軟件——CiteSpace正日益吸引學(xué)者的目光.CiteSpace(引文空間)是一款基于Java語言,并通過數(shù)據(jù)挖掘、科學(xué)測量和信息分析對(duì)某一研究領(lǐng)域進(jìn)行信息可視化研究的軟件.相較于其他信息可視化軟件,CiteSpace軟件自身功能比較完善,尤其是在時(shí)間序列分析和突發(fā)檢測方面的優(yōu)勢明顯.在構(gòu)建知識(shí)圖譜流程中,對(duì)每個(gè)步驟的處理也都比較合理,能夠突出現(xiàn)實(shí)核心項(xiàng)目,尤其適合用于作者合作網(wǎng)絡(luò)分析、文獻(xiàn)共被引分析、時(shí)間序列分析和突發(fā)檢測等方面[12].目前,該軟件在進(jìn)行科學(xué)知識(shí)圖譜的繪制方面取得了很好的成效.本文運(yùn)用CiteSpace 5.3.R4軟件對(duì)科學(xué)引文索引(Web of Science,WOS)核心合集數(shù)據(jù)庫和中國知網(wǎng)(China National Knowledge Infrastructure,CNKI)核心數(shù)據(jù)庫中人工智能相關(guān)文獻(xiàn)進(jìn)行了統(tǒng)計(jì)分析,繪制文獻(xiàn)共被引圖譜、研究熱點(diǎn)圖譜和突現(xiàn)時(shí)序圖圖譜等,得出了目前國內(nèi)外人工智能的研究熱點(diǎn)及發(fā)展趨勢等相關(guān)結(jié)論.
本文研究對(duì)象是國內(nèi)外人工智能領(lǐng)域的相關(guān)文獻(xiàn),數(shù)據(jù)來源分別為WOS核心合集和CNKI核心數(shù)據(jù)庫,檢索時(shí)間截止到2018年12月31日.為了最大程度地涵蓋人工智能領(lǐng)域的研究現(xiàn)狀,檢索方式均選擇主題檢索,時(shí)間范圍設(shè)定為2010—2018年.由于人工智能可以用于各個(gè)研究領(lǐng)域,因此選擇學(xué)科分類為全部學(xué)科,通過閱讀文獻(xiàn)摘要,將相關(guān)綜述類、會(huì)議通知類、會(huì)議新聞等不相關(guān)文獻(xiàn)作為無效記錄,最終從WOS和CNKI數(shù)據(jù)庫中分別獲得6 213篇英文文獻(xiàn)和7 826篇中文文獻(xiàn).
發(fā)文量的增加或減少會(huì)隨著時(shí)間分布的變化而變化,文獻(xiàn)數(shù)量作為衡量某一領(lǐng)域研究熱點(diǎn)的重要指標(biāo)之一,文獻(xiàn)的年度分布變化趨勢能揭示該領(lǐng)域的研究發(fā)展趨勢[13].為了全面掌握國內(nèi)外人工智能研究領(lǐng)域隨時(shí)間變化的發(fā)展態(tài)勢及理論水平,本研究對(duì)國內(nèi)外2010年—2018年發(fā)表的人工智能研究領(lǐng)域的文獻(xiàn)數(shù)量進(jìn)行統(tǒng)計(jì)(如圖1).
圖1 2010年-2018年人工智能研究領(lǐng)域國內(nèi)外發(fā)文情況對(duì)比Fig.1 Comparison of publications in AI at home and abroad from 2010 to 2018
如圖1所示,國內(nèi)外人工智能研究領(lǐng)域的文獻(xiàn)2010年—2018年均呈現(xiàn)逐年穩(wěn)定增長的趨勢,說明學(xué)者們對(duì)人工智能的研究越來越重視,人工智能的研究熱度也越來越高.對(duì)比國內(nèi)外人工智能研究領(lǐng)域發(fā)文情況,2010年—2014年國內(nèi)外人工智能研究領(lǐng)域發(fā)文量的差距逐漸縮小,最后趨近于0.說明國外學(xué)者們對(duì)人工智能領(lǐng)域的研究后來居上;2014年—2018年,國內(nèi)外發(fā)文量之差又開始慢慢增大,并且國內(nèi)外人工智能研究文獻(xiàn)數(shù)整體上呈現(xiàn)大幅度增長趨勢,這充分表明了近幾年對(duì)人工智能領(lǐng)域的相關(guān)研究熱度再次升溫.從文獻(xiàn)分析法的角度,其發(fā)展趨勢公式表達(dá)為:
y=-0.765 1x5+20.086x4-197.98x3+
922.11x2-2 065x+1 922.6,
R2=0.983 3.
R2=0.983 3說明國內(nèi)外關(guān)于人工智能領(lǐng)域的研究發(fā)文量之差與時(shí)間分布的擬合度良好,且差距曲線呈現(xiàn)出W型的演變趨勢,對(duì)國內(nèi)外人工智能領(lǐng)域研究的發(fā)文量的變化趨勢做預(yù)測,國內(nèi)文獻(xiàn)數(shù)可能會(huì)超過國際文獻(xiàn)數(shù).這一變化趨勢與國內(nèi)外政策密切相關(guān).2017年召開的中國共產(chǎn)黨第十九次全國代表大會(huì)進(jìn)一步明確指出,加強(qiáng)互聯(lián)網(wǎng)、大數(shù)據(jù)與人工智能的深度融合[14].更代表著人工智能領(lǐng)域的第三次熱潮來臨.
知識(shí)基礎(chǔ)是一個(gè)有利于進(jìn)一步明晰研究前沿本質(zhì)的概念.為更加清晰、全面地掌握國內(nèi)外人工智能領(lǐng)域的知識(shí)基礎(chǔ),需要對(duì)重點(diǎn)文獻(xiàn)(核心文獻(xiàn))進(jìn)行具體分析.文獻(xiàn)共被引分析則是通過分析某文獻(xiàn)同時(shí)被其他文獻(xiàn)引用的頻次高低,來判斷該領(lǐng)域研究的核心文獻(xiàn)有哪些.本研究將網(wǎng)絡(luò)節(jié)點(diǎn)設(shè)置為“Cited reference”,閾值設(shè)置為TOP30.
2.2.1 國際AI領(lǐng)域知識(shí)基礎(chǔ) 運(yùn)用CiteSpace 5.3.R4對(duì)WOS 核心合集中的6 213篇文獻(xiàn)進(jìn)行文獻(xiàn)共被引分析,繪制得到國際AI研究領(lǐng)域的文獻(xiàn)共被引可視化圖譜(如圖2).圖譜中共生成254個(gè)節(jié)點(diǎn),405條連線,網(wǎng)絡(luò)模塊度Modularity=0.862 3>0.7,說明網(wǎng)絡(luò)的聚類結(jié)構(gòu)比較好.并選擇“Generate a narrative”選項(xiàng),可分別得到以“Citation counts/bursts/centrality”為衡量指標(biāo)的核心文獻(xiàn)的列表信息.為了選出更具學(xué)術(shù)影響力的文獻(xiàn),分別篩選出被引頻次、爆發(fā)性和中心度排名相對(duì)靠前的文獻(xiàn)(見表1,表2和表3),可發(fā)現(xiàn)以三種不同衡量指標(biāo)篩選的文獻(xiàn)的排名并不一致,說明很少有文獻(xiàn)能在某一時(shí)間段被其他文獻(xiàn)引用多次,具有很強(qiáng)的中心性.通過綜合比較各列表中的中心度、被引頻次和爆發(fā)性排名靠前的文獻(xiàn),篩選出9篇綜合性最強(qiáng)的國際AI領(lǐng)域的經(jīng)典文獻(xiàn)(見表4).
通過對(duì)篩選出的9篇經(jīng)典文獻(xiàn)進(jìn)行深入探究,得出國際AI領(lǐng)域?qū)W者對(duì)該領(lǐng)域作出的突出貢獻(xiàn).如LeCun等[15]對(duì)深度學(xué)習(xí)領(lǐng)域進(jìn)行詳細(xì)的文獻(xiàn)綜述,提出深度學(xué)習(xí)能夠通過反向傳播算法指出機(jī)器應(yīng)如何改變它的內(nèi)部參數(shù)來發(fā)現(xiàn)大數(shù)據(jù)復(fù)雜的結(jié)構(gòu).Karaboga等[16-18]提出一種人工蜂群(ABC)算法,并將該算法與遺傳算法、粒子群優(yōu)化算法和進(jìn)化策略獲得的結(jié)果進(jìn)行對(duì)比,發(fā)現(xiàn)蜂群算法在參數(shù)控制方面優(yōu)于其他算法.Krizhevsky等[19]運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)對(duì)120萬幅高分辨率圖像進(jìn)行分類,并且使用了不飽和神經(jīng)元和一個(gè)有效的GPU實(shí)現(xiàn)卷積運(yùn)算.Silver等[20]提出一種新的計(jì)算機(jī)圍棋的方法,將蒙特卡洛模擬與價(jià)值網(wǎng)絡(luò)策略相結(jié)合的搜索算法,使得AlphaGO對(duì)其他圍棋程序的勝率達(dá)到99.8%.Esteva等[21]則將人工智能技術(shù)運(yùn)用到醫(yī)療領(lǐng)域,使用深度卷積神經(jīng)網(wǎng)路對(duì)皮膚癌癌細(xì)胞進(jìn)行圖像識(shí)別,能夠起到區(qū)分癌細(xì)胞種類的作用.Mnih等[22]基于深度神經(jīng)網(wǎng)絡(luò),開發(fā)了一種新的人工智能體——深度Q網(wǎng)絡(luò),能夠?qū)崿F(xiàn)端到端的強(qiáng)化學(xué)習(xí),直接從高維感官輸入中學(xué)習(xí)成功的策略.Gulshan等[23]同樣也是將深度學(xué)習(xí)應(yīng)用于醫(yī)療領(lǐng)域,建立了一種自動(dòng)檢測眼底照片匯總糖尿病視網(wǎng)膜病變和黃斑水腫的算法,為眼科醫(yī)學(xué)成像提供了新的方案.
圖2 國際AI領(lǐng)域知識(shí)基礎(chǔ)知識(shí)圖譜Fig.2 Mapping knowledge domins of international knowledge base in AI
表1 被引頻次排名前6的文獻(xiàn)列表Tab.1 A list of the top 6 cited references on citation counts
表2 突發(fā)性排名前6的文獻(xiàn)列表Tab.2 A list of the top 6 literature on bursts
表3 中心性排名前6的文獻(xiàn)列表Tab.3 A list of the top 6 literatures on centrality
表4 國際AI領(lǐng)域經(jīng)典文獻(xiàn)Tab.4 International classic literatures of AI
2.2.2 國內(nèi)AI領(lǐng)域知識(shí)基礎(chǔ) 通過作者的合作網(wǎng)絡(luò)分析,找出發(fā)文量相對(duì)較高的高產(chǎn)作者,從高產(chǎn)作者發(fā)表的文獻(xiàn)中找出被引頻次最高的文獻(xiàn)作為國內(nèi)AI領(lǐng)域的核心文獻(xiàn).以“Author”作為網(wǎng)絡(luò)節(jié)點(diǎn),閾值設(shè)置為TOP30,繪制出國內(nèi)AI領(lǐng)域研究的作者網(wǎng)絡(luò)知識(shí)圖譜,并篩選出5篇被引頻次最高的文獻(xiàn)作為經(jīng)典文獻(xiàn)(見表5).
分析得出:喻國明(北京師范大學(xué)新聞傳播學(xué)院)、王偉(北京航空航天大學(xué)機(jī)器人研究所)、王飛躍(中國科學(xué)院自動(dòng)化研究所復(fù)雜系統(tǒng)管理與控制國家重點(diǎn)實(shí)驗(yàn)室)、李斌(中國科學(xué)院沈陽自動(dòng)化研究所機(jī)器人學(xué)國家重點(diǎn)實(shí)驗(yàn)室)以及高奇琦(華東政法大學(xué)政治學(xué)研究院)等學(xué)者在AI領(lǐng)域的研究具有突出貢獻(xiàn).喻國明等[24-25]對(duì)人工智能技術(shù)在新聞傳播領(lǐng)域的研究較為深入,重點(diǎn)探討了人工智能技術(shù)如何通過改變新聞生產(chǎn)與推送的具體環(huán)節(jié),以優(yōu)化受眾的感官和認(rèn)知體驗(yàn),提出讓新聞產(chǎn)品更懂用戶的基本運(yùn)作范式.王偉等[26-27]主要致力于研究人工智能技術(shù)在機(jī)器人砂帶磨削中的應(yīng)用,將人工智能中的各種算法,如模擬退火算法運(yùn)用到機(jī)器人磨削路徑的設(shè)計(jì)中,以提高機(jī)器人的磨削質(zhì)量.王飛躍等[28-29]對(duì)人工智能理論研究較為突出,提出一種新的機(jī)器學(xué)習(xí)理論框架,對(duì)預(yù)測學(xué)習(xí)、集成學(xué)習(xí)和指示學(xué)習(xí)等進(jìn)行特別設(shè)計(jì),并對(duì)深度學(xué)習(xí)在目標(biāo)視覺檢測中進(jìn)展與展望進(jìn)行綜述.李斌等[30-31]集中在機(jī)器人的研究與開發(fā)方面,基于人機(jī)交互技術(shù),涉及了可變形的災(zāi)難救援機(jī)器人控制站系統(tǒng),能夠?qū)崿F(xiàn)機(jī)器人在復(fù)雜環(huán)境中的運(yùn)動(dòng)控制和信息交互等功能,對(duì)災(zāi)難救援領(lǐng)域具有重要意義.高奇琦等[32-33]則認(rèn)為人工智能的發(fā)展對(duì)未來法律的影響是多方面的,不僅對(duì)律師行業(yè)的發(fā)展前景形成重大沖擊,同時(shí)也對(duì)民法的核心內(nèi)涵產(chǎn)生影響.
研究熱點(diǎn)指在一段時(shí)間內(nèi),研究者們對(duì)某一科學(xué)領(lǐng)域的問題或?qū)n}進(jìn)行探討并高度關(guān)注的核心問題.這些問題相互之間有內(nèi)在聯(lián)系并且國內(nèi)外對(duì)該方面的研究文獻(xiàn)數(shù)量也會(huì)相對(duì)較多.而關(guān)鍵詞則是對(duì)文獻(xiàn)主要內(nèi)容的高度凝練與概括,通過對(duì)文獻(xiàn)的關(guān)鍵詞進(jìn)行分析,找出出現(xiàn)頻率相對(duì)較高的關(guān)鍵詞,可在一定程度上看作是該領(lǐng)域的研究熱點(diǎn)[34].為了更加清晰地掌握國內(nèi)外人工智能研究領(lǐng)域的熱點(diǎn)分布情況,本研究以CiteSpace 5.3.R4軟件分別對(duì)國內(nèi)外人工智能領(lǐng)域研究文獻(xiàn)進(jìn)行共現(xiàn)網(wǎng)絡(luò)分析,以“Keyword”作為圖譜分析節(jié)點(diǎn),設(shè)置“Time Spicing” 為2010年—2018年,1年為一個(gè)時(shí)間段,并選擇術(shù)語類型為名字短語,閾值設(shè)為(Top N)30,得到國際及國內(nèi)人工智能領(lǐng)域研究熱點(diǎn)的知識(shí)圖譜,并加以對(duì)比分析.
2.3.1 國際AI領(lǐng)域研究熱點(diǎn) 如圖3所示,圖譜中共有57個(gè)節(jié)點(diǎn),說明在每個(gè)時(shí)間段排在前30的文獻(xiàn)中共包括57個(gè)關(guān)鍵詞,而節(jié)點(diǎn)的大小則與關(guān)鍵詞出現(xiàn)的頻次成正比.圖譜中各節(jié)點(diǎn)間的245條連線表示不同關(guān)鍵詞之間具有共現(xiàn)關(guān)系,連線的粗細(xì)代表共現(xiàn)關(guān)系的強(qiáng)度[35].通過篩選一些具有相近詞義的關(guān)鍵詞,并且去除information(信息)等一些針對(duì)性不強(qiáng)的詞匯,最終選取出現(xiàn)頻次和中心度排名前20的關(guān)鍵詞作為國際人工智能領(lǐng)域研究的熱點(diǎn)詞匯(見表6).
從圖3和表6可以看出,該領(lǐng)域出現(xiàn)頻次最高的關(guān)鍵詞是aritificial intelligence(人工智能),頻次高達(dá)2 091次.高頻詞反映出的以aritificial intelligence為中心的其他關(guān)鍵詞節(jié)點(diǎn)還包括neural network(神經(jīng)網(wǎng)絡(luò))、system(系統(tǒng))、model(模型)、algorithm(算法)、prediction(預(yù)測)、classification(分類)、optimization(優(yōu)化)和machine learning(機(jī)器學(xué)習(xí))等.從中心性角度來看,中心性大于0.05的關(guān)鍵詞包括artificial intelligence(人工智能)、neural network(神經(jīng)網(wǎng)絡(luò))、system(系統(tǒng))、model(模型)、algorithm(算法)、prediction(預(yù)測)、classification(分類)、machine learning(機(jī)器學(xué)習(xí))和support vector machine(支持向量機(jī))等.同時(shí)將高頻詞出現(xiàn)頻次的排列順序與中心性的排序進(jìn)行對(duì)比,發(fā)現(xiàn)兩者在一定程度上基本保持一致,出現(xiàn)的頻次越高,其中心性也相對(duì)更加明顯.由此可確定這些關(guān)鍵詞能夠在一定程度上涵蓋人工智能領(lǐng)域研究的熱點(diǎn).如何更加精確地掌握AI領(lǐng)域的研究熱點(diǎn),利用CiteSpace軟件,從檢索文獻(xiàn)的標(biāo)題中提取聚類命名術(shù)語,繪制人工智能領(lǐng)域的聚類知識(shí)圖譜,得到四個(gè)聚類,分別為stock trading(股權(quán)交易)、deep learning(深度學(xué)習(xí))、supply chain planning(供應(yīng)鏈計(jì)劃)和tabu programming(禁忌編程).根據(jù)關(guān)鍵詞共現(xiàn)頻次表、共現(xiàn)網(wǎng)絡(luò)和聚類圖譜,結(jié)合對(duì)2010年—2018年間的國外文獻(xiàn)的深度研究,可將AI領(lǐng)域的具體熱點(diǎn)研究內(nèi)容歸納為以下幾個(gè)方面.
圖3 國際AI領(lǐng)域研究熱點(diǎn)知識(shí)圖譜Fig.3 Mapping knowledge domains of international research focuses in AI
表6 國際AI領(lǐng)域研究熱點(diǎn)高頻詞Tab.6 High-frequency words of international research focuses in AI
1) 人工智能與機(jī)器學(xué)習(xí)
人工智能與機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn)內(nèi)容概括為表示學(xué)習(xí)、理論研究、基于人類認(rèn)知的學(xué)習(xí)方法和復(fù)雜問題的遺傳編程求解等.其中表示學(xué)習(xí)已在許多領(lǐng)域發(fā)揮其強(qiáng)大的潛能,尤其對(duì)計(jì)算機(jī)視覺、機(jī)器人和自然語言處理等領(lǐng)域都產(chǎn)生革命性影響.涉及的熱點(diǎn)詞匯包括learning Bayesian network structure(學(xué)習(xí)貝葉斯網(wǎng)絡(luò)結(jié)構(gòu))、applying machine learning (應(yīng)用機(jī)器學(xué)習(xí))等.在機(jī)器學(xué)習(xí)理論熱點(diǎn)研究領(lǐng)域的研究,涉及的熱點(diǎn)詞匯主要有artificial intelligence method (人工智能方法)、expandable deep learning(可拓展深度學(xué)習(xí))和learning (artificial intelligence)(學(xué)習(xí)人工智能)等.在基于人類認(rèn)知的學(xué)習(xí)方法研究熱點(diǎn)領(lǐng)域,主要研究如何將改進(jìn)的數(shù)學(xué)模型用于具體問題,例如因果關(guān)系的學(xué)習(xí)、概率推理、相似性和分類法、語言的統(tǒng)計(jì)模型、分參數(shù)貝葉斯統(tǒng)計(jì)和文化進(jìn)化模型等,熱點(diǎn)詞匯包括recognition(認(rèn)知)、probabilistic graphical model(概率圖形模型)等.在復(fù)雜問題遺傳編程求解熱點(diǎn)領(lǐng)域,主要是用遺傳編程方法為顯示問題提供創(chuàng)新性解決方法,從而推動(dòng)AI的進(jìn)步.涉及的熱點(diǎn)詞匯包括artificial neural networks(人工神經(jīng)網(wǎng)絡(luò))、algorithm(算法)和genetic algorithm(遺傳算法)等.
2) 人工智能與交叉學(xué)科
人工智能受到的廣泛關(guān)注與其在各領(lǐng)域的交叉應(yīng)用密不可分.其應(yīng)用范圍已經(jīng)涵蓋了機(jī)械工程、金融、生物化工、智能控制等諸多領(lǐng)域.其中熱點(diǎn)研究領(lǐng)域之一是人工智能與經(jīng)濟(jì)學(xué)的交叉研究,例如拍賣機(jī)制的優(yōu)化(VCG拍賣機(jī)制)、博弈的研究與應(yīng)用(Stackelberg博弈、納什均衡)等理論的應(yīng)用、安全策略的研究(網(wǎng)絡(luò)安全問題和調(diào)度安全策略)、投票機(jī)制的設(shè)計(jì)(對(duì)無負(fù)重的聯(lián)合操縱).涉及的熱點(diǎn)詞匯包括trading system (交易系統(tǒng))、optimization(優(yōu)化)等.另一研究熱點(diǎn)為人工智能與算法生物學(xué)的交叉研究,例如神經(jīng)網(wǎng)絡(luò)中的協(xié)同學(xué)習(xí)和分布式優(yōu)化的異同分析研究、在社交網(wǎng)絡(luò)和聚集性智能、遺傳網(wǎng)絡(luò)和適應(yīng)性進(jìn)化,生態(tài)網(wǎng)絡(luò)和過度穩(wěn)定進(jìn)化等領(lǐng)域中的適應(yīng)性網(wǎng)絡(luò)分析研究.熱點(diǎn)詞匯包括systems biology(系統(tǒng)生物學(xué))、network-based fuzzy inference system(基于網(wǎng)絡(luò)的模糊推理系統(tǒng))和neural network(神經(jīng)網(wǎng)絡(luò))等.
3) 人工智能與軟計(jì)算
相對(duì)于“硬計(jì)算”而言,軟計(jì)算是模擬自然界中智能系統(tǒng)的生化過程來有效處理日常工作.涉及的計(jì)算模式包括模糊邏輯、人工神經(jīng)網(wǎng)絡(luò)、遺傳算法、混沌理論等.熱點(diǎn)研究內(nèi)容主要包括使用神經(jīng)網(wǎng)絡(luò)處理有關(guān)感知、模式識(shí)別、非線性回歸與分類等問題,使用遺傳算法、模擬退火、隨機(jī)搜索等優(yōu)化方法解決復(fù)雜優(yōu)化問題.軟計(jì)算是對(duì)傳統(tǒng)人工智能面臨的問題提出的新的解決方案,涉及的熱點(diǎn)詞匯包括genetic algorithms(遺傳算法)、search algorithms(搜索算法)、particle swarm optimization(粒子群優(yōu)化)和support vector machine(支持向量機(jī))等.
2.3.2 國內(nèi)AI領(lǐng)域研究熱點(diǎn) 相較于國際人工智能研究領(lǐng)域的研究熱點(diǎn)知識(shí)圖譜,國內(nèi)人工智能領(lǐng)域的研究熱點(diǎn)共現(xiàn)圖譜如圖4所示,共得到133個(gè)節(jié)點(diǎn),427條線.可見關(guān)鍵詞更多,而且共現(xiàn)關(guān)系的強(qiáng)度更強(qiáng).同樣通過剔除一些不符合條件的詞匯,選取出現(xiàn)頻次和中心度排名前20的關(guān)鍵詞作為熱點(diǎn)詞匯并加以分析(見表7).
通過對(duì)國內(nèi)研究熱點(diǎn)共現(xiàn)圖譜和高頻詞列表可以看出,除人工智能、機(jī)器人、計(jì)算機(jī)視覺等關(guān)鍵詞節(jié)點(diǎn)大小相對(duì)突出之外,其他節(jié)點(diǎn)的大小并不太突出,各關(guān)鍵詞的節(jié)點(diǎn)大小相差較大,說明國內(nèi)學(xué)者對(duì)人工智能領(lǐng)域的研究重點(diǎn)相對(duì)突出,研究方向的頻率存在一定差異.節(jié)點(diǎn)個(gè)數(shù)133個(gè),相對(duì)較多,說明相對(duì)于國際研究來說,國內(nèi)的研究范圍相對(duì)廣泛;連線為427條,說明各領(lǐng)域之間的交叉研究較多.通過關(guān)鍵詞進(jìn)行聚類分析,得出7個(gè)聚類,分別為機(jī)器人、人工智能、ai、計(jì)算機(jī)視覺、中華人民共和國、學(xué)習(xí)和知識(shí)表示.結(jié)合高頻關(guān)鍵詞和聚類圖譜分析得出國內(nèi)人工智能領(lǐng)域的主要研究熱點(diǎn)有以下幾個(gè)方面:
1) 人工智能與機(jī)器人
人工智能與機(jī)器人領(lǐng)域的研究熱點(diǎn)包括自動(dòng)駕駛汽車、與機(jī)器人對(duì)話、多機(jī)器人控制等方面.其中在自動(dòng)駕駛汽車研究領(lǐng)域,研究者都致力于開發(fā)無人駕駛汽車能夠告知和理解周邊環(huán)境,并能按照人類的規(guī)則和傳統(tǒng)行駛的算法,以及對(duì)動(dòng)態(tài)對(duì)象進(jìn)行可靠的識(shí)別、跟蹤、運(yùn)動(dòng)預(yù)測,并使用這些信息幫助決策等.涉及的熱點(diǎn)詞匯有路徑規(guī)劃、優(yōu)化、軌跡跟蹤等.在與機(jī)器人對(duì)話這一熱點(diǎn)研究領(lǐng)域,研究熱點(diǎn)內(nèi)容主要有機(jī)器人的控制和其他代理、機(jī)器學(xué)習(xí)(特別是強(qiáng)化學(xué)習(xí)方向)、人機(jī)交互、認(rèn)知科學(xué)研究中基于人類行為的計(jì)算模型等.涉及的熱點(diǎn)詞匯為人機(jī)交互、機(jī)器學(xué)習(xí)、自然語言處理等.在多機(jī)器人控制研究方面,主要是實(shí)現(xiàn)多機(jī)器人系統(tǒng)在交通、物流、農(nóng)業(yè)、醫(yī)學(xué)及災(zāi)難應(yīng)急反應(yīng)等領(lǐng)域的全部潛能,建立分布式多機(jī)器人規(guī)劃和控制策略是當(dāng)前的研究熱點(diǎn).涉及到的熱點(diǎn)詞匯為激光切割、外科手術(shù)、煤礦救援等.
圖4 國內(nèi)AI領(lǐng)域研究熱點(diǎn)知識(shí)圖譜Fig.4 Mapping knowledge domains of domestic research focuses in AI
表7 國內(nèi)AI領(lǐng)域研究熱點(diǎn)高頻詞Table 7 High-frequency words of domestic research focuses in AI
2) 人工智能與可視化
可視化研究熱點(diǎn)主要包括可視化搜索與分析、計(jì)算攝影中的圖像統(tǒng)計(jì)、視覺場景的學(xué)習(xí)表示等方面.可視化搜索與分析研究是提出一系列高效的可視化識(shí)別算法和識(shí)別模型(如代價(jià)敏感的可視化分類學(xué)習(xí)算法、快速相似度搜索算法、目標(biāo)檢測的有效區(qū)域檢索模型等).計(jì)算攝影中的圖像統(tǒng)計(jì)研究主要是結(jié)合計(jì)算機(jī)視覺、計(jì)算機(jī)圖形學(xué)和機(jī)器學(xué)習(xí)完成圖像的后期處理,并將該技術(shù)應(yīng)用于相機(jī)和計(jì)算機(jī).視覺場景的學(xué)習(xí)表示研究內(nèi)容包括運(yùn)用概率圖模型、分參數(shù)貝葉斯方法以及統(tǒng)計(jì)機(jī)器學(xué)習(xí)在圖像處理、跟蹤、目標(biāo)識(shí)別和視覺場景中進(jìn)行分析.涉及的熱點(diǎn)詞匯有計(jì)算機(jī)視覺、圖像處理、圖像去噪、視覺規(guī)劃等.
3) 人工智能與國家政策
隨著人工智能在我國發(fā)展的持續(xù)火熱,越來越多的學(xué)者開始研究與人工智能相關(guān)的發(fā)展戰(zhàn)略和政策環(huán)境.從2010年到現(xiàn)在,我國人工智能政策發(fā)布不斷發(fā)生變化,從最早期的物聯(lián)網(wǎng)、信息安全、數(shù)據(jù)庫等基礎(chǔ)科研,到中期開始關(guān)注大數(shù)據(jù)和基礎(chǔ)設(shè)施建設(shè),再到現(xiàn)在互聯(lián)網(wǎng)+、知識(shí)產(chǎn)權(quán)保護(hù)等政策都成為人工智能研究的熱點(diǎn)話題.涉及的熱點(diǎn)關(guān)鍵詞有行政審批制度改革、中華人民共和國、中外企業(yè)、產(chǎn)業(yè)、企業(yè)管理等.
為更加清晰的掌握某學(xué)科領(lǐng)域的最前沿的發(fā)展動(dòng)態(tài),對(duì)未來該學(xué)科領(lǐng)域的發(fā)展方向和熱點(diǎn)問題進(jìn)行預(yù)測,采用CiteSpace 5.3.R4 軟件中的突現(xiàn)探測(burst detection) 方式,找出短時(shí)間內(nèi)出現(xiàn)頻次突然增加或使用頻率顯著提高的關(guān)鍵詞,根據(jù)詞頻的時(shí)間分布情況和變化趨勢,可以清晰明了地探測AI領(lǐng)域的研究前沿及演進(jìn)發(fā)展趨勢.將“keyword”作為節(jié)點(diǎn),以“Timezone”模式繪制出 AI領(lǐng)域的高頻突現(xiàn)關(guān)鍵詞時(shí)序圖.
2.4.1 國際AI領(lǐng)域研究前沿 圖5中的每一個(gè)節(jié)點(diǎn)代表一個(gè)熱點(diǎn)關(guān)鍵詞,節(jié)點(diǎn)大小表示關(guān)鍵詞出現(xiàn)頻次的高低.從圖中可看出,國際人工智能領(lǐng)域的研究大致可以分為繁榮期、穩(wěn)定發(fā)展期以及新一輪繁榮期.
1) 人工智能研究的繁榮期(2010年—2012年)
從圖5可以看出,大量的高頻詞匯出現(xiàn)在這一時(shí)期,如2010年,出現(xiàn)的高頻詞匯有neural network(神經(jīng)網(wǎng)絡(luò))、system(系統(tǒng))、algorithm(算法)、classification(分類)、optimization(優(yōu)化) 和performance(績效)等.2011年則是高頻詞匯爆發(fā)的一年,出現(xiàn)的高頻詞匯有artificial intelligence(人工智能)、model(模型)、artificial neural network(人工神經(jīng)網(wǎng)絡(luò))、prediction(預(yù)測)、genetic algorithm(遺傳算法)、support vector machine(支持向量機(jī))等.2012年出現(xiàn)的熱點(diǎn)高頻詞匯僅有parameter(參數(shù))和regression(回歸).在這一階段,國外學(xué)者對(duì)人工智能領(lǐng)域的研究主要集中于運(yùn)用人工智能的思想提出新的算法和新的技術(shù)解決實(shí)際問題.
2) 人工智能研究的穩(wěn)定發(fā)展期(2013年—2015年)
圖 5 國際AI領(lǐng)域突現(xiàn)詞時(shí)序圖Fig.5 Sequence diagram of international emerged terms in AI
從圖譜中可明顯看出這一時(shí)期AI研究的熱點(diǎn)關(guān)鍵詞在顯著下降,可推斷在這一時(shí)期國際學(xué)者們正在不斷探索人工智能研究的新的思路與方向,并對(duì)人工智能技術(shù)加以創(chuàng)新.2013年的出現(xiàn)的高頻詞有machine learning(機(jī)器學(xué)習(xí))、fuzzy inference system(模糊推理系統(tǒng))、framework(結(jié)構(gòu))和recognition(認(rèn)知).2014年出現(xiàn)的高頻關(guān)鍵詞僅有selection(選擇),2015年的高頻詞僅為particle swarm optimation(粒子群優(yōu)化).這時(shí)期學(xué)者對(duì)人工智能研究的重點(diǎn)仍然集中在技術(shù)的研發(fā)和應(yīng)用拓展上,人工智能的發(fā)展將向不同的研究領(lǐng)域融合.
3) 人工智能研究的新一輪繁榮期(2016年—2018年)
這一時(shí)期的關(guān)鍵詞開始緩慢增加,2016年出現(xiàn)的高頻關(guān)鍵詞僅為data mining(數(shù)據(jù)挖掘).2017年突現(xiàn)的關(guān)鍵詞為management(管理)、identification(識(shí)別)、big data(大數(shù)據(jù)) 和learning (artificial intelligence)[學(xué)習(xí)(人工智能)]等.2018年出現(xiàn)的關(guān)鍵詞有deep learning(深度學(xué)習(xí))和convolutional neural network(卷積神經(jīng)網(wǎng)絡(luò)).隨著大數(shù)據(jù)、云計(jì)算的迅猛發(fā)展,人工智能領(lǐng)域研究的空間和廣度越來越大,從這一時(shí)期熱點(diǎn)關(guān)鍵詞的變化趨勢可以看出,國際對(duì)人工智能領(lǐng)域研究的方向轉(zhuǎn)向基于機(jī)器學(xué)習(xí)的圖像處理方法,而人工智能領(lǐng)域在發(fā)展過程中遇到的機(jī)遇與挑戰(zhàn)的研究,則為人工智能在未來取得更好的發(fā)展提供借鑒.
2.4.2 國內(nèi)AI領(lǐng)域研究前沿 圖6中顯示的高頻關(guān)鍵詞的發(fā)展趨勢,反映出國內(nèi)人工智能領(lǐng)域研究也大致經(jīng)歷三個(gè)時(shí)期2010—2013年為繁榮期,2014年為穩(wěn)定期,2015—2018年為新一輪繁榮期.
1) 人工智能研究的繁榮期(2010年—2013年)
從圖6可以看出,大量的高頻詞匯出現(xiàn)在這一時(shí)期.如2010年,出現(xiàn)的高頻詞匯有人工智能、計(jì)算機(jī)視覺、機(jī)器視覺、神經(jīng)網(wǎng)絡(luò)、路徑規(guī)劃、軌跡規(guī)劃、模糊控制、智能機(jī)器人、問題解答和學(xué)習(xí)等.2011年出現(xiàn)的高頻關(guān)鍵詞為機(jī)器人、圖像處理、遺傳算法、決策系統(tǒng)和仿真等.2012年的熱點(diǎn)關(guān)鍵詞轉(zhuǎn)向機(jī)器學(xué)習(xí)、控制系統(tǒng)、設(shè)計(jì)、記憶、語義網(wǎng)絡(luò)和外科手術(shù)等.2013年出現(xiàn)bp神經(jīng)網(wǎng)絡(luò)、人機(jī)交互、運(yùn)動(dòng)仿真、任務(wù)分配和工作空間等高頻詞匯.這一時(shí)期人工智能關(guān)注的主要還是集中在人工智能技術(shù)創(chuàng)新本身的考察,并且可以看到人工智能慢慢開始涉及諸多具體應(yīng)用領(lǐng)域.
2) 人工智能研究的穩(wěn)定探索期(2014年)
這一時(shí)期人工智能研究領(lǐng)域的高頻詞匯主要有企業(yè)、大數(shù)據(jù)、企業(yè)管理和中華人民共和國等,說明人工智能領(lǐng)域的研究熱點(diǎn)開始由具體工程領(lǐng)域轉(zhuǎn)向經(jīng)濟(jì)與管理科學(xué)領(lǐng)域,體現(xiàn)了人工智能與交叉學(xué)科的緊密結(jié)合.
3) 人工智能研究的新一輪繁榮期(2015—2018年)
這一時(shí)期的關(guān)鍵詞又開始緩慢增加.2015年的高頻詞匯有智能制造、matlab、產(chǎn)業(yè)、算法和深度學(xué)習(xí)等.2016年的突現(xiàn)詞匯為人工智能技術(shù)、物聯(lián)網(wǎng)、虛擬現(xiàn)實(shí)、創(chuàng)新、圍棋和機(jī)械臂等.2017年的熱點(diǎn)詞匯為媒體融合、自然語言處理、ai和卷積神經(jīng)網(wǎng)絡(luò)等.2018年AI領(lǐng)域的研究熱點(diǎn)詞匯轉(zhuǎn)為智能技術(shù)、互聯(lián)網(wǎng)、區(qū)塊鏈、信息技術(shù)、智能教育、金融科技、教育信息化和智慧圖書館等.從這一時(shí)期熱點(diǎn)關(guān)鍵詞的變化趨勢可以看出國內(nèi)對(duì)人工智能領(lǐng)域研究的方向逐步由技術(shù)創(chuàng)新向?qū)嵺`創(chuàng)新轉(zhuǎn)變,由“硬學(xué)科”逐步向“軟學(xué)科”轉(zhuǎn)變,由信息科學(xué)領(lǐng)域逐步與其他學(xué)科相融合轉(zhuǎn)變,尤其是與經(jīng)濟(jì)及管理學(xué)科的聯(lián)系成為人工智能領(lǐng)域研究的最新趨勢.
圖6 國內(nèi)AI領(lǐng)域突現(xiàn)詞時(shí)序圖Fig.6 Sequence diagram of domestic emerged terms in AI
運(yùn)用CiteSpace 5.3.R4軟件進(jìn)行可視化知識(shí)圖譜繪制,本研究選取 WOS 數(shù)據(jù)庫作為國際數(shù)據(jù)來源和 CNKI 數(shù)據(jù)庫中核心以上期刊為國內(nèi)數(shù)據(jù)來源,對(duì)年度分布、知識(shí)基礎(chǔ)、研究熱點(diǎn)與研究前沿及演進(jìn)趨勢進(jìn)行對(duì)比分析,研究結(jié)論如下.
1) 從年度分布來看,隨著國內(nèi)外對(duì)人工智能領(lǐng)域政策的相應(yīng)推出,人工智能研究領(lǐng)域的發(fā)文量呈逐年遞增趨勢,說明越來越多的學(xué)者開始更加關(guān)注人工智能的研究,代表著人工智能領(lǐng)域第三次熱潮來臨.
2) 從知識(shí)基礎(chǔ)來看,國際AI研究主要集中在深度學(xué)習(xí)的理論方法以及技術(shù)應(yīng)用方面,通過文獻(xiàn)共被引結(jié)果圖可看出國際研究學(xué)者有著比較密切的合作.而國內(nèi)AI領(lǐng)域的研究文獻(xiàn)多以人工智能理論框架的構(gòu)建為主,且作者之間的合作度不高,研究相對(duì)獨(dú)立.
3) 從研究熱點(diǎn)來看,國際上對(duì)人工智能領(lǐng)域研究的高頻詞之間共現(xiàn)關(guān)系的程度更強(qiáng),與許多其他學(xué)科之間相互融合,形成了許多交叉領(lǐng)域,學(xué)者們對(duì)人工智能與機(jī)器學(xué)習(xí)、與相關(guān)交叉學(xué)科之間的學(xué)科融合、與軟計(jì)算之間的結(jié)合應(yīng)用分析等進(jìn)行深入探討.相比國外研究,國內(nèi)對(duì)人工智能領(lǐng)域的研究涉及的面更加廣泛,且在“人工智能”和“機(jī)器人”這兩個(gè)關(guān)鍵詞出現(xiàn)的頻次相當(dāng)高,但其他相關(guān)方向的關(guān)注度卻相對(duì)均衡,主要集中在人工智能與機(jī)器人、可視化、國家政策等相關(guān)主題.可見國外對(duì)人工智能領(lǐng)域的研究更加注重將人工智能與其他各個(gè)學(xué)科相互交叉以研究具體問題,而國內(nèi)對(duì)人工智能領(lǐng)域的研究除了注重機(jī)器學(xué)習(xí)和圖像可視化領(lǐng)域,同時(shí)還注重對(duì)人工智能發(fā)展戰(zhàn)略和國家政策的研究,為人工智能研究的進(jìn)一步發(fā)展提供借鑒.
4) 從研究前沿及演進(jìn)趨勢來看,不論是國際的還是國內(nèi)的人工智能研究領(lǐng)域,通過觀察高頻關(guān)鍵詞的變化趨勢,國內(nèi)外人工智能領(lǐng)域的發(fā)展都經(jīng)歷了三個(gè)時(shí)期,分別為繁榮期、穩(wěn)定探索期和新一輪繁榮期.但國內(nèi)外每個(gè)時(shí)期的關(guān)注熱點(diǎn)又有所區(qū)別.國際上對(duì)人工智能領(lǐng)域的研究從早期關(guān)注技術(shù)與管理的結(jié)合,到中期探索人工智能在不同領(lǐng)域如商業(yè)、生物、交通和醫(yī)療等領(lǐng)域的應(yīng)用,再到后期將研究重點(diǎn)轉(zhuǎn)向圖像處理領(lǐng)域.這一演進(jìn)趨勢的形成與云計(jì)算、大數(shù)據(jù)的發(fā)展密切相關(guān).而國內(nèi)對(duì)人工智能的發(fā)展趨勢從早期對(duì)人工智能技術(shù)創(chuàng)新本身的考察,到中期漸漸轉(zhuǎn)向與經(jīng)濟(jì)及管理學(xué)科的交叉研究,再到后期研究主題轉(zhuǎn)向信息技術(shù)、教育信息化等,可看出國內(nèi)對(duì)人工智能領(lǐng)域的發(fā)展逐步由技術(shù)創(chuàng)新向?qū)嵺`創(chuàng)新轉(zhuǎn)變,由“硬學(xué)科”向“軟學(xué)科”轉(zhuǎn)變,由信息科學(xué)領(lǐng)域向與其他學(xué)科融合轉(zhuǎn)變,尤其是與經(jīng)濟(jì)及管理學(xué)科的聯(lián)系成為人工智能領(lǐng)域研究的最新趨勢.