張 寧, 劉 勇, 郭 婷, 宣曉冬
(1.浙江師范大學,地理與環(huán)境科學學院,浙江 金華 321004;2.浙江師范大學,科學研究院,浙江 金華 321004;3.浙江省知識產(chǎn)權(quán)研究與服務中心,浙江 杭州 310012)
無論是在早期的工業(yè)革命時代還是現(xiàn)在的網(wǎng)絡知識經(jīng)濟時代,技術(shù)創(chuàng)新都是推動社會經(jīng)濟發(fā)展的重要力量.自20世紀中葉以來,以信息技術(shù)、生物技術(shù)為代表的第三次技術(shù)革命使技術(shù)研發(fā)的周期大大縮短,創(chuàng)新的速度明顯加快.這些新技術(shù)改變了很多傳統(tǒng)行業(yè),并催生出一批新行業(yè),這種具有創(chuàng)造一個新行業(yè)或改變一個現(xiàn)存行業(yè)并對經(jīng)濟結(jié)構(gòu)產(chǎn)生重大影響能力的技術(shù),被管理學界稱為新興技術(shù)(emerging technology)[1].
創(chuàng)新性和不確定性是新興技術(shù)的2個重要特征[2],正因如此,企業(yè)才會對新興技術(shù)既有濃厚的興趣,又對運用新興技術(shù)的產(chǎn)品未來的性能和市場前景有著深深的擔憂,這時技術(shù)預測就顯得非常重要.技術(shù)預測是一種系統(tǒng)方法,通過對技術(shù)現(xiàn)有狀態(tài)和發(fā)展過程進行分析,選擇合適的方法論組合,從而對技術(shù)將來可能的發(fā)展情況作出評估[3].
傳統(tǒng)的技術(shù)預測方法有德爾菲法、情境分析法、關(guān)鍵技術(shù)法、趨勢外推法、層次分析法和決策樹法等[4],這些方法主要以定性分析為主,缺少定量分析.進入信息大數(shù)據(jù)時代后,面對海量的、可獲得的數(shù)據(jù)信息,運用一些工具和方法,剖析和分析里面大量有價值的信息,從而對新興技術(shù)進行預測和選擇,該種方法稱為技術(shù)挖掘(tech mining)[5].
基于“情報、設計和選擇”三步法理論,本文建立了一套基于科技文獻數(shù)據(jù)的技術(shù)識別與技術(shù)預測方法(模型),并應用該方法進行室內(nèi)空氣凈化技術(shù)的識別與預測案例研究,旨在開拓技術(shù)挖掘方法的新思路,并推動其在技術(shù)預測過程中的應用.
技術(shù)挖掘是文本挖掘工具在科技信息上的應用,建立在對技術(shù)創(chuàng)新流程理解的基礎上,它依賴于科技領域的知識來影響其實踐,能幫助決策者調(diào)整策略、減少風險、制定正確的決策[6].
技術(shù)挖掘依靠數(shù)據(jù)挖掘(data mining)、文本挖掘(text mining)、網(wǎng)絡挖掘(web mining)的基本手段與工具,對從海量的數(shù)據(jù)中獲得的信息作出理性的分析和判斷.當需要進行技術(shù)抉擇時,技術(shù)挖掘工作可幫助回答以下3個方面的問題:
1)針對要解決的現(xiàn)實問題,有哪些新興技術(shù)?可能的發(fā)展路徑是什么?
2)選擇哪項技術(shù)?跟蹤哪些技術(shù)?
3)在新興技術(shù)發(fā)展中,如何取得競爭優(yōu)勢?如何布局專利?
研究技術(shù)挖掘的先驅(qū)是美國佐治亞理工大學Porter教授領銜的技術(shù)政策與評估中心.他們研究工作的一個方面是提出技術(shù)挖掘的基本思路、方法和工具[7-9];另一方面就是開展實證研究,如技術(shù)挖掘方法和工具支持新興技術(shù)創(chuàng)新路徑預測等[10-11].
技術(shù)挖掘方法較傳統(tǒng)數(shù)據(jù)分析方法的優(yōu)勢在于可依靠信息分析專家和若干技術(shù)領域?qū)<业暮献?,先通過數(shù)據(jù)挖掘獲得一張技術(shù)發(fā)展全景圖,再依靠領域?qū)<医庾x相關(guān)數(shù)據(jù),從而提高技術(shù)選擇的科學性和有效性,同時降低人工的工作成本.
技術(shù)預測的最終目的是對技術(shù)將來可能的發(fā)展趨勢作出估計,根據(jù)預測的范圍大小,預測的內(nèi)容也有所不同.如大規(guī)模的預測可以涉及到一個政府部門對一系列研究領域的預測,中等規(guī)模預測只涉及到一個技術(shù)范圍或一個產(chǎn)品系列,而小規(guī)模的技術(shù)預測只是對一個技術(shù)項目或一個特定產(chǎn)品中的技術(shù)進行預測.技術(shù)挖掘是基于數(shù)據(jù)統(tǒng)計分析的定量分析方法,更適合于一個行業(yè)或特定產(chǎn)品的技術(shù)預測,故本次研究以特定產(chǎn)品為案例設計技術(shù)預測模型.
對一個產(chǎn)品而言,判斷其核心技術(shù)的技術(shù)成熟度和未來發(fā)展趨勢是技術(shù)預測的關(guān)鍵[12].若技術(shù)進入衰退期,說明該技術(shù)陳舊,對其進行技術(shù)預測已無多大意義;若技術(shù)處于萌芽期,說明技術(shù)尚未成熟,未來有發(fā)展空間和不確定性,需要進行技術(shù)預測;若技術(shù)處于成長或成熟階段,表示在未來一段時間內(nèi)擁有較大的發(fā)展?jié)摿?,需要對其進行預測并分析演化方向.
將技術(shù)挖掘運用到技術(shù)預測過程中,可遵循1960年諾貝爾獎得主Herbert Simon提出的決策制定三步法,即情報、設計(包括分析)和選擇[6].情報階段包括為挖掘作準備和收集數(shù)據(jù);設計和分析階段是運用從收集到的數(shù)據(jù)中獲得的知識解決創(chuàng)新或技術(shù)管理中遇見的問題的過程;選擇階段是研究團體通過技術(shù)挖掘創(chuàng)造的可控制的結(jié)果進行決策和應用的過程.
基于上述理論,本文設計了基于科技文獻研究的技術(shù)挖掘模型圖(見圖1),希望通過模型的建立,解決產(chǎn)品技術(shù)預測中的以下問題:
1)該產(chǎn)品涉及的核心技術(shù)有哪些;
2)其中哪些技術(shù)有良好的發(fā)展前景;
3)該選擇哪些適合我們的技術(shù).
圖1 技術(shù)挖掘模型圖
科技文獻數(shù)據(jù)庫是技術(shù)挖掘的重要數(shù)據(jù)來源,供分析的數(shù)據(jù)源可選擇期刊數(shù)據(jù)庫和專利信息數(shù)據(jù)庫,期刊文獻側(cè)重于基礎研究部分,而專利文獻則是基礎研究向應用研究的有效擴展,對二者綜合分析更有利于對技術(shù)發(fā)展方向作出判斷.數(shù)據(jù)源確定后,需要設計檢索策略對數(shù)據(jù)進行檢索.整個檢索過程不是一蹴而就,當檢索結(jié)果不符合預期時,需要對原有檢索策略進行調(diào)整,必要時需征求專家意見,最終的檢索結(jié)果需要有覆蓋性和準確性.最終檢索獲得的數(shù)據(jù)集要做好重復數(shù)據(jù)和異常數(shù)據(jù)的清理工作,以減少給下一步詞頻分析帶來的干擾.
詞頻分析是一種透過詞頻現(xiàn)象看內(nèi)容本質(zhì)的科學方法,是目前內(nèi)容分析法中最重要、也是使用最多的方法[13],也是第一次篩選階段中較為關(guān)鍵的一環(huán).運用詞頻分析法,可以從期刊文獻與專利文獻的標題、摘要、關(guān)鍵詞乃至全文中萃取出技術(shù)主題詞,這些詞被認為是對該文獻研究內(nèi)容的有效歸納與總結(jié),也是對整個技術(shù)研究領域中核心問題與內(nèi)在聯(lián)系的映射[14].運用詞頻分析法可以建立技術(shù)高頻詞庫,為二次篩選做好準備.
通過第一步篩選得到的技術(shù)高頻詞庫中,由于年度跨度大,包含的技術(shù)總類也是多樣的.有些技術(shù)手段在早些年可能是熱點技術(shù),但現(xiàn)在已經(jīng)陳舊;有些技術(shù)進入成熟期,在當前和今后一段時間內(nèi)還將是核心和熱點;有些技術(shù)出現(xiàn)時間不長,但短時間內(nèi)關(guān)注度高,故在未來一段時間內(nèi)可能擁有較大的發(fā)展?jié)摿?為了區(qū)分出具有發(fā)展前景的新興技術(shù),需要對技術(shù)高頻詞做二次篩選.
首先,需要對技術(shù)高頻詞進行時間準度定位,就是分別作出每個高頻詞隨著時間年限變化的頻率曲線,近期曲線上揚幅度較大的技術(shù)應密切關(guān)注;其次,要對技術(shù)高頻詞進行主題聚類分析,若一個高頻詞與其他關(guān)鍵詞同時出現(xiàn)的次數(shù)較多,則可能是通用或重要共性技術(shù),值得關(guān)注;最后,經(jīng)過上面兩步驟形成的技術(shù)詞庫需征求相關(guān)領域?qū)<业囊庖?,由專家根?jù)自身對技術(shù)領域的經(jīng)驗積累對技術(shù)詞庫作適當調(diào)整和增補,最終形成長期、成熟期技術(shù)詞庫.
成長期、成熟期技術(shù)詞庫建立之后,需要對每個技術(shù)進行單獨分析,針對該技術(shù)形成產(chǎn)品進入市場的可能性,需要考慮政府政策因素、專家意見、技術(shù)區(qū)域分布、該領域的重點研究機構(gòu)和研究者,以及相關(guān)產(chǎn)品專利的布局情況等,最終得出預測結(jié)論并完成技術(shù)選擇.
以室內(nèi)空氣凈化領域新興技術(shù)的預測和選擇為例.隨著大氣污染問題的日益突出,空氣質(zhì)量問題已成為人們越來越關(guān)注的熱點話題之一,“甲醛”“霧霾”“PM 2.5”已成為人們口中的熱點詞匯,而室內(nèi)空氣凈化器也成為人們?nèi)粘1貍涞募译娭?室內(nèi)空氣凈化器針對凈化的室內(nèi)污染物主要分為三大類:顆粒物(PM 10和PM 2.5)、揮發(fā)性有機污染物和細菌病毒等微生物[15].凈化的技術(shù)隨著時間發(fā)展也在不斷革新,符合新興技術(shù)范疇,本文以室內(nèi)空氣凈化技術(shù)為例進行新興技術(shù)的預測和選擇,為新一代空氣凈化器的研發(fā)提供參考和建議.
考慮到數(shù)據(jù)的完整性和規(guī)范性,本研究選擇湯森路透公司的SCI/SSCI期刊文獻數(shù)據(jù)庫.研究制定了以主題=("air clean*" OR "air purif*" AND "indoor")的檢索策略,共獲得SCI/SSCI文獻1 617篇,經(jīng)過二次清理,獲得有效文獻1 056篇.數(shù)據(jù)分析軟件運用湯森路透公司的TDA軟件.
圖2為近年來關(guān)于室內(nèi)空氣進化相關(guān)文獻與專利的數(shù)量走勢圖,數(shù)量呈明顯上升趨勢,說明該領域一直是社會關(guān)注的熱點.
圖2 國內(nèi)外1995—2015年間空氣凈化相關(guān)文獻發(fā)表數(shù)量年度分布圖
采用TDA軟件提取1 056篇文獻中所有的關(guān)鍵詞(keywords),共提取到關(guān)鍵詞3 787個.按照不同空氣凈化技術(shù),選取與凈化技術(shù)相關(guān)的關(guān)鍵詞設定為有效關(guān)鍵詞,提取出高頻詞44個,建立高頻詞庫.高頻詞庫見表1.
表1 室內(nèi)空氣凈化技術(shù)高頻詞庫表
運用聚類分析方法,進行室內(nèi)空氣凈化技術(shù)解析,聚類結(jié)果見圖3.從聚類結(jié)果可以發(fā)現(xiàn),以歐拉值為20劃分,可將現(xiàn)有的空氣凈化技術(shù)聚類分為7類技術(shù),分別是:光催化氧化技術(shù);吸附(收)技術(shù);等離子體技術(shù);微生物凈化技術(shù);靜電除塵技術(shù);通風過濾技術(shù)和負離子技術(shù).
圖3 聚類分析結(jié)果圖
將解析出的7類空氣凈化技術(shù)回溯至文獻數(shù)量,分析各種技術(shù)的關(guān)注度,結(jié)果見圖4.光催化氧化技術(shù)是7類空氣凈化技術(shù)中最受關(guān)注的空氣凈化技術(shù),在1 056篇文獻中,有863篇文獻屬于光催化氧化技術(shù)范疇,占比達到82%;其次是空氣凈化技術(shù),依次為:等離子體技術(shù)(6%)、吸附(收)技術(shù)(6%)、過濾技術(shù)(5%)、離子化技術(shù)(<1%)、靜電除塵技術(shù)(<1%)和微生物技術(shù)(<1%).
圖4 技術(shù)關(guān)注度圖
對詞庫中每個關(guān)鍵詞進行時間準度定位,繪制每個詞隨著時間年限變化的詞頻變化圖譜,分析每個詞的演變趨勢,結(jié)果見圖5.從圖5可以發(fā)現(xiàn),“TIO2”“OXIDATION”和“HETEROGENEOUS PHOTOCATALYSIS”這3個詞,在過去的20年里,詞頻始終出現(xiàn)并且呈顯著增加的態(tài)勢,它們都隸屬于光催化氧化技術(shù),這與光催化氧化技術(shù)是最受關(guān)注的技術(shù)結(jié)論相一致.“AMBIENT-TEMPERATURE”“HYDROTHERMAL SYNTHESIS”和“NANOSHEETS”是近5年來才出現(xiàn)的新詞,且詞頻穩(wěn)步增長.這3個詞也都隸屬于光催化氧化技術(shù),它們代表了光催化氧化技術(shù)的研究方向.
圖5 高頻詞庫詞頻隨年度變化圖譜
綜合以上分析結(jié)果,推斷出光催化氧化技術(shù)是最具發(fā)展前景的室內(nèi)空氣凈化技術(shù).
技術(shù)挖掘是一種從科技數(shù)據(jù)庫的數(shù)據(jù)信息中揭示出隱含的、先前未知的、并有潛在價值的信息決策方法,它能幫助決策者調(diào)整策略、減少風險、制定正確決策.本文建立了一套基于科技文獻數(shù)據(jù)的技術(shù)識別與技術(shù)預測方法.通過文獻檢索、詞頻分析、聚類技術(shù)分析,發(fā)現(xiàn)新技術(shù)或者技術(shù)方向,評估技術(shù)發(fā)展前景.文中以室內(nèi)空氣凈化技術(shù)為研究案例,進行了室內(nèi)空氣凈化技術(shù)的識別與評價,最終確定出光催化氧化技術(shù)是最具應用前景的室內(nèi)空氣凈化技術(shù).
參考文獻:
[1]Day G S,Sehoomaker P J H,Gunther R E.Wharton on managing emerging technologies[M].Hoboken,New Jersey:John Wiley and Sons Inc,2000:1-435.
[2]魏國平.新興技術(shù)管理策略研究[D].杭州:浙江大學,2006:17-18.
[3]陳勁.技術(shù)管理[M].北京:科學出版社,2018:87.
[4]中國科學技術(shù)信息研究所.技術(shù)發(fā)展預測與評論[M].北京:北京理工大學出版社,2003:1-44.
[5]Porter A L,Cunningham S W.Tech mining:Exploiting new technologies for competitive advantage[M].UK:Pergamon Press Inc,2005:1305-1306.
[6]波特5坎寧安.技術(shù)挖掘與專利分析[M].陳燕,譯.北京:清華大學出版社,2012:13-14.
[7]Bishop P C,Porter A L.Tech Mining:Exploiting new technologies for competitive advantage 2005 wiley[J].Technological Forecasting & Social Change,2005,73(1):91-93.
[8]Porter A L.QTIP:Quick technology intelligence processes[J].Technological Forecasting & Social Change,2005,72(9):1070-1081.
[9]Porter A L,Newman N C.Mining external R&D[J].Technovation,2011,31(4):171-176.
[10]Porter A L,Guo Y,Huang L,et al.Forecasting innovation pathways:The case of nano-enhanced solar cells[C]//International Conference on Technological Innovation and Competitive Technical Intelligence.Beijing:Peking University,2010:259-272.
[11]Robinson D K R,Huang L,Guo Y,et al.Forecasting Innovation Pathways (FIP) for new and emerging science and technologies[J].Technological Forecasting & Social Change,2013,80(2):267-285.
[12]侯劍華,朱曉清.基于專利的技術(shù)預測評價指標體系及其實證研究[J].圖書情報工作,2014,58(18):77-82.
[13]紀蔚蔚.基于詞頻分析的我國2004年科學學發(fā)展動向研究[J].科研管理,2006,27(3):81-89.
[14]張嶷,汪雪鋒,郭穎,等.基于文獻計量學的技術(shù)路線圖構(gòu)建模型研究[J].科學學研究,2012,30(4):495-502.
[15]Mahto P,Dubey V,Panhotra J.Indoor air pollution:Health hazards and techniques to reduce the hazardous effects[J].International Journal of Research:GRANTHAALAYAH,2015,3(9):1-5.