楊高均
(貴陽(yáng)市服務(wù)外包及呼叫中心產(chǎn)業(yè)發(fā)展辦公室 貴州省貴陽(yáng)市 550001)
近年來(lái),我國(guó)對(duì)科技研發(fā)和生產(chǎn)的重視程度不斷提高,并要求各省市科技業(yè)務(wù)部門積極開(kāi)展科技專家?guī)旃芾硐到y(tǒng)建設(shè)工作,以期利用科技專家?guī)旃芾硐到y(tǒng)這一匯聚科技專家的信息智庫(kù)為科研人員、科技管理者等提供良好的信息服務(wù),從而促進(jìn)其科研決策更加精準(zhǔn)和管理質(zhì)量更加高效。然而,我國(guó)當(dāng)前大部分省市的科技專家?guī)旃芾硐到y(tǒng)構(gòu)建現(xiàn)狀來(lái)看,不少省市構(gòu)建的科技專家?guī)旃芾硐到y(tǒng)對(duì)大數(shù)據(jù)技術(shù)應(yīng)用不足或應(yīng)用不合理,從而導(dǎo)致構(gòu)建的專家基礎(chǔ)資源少、數(shù)據(jù)庫(kù)專家信息結(jié)構(gòu)單一,難以滿足大數(shù)據(jù)時(shí)代背景下,科技專家?guī)旃芾硐到y(tǒng)海量的數(shù)據(jù)信息管理要求,從而難以充分發(fā)揮科技專家?guī)旃芾硐到y(tǒng)的信息服務(wù)作用[1]。基于此,就需要各科技業(yè)務(wù)部門工作人員積極探索構(gòu)建基于大數(shù)據(jù)的科技專家?guī)旃芾硐到y(tǒng)的方法,構(gòu)建一個(gè)科學(xué)、完善的科技專家?guī)旃芾硐到y(tǒng),才能為相關(guān)使用者提供良好的科技信息和咨詢服務(wù),從而才能推動(dòng)我國(guó)科技不斷進(jìn)步和發(fā)展。
科技專家?guī)旃芾硐到y(tǒng)指的是收集各行業(yè)科技評(píng)審專家及其咨詢意見(jiàn)和建議的信息智庫(kù),利用該信息智庫(kù)為相應(yīng)的科技項(xiàng)目抽取合適的評(píng)審專家,以減少科技決策失誤和促進(jìn)科技成果更好地進(jìn)行轉(zhuǎn)化。從這個(gè)概念可以看出,科技專家?guī)旃芾硐到y(tǒng)包含的管理內(nèi)容眾多,基于此,就需要相關(guān)技術(shù)人員積極構(gòu)建基于大數(shù)據(jù)的科技專家?guī)旃芾硐到y(tǒng),利用大數(shù)據(jù)技術(shù)對(duì)專家信息數(shù)據(jù)進(jìn)行全面收集和充分挖掘,并進(jìn)行結(jié)構(gòu)化處理,才能實(shí)現(xiàn)專家精確分類。并且,利用大數(shù)據(jù)技術(shù)進(jìn)行數(shù)據(jù)轉(zhuǎn)換、傳輸,還能更好地實(shí)現(xiàn)數(shù)據(jù)共享,從而有助于提升科技專家?guī)旃芾碣|(zhì)量和效率[2]。
隨著我國(guó)科技創(chuàng)新評(píng)審和咨詢項(xiàng)目的不斷增多,我國(guó)不少省市科技業(yè)務(wù)部門均開(kāi)展了科技專家?guī)旃芾硐到y(tǒng)建設(shè)工作,但是,從我國(guó)當(dāng)前的科技專家?guī)旃芾硐到y(tǒng)構(gòu)建現(xiàn)狀來(lái)看,大部分省市構(gòu)建的科技專家?guī)旃芾硐到y(tǒng)信息化程度和對(duì)大數(shù)據(jù)技術(shù)的利用程度均較低,如不少科技業(yè)務(wù)部門按照各自管理需要構(gòu)建了各類專家?guī)旃芾硐到y(tǒng)和對(duì)專家進(jìn)行標(biāo)準(zhǔn)分類入庫(kù),并按照評(píng)審項(xiàng)目所屬技術(shù)領(lǐng)域或?qū)W科大類對(duì)項(xiàng)目進(jìn)行分組,然后,根據(jù)分組統(tǒng)一標(biāo)準(zhǔn)匹配入庫(kù)專家,雖在一定程度上促進(jìn)了各類專家的信息標(biāo)準(zhǔn)規(guī)范與科技業(yè)務(wù)部門管理需求和本級(jí)所屬業(yè)務(wù)相符,并實(shí)現(xiàn)了與評(píng)審項(xiàng)目對(duì)應(yīng)的專家合理抽取[3]。但是,在實(shí)際建設(shè)過(guò)程中,也存在不少的問(wèn)題,如:
(1)專家基礎(chǔ)資源少,指的是構(gòu)建的科技專家?guī)旃芾硐到y(tǒng)平臺(tái)中各專家信息系統(tǒng)相互獨(dú)立,分別由不同的部門管理和使用,從而導(dǎo)致科技專家信息資源過(guò)度分散,相互之間難以進(jìn)行有效聯(lián)通和共享,且專家信息來(lái)源方式單一和專家基礎(chǔ)資源少,多是專家自我填寫,常會(huì)導(dǎo)致庫(kù)有專家數(shù)量難以匹配參評(píng)科技項(xiàng)目數(shù)量要求。
(2)數(shù)據(jù)庫(kù)專家信息結(jié)構(gòu)單一,當(dāng)前大部分科技業(yè)務(wù)部門多是采用關(guān)系數(shù)據(jù)庫(kù)線性表描述和存儲(chǔ)數(shù)據(jù)庫(kù)專家信息關(guān)系及相關(guān)數(shù)據(jù)信息,這種信息結(jié)構(gòu)描述方式不僅會(huì)造成系統(tǒng)相關(guān)數(shù)據(jù)信息的重復(fù)和疊加,還會(huì)影響數(shù)據(jù)庫(kù)專家信息的全面和高效展示,從而會(huì)使科技項(xiàng)目對(duì)評(píng)審專家的精準(zhǔn)匹配需求受到一定影響。
要構(gòu)建一個(gè)合理和優(yōu)質(zhì)的基于大數(shù)據(jù)的科技專家?guī)旃芾硐到y(tǒng),首先就需要做好專家?guī)旃芾硇畔⑾到y(tǒng)架構(gòu)設(shè)計(jì),然后,采用關(guān)鍵性的大數(shù)據(jù)技術(shù)做好專家管理信息系統(tǒng)設(shè)計(jì),下面是筆者總結(jié)的專家?guī)旃芾硇畔⑾到y(tǒng)架構(gòu)設(shè)計(jì)方法及專家管理信息系統(tǒng)設(shè)計(jì)方法。
基于大數(shù)據(jù)的科技專家?guī)旃芾硐到y(tǒng)指的是以大數(shù)據(jù)技術(shù)作為基礎(chǔ),聯(lián)合科學(xué)的專家?guī)旃芾硇畔⑾到y(tǒng)架構(gòu)設(shè)計(jì)方法將科技評(píng)審專家、科技項(xiàng)目、科技文獻(xiàn)、進(jìn)行科技研究所需的儀器設(shè)備、成果等科技創(chuàng)新要素進(jìn)行有機(jī)結(jié)合,從而為科研人員、科技管理者、社會(huì)公眾等開(kāi)展專家推薦、咨詢、管理和科研決策等活動(dòng)提供良好的信息服務(wù),要達(dá)到這一目標(biāo)要求,就需確保設(shè)計(jì)和構(gòu)建的專家?guī)旃芾硇畔⑾到y(tǒng)架構(gòu)包含基礎(chǔ)數(shù)據(jù)層、數(shù)據(jù)存儲(chǔ)分析層和數(shù)據(jù)服務(wù)層三個(gè)子系統(tǒng)[4]。
3.1.1 基礎(chǔ)數(shù)據(jù)層設(shè)計(jì)
為確??萍紝<?guī)旃芾硐到y(tǒng)能夠?yàn)楦黝愑脩籼峁┩晟频目萍夹畔⒎?wù),首先,就需要設(shè)計(jì)基礎(chǔ)數(shù)據(jù)層,該數(shù)據(jù)層應(yīng)涵蓋專家信息基本庫(kù)、專家?guī)旖尤牍芾硐到y(tǒng)的歷史項(xiàng)目數(shù)據(jù)、現(xiàn)有項(xiàng)目數(shù)據(jù)以及其他各類與科技計(jì)劃管理相關(guān)的數(shù)據(jù),如機(jī)構(gòu)信息庫(kù)、人員信息庫(kù)、論文資源庫(kù),只有具備這些海量的數(shù)據(jù),才能實(shí)現(xiàn)系統(tǒng)對(duì)評(píng)審專家的精準(zhǔn)匹配需求[5]。
3.1.2 數(shù)據(jù)存儲(chǔ)分析層設(shè)計(jì)
通過(guò)設(shè)計(jì)和構(gòu)建基礎(chǔ)數(shù)據(jù)層雖能為科技專家?guī)旃芾硐到y(tǒng)獲取海量的數(shù)據(jù)信息,但是,這些數(shù)據(jù)信息存在結(jié)構(gòu)各異、類型和標(biāo)準(zhǔn)不一等特點(diǎn),若直接將這些數(shù)據(jù)信息提供給用戶,將會(huì)導(dǎo)致專家標(biāo)準(zhǔn)規(guī)范多,從而也難以滿足精準(zhǔn)的匹配需求,為解決這一問(wèn)題,就需要設(shè)計(jì)數(shù)據(jù)存儲(chǔ)分析層,利用該分析層和據(jù)識(shí)別、數(shù)據(jù)傳輸、數(shù)據(jù)感知等大數(shù)據(jù)技術(shù)對(duì)專家?guī)熘械幕A(chǔ)數(shù)據(jù)進(jìn)行匯聚、標(biāo)準(zhǔn)清洗及加工處理,最后形成數(shù)據(jù)中心庫(kù),該數(shù)據(jù)中心庫(kù)不僅能對(duì)相關(guān)數(shù)據(jù)進(jìn)行分析、計(jì)算和關(guān)聯(lián)分析,同時(shí)還能自動(dòng)將最終得到的分析結(jié)果傳輸給數(shù)據(jù)服務(wù)層,以促進(jìn)數(shù)據(jù)服務(wù)層為用戶提供良好的數(shù)據(jù)服務(wù)。
3.1.3 數(shù)據(jù)服務(wù)層設(shè)計(jì)
為給各類用戶提供良好和高效的科技項(xiàng)目咨詢、專家管理和科研評(píng)審等服務(wù),就需要根據(jù)科技項(xiàng)目的實(shí)際業(yè)務(wù)需求,對(duì)大數(shù)據(jù)技術(shù)、互動(dòng)交流技術(shù)、互聯(lián)網(wǎng)可視化技術(shù)等進(jìn)行有機(jī)整合,這樣不僅能有效實(shí)現(xiàn)專家?guī)旃芾硇畔⑾到y(tǒng)的合理應(yīng)用,還能實(shí)現(xiàn)專家?guī)旃芾硇畔⑶岸说娘@示,從而能提升用戶對(duì)科技專家?guī)旃芾硐到y(tǒng)使用的滿意度[6]。
完成專家?guī)旃芾硇畔⑾到y(tǒng)架構(gòu)設(shè)計(jì)和構(gòu)建后,便是采用合理的大數(shù)據(jù)技術(shù)進(jìn)行專家管理信息系統(tǒng)設(shè)計(jì),常用的大數(shù)據(jù)技術(shù)有數(shù)據(jù)存儲(chǔ)技術(shù)、大數(shù)據(jù)挖掘分析技術(shù)等,構(gòu)建的專家管理信息系統(tǒng)主要包含了專家管理和專家推薦兩大類別,下面具體介紹構(gòu)建專家管理信息系統(tǒng)應(yīng)用的大數(shù)據(jù)技術(shù)及方法。
3.2.1 專家管理信息系統(tǒng)設(shè)計(jì)和構(gòu)建中應(yīng)用的大數(shù)據(jù)技術(shù)
數(shù)據(jù)存儲(chǔ)技術(shù)、大數(shù)據(jù)挖掘分析技術(shù)不僅是兩項(xiàng)關(guān)鍵性的大數(shù)據(jù)技術(shù),同時(shí)也是構(gòu)建專家管理信息系統(tǒng)必不可少的兩大技術(shù)。
(1)數(shù)據(jù)存儲(chǔ)技術(shù),上面已說(shuō)到基礎(chǔ)數(shù)據(jù)層中的數(shù)據(jù)具有海量、結(jié)構(gòu)各異、類型和標(biāo)準(zhǔn)不一等特點(diǎn),這主要是因?yàn)檫@些數(shù)據(jù)來(lái)源于不同類型的數(shù)據(jù)庫(kù),而不同類型的數(shù)據(jù)存儲(chǔ)和管理方式有存在顯著的差異,一般來(lái)說(shuō),數(shù)據(jù)信息可分為非結(jié)構(gòu)化和結(jié)構(gòu)化兩種類型,其中,結(jié)構(gòu)化數(shù)據(jù)信息多采用關(guān)系型數(shù)據(jù)庫(kù)進(jìn)行存儲(chǔ)和管理,非結(jié)構(gòu)化數(shù)據(jù)信息存儲(chǔ)和管理就相對(duì)復(fù)雜,且相比于單純的非結(jié)構(gòu)化數(shù)據(jù)信息,海量異構(gòu)的非結(jié)構(gòu)化數(shù)據(jù)信息存儲(chǔ)和管理更加復(fù)雜,對(duì)此,為實(shí)現(xiàn)這些數(shù)據(jù)信息的結(jié)構(gòu)、類型統(tǒng)一,就需要采用No SQL 數(shù)據(jù)庫(kù)(HBase)、布式文件系統(tǒng)(HDFS)、大數(shù)據(jù)倉(cāng)庫(kù)(Hive)、MPP 數(shù)據(jù)庫(kù)等大數(shù)據(jù)存儲(chǔ)技術(shù)對(duì)一些零散的數(shù)據(jù)信息進(jìn)行有機(jī)整合、實(shí)時(shí)處理、存儲(chǔ)和管理,才能有效實(shí)現(xiàn)結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)的合理轉(zhuǎn)換與存儲(chǔ)。
(2)大數(shù)據(jù)挖掘分析技術(shù),指的是采用文本分析、關(guān)聯(lián)分析、回歸分析、網(wǎng)絡(luò)分析、聚類分析等大數(shù)據(jù)挖掘分析技術(shù)獲取各類基礎(chǔ)數(shù)據(jù)中隱藏的有價(jià)值的信息,才能為用戶在海量的數(shù)據(jù)庫(kù)中快速、準(zhǔn)確地匹配到其所需的數(shù)據(jù)信息。由于科技專家?guī)旃芾硐到y(tǒng)本身是一個(gè)數(shù)據(jù)規(guī)模龐大、數(shù)據(jù)類別多且數(shù)據(jù)分散的系統(tǒng),若采用傳統(tǒng)的數(shù)據(jù)挖掘分析技術(shù)對(duì)其進(jìn)行處理,不僅要耗費(fèi)較長(zhǎng)的時(shí)間,同時(shí)也難以確保數(shù)據(jù)挖掘分析結(jié)果的有效性,而采用大數(shù)據(jù)挖掘分析技術(shù)則能借助于科學(xué)的數(shù)據(jù)挖掘分析方法對(duì)數(shù)據(jù)信息進(jìn)行挖掘分析,如在文本分析方法中可采用關(guān)鍵詞提取、詞義聯(lián)系、自動(dòng)摘要、詞性分析、分詞工具、依存文法、漢字轉(zhuǎn)拼音、繁體轉(zhuǎn)換、簡(jiǎn)體轉(zhuǎn)換等多種技術(shù)對(duì)相關(guān)數(shù)據(jù)信息進(jìn)行多維關(guān)聯(lián)分析,并形成關(guān)系圖譜,從而能實(shí)現(xiàn)數(shù)據(jù)信息的高效處理[7]。
3.2.2 專家管理信息系統(tǒng)設(shè)計(jì)和構(gòu)建方法
構(gòu)建基于大數(shù)據(jù)的科技專家?guī)旃芾硐到y(tǒng)的最終目標(biāo)一方面是為科研人員、科技管理者、社會(huì)公眾等系統(tǒng)使用用戶提供高效的信息服務(wù),另一方面還能為科技專家提供科學(xué)的管理服務(wù),要同時(shí)達(dá)到這兩個(gè)目標(biāo)要求,就需要以大數(shù)據(jù)技術(shù)為技術(shù)基礎(chǔ),以信息技術(shù)為輔,根據(jù)專家?guī)旃芾硐到y(tǒng)業(yè)務(wù)需求合理設(shè)計(jì)和構(gòu)建一個(gè)科學(xué)的專家管理信息系統(tǒng),該系統(tǒng)應(yīng)由專家管理和專家推薦兩部分組成,才能實(shí)現(xiàn)科技專家的規(guī)范、高效管理和為用戶提供良好的數(shù)據(jù)支撐及科技咨詢服務(wù)。
(1)專家管理。在構(gòu)建專家管理信息系統(tǒng)過(guò)程中,構(gòu)建人員應(yīng)以大數(shù)據(jù)存儲(chǔ)技術(shù)為主要手段,以信息標(biāo)準(zhǔn)規(guī)范為基準(zhǔn),全面采集或征集科技專家相關(guān)的信息,并采用大數(shù)據(jù)信息挖掘分析技術(shù)對(duì)專家信息進(jìn)行動(dòng)態(tài)化和高效管理,另外,還需嚴(yán)格做好篩選出的有價(jià)值的專家信息的入庫(kù)、出庫(kù)審核工作,才能全面提高專家管理設(shè)計(jì)和構(gòu)建質(zhì)量。
(2)專家推薦。為實(shí)現(xiàn)評(píng)審專家與科技項(xiàng)目的精準(zhǔn)匹配以及根據(jù)科技項(xiàng)目特點(diǎn)為用戶提供良好科技咨詢服務(wù)等功能,在設(shè)計(jì)和構(gòu)建專家推薦系統(tǒng)過(guò)程中,構(gòu)建人員需采用專家數(shù)據(jù)分析技術(shù)聯(lián)合關(guān)聯(lián)分析技術(shù)對(duì)多維度的專家信息進(jìn)行采集和分析,如學(xué)歷、基本信息、工作經(jīng)歷、承擔(dān)項(xiàng)目、榮譽(yù)、科研成果等,并生成專家信息,然后,利用支撐、人才稱號(hào)等限制條件對(duì)入選的專家進(jìn)行層層篩選,這樣不僅能促進(jìn)參評(píng)項(xiàng)目或咨詢服務(wù)與專家實(shí)現(xiàn)精準(zhǔn)化匹配,還能提高系統(tǒng)的專家推薦效率。完成專家推薦系統(tǒng)構(gòu)建后,系統(tǒng)管理人員還需對(duì)專家推薦系統(tǒng)進(jìn)行科學(xué)評(píng)價(jià),才能全面提升專家推薦和科技評(píng)審質(zhì)量[8]。
科技專家?guī)旃芾硐到y(tǒng)是一個(gè)收集了各行業(yè)科技評(píng)審專家及其咨詢意見(jiàn)和建議的信息智庫(kù),該信息智庫(kù)具有數(shù)據(jù)信息量大、管理相對(duì)復(fù)雜等特點(diǎn),需要借助于大數(shù)據(jù)技術(shù)對(duì)相關(guān)信息數(shù)據(jù)進(jìn)行全面收集、充分挖掘、結(jié)構(gòu)化處理、存儲(chǔ)和管理,才能提高科技專家?guī)旃芾碣|(zhì)量和效率,從而才能為相關(guān)使用者提供良好的信息服務(wù),然而,當(dāng)前不少科技業(yè)務(wù)部門工作人員并未掌握構(gòu)建基于大數(shù)據(jù)的科技專家?guī)旃芾硐到y(tǒng)的方法,基于此,筆者總結(jié)了專家?guī)旃芾硇畔⑾到y(tǒng)架構(gòu)設(shè)計(jì)方法,包含基礎(chǔ)數(shù)據(jù)層設(shè)計(jì)、數(shù)據(jù)存儲(chǔ)分析層設(shè)計(jì)及數(shù)據(jù)服務(wù)層設(shè)計(jì),另外,還需采用數(shù)據(jù)存儲(chǔ)技術(shù)、大數(shù)據(jù)挖掘分析技術(shù)等關(guān)鍵性大數(shù)據(jù)技術(shù)做好專家管理、專家推薦兩大專家管理信息系統(tǒng)構(gòu)建,才能實(shí)現(xiàn)科技專家的規(guī)范、高效管理和為用戶提供良好的數(shù)據(jù)支撐及科技咨詢服務(wù),從而才能推動(dòng)我國(guó)科技水平的不斷發(fā)展和進(jìn)步。