歐衛(wèi)紅
(廣州科技職業(yè)技術(shù)大學(xué),廣東 廣州 510555)
為應(yīng)對(duì)信息資源網(wǎng)絡(luò)化和數(shù)字化的需求,人們需要借助網(wǎng)絡(luò)信息計(jì)量學(xué)的相關(guān)工具來(lái)計(jì)量網(wǎng)絡(luò)上的電子信息資源,解決相應(yīng)的計(jì)量問(wèn)題,這對(duì)相關(guān)行業(yè)的發(fā)展具有重要的指導(dǎo)價(jià)值。因此,當(dāng)前必須明確網(wǎng)絡(luò)信息計(jì)量學(xué)的應(yīng)用領(lǐng)域以及軟件開(kāi)發(fā)方向,朝著既定的方向?qū)W(xué)科進(jìn)行不斷完善優(yōu)化,令其更好地服務(wù)于信息化時(shí)代。
從研究現(xiàn)狀及發(fā)展趨勢(shì)角度來(lái)看待網(wǎng)絡(luò)信息計(jì)量學(xué),可以將其看作是一門(mén)以統(tǒng)計(jì)學(xué)和數(shù)學(xué)為定量研究方法,以組織、傳遞、開(kāi)發(fā)利用網(wǎng)絡(luò)信息為目的,通過(guò)定量描述和統(tǒng)計(jì)分析揭示信息內(nèi)在規(guī)律的一門(mén)學(xué)科。該學(xué)科的核心構(gòu)成包括網(wǎng)絡(luò)技術(shù)、網(wǎng)絡(luò)管理、信息計(jì)量學(xué)以及信息資源管理,學(xué)科交叉性相對(duì)較強(qiáng),是網(wǎng)絡(luò)信息的重要研究領(lǐng)域。基于此,以下將對(duì)其主要研究對(duì)象進(jìn)行系統(tǒng)性介紹。
多媒體數(shù)字信息主要包括文字信息、圖像信息以及音頻信息等,對(duì)這部分信息的研究統(tǒng)稱(chēng)網(wǎng)絡(luò)信息的直接計(jì)量問(wèn)題,隨著網(wǎng)絡(luò)信息的爆炸式增長(zhǎng),如何對(duì)數(shù)以?xún)|萬(wàn)計(jì)的信息進(jìn)行統(tǒng)計(jì)是一項(xiàng)新的挑戰(zhàn)。通過(guò)對(duì)網(wǎng)絡(luò)信息的統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)類(lèi)型以及相關(guān)問(wèn)題展開(kāi)討論,相關(guān)學(xué)者認(rèn)為信息的計(jì)量方向應(yīng)包括站點(diǎn)數(shù)量、靜止的網(wǎng)頁(yè)數(shù)、網(wǎng)頁(yè)平均規(guī)模、網(wǎng)頁(yè)平均壽命甚至語(yǔ)言分布等[1]。
網(wǎng)絡(luò)上分布著大量的電子期刊、讀書(shū)報(bào)告、學(xué)術(shù)論文等不同表現(xiàn)形式的文獻(xiàn),而文獻(xiàn)信息及相關(guān)特征信息的計(jì)量問(wèn)題主要研究文獻(xiàn)的分布結(jié)構(gòu)、學(xué)科方向、關(guān)鍵詞以及相關(guān)著作信息等,涉及一次文獻(xiàn)、二次文獻(xiàn)甚至是三次文獻(xiàn)的計(jì)量。
就網(wǎng)絡(luò)結(jié)構(gòu)單元的信息計(jì)量問(wèn)題這一研究對(duì)象來(lái)看,其結(jié)構(gòu)單元囊括討論組、聊天室、站點(diǎn)以及電子郵件等,上述結(jié)構(gòu)單元中存在不同程度的信息增長(zhǎng)、信息傳遞以及信息老化問(wèn)題,這正是網(wǎng)絡(luò)信息計(jì)量學(xué)的重點(diǎn)研究方向。除此以外,學(xué)科的研究對(duì)象還包括上述各單元的相互引證和聯(lián)系[2]。
隨著網(wǎng)絡(luò)信息計(jì)量學(xué)的不斷發(fā)展完善,該學(xué)科理論及配套工具的應(yīng)用為各學(xué)科發(fā)展趨勢(shì)的探討提供了切入點(diǎn),有助于專(zhuān)家學(xué)者從專(zhuān)業(yè)角度建立新的科學(xué)發(fā)展指標(biāo),為決策制定提供參考依據(jù)。通過(guò)對(duì)網(wǎng)絡(luò)上電子期刊、文獻(xiàn)信息、聊天室、討論組等進(jìn)行計(jì)量分析,可以大致推斷出網(wǎng)絡(luò)上科學(xué)信息的分布情況。與此同時(shí),借助專(zhuān)業(yè)軟件,可以將特定對(duì)象的電子郵件使用情況作為媒介分析網(wǎng)上的科學(xué)信息交流情況。
對(duì)網(wǎng)絡(luò)信息資源開(kāi)發(fā)利用情況的研究是網(wǎng)絡(luò)信息計(jì)量學(xué)極具實(shí)用性的一個(gè)應(yīng)用方向。其主要通過(guò)特定指標(biāo)對(duì)網(wǎng)絡(luò)信息資源進(jìn)行評(píng)價(jià),進(jìn)而指導(dǎo)資源的開(kāi)發(fā)利用。具體來(lái)說(shuō),人們可以通過(guò)互聯(lián)網(wǎng)檢索到海量的信息資源,但網(wǎng)絡(luò)信息畢竟良莠不齊,其中不乏虛假的數(shù)據(jù)材料,由于用戶(hù)辨別信息的能力有限,這部分未經(jīng)權(quán)威認(rèn)證的材料很容易對(duì)用戶(hù)做出誤導(dǎo),導(dǎo)致網(wǎng)絡(luò)信息資源開(kāi)發(fā)進(jìn)入僵局。
挖掘并對(duì)網(wǎng)絡(luò)信息資源進(jìn)行分類(lèi),并在此基礎(chǔ)上開(kāi)發(fā)網(wǎng)絡(luò)搜索引擎同樣需要應(yīng)用到網(wǎng)絡(luò)信息計(jì)量學(xué)相關(guān)知識(shí)。由此可見(jiàn),網(wǎng)絡(luò)信息計(jì)量學(xué)對(duì)于網(wǎng)絡(luò)信息檢索技術(shù)的發(fā)展具有重要推動(dòng)意義。一般情況下,搜索引擎開(kāi)發(fā)主要須涉及做網(wǎng)絡(luò)的關(guān)鍵詞、超鏈接以及相關(guān)特征的定量分析,在上述信息數(shù)據(jù)已知的前提下,專(zhuān)業(yè)學(xué)者可以研究網(wǎng)上的實(shí)時(shí)的動(dòng)態(tài)信息特點(diǎn),并通過(guò)相關(guān)程序?qū)?dòng)態(tài)信息進(jìn)行自動(dòng)化的抓取和過(guò)濾,實(shí)現(xiàn)高效率的信息分類(lèi)。從某種角度來(lái)說(shuō),這一研究實(shí)踐為信息搜索過(guò)程設(shè)計(jì)提供了參考,可以對(duì)搜索結(jié)果進(jìn)行智能化排序。
在網(wǎng)絡(luò)信息計(jì)量學(xué)的支持下,信息技術(shù)人員可以對(duì)用戶(hù)的信息需求以及上網(wǎng)習(xí)慣進(jìn)行研究,從而為網(wǎng)絡(luò)建設(shè)及網(wǎng)站管理的相關(guān)決策提供重要依據(jù)。隨著網(wǎng)絡(luò)信息技術(shù)的繁榮發(fā)展,電腦等電子媒介逐漸普及,網(wǎng)絡(luò)用戶(hù)也整體呈現(xiàn)出迅猛的增長(zhǎng)態(tài)勢(shì)。而針對(duì)網(wǎng)站開(kāi)發(fā)者而言,若網(wǎng)站不符合用戶(hù)的信息需求和上網(wǎng)習(xí)慣,則網(wǎng)站將會(huì)大概率面臨虧損。但是,用戶(hù)網(wǎng)上行為普遍具有隨意性,對(duì)用戶(hù)的信息需求以及行為習(xí)慣進(jìn)行記錄和匯總何其困難。針對(duì)這一問(wèn)題,專(zhuān)家學(xué)者主張從兩種角度展開(kāi)用戶(hù)研究,一種是在專(zhuān)業(yè)軟件的配合下進(jìn)行動(dòng)態(tài)追蹤,另一種則是以互聯(lián)網(wǎng)為載體展開(kāi)交互式調(diào)查,并對(duì)搜查所獲得的數(shù)據(jù)進(jìn)行計(jì)量分析。近幾年來(lái),互聯(lián)網(wǎng)行業(yè)爆發(fā)出較大的潛力,相對(duì)網(wǎng)絡(luò)競(jìng)爭(zhēng)也日趨激烈,只有在用戶(hù)需求基礎(chǔ)上建立開(kāi)發(fā)網(wǎng)站,方能真正提升行業(yè)的競(jìng)爭(zhēng)力,因此對(duì)于用戶(hù)的信息需求的計(jì)量研究至關(guān)重要[3]。
網(wǎng)絡(luò)信息計(jì)量學(xué)軟件是該門(mén)學(xué)科發(fā)展的重要工具,國(guó)內(nèi)外無(wú)數(shù)專(zhuān)家學(xué)者聚焦新型信息計(jì)量學(xué)軟件開(kāi)發(fā)工作,并取得了顯著的成效。但長(zhǎng)遠(yuǎn)來(lái)看,網(wǎng)絡(luò)信息計(jì)量學(xué)的發(fā)展仍舊具備無(wú)限潛力,其軟件開(kāi)發(fā)整體存在以下幾個(gè)大方向。
雖然網(wǎng)絡(luò)信息計(jì)量學(xué)的應(yīng)用領(lǐng)域相對(duì)較廣,但其宏觀環(huán)境是信息網(wǎng)絡(luò)。因此,無(wú)論是短期還是長(zhǎng)期,軟件面向網(wǎng)絡(luò)是軟件開(kāi)發(fā)的必然方向。以現(xiàn)階段網(wǎng)絡(luò)結(jié)構(gòu)為例,軟件與網(wǎng)絡(luò)集成覆蓋內(nèi)聯(lián)網(wǎng)、外聯(lián)網(wǎng)以及互聯(lián)網(wǎng),這也間接體現(xiàn)了網(wǎng)絡(luò)信息計(jì)量學(xué)軟件的基本特征,即內(nèi)嵌于網(wǎng)絡(luò)技術(shù)和網(wǎng)絡(luò)環(huán)境。
網(wǎng)絡(luò)信息計(jì)量軟件的功能細(xì)化已經(jīng)初見(jiàn)成效,但隨著網(wǎng)絡(luò)信息計(jì)量學(xué)研究的日益深入,各行業(yè)以及各應(yīng)用領(lǐng)域?qū)τ谙盗熊浖膮?shù)要求會(huì)愈加嚴(yán)格。面對(duì)這一需求,一方面,要對(duì)網(wǎng)絡(luò)信息計(jì)量軟件的原有功能進(jìn)行補(bǔ)充和完善,增加統(tǒng)計(jì)分析指標(biāo)、信息處理等功能,并對(duì)功能進(jìn)行細(xì)致的優(yōu)化。另一方面,為滿足網(wǎng)絡(luò)信息計(jì)量研究日益增長(zhǎng)的需求,軟件在創(chuàng)新中應(yīng)具備多功能集成。具體來(lái)說(shuō),多功能集成既包括信息的收集、轉(zhuǎn)化、整理以及分析,也包括數(shù)據(jù)庫(kù)、功能包、詞典等輔助工具的開(kāi)發(fā)。
自動(dòng)化是網(wǎng)絡(luò)信息計(jì)量學(xué)軟件開(kāi)發(fā)的重要方向,伴隨信息的海量增長(zhǎng),借助人工手段對(duì)信息進(jìn)行處理已經(jīng)不切實(shí)際??陀^來(lái)說(shuō),自動(dòng)化信息處理包括信息的自動(dòng)化轉(zhuǎn)化、整理、歸納以及分析等,其必須依托智能化檢索和智能化分析來(lái)實(shí)現(xiàn)。在現(xiàn)有技術(shù)水平下,網(wǎng)絡(luò)內(nèi)容分析主要可以從語(yǔ)用層次分析和信息語(yǔ)義分析兩方面來(lái)發(fā)展,而隨著軟件的進(jìn)一步更新,網(wǎng)絡(luò)內(nèi)容分析將會(huì)向語(yǔ)法層次和語(yǔ)用層次邁進(jìn),而這勢(shì)必會(huì)推動(dòng)信息計(jì)量學(xué)軟件智能化水平的提升。
由于網(wǎng)絡(luò)信息計(jì)量學(xué)軟件開(kāi)發(fā)上存在短板,現(xiàn)階段網(wǎng)絡(luò)信息計(jì)量分析工作還存在不規(guī)范的亂象。但隨著學(xué)科發(fā)展不斷完善,該問(wèn)題或?qū)⒌玫礁拘越鉀Q。具體來(lái)說(shuō),規(guī)范化的信息處理工作應(yīng)建立在規(guī)范的軟件自動(dòng)化收集網(wǎng)絡(luò)信息數(shù)據(jù)項(xiàng)、規(guī)范的軟件數(shù)據(jù)統(tǒng)計(jì)指標(biāo)、規(guī)范的軟件讀取、轉(zhuǎn)化以及數(shù)據(jù)格式生成等方面。若上述條件能達(dá)成,則網(wǎng)絡(luò)數(shù)據(jù)的準(zhǔn)確性和完整性將會(huì)得到質(zhì)的飛躍。
面對(duì)網(wǎng)絡(luò)信息計(jì)量學(xué)的不同研究需求,多版本軟件開(kāi)發(fā)具有必然性。比如說(shuō),網(wǎng)站規(guī)模不同,則對(duì)應(yīng)的軟件處理版本不同,語(yǔ)言?xún)?nèi)容不同,對(duì)版本分析能力的要求也不同。因此,相關(guān)技術(shù)人員可以根據(jù)具體的網(wǎng)絡(luò)信息計(jì)量學(xué)研究對(duì)象以及研究方向開(kāi)發(fā)對(duì)應(yīng)的版本軟件,從而針對(duì)性地對(duì)原內(nèi)容進(jìn)行分析,以問(wèn)題的難度系數(shù)為標(biāo)準(zhǔn)選擇簡(jiǎn)易版或集成版、單機(jī)版或網(wǎng)絡(luò)版的軟件,以滿足網(wǎng)絡(luò)信息計(jì)量學(xué)的不同需求。
綜上所述,目前國(guó)內(nèi)外對(duì)于網(wǎng)絡(luò)信息計(jì)量學(xué)的研究已經(jīng)形成一定規(guī)模,網(wǎng)絡(luò)信息計(jì)量軟件的開(kāi)發(fā)應(yīng)用也取得顯著成效。隨著信息化時(shí)代的日益推進(jìn),相關(guān)領(lǐng)域?qū)<覍W(xué)者及技術(shù)人員應(yīng)立足學(xué)科對(duì)軟件支持的需求,不斷開(kāi)拓學(xué)科應(yīng)用領(lǐng)域,推斷網(wǎng)絡(luò)信息計(jì)量學(xué)的深層次、大范圍應(yīng)用。