葉健
摘要:隨著互聯(lián)網(wǎng)絡(luò)信息與計(jì)算機(jī)技術(shù)的深入發(fā)展,網(wǎng)絡(luò)信息資源具有多元化、隨機(jī)性、碎片化、模糊化、個(gè)性化等特征,為了更加精準(zhǔn)和有針對性的利用網(wǎng)絡(luò)信息資源,需要采取科學(xué)合理行之有效的開發(fā)與挖掘方法,使得數(shù)據(jù)信息能夠得到有效應(yīng)用。
關(guān)鍵詞:網(wǎng)絡(luò);組織;開發(fā);信息資源;數(shù)據(jù)挖掘
中圖分類號:TP311.13 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2017)01-0105-01
1 價(jià)值概述:網(wǎng)絡(luò)信息資源開發(fā)與挖掘的意義
網(wǎng)絡(luò)信息資源較之于傳統(tǒng)的一般的信息資源而言,具有其獨(dú)特的特征,信息內(nèi)容豐富,信息變化頻繁,信息結(jié)構(gòu)復(fù)雜,信息格式多樣。誠然,這些信息的本身的價(jià)值大小也不一樣。我們所處的信息環(huán)境是在不斷變化的,而且信息技術(shù)條件對信息環(huán)境的變化是革命性的,信息環(huán)境影響、催化或在一定程度上決定了人們的信息需求。
網(wǎng)絡(luò)信息資源的開發(fā)與挖掘就在于從紛繁復(fù)雜的“大數(shù)據(jù)”里通過合理的成本支出和科學(xué)的手段獲取有效信息。一般而言,針對于用戶行為層面的“大數(shù)據(jù)”(big data),乃是基于用戶行為信息的海量數(shù)據(jù)源,亦是用戶行為信息爆炸的產(chǎn)物。在自媒體及移動終端技術(shù)不斷發(fā)展的深刻變革前提下,用戶行為大數(shù)據(jù)具有幾個(gè)基本特點(diǎn),亦稱之為“4V”特點(diǎn):其一是Volume(指的是用戶行為信息的海量數(shù)據(jù)資料),其二是Velocity(指的是用戶行為信息的產(chǎn)生更新迭代速度快),其三是Variety(用戶行為信息類型繁復(fù)多樣),其四是Veracity(基于自媒體等智能挖掘的用戶信息真實(shí))。
基于大數(shù)據(jù)的數(shù)據(jù)挖掘概言之就是從多元的、大量的、不完全的、模糊的、隨機(jī)的、碎片化的、零散分布的數(shù)據(jù)中挖掘出我們所需要的潛在有效信息。這些信息能夠被充分應(yīng)用于電子商務(wù)、生活服務(wù)、經(jīng)濟(jì)貿(mào)易、學(xué)術(shù)研究、科技提升等諸多領(lǐng)域。
2 模式分析:網(wǎng)絡(luò)信息資源開發(fā)與挖掘的基本模式
針對較為專業(yè)的諸如學(xué)術(shù)信息資源的開發(fā)與挖掘主要利用網(wǎng)絡(luò)搜索引擎及開放式存取的模式進(jìn)行開發(fā)與挖掘。其一是綜合型搜索引擎,如百度、搜狐、新浪、Google、Yahoo、AlltheWeb、dmoz、MSN Search、。其二是專用搜索引擎,包括查找學(xué)術(shù)資源、查詢圖像信息、查找電子郵件、電話號碼、人物、新聞組、FTP服務(wù)器方面的引擎,如- WWW Virtual Library、 Intute、SCIRUS(科技文獻(xiàn))、Google scholar。各種網(wǎng)絡(luò)搜索引擎的使用方法大體相同,根據(jù)用戶需要,可以輸入檢索詞進(jìn)行主題查詢,也可以從分類目錄逐級查詢。其三是開放存取資源,如開放存取(Open Access,簡稱OA)是國際科技界、學(xué)術(shù)界、出版界、信息傳播界為推動科研成果利用網(wǎng)絡(luò)自由傳播而發(fā)起的運(yùn)動。通過蓋技術(shù),任何人可以免費(fèi)的獲得各類文獻(xiàn)。開放存取不是一個(gè)技術(shù)問題,而是一個(gè)觀念和文化問題。
針對分散多元的信息需要通過數(shù)據(jù)挖掘工具手段加以實(shí)現(xiàn)。數(shù)據(jù)挖掘(Mining for Data)工具,其所用的網(wǎng)絡(luò)信息數(shù)據(jù)都存儲在已經(jīng)有了明確字段定義的數(shù)據(jù)庫或文本文件里,我們稱之為結(jié)構(gòu)化的網(wǎng)絡(luò)信息數(shù)據(jù)挖掘工具。它主要是用來進(jìn)行預(yù)測、聚類分析、關(guān)聯(lián)分析、時(shí)間序列分析以及統(tǒng)計(jì)分析等。此外,需要指出的是對于一些數(shù)據(jù)信息還需要充分利用文本挖掘手段和技術(shù)來加以實(shí)現(xiàn)。
3 未來路徑:網(wǎng)絡(luò)信息資源開發(fā)與挖掘的發(fā)展趨勢
隨著大數(shù)據(jù)以及云計(jì)算技術(shù)的不斷深入發(fā)展以及人們對網(wǎng)絡(luò)信息資源的需求日漸精細(xì)化和精準(zhǔn)化,網(wǎng)絡(luò)信息資源開發(fā)與挖掘未來在技術(shù)創(chuàng)新、渠道多元、成本收益比率等方面都會進(jìn)行相應(yīng)的提高。
對于網(wǎng)絡(luò)信息資源開發(fā)與挖掘的共享未來亦會成為一個(gè)全新的趨勢。網(wǎng)絡(luò)本身具有開放性,為了能夠更好的服務(wù)網(wǎng)絡(luò)信息資源使用者,充分發(fā)揮其價(jià)值,網(wǎng)絡(luò)資源的共享具有十分重要的意義與價(jià)值。今后應(yīng)更加了解信息技術(shù)和網(wǎng)絡(luò)技術(shù)的使用,并積極尋求通過技術(shù)手段提高網(wǎng)絡(luò)信息資源和服務(wù)的覆蓋率。但是這也不可避免的存在諸多風(fēng)險(xiǎn),需要指出的是,系統(tǒng)的實(shí)現(xiàn)還需要充分加強(qiáng)對系統(tǒng)的風(fēng)險(xiǎn)管理。然而,有許多風(fēng)險(xiǎn)需要指出,需要加強(qiáng)系統(tǒng)的風(fēng)險(xiǎn)管理來實(shí)現(xiàn)系統(tǒng)功能。構(gòu)建基于安全前提下的網(wǎng)絡(luò)安全實(shí)現(xiàn)的大數(shù)據(jù)管理體系,實(shí)現(xiàn)相關(guān)信息的共享至關(guān)重要。隨著網(wǎng)絡(luò)技術(shù)的進(jìn)一步發(fā)展,尤其是“大數(shù)據(jù)”、“云計(jì)算”時(shí)代的來臨,可以充分利用相關(guān)技術(shù)構(gòu)建基于網(wǎng)絡(luò)安全實(shí)現(xiàn)的大數(shù)據(jù)管理體系,實(shí)現(xiàn)數(shù)據(jù)源及信息流的流動的信任機(jī)制和協(xié)商機(jī)制建設(shè)。
參考文獻(xiàn)
[1]王娜.網(wǎng)絡(luò)信息資源挖掘研究概述[J].圖書館學(xué)刊,2007(1):123-124.
[2]黃南霞,謝輝,王學(xué)東等.大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò)協(xié)同創(chuàng)新平臺及其應(yīng)用研究[J].現(xiàn)代情報(bào),2013,33(10):75-79.
[3]趙曉菲.動態(tài)關(guān)聯(lián)規(guī)則在網(wǎng)絡(luò)數(shù)據(jù)挖掘中的應(yīng)用[J].數(shù)字技術(shù)與應(yīng)用,2015(3):71-71.