?
“大數(shù)據(jù)”時代背景下計算機(jī)信息處理技術(shù)的分析
嚴(yán)平
鹽城市經(jīng)濟(jì)和信息化委員會 224001
[摘要]隨著網(wǎng)絡(luò)技術(shù)和信息技術(shù)的不斷發(fā)展,給社會生產(chǎn)生活帶來了巨大變化,與此同時也促使社會步入大數(shù)據(jù)時代?;诖诵蝿菹?,對計算機(jī)信息處理技術(shù)有了更高的要求。本文從“大數(shù)據(jù)”與計算機(jī)信息處理技術(shù)的概念出發(fā),闡述“大數(shù)據(jù)”的作用,在此基礎(chǔ)上系統(tǒng)分析“大數(shù)據(jù)”時代背景下的計算機(jī)信息處理技術(shù),并對其未來發(fā)展趨勢進(jìn)行探討。
[關(guān)鍵詞]“大數(shù)據(jù)”;計算機(jī);信息處理
進(jìn)入21世紀(jì)以來,在社會經(jīng)濟(jì)發(fā)展中多種多樣的數(shù)據(jù)大量出現(xiàn),逐步形成“大數(shù)據(jù)”環(huán)境,以致于數(shù)據(jù)容量及其結(jié)構(gòu)發(fā)生了巨大改變[1]。在此背景下,對現(xiàn)代計算機(jī)信息處理技術(shù)的要求日益提高。因此,加強(qiáng)對“大數(shù)據(jù)”時代背景下的計算機(jī)信息處理技術(shù)的研究,具有重要的現(xiàn)實意義。
1.1“大數(shù)據(jù)”的概念
“大數(shù)據(jù)”是一個基于現(xiàn)代計算機(jī)信息技術(shù)發(fā)展而來的具有時代特征的新概念。所謂“大數(shù)據(jù)”,就是指數(shù)據(jù)的量和規(guī)模極為巨大,且可從中獲取到有價值、有作用的信息。大數(shù)據(jù)具有量大、種類多樣、處理速度極快及價值密度偏低的特點。目前,對大數(shù)據(jù)的“大”尚無統(tǒng)一標(biāo)準(zhǔn),通常數(shù)據(jù)量大于10TB到1PB。現(xiàn)階段,大數(shù)據(jù)相關(guān)的重要技術(shù)包括分類分析、機(jī)器學(xué)習(xí)、遺傳算法等[2]。
1.2計算機(jī)信息處理技術(shù)的概念
進(jìn)入信息時代以來,計算機(jī)信息技術(shù)取得了長足發(fā)展,它是集數(shù)據(jù)傳輸、采集、分析及處理于一體的一項技術(shù)。主要有網(wǎng)絡(luò)技術(shù)、計算機(jī)技術(shù)、通信技術(shù)等。根據(jù)類型分為信息系統(tǒng)技術(shù)、檢索技術(shù)及數(shù)據(jù)庫技術(shù)等。其中,信息處理技術(shù)是最為核心的一項,其他兩項為分析技術(shù)。而尤以數(shù)據(jù)庫技術(shù)最為關(guān)鍵,其能將所有相關(guān)信息進(jìn)行歸集和整合,并進(jìn)行有效儲存為滿足不同客戶的需求。
“大數(shù)據(jù)”的形成和應(yīng)用在現(xiàn)代社會中發(fā)揮重要作用,具體而言,表現(xiàn)在三個方面:一是“大數(shù)據(jù)”是一項國家信息戰(zhàn)略性資源,它的研究和發(fā)展直接關(guān)系到國家信息安全和國際競爭力,關(guān)系到一個國家的安全和社會的穩(wěn)定。二是“大數(shù)據(jù)”有助于推動國家新技術(shù)產(chǎn)業(yè)的升級及發(fā)展。特別是云計算和物聯(lián)網(wǎng)的廣泛應(yīng)用,極大提高社會生產(chǎn)和科研的效率。進(jìn)一步推進(jìn)了我國產(chǎn)業(yè)信息化和現(xiàn)代化的進(jìn)程。三是“大數(shù)據(jù)”的形成引發(fā)了現(xiàn)代科學(xué)思維的變革。大數(shù)據(jù)的復(fù)雜特性促使人們逐步探尋相關(guān)理論,極大推動了科學(xué)技術(shù)的發(fā)展。
3.1分布式數(shù)據(jù)存儲技術(shù)
分布式數(shù)據(jù)處理和存儲技術(shù)是由GooGle公司提出的GFS技術(shù)實現(xiàn)的。改技術(shù)在IBM、搜狐、維基百科等IT企業(yè)中具有廣泛應(yīng)用和較快發(fā)展。分布式數(shù)據(jù)儲存主要利用了列存儲相關(guān)技術(shù)。所謂列存儲,就是以列為基本單位予以儲存,和行存儲相比較,它具有數(shù)據(jù)壓縮、快循環(huán)等優(yōu)勢[3]。在實際研究中,還應(yīng)進(jìn)一步優(yōu)化數(shù)據(jù)布局和分布存儲法,以強(qiáng)化大數(shù)據(jù)的存儲和處理能力。
3.2基于內(nèi)容數(shù)據(jù)挖掘技術(shù)
該項技術(shù)主要包括網(wǎng)絡(luò)搜索和實體關(guān)聯(lián)分析兩項技術(shù)。如今,網(wǎng)絡(luò)信息搜索熱點一般采用排序?qū)W習(xí)算法,該方法的提出主要根據(jù)當(dāng)前社會媒體信息量,媒體關(guān)注數(shù)據(jù)特點作為短文本特性,而此項算法也就是基于該特性所提出的,常見排序?qū)W習(xí)算法主包括逐點、逐對及逐列等。
3.3數(shù)據(jù)索引技術(shù)
GOOGle公司所提出的Bigtable技術(shù)是如今最為主流的一項索引技術(shù)?,F(xiàn)階段主要對聚簇索引和互補(bǔ)式聚簇索引進(jìn)行研究。前者是同時根據(jù)索引順序存儲所有數(shù)據(jù)的結(jié)構(gòu)。而后者則是通過多副本為索引列創(chuàng)建互為補(bǔ)充的索引表。與此同時,還結(jié)合查詢結(jié)果估算法,實施最優(yōu)數(shù)據(jù)查詢。
3.4分類和聚類分析技術(shù)
所謂分類分析,就是先對數(shù)據(jù)點予以歸類,再確定新數(shù)據(jù)點。在明確假設(shè)及客觀結(jié)構(gòu)基礎(chǔ)上,對客戶的操作或行為進(jìn)行有效預(yù)測。聚類分析,就是在未了解限制因素基礎(chǔ)上,把集合分成多個對象組,再對其分析。兩種分析技術(shù)都是在數(shù)據(jù)挖掘中應(yīng)用。
3.5神經(jīng)網(wǎng)絡(luò)與遺傳算法技術(shù)
遺傳算法的出現(xiàn)是基于生物進(jìn)化規(guī)律而演化得到的一種隨機(jī)搜索法,它的尋優(yōu)策略主要采取概率化,其可自動優(yōu)化和調(diào)整搜索向[4]。該項技術(shù)已在機(jī)器學(xué)習(xí)、信號處理、物流配址等方面有廣泛應(yīng)用。
隨著社會和經(jīng)濟(jì)發(fā)展的需要,以及計算機(jī)網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,未來計算機(jī)信息技術(shù)發(fā)展的方向主要有三個:一是向云計算發(fā)展,當(dāng)前計算機(jī)網(wǎng)絡(luò)的整體架構(gòu)基本上以各類硬件為前提,受到一定限制。數(shù)據(jù)庫技術(shù)當(dāng)前網(wǎng)絡(luò)和信息技術(shù)中的核心技術(shù),因此,要求計算機(jī)網(wǎng)絡(luò)應(yīng)充分運(yùn)用好該項技術(shù),實現(xiàn)云計算;二是逐步實現(xiàn)開放網(wǎng)絡(luò)傳輸,基于網(wǎng)絡(luò)框架的建立,把網(wǎng)卡信息和計算機(jī)硬件相分離。三是計算機(jī)與其網(wǎng)絡(luò)有機(jī)結(jié)合。未來計算機(jī)信息處理技術(shù)不單單通過單一硬件完成,而是通過網(wǎng)絡(luò)實現(xiàn)相互的連接和傳輸。只有依靠現(xiàn)代網(wǎng)絡(luò)技術(shù),計算機(jī)信息處理技術(shù)才可充分滿足“大數(shù)據(jù)”背景下社會和經(jīng)濟(jì)發(fā)展的需要。
步入“大數(shù)據(jù)”時代,為現(xiàn)代社會和經(jīng)濟(jì)的發(fā)展帶來了新的變革,更為現(xiàn)代計算機(jī)信息處理技術(shù)帶來新的機(jī)遇和活力,作為多項先進(jìn)技術(shù)的一個集合體,會逐步成熟和完善。未來應(yīng)充分認(rèn)識到“大數(shù)據(jù)”的重要性,更要看到在此背景下計算機(jī)信息處理技術(shù)的戰(zhàn)略作用,不斷加強(qiáng)該技術(shù)的研究,提高它的應(yīng)用效率,為社會的生產(chǎn)和生活帶來更大便利及效益。
參考文獻(xiàn)
[1]吳恩生,王桂梅.大數(shù)據(jù)時代計算機(jī)信息處理技術(shù)分析[J].江蘇科技信息,2015,(6):20-22.
[2]何騫,曾川,張金榜.大數(shù)據(jù)時代的計算機(jī)信息處理技術(shù)分析[J].無線互聯(lián)科技,2014,11(7):201-202.
[3]楊燕艷,朱春燕,韓業(yè)儉.大數(shù)據(jù)環(huán)境下的信息處理[J].電子技術(shù)與軟件工程,2014,5(11):147-149.
[4]劉越.大數(shù)據(jù)時代下的計算機(jī)信息處理技術(shù)研究[J].計算機(jī)光盤軟件與應(yīng)用,2014,11(7):201-202.