黃學(xué)中
摘要:當(dāng)今的信息時代,信息呈爆炸式增長,人類每天產(chǎn)生了的數(shù)據(jù)信息超過了過去幾千年的總和,互聯(lián)網(wǎng)每年產(chǎn)生的數(shù)據(jù)以50%以上的速度,每兩年翻一番,這給數(shù)據(jù)信息處理帶來一定的挑戰(zhàn)。如何深度挖掘有效數(shù)據(jù)信息,成為計算機信息技術(shù)的重點和難點問題。大數(shù)據(jù)就是在這樣一個背景下產(chǎn)生。該文主要簡單闡述了大數(shù)據(jù)和信息處理技術(shù),大數(shù)據(jù)時代背景下計算機處理技術(shù)面臨的挑戰(zhàn)以及計算機信息處理技術(shù)。
關(guān)鍵詞:大數(shù)據(jù);計算機信息處理技術(shù);互聯(lián)網(wǎng)
中圖分類號:TP311 文獻標(biāo)識碼:A 文章編號:1009-3044(2018)02-0008-03
隨著計算機信息技術(shù)的發(fā)展和應(yīng)用,極大地提高了人們生活和生產(chǎn)效率,給人們生活帶來了翻天覆地變化。然而隨著互聯(lián)網(wǎng)以及移動互聯(lián)網(wǎng)的發(fā)展,互聯(lián)網(wǎng)每天產(chǎn)生海量的數(shù)據(jù)信息,如何挖掘這些數(shù)據(jù)信息背后的價值,已經(jīng)成為國家、企業(yè)關(guān)注的重點,越來越多的國家和企業(yè)開始重視數(shù)據(jù)專業(yè)化的處理,從而實現(xiàn)數(shù)據(jù)的增值,為國家以及企業(yè)的發(fā)展提供一定的數(shù)據(jù)支持。
1 大數(shù)據(jù)技術(shù)和計算機信息處理技術(shù)
1.1 大數(shù)據(jù)技術(shù)概述
大數(shù)據(jù)(big data) 是這幾年來互聯(lián)網(wǎng)社會的一個熱詞,然而關(guān)于大數(shù)據(jù)的定義,國家上沒有統(tǒng)一的標(biāo)準。麥肯錫全球研究所對大數(shù)據(jù)的定義是一種獲取、存儲、分析和管理方面大大超過了傳統(tǒng)數(shù)據(jù)庫軟件工具的數(shù)據(jù)集合能力。馬云曾經(jīng)說過未來不是互聯(lián)網(wǎng)時代,而是大數(shù)據(jù)時代。在當(dāng)今時代,大數(shù)據(jù)能夠深度挖掘用戶需求,為消費者和服務(wù)型企業(yè)提供精準營銷或者為傳統(tǒng)企業(yè)轉(zhuǎn)型提供數(shù)據(jù)支持。大數(shù)據(jù)具有以下特征:第一,海量數(shù)據(jù),數(shù)據(jù)信息總量急劇增長,并由原來的TB轉(zhuǎn)化為現(xiàn)在的ZB存儲內(nèi)存。第二,數(shù)據(jù)存儲形式的多樣化。傳統(tǒng)的數(shù)據(jù)大多數(shù)指圖表,大數(shù)據(jù)時代,數(shù)據(jù)包括文字、圖片、音頻、視頻、動畫等形式內(nèi)容。第三,獲取數(shù)據(jù)信息的速度快。在大數(shù)據(jù)時代背景下,在數(shù)據(jù)信息的獲取、處理速度方面提出了新的要求。第四,復(fù)雜性。互聯(lián)網(wǎng)每天產(chǎn)生海量的數(shù)據(jù)信息,這些數(shù)據(jù)信息的來源渠道廣、數(shù)據(jù)多,具有一定的復(fù)雜性,這對數(shù)據(jù)信息處理技術(shù)提出了新的要求。隨著信息技術(shù)的發(fā)展,大數(shù)據(jù)與云計算、物聯(lián)網(wǎng)技術(shù)結(jié)合,為大數(shù)據(jù)的發(fā)展助力,讓大數(shù)據(jù)營銷發(fā)揮更好的作用。
1.2 計算機信息處理技術(shù)
計算機信息處理技術(shù)指對數(shù)據(jù)信息進行集中處理、綜合分析,并利用計算機技術(shù)進行系統(tǒng)化的分析。針對計算機相應(yīng)的問題采取有效的數(shù)字、符號和運算符號。比如計算機中的語言、文字、圖像、圖片可以使用相應(yīng)的字母代替,計算機的數(shù)值、數(shù)據(jù)則采用數(shù)字符號表示。計算機信息技術(shù)的單位是Bit,一般用來表示一位二進制數(shù)字,字節(jié)用Byte表示,一個字節(jié)由8位二進制數(shù)表示,其單位換算公式如下: 1Byte=8Bit、1KB=1024B、1MB=1024KB、1GB=1024MB、1TB=1024GB等。
2 大數(shù)據(jù)時代背景下計算機處理技術(shù)面臨的挑戰(zhàn)
在信息時代,每天產(chǎn)生海量的數(shù)據(jù)信息,這對數(shù)據(jù)信息的處理的實時性、快捷性、精準性提出了更高的要求,因此促進了大數(shù)據(jù)技術(shù)的發(fā)展。大數(shù)據(jù)技術(shù)的發(fā)展,給企業(yè)精準營銷和服務(wù)提供了便利。然而,大數(shù)據(jù)技術(shù)的發(fā)展,給計算機處理技術(shù)帶來了一定的挑戰(zhàn),具體有幾個方面:
2.1 數(shù)據(jù)信息的泄漏
互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)的發(fā)展,在給人帶來一定的便利的同時,也帶來了不少安全隱患。尤其在當(dāng)前大量的電子商務(wù)平臺、網(wǎng)絡(luò)社交平臺以及網(wǎng)絡(luò)等需要用戶實名認證,用戶的姓名、身份證、銀行卡、家庭住址等個人隱私信息都存儲在網(wǎng)絡(luò)上,這就增加了數(shù)據(jù)信息泄露的風(fēng)險。一些黑客攻擊網(wǎng)絡(luò)平臺,或者網(wǎng)絡(luò)詐騙集團利用計算機系統(tǒng)的漏洞竊取用戶個人數(shù)據(jù)信息,將用戶個人賬戶上的錢轉(zhuǎn)走,給用戶造成極大的經(jīng)濟損失。如今,網(wǎng)絡(luò)賬號信息已經(jīng)成為用戶個人信息泄露最主要的途徑。針對上述問題對計算機處理技術(shù)提出了新的要求,人們利用大數(shù)據(jù)技術(shù)處理網(wǎng)絡(luò)數(shù)據(jù)的同時,必須確保計算機系統(tǒng)數(shù)據(jù)信息的安全性和可靠性,避免用戶個人信息的外泄。
2.2 計算機網(wǎng)絡(luò)技術(shù)本身存在的問題
計算機網(wǎng)絡(luò)具有一定的數(shù)據(jù)信息收集能力和整理能力,所以一些復(fù)雜的數(shù)據(jù)信息通過計算機網(wǎng)絡(luò)也能快速處理。然而在當(dāng)前大數(shù)據(jù)時代背景下,數(shù)據(jù)信息之間的聯(lián)系越來越緊密,因此需要計算機數(shù)據(jù)信息處理人員掌握相關(guān)的數(shù)據(jù)信息基礎(chǔ)知識。其次,網(wǎng)絡(luò)上的海量數(shù)據(jù)信息來源廣,包羅萬象,有文字、圖片、音頻、視頻、動畫等各種形式的數(shù)據(jù)信息,人們很難在海量的數(shù)據(jù)信息中找到自己需要的數(shù)據(jù)信息。比如一些網(wǎng)絡(luò)上設(shè)置了滾動信息,這些數(shù)據(jù)信息第一時間出現(xiàn)在人們面前,然而此類數(shù)據(jù)信息的真實性和準確性無法判斷。大量的數(shù)據(jù)被搜索前,需要搜索引擎百度、搜狗、谷歌等運營商對數(shù)據(jù)信息進行處理,對搜索引擎運營商提出了新的要求。而作為我國最大的搜索引擎運營商百度近年來的百度競價排名一直備受廣大網(wǎng)民詬病。尤其是2016年西安電子科技大學(xué)21歲的學(xué)生魏則西通過百度搜索找到三甲武警二院花費了大量的金錢,采用了所謂最新美國技術(shù),最終卻因為庸醫(yī)誤人導(dǎo)致年輕的生命在絕望和無奈中過世。因此,如何確保網(wǎng)絡(luò)數(shù)據(jù)信息的安全性和可靠性對運營商是一個很大的挑戰(zhàn)。此外,由于我國網(wǎng)絡(luò)的普及和發(fā)展,對網(wǎng)絡(luò)數(shù)據(jù)信息的處理技術(shù)提出了新的要求,需要一些更強大的數(shù)據(jù)信息處理軟件和分析軟件,能夠根據(jù)人們實際需求推送。
2.3 網(wǎng)絡(luò)黑客的惡意攻擊
當(dāng)我們的企業(yè)、社會組織和團體在利用大數(shù)據(jù)實現(xiàn)利益價值和商業(yè)價值的時候,互聯(lián)網(wǎng)的技術(shù)黑客也在利用這些技術(shù)向企業(yè)、社會單位進行攻擊。2016年1月17日,清華大學(xué)的門戶網(wǎng)站遭到黑客攻擊。點開一些頁面以后,里面出現(xiàn)了大量的阿拉伯伊斯蘭教經(jīng)文,大意為“真主偉大,我不懼死亡,犧牲是我最終的目標(biāo)”。事情發(fā)生以后,清華大學(xué)立即關(guān)閉了學(xué)校的服務(wù)器,才解決了這個問題,阻止事情的進一步惡化。黑客一般都是網(wǎng)絡(luò)技術(shù)人才,對計算機科學(xué)頗有研究,是計算機系統(tǒng)的操作高手。大數(shù)據(jù)時代也為黑客發(fā)起攻擊提供更多的機會,黑客可以利用大數(shù)據(jù)收集有效的信息,入侵他人的電腦,將別人的社交網(wǎng)絡(luò)賬號密碼盜取,然后聯(lián)系賬號信息的關(guān)聯(lián)性,將他人的郵件、微博、微信賬號甚至家庭電話號碼、地址等有效信息竊取。他們還可以利用大數(shù)據(jù)控制成百上千臺電腦進行網(wǎng)絡(luò)惡意攻擊,嚴重影響企業(yè)或者個人的生活生產(chǎn)。endprint
3 大數(shù)據(jù)時代計算機信息處理技術(shù)的分析
我國的互聯(lián)網(wǎng)技術(shù)發(fā)展與國外計算機互聯(lián)網(wǎng)技術(shù)相比,起步時間比較晚,直到二十世紀九十年代互聯(lián)網(wǎng)才引入中國。近十年我國互聯(lián)網(wǎng)技術(shù)高速發(fā)展,在全國得到了廣泛的普及。然而,不可否認當(dāng)前我國的大數(shù)據(jù)存儲能力、分析能力和安全防護能力相對來說還比較薄弱,尤其是大數(shù)據(jù)相關(guān)技術(shù)并不成熟,大部分企業(yè)的大數(shù)據(jù)挖掘手段和方法還比較落后。而海量的數(shù)據(jù)信息對信息存儲和分析能力提高了新的要求。因此,如何進一步挖掘大數(shù)據(jù)價值,充分發(fā)掘大數(shù)據(jù)中有價值的信息和知識,是我們現(xiàn)階段遇到的主要問題。
3.1 信息獲取、加工、傳輸技術(shù)
在大數(shù)據(jù)背景下,每天產(chǎn)生海量的數(shù)據(jù)信息,想要對這些數(shù)據(jù)信息進行有效的處理。要獲取有效信息,這就需要信息獲取技術(shù)。通過信息獲取技術(shù),結(jié)合用戶需求,對相關(guān)數(shù)據(jù)信息進行監(jiān)控,并選擇性的選擇相關(guān)數(shù)據(jù)信息存儲到數(shù)據(jù)庫中,這樣便于數(shù)據(jù)信息的加工處理;數(shù)據(jù)加工指根據(jù)用戶實際需求,將存儲到數(shù)據(jù)庫中的數(shù)據(jù)信息進行加工處理,剔除一些無用、冗余、無效的數(shù)據(jù)信息,留下一些有用的數(shù)據(jù)信息,并按照數(shù)據(jù)信息的性質(zhì)、類別、功能、學(xué)科進行分類,便于人們后期調(diào)取數(shù)據(jù)信息,提高數(shù)據(jù)信息的利用率。數(shù)據(jù)傳輸技術(shù)將經(jīng)過加工處理的數(shù)據(jù)信息按照用戶的實際需求,通過網(wǎng)絡(luò)平臺將數(shù)據(jù)傳輸?shù)接脩羰种小?shù)據(jù)傳輸技術(shù)如今在企業(yè)精準營銷中廣泛應(yīng)用。在電子商務(wù)中,企業(yè)根據(jù)用戶購買記錄、瀏覽記錄、搜索記錄信息,分析用戶的購買需求和消費行為特征,然后定時向用戶發(fā)送相關(guān)服務(wù)信息。
3.2 存儲技術(shù)
在大數(shù)據(jù)時代背景下,數(shù)據(jù)信息成倍增長,數(shù)據(jù)信息的更新速度不斷加快,這對數(shù)據(jù)信息的存儲技術(shù)提出了新的要求。信息存儲技術(shù)指通過數(shù)據(jù)信息獲取技術(shù)獲取大量數(shù)據(jù)信息以后,要及時將這些數(shù)據(jù)信息保存下來,并按照一定的分類規(guī)律和要求存儲到數(shù)據(jù)庫中。當(dāng)用戶需要數(shù)據(jù)庫中的數(shù)據(jù)信息,用戶通過搜索技術(shù)可以及時調(diào)取其中的數(shù)據(jù)信息。在當(dāng)今信息爆炸的年代,如何確保海量的數(shù)據(jù)信息的完整性、穩(wěn)定性和長時間的存儲是當(dāng)前計算機存儲技術(shù)遇到的難題。目前,大部分的數(shù)據(jù)信息無法長時間存儲下來,比如電子交通警察的采集的數(shù)據(jù)信息智只能保存一個星期,銀行監(jiān)控視頻數(shù)據(jù)信息保存的時間只有一個月。因此,如何提高數(shù)據(jù)信息的存儲時間是當(dāng)前計算機信息處理技術(shù)的重點也是難點。DEEP WEB技術(shù)是網(wǎng)絡(luò)深層空間技術(shù),在這種空間技術(shù)下,網(wǎng)絡(luò)數(shù)據(jù)信息的規(guī)模量、信息動態(tài)變化、分布方式具有一定的特點,并對數(shù)據(jù)進行高質(zhì)量的集成、處理和整合。GFS分布式存儲技術(shù)由谷歌公司發(fā)明,隨后在百度以及IBM等企業(yè)得到了快速發(fā)展,這種分布式存儲技術(shù)通過列存儲的方式,以列單位進行存儲,具有數(shù)據(jù)壓縮的特點,能夠快速將海量數(shù)據(jù)信息進行壓縮,縮小數(shù)據(jù)整體存量和查詢時間,提高磁盤的空間利用率。隨著大數(shù)據(jù)技術(shù)的發(fā)展,未來還要繼續(xù)優(yōu)化列存儲方法,提高存儲數(shù)據(jù)信息的能力和處理效率。
3.3 信息安全技術(shù)
網(wǎng)絡(luò)是一把雙刃劍,在給人們生活帶來便利的同時,也給人們數(shù)據(jù)信息的安全帶來了一定的威脅。由于我國的大數(shù)據(jù)技術(shù)依托互聯(lián)網(wǎng)技術(shù)發(fā)展起來的,互聯(lián)網(wǎng)具有開放性和共享性,數(shù)據(jù)信息很容易受到黑客的非法入侵。近年來,類似這種事情層出不窮,2013年亞馬遜網(wǎng)絡(luò)1萬多名用戶客人信息泄露;國內(nèi)的漢庭、如家等酒店的開房記錄被泄露,用戶的姓名、身份證號碼等個人隱私數(shù)據(jù)被外泄;2016年國內(nèi)著名的旅游APP攜程存在系統(tǒng)漏洞,導(dǎo)致用戶的個人信息、身份證號碼、銀行卡卡號等安全信息外泄。網(wǎng)絡(luò)信息安全已經(jīng)成為當(dāng)下網(wǎng)民關(guān)注的重點內(nèi)容,加大網(wǎng)絡(luò)信息安全技術(shù)迫在眉睫。主要從以下幾個方面進行加強。第一,建立計算機信息安全系統(tǒng),當(dāng)前我國廣大個人用戶、企業(yè)用戶將大量的數(shù)據(jù)信息存儲在云計算服務(wù)商提供的網(wǎng)絡(luò)硬盤上,由于網(wǎng)絡(luò)的開放性,給用戶數(shù)據(jù)信息的安全帶來了很大的挑戰(zhàn)。因此,云計算服務(wù)商必須設(shè)置數(shù)據(jù)信息安全措施,對用戶數(shù)據(jù)信息做出有效的評估,根據(jù)數(shù)據(jù)信息的安全等級采用相應(yīng)的安全防護措施。比如通過用戶個人身份認證,加密技術(shù)和安全認證等手段,防止用戶個人數(shù)據(jù)信息的泄漏。網(wǎng)絡(luò)信息安全關(guān)系國家信息安全,因此國家應(yīng)該加大這方面的投入,提高我國網(wǎng)絡(luò)信息的安全性和可靠性。
3.4 ALE-IDoc接口技術(shù)
這種ALE-IDoc接口技術(shù)采用分布式-集成SAP系統(tǒng),為分布式-集成SAP系統(tǒng)提供通信接口信息整合,從而使得各個分散的系統(tǒng)之間建立有效的聯(lián)系,提高各個子系統(tǒng)之間的關(guān)聯(lián)性。ALE-IDoc接口技術(shù)通過異步/同步傳輸技術(shù)對分布式-集成系統(tǒng)業(yè)務(wù)進行統(tǒng)一集中管理,也就是ALE負責(zé)系統(tǒng)中業(yè)務(wù)關(guān)聯(lián)性比較強的SAP之間的數(shù)據(jù)同步服務(wù),在同步服務(wù)采用IDoc格式,這種格式能確保傳輸數(shù)據(jù)的完整性,提高SAP系統(tǒng)數(shù)據(jù)的識別能力。IDoc格式包括控制頭、數(shù)據(jù)段、狀態(tài)記錄等內(nèi)容,控制頭控制同步數(shù)據(jù)內(nèi)容,并對收發(fā)雙方進行詳細的描述;數(shù)據(jù)段則是記錄同步數(shù)據(jù)的具體內(nèi)容,并按照網(wǎng)絡(luò)相關(guān)標(biāo)準生成IDoc格式;狀態(tài)記錄則是記錄IDoc格式數(shù)據(jù)狀態(tài)。ALE-IDoc接口技術(shù)具體實施步驟如下:啟動輸出功能——生成IDoc數(shù)據(jù)——ALE服務(wù)層分發(fā)數(shù)據(jù)信息——接收端接收服務(wù)層發(fā)送的數(shù)據(jù)信息。
3.5 基于內(nèi)容的數(shù)據(jù)挖掘技術(shù)
如何深度挖掘數(shù)據(jù)信息的價值成為當(dāng)下大數(shù)據(jù)發(fā)展方向,基于大數(shù)據(jù)內(nèi)容的數(shù)據(jù)挖掘方法有網(wǎng)絡(luò)搜索技術(shù)和實體關(guān)聯(lián)分析。目前互聯(lián)網(wǎng)信息搜索技術(shù)是排序時間算法,排序時間算法主要針對社交媒體的海量數(shù)據(jù)信息,根據(jù)社會媒體和網(wǎng)民關(guān)注量,以短文本特征,進行逐點、逐對、逐列。關(guān)聯(lián)性則是在數(shù)據(jù)處理過程中,根據(jù)數(shù)據(jù)信息之間的關(guān)聯(lián)性進行統(tǒng)一歸類和處理,這樣提高數(shù)據(jù)信息的處理速度。
4 結(jié)束語
隨著互聯(lián)網(wǎng)的發(fā)展,大數(shù)據(jù)技術(shù)與云計算、物聯(lián)網(wǎng)技術(shù)之間聯(lián)系越來越親密。而計算機系統(tǒng)受到自身硬件的影響,具有一定的局限性,而云計算不需要受到計算機硬件的影響,因此未來云計算將發(fā)展云計算機網(wǎng)絡(luò)。這對計算機分析處理技術(shù)提出了更高的要求,因此需要國家、社會以及企業(yè)加大這方面的研究,促進計算機分析處理技術(shù)的發(fā)展。
參考文獻:
[1] 周洪."大數(shù)據(jù)"時代背景下計算機信息處理技術(shù)的分析[J].信息與電腦,2015(23):48-49.
[2] 馮瀟婧.“大數(shù)據(jù)”時代背景下計算機信息處理技術(shù)的分析[J].計算機光盤軟件與應(yīng)用,2014,(5):105-105.
[3] 呂晉俐.大數(shù)據(jù)時代背景下計算機信息處理技術(shù)的分析[J].信息與電腦,2017(10):179-180.
[4] 鄭鑫淼.“大數(shù)據(jù)”時代背景下計算機信息處理技術(shù)的分析[J].科技創(chuàng)新導(dǎo)報,2016(17):72-73.
[5] 高沖."大數(shù)據(jù)"時代背景下計算機信息處理技術(shù)的分析[J].電腦知識與技術(shù),2016,12(5):23-24.
[6] 嚴平."大數(shù)據(jù)"時代背景下計算機信息處理技術(shù)的分析[J].決策與信息(中旬刊) ,2015(9):176-176.
[7] 鄭軍,陳燕,歐陽柏成,等."大數(shù)據(jù)"時代背景下計算機信息處理技術(shù)的探討[J].企業(yè)文化(中旬刊),2017(7):266-267.
[8] 張奇."大數(shù)據(jù)"時代背景下計算機信息處理技術(shù)的分析[J].通信世界,2017(3):100-101.
[9] 李光亮.基于大數(shù)據(jù)時代背景下計算機信息處理技術(shù)的分析[J].電腦迷,2016(10):71-72.
[10] 胡廣宗,袁祖根,周亮等.基于"大數(shù)據(jù)"時代背景下的計算機信息處理技術(shù)[J].軍民兩用技術(shù)與產(chǎn)品,2017(8):76-77.endprint