張曉龍
(高途教育科技集團有限公司,北京100084)
隨著互聯(lián)網(wǎng)用戶的激增,創(chuàng)造的數(shù)據(jù)也越來越多,大數(shù)據(jù)在此背景之下出現(xiàn),近年來,計算機行業(yè)持續(xù)穩(wěn)定發(fā)展,速度之快令人難以想象,在互聯(lián)網(wǎng)技術持續(xù)快速發(fā)展的時代,怎樣處理和存儲大量的數(shù)據(jù)成了問題,這個問題也在一定程度上制約著計算機處理技術的進步和發(fā)展,為其發(fā)展帶來了巨大的挑戰(zhàn),同時這也是一個新的機遇,相關人士應當用創(chuàng)新的思維和知識處理這個問題。
大數(shù)據(jù)屬于時代發(fā)展中新出現(xiàn)的詞匯,想要研究大數(shù)據(jù),就要先知道其內(nèi)涵與意義。大數(shù)據(jù)指的是將網(wǎng)絡上發(fā)生的事情,包括各種信息、各種資源,轉(zhuǎn)變?yōu)閿?shù)字形式,并存儲起來,在需要應用的時候從數(shù)據(jù)庫中提取數(shù)據(jù)并分析。這就是大數(shù)據(jù)的定義,同樣,定義中的內(nèi)涵就是大數(shù)據(jù)時代信息處理的主要特征。通過對比可以發(fā)現(xiàn),大數(shù)據(jù)擁有無可比擬的優(yōu)勢,其數(shù)據(jù)處理速度快,信息分析速度快,存儲不占用實際空間,不僅提升了信息處理和應用的效率,還能節(jié)約空間。是推動時代發(fā)展和經(jīng)濟進步的重要動力,也是計算機信息處理技術的未來主要發(fā)展方向,因此,需要對大數(shù)據(jù)進行研究,為大數(shù)據(jù)時代的到來做好準備,以應對各種即將或可能出現(xiàn)的問題,提升生產(chǎn)生活效率,從而創(chuàng)造更大的效益。大數(shù)據(jù)的特點主要有三個方面:首先,大數(shù)據(jù)的最重要特點就是“大”,這種“大”不僅僅是數(shù)據(jù)量的龐大,也是處理速度、覆蓋方面的廣大,大數(shù)據(jù)的出現(xiàn),是對信息技術的一種挑戰(zhàn),必須要有足夠先進、足夠完善的計算機信息技術做支撐,才能夠在大數(shù)據(jù)的背景之下,創(chuàng)造更大的效益。其次,大數(shù)據(jù)另一個特點就是多,大數(shù)據(jù)具備很強的多樣性,是一種全面變化,生產(chǎn)生活中的大量信息共同轉(zhuǎn)化為了大數(shù)據(jù),可以發(fā)現(xiàn)大數(shù)據(jù)所包含的數(shù)據(jù)種類多、數(shù)量多。若想借助計算機信息技術采集信息,就必須要提升相關技術水平,這也是升級計算機信息技術所需要攻破的技術難點之一。最后,大數(shù)據(jù)的特點還有快。大數(shù)據(jù)的數(shù)據(jù)處理不局限于信息的采集和存儲,處理才是最重要的內(nèi)容,無論存儲了多少數(shù)據(jù),如果不能快速處理,還是會影響發(fā)展速度,阻礙時代發(fā)展,快代表了大數(shù)據(jù)的便捷性。因此,提升數(shù)據(jù)處理速度將是大數(shù)據(jù)進步所不斷追求的要素[1]。
計算機信息技術的不斷創(chuàng)新和升級,是大數(shù)據(jù)產(chǎn)生的最重要背景,網(wǎng)絡時代之下,無論是數(shù)據(jù)量還是數(shù)據(jù)處理,都需要進步。雖然龐大的數(shù)據(jù)量為人們的信息處理增添了困難,但技術的升級完全可以解決上述難題,而技術升級就需要人們的不斷思考,應用先進知識,不斷探索,從而找到技術創(chuàng)新的突破點,實現(xiàn)數(shù)據(jù)創(chuàng)新。大數(shù)據(jù)時代不僅是挑戰(zhàn),更是機遇,合理應用大數(shù)據(jù)可以幫助企業(yè)開展更多更好的生產(chǎn)經(jīng)營活動,提升管理效率,降低額外風險,確保發(fā)展平衡穩(wěn)定。而在教育層面,大數(shù)據(jù)的應用有助于人才的培養(yǎng),老師可以通過數(shù)據(jù)平臺監(jiān)督學生的學習情況,例如課件觀看情況和考試情況等。雖然這些數(shù)據(jù)可能并不會有多大的意義,但是站在宏觀的角度,分析大量的數(shù)據(jù),就能找到學生學習的一些問題,從而采取措施解決,施行科學化、針對化的教育,針對每個學生,制定不同的教育方案。但除此之外,大數(shù)據(jù)也是一種挑戰(zhàn),我們所面臨的最艱巨的挑戰(zhàn)就是數(shù)據(jù)安全問題,大數(shù)據(jù)極有可能受到黑客的攻擊,使用木馬病毒等手段非法獲取信息,威脅數(shù)據(jù)安全,這將在極大程度上降低人們對互聯(lián)網(wǎng)的信任度,有可能影響到互聯(lián)網(wǎng)的普及使用,甚至制約計算機網(wǎng)絡技術的創(chuàng)新和升級。
計算機信息處理技術的更新升級需要時間,不可能一蹴而就,對于計算機信息處理技術的更新需要持續(xù)探索和分析,才能夠起到促進計算機信息處理技術發(fā)展的作用。在該階段來看,大數(shù)據(jù)時代背景之下的計算機信息處理技術升級主要有以下幾個方面內(nèi)容。
大數(shù)據(jù)背景下的數(shù)據(jù)處理可以分為兩大類,一類是流處理模型,一類是批處理類型,前一種在本質(zhì)上就是處理相應數(shù)據(jù)高的數(shù)據(jù)的過程,這個過程擁有運算速度快、運算所需時間短、準確率高的特點。廣泛地應用于金融業(yè)等行業(yè)的數(shù)據(jù)處理當中,這種處理模型需要高級計算機服務器和技術的支持,在應用流處理模型后,會大幅度提升金融信息運算的速度,最明顯的表現(xiàn)之一就是加快了銀行系統(tǒng)出款的速度,從而使用戶體驗得到提升,起到拉攏客戶的作用。另一種處理模型具有占有空間小的特點,一般在建設信息處理模型時,為確保其合理性,需要兩種模型連用,從而達到最佳的處理效果[2]。
在大數(shù)據(jù)背景下,如何采集、運輸、存儲數(shù)據(jù)也成了技術更新的重點內(nèi)容,采集技術作為信息處理的開端,其重要性不言而喻,因此,若想要實現(xiàn)徹底的技術革新,就要先從采集技術的創(chuàng)新開始做起。信息采集對于大數(shù)據(jù)發(fā)展而言是不可或缺的存在,在一定程度上,數(shù)據(jù)采集的質(zhì)量關乎整個大數(shù)據(jù)技術的運行,也是技術價值的重要體現(xiàn)[3]。在發(fā)展迅速的21 世紀,大數(shù)據(jù)已經(jīng)滲透于人們生產(chǎn)生活的方方面面,并發(fā)揮著不可替代的效用,這導致信息采集的內(nèi)容繁多,難度提升。因此,為確保信息采集的準確性及效率。專業(yè)人士正在不斷優(yōu)化采集技術?,F(xiàn)階段的采集技術已經(jīng)可以做到深層分析各類型數(shù)據(jù)源,與之前相比較而言,有了很大程度的進步。在提出了結(jié)構(gòu)化信息理論后,建立了更多功能更強大的數(shù)據(jù)庫,其應用范圍也越來越大,例如常見的Web 信息采集技術,該技術依靠分析HTML 代碼,獲取超鏈接的有關信息,以搜索算法為技術基礎,實現(xiàn)超鏈接信息的提取和研究,從而實現(xiàn)高效數(shù)據(jù)采集,其流程如圖1所示。從某種意義上來講,計算機信息采集技術的升級發(fā)展,是支撐大數(shù)據(jù)發(fā)展的中堅力量。
圖1 Web信息采集技術示意圖
計算機信息處理技術不僅可以采集數(shù)據(jù),還能將采集到的數(shù)據(jù)存儲至數(shù)據(jù)庫當中,信息的利用離不開存儲技術?,F(xiàn)階段,大數(shù)據(jù)與時代發(fā)展息息相關。因此,信息存儲技術需要不斷升級,持續(xù)擴充數(shù)據(jù)的存儲空間,確保大量信息可以完整地存儲于數(shù)據(jù)庫之內(nèi)。在過去,信息存儲空間較小,不能存儲大量數(shù)據(jù),且數(shù)據(jù)的調(diào)取和處理也存在一些問題,在一定程度上制約了整個信息技術的發(fā)展。在大數(shù)據(jù)背景之下,必須要升級信息存儲技術。除此之外,信息存儲具有時間維度的延展性,換句話來講,信息儲存技術要不間斷地工作,二十四小時無時無刻不在工作,只有這樣才能起到應用效果[4]。在該種情況下,擴大數(shù)據(jù)存儲空間成了最主要的問題。計算機存儲技術在本質(zhì)上就是以計算機的各個模塊作為基礎,在其之上建立多個存儲空間,實現(xiàn)信息的存儲。這些存儲模塊通常是芯片或者集成電路。
在計算機信息處理技術當中,信息運輸為核心技術,要想實現(xiàn)信息的利用,就必須完善信息運輸技術,信息的運輸是完成一切信息應用行為的前提,是能否有效應用的最重要技術環(huán)節(jié)。因此,在相關專業(yè)人員在不斷完善信息傳輸技術的同時,也要注重提升傳播效率和信息的準確性和完整性,最重要的是確保信息的安全,以免數(shù)據(jù)泄露造成損失。若出現(xiàn)這些情況,則可能會造成巨大的損失,例如丟失用戶信息,那么企業(yè)不僅要承擔用戶的損失,還要消耗資源改進安全技術。健全信息安全技術比較困難,相關工作的開展可以從以下幾個方面內(nèi)容著手:首先,企業(yè)應當不斷健全信息安全隊伍,持續(xù)招攬信息人才,從而實現(xiàn)計算機安全技術的提升,只有人才的素質(zhì)得到了提升,才能夠確保技術的穩(wěn)定進步。其次,技術人員應當持續(xù)分析現(xiàn)有技術,找到技術漏洞和不充足,從根本上解決問題,要徹底解決問題,從而實現(xiàn)整體技術的升級,也能確保信息安全。最后,企業(yè)應當加強對信息技術的監(jiān)督與管理,對于一些重點信息,應當建立專門的數(shù)據(jù)庫,應用特殊保障措施,從而確保信息安全,避免出現(xiàn)損失。
大數(shù)據(jù)帶來時代發(fā)展機會的同時,也有很多問題出現(xiàn),大數(shù)據(jù)所帶來的時代機遇,伴隨著許多有難度的挑戰(zhàn)。若想解決安全問題,就必須要做好防火墻的建設工作,還要持續(xù)研究其他安全技術,做到研究新技術與改進舊技術同時開展。木馬病毒是傳統(tǒng)的計算機技術難題,數(shù)據(jù)安全問題不僅存在于大數(shù)據(jù)時代,也存在于信息時代,這些都威脅著計算機信息處理技術的進步與發(fā)展。此外,數(shù)據(jù)查詢問題。傳統(tǒng)的直接查詢的數(shù)據(jù)庫管理系統(tǒng)已經(jīng)很難應對海量數(shù)據(jù)的查詢,一個存儲量在GB級別的數(shù)據(jù)表的遍歷查詢都需要十幾個小時來完成,所以如何快速地實現(xiàn)對大數(shù)據(jù)的查詢和提取也是當前急需解決的問題。最后,數(shù)據(jù)安全問題?;ヂ?lián)網(wǎng)絡中各種系統(tǒng)層出不窮,各式各樣的數(shù)據(jù)都需要相互傳輸,這些都為網(wǎng)絡惡意攻擊者提供了可乘之機。各種社會工程學攻擊、病毒、木馬、系統(tǒng)后門等惡意行為都時時刻刻威脅著大數(shù)據(jù)信息的安全,如何能夠保證大數(shù)據(jù)中有效信息不被泄露或惡意篡改,這也是當前大數(shù)據(jù)時代需解決的問題。
首先,云計算技術一定是最主要的發(fā)展方向,云計算技術是計算機信息處理技術的互補技術,在其基礎之上發(fā)展而來,云計算技術的誕生為計算機信息技術的進步提供了方向和基礎,促進了其發(fā)展和創(chuàng)新,有助于大數(shù)據(jù)時代背景下信息采集、存儲、處理、運輸、安全保障等方面內(nèi)容的完善。能夠更好地滿足時代快速發(fā)展背景下,人們?nèi)粘I詈蜕a(chǎn)經(jīng)營下產(chǎn)生的信息處理需要,為人們的生產(chǎn)生活活動提供便利。其次,計算機處理技術在接下來將向著一體化的方向進步?,F(xiàn)階段,計算機信息處理的存儲和采集分屬不同的技術類型,并沒有融合在一起,想要進一步做好信息處理,就必須要推動信息存儲和采集兩方面內(nèi)容融合發(fā)展。最后,現(xiàn)階段互聯(lián)網(wǎng)越來越開放,包容性越來越強,已經(jīng)突破了區(qū)域上的限制,可以發(fā)現(xiàn),計算機信息處理技術的開放性越來越強,網(wǎng)絡數(shù)據(jù)和信息也即將迎來一次大的變革。在新時代的要求下,將降低對硬件的要求,提升對網(wǎng)絡數(shù)據(jù)信息的重視,其將成為時代主導,實現(xiàn)信息安全的穩(wěn)定[5]。
總而言之,在大數(shù)據(jù)時代,計算機信息處理技術也在不斷發(fā)展升級,在各個方面的應用,如生活、生產(chǎn)、經(jīng)濟、文化等方面都很重要。既影響著人們的生產(chǎn)生活,也影響著人們的日常娛樂和學習等方面內(nèi)容。因此,我們必須要做好計算機信息處理技術的創(chuàng)新研究,提升技術處理水平,要做好信息的存儲、傳輸、處理、安全管理等方面內(nèi)容,除此之外,重視技術的整體升級和創(chuàng)新,政府應加大對計算機處理技術創(chuàng)新的政策、資源扶持力度,盡可能為技術的創(chuàng)新和升級提供方便,以滿足大數(shù)據(jù)的實際發(fā)展需求,促進時代進步和發(fā)展。