孫明
摘 要:隨著社會全面的進入大數(shù)據(jù)時代和云計算時代,大數(shù)據(jù)已經(jīng)逐步的融入到我們的生活中,人們都能夠感受到大數(shù)據(jù)對我們生活的改變。同時,很多用戶的行為,會被計算機自動化機器所保留記錄下來,通過大數(shù)據(jù)和云計算的方式,對這些用戶的行為進行分析,可以更好的掌握經(jīng)濟發(fā)展的規(guī)律。本文探討了大數(shù)據(jù),分析了大數(shù)據(jù)和云計算下對用戶行為,研究了大數(shù)據(jù)對企業(yè)與用戶關(guān)系的影響,以及大數(shù)據(jù)背景下對用戶行為分析帶來的挑戰(zhàn)。
關(guān)鍵詞:大數(shù)據(jù);云計算;用戶行為分析
中圖分類號:TN919.2 文獻標識碼:A 文章編號:1671-2064(2019)15-0027-02
0 引言
隨著人類社會的發(fā)展,目前已經(jīng)全面的進入到了信息化、智能化的時代中,很多用戶的行為都被記錄下來,并且能夠?qū)ζ渥龀龇治龊皖A(yù)測,對于掌握我國的經(jīng)濟發(fā)展和社會的真實規(guī)律有很大的幫助,能夠為人們制定智能化、個性化的服務(wù),對提升城市的管理、提高交通質(zhì)量、提升人們的生活質(zhì)量,有很大的幫助作用,同時,減少不必要的浪費。
1 大數(shù)據(jù)概述
1.1 大數(shù)據(jù)分析
大數(shù)據(jù)的記錄數(shù)據(jù)的方式,從本質(zhì)上發(fā)生的改變,用戶在瀏覽網(wǎng)站中的數(shù)據(jù)信息,會通過設(shè)備記錄下來,通過用戶的行為來挖掘數(shù)據(jù),由于數(shù)據(jù)規(guī)模比較龐大,因此,需要多個云平臺來擴展數(shù)據(jù)的節(jié)點體系,需要拓展性更強的大數(shù)據(jù)架構(gòu),云計算能夠為用戶提供多種數(shù)據(jù)支持。
1.2 云計算的發(fā)展趨勢
云計算能夠讓用戶集中到“云端”,是計算機網(wǎng)的一種運用模式[1]。在外國的一些國家,云計算逐漸成為國家核心競爭力的主要手段,如美國的云計算服務(wù)中,在農(nóng)業(yè)、司法部門和軍事中得到的應(yīng)用,并通過構(gòu)建云計算的生態(tài)系統(tǒng),能夠推動產(chǎn)業(yè)鏈的發(fā)展,在澳大利亞,政府在公共行業(yè)和服務(wù)行業(yè)中,將大數(shù)據(jù)分析融入其中,制定出了公共政策。我國的云技術(shù)已經(jīng)有了很大的突破,主要應(yīng)用在了北京電力和我國的教育云系統(tǒng)中,形成了H3C的云計算系統(tǒng)。
2 大數(shù)據(jù)和云計算下對用戶行為分析
2.1 對信息進行分類
信息資源整合分為兩大類型,一是同類數(shù)據(jù)的合并,二是不同類數(shù)據(jù)之間的關(guān)聯(lián)[2]。在同事數(shù)據(jù)的合并中,可以將用戶發(fā)的信息匯集起來,進行歸類研究,關(guān)注用戶群體的特點,在同一類性的數(shù)據(jù)中,存在數(shù)據(jù)格式的不同、數(shù)據(jù)規(guī)模的差異,所以需要對資源進行整合,使得數(shù)據(jù)資源具有統(tǒng)一的結(jié)構(gòu),形成具有代表性的數(shù)據(jù)規(guī)模;另外一類是不同數(shù)據(jù)之間的關(guān)聯(lián),是利用科技的搜索形式,通過關(guān)鍵詞、摘要、文獻、用戶日志對信息進行整合[3]。大數(shù)據(jù)信息組織,目前具有很強的擴展性、容錯性。在信息組織過程中,具有較好的精確性和普遍通用性。目前的大數(shù)據(jù)建模中,還沒有完全參考數(shù)關(guān)系數(shù)據(jù)庫的模板,因此,存在著信息冗繁不一致的現(xiàn)象??梢酝ㄟ^用戶行為的分析,進行宏觀、微觀和中觀的多層次的觀察,建立一個具有一定彈性和層次的數(shù)據(jù)信息。
2.2 對信息資源的收集
目前,在網(wǎng)絡(luò)上可以通過大數(shù)據(jù),收集信息,但是卻沒有分析數(shù)據(jù)對用戶行為帶來的影響,為用戶行為的分析帶來了難度。通過對原本的數(shù)據(jù)進行標注,可以獲取大量的信息內(nèi)涵,可以為用戶的行為作出很好的指引,為用戶尋找數(shù)據(jù)提供便利的條件。目前,主要使用的映射方法有GAV和LAV兩種方法,雖然前者查詢的效率比較高,但是沒有很強映射擴展性。而LAV方法具有很強的擴展性,是采集發(fā)數(shù)據(jù)集的主要應(yīng)用方法。
2.3 對信息的處理和挖掘
在對用戶的數(shù)據(jù)進行分析和挖掘的過程中,主要表現(xiàn)在的幾個方面:(1)將數(shù)據(jù)可以分成多個小規(guī)模的模塊,再對數(shù)據(jù)進行處理和挖掘,降低數(shù)據(jù)的傳輸和系統(tǒng)計算的費用。(2)針對不同的數(shù)據(jù)的結(jié)構(gòu)的不同,安全性的不同以及相關(guān)法律限制的不同,可以將數(shù)據(jù)信息進行集中化的分析,對于不符合實際的數(shù)據(jù)信息,進行處理。通過云計算分布式的用戶日志框架進行分析,對日志進行處理、用戶模式進行深入的挖掘、分析和研究,這種方式非常方便、便捷,在云端就可以完成。(3)對于不同結(jié)構(gòu)的數(shù)據(jù)的分布式的數(shù)據(jù)挖掘,可以從相互學習和元學習進行。元學習是從已經(jīng)得到的知識中再進行學習,最終得到數(shù)據(jù)模型。而相互學習是從多個數(shù)據(jù)的挖掘節(jié)點,對通過一個學習任務(wù)進行互相分析學習成果的方式。對于異構(gòu)的數(shù)據(jù)分布挖掘數(shù)據(jù)的形式,可以先使用正交化的基函數(shù)分成分量模式,最后行成全局的模式。(4)云計算能夠以租代買的形式,可以有效的提升計算系統(tǒng)的使用率,對于商業(yè)領(lǐng)域來說,可以在云數(shù)據(jù)平臺中以較低的成本進行使用信息。(5)云數(shù)據(jù)儲存的模式。GFS硬件系統(tǒng),是一個規(guī)模比較大的中低端計算機集群,有一個主節(jié)點和許多的數(shù)據(jù)節(jié)點。在程序訪問數(shù)據(jù)的過程中,會首先訪問主節(jié)點,在獲取主節(jié)點的信息,通過數(shù)據(jù)的節(jié)點就會影響到整個系統(tǒng)數(shù)據(jù)的使用情況。(6)云分布式計算架構(gòu)。這種與GFS相類似,是面向隊規(guī)模的計算機集團進行設(shè)計的,主節(jié)點控制和分配個子節(jié)點的計算機資源。任何一個子節(jié)點,就可以從集群中移除,不會影響執(zhí)行當前的任務(wù)。在MAPPEDUCE的構(gòu)架下,可以由系統(tǒng)自行完成,用戶不需要有此方面的轉(zhuǎn)化,也可以有效的進行分布式的計算。在谷歌提出的這兩種思想的基礎(chǔ)上,研發(fā)了一個Hadoop計算框架,能夠處理大量的分布式的處理軟件框架,在實踐中取得了很大的成效。(7)對知識呈現(xiàn)的方式進行研究。在知識的呈現(xiàn)上,需要通過數(shù)據(jù)的可視化形式來表達出來,再進行分析,如媒體軟件臉書上的情感數(shù)據(jù)分析可知,科學家將人類的情緒分為12種不同的類型,如高興、悲傷、生氣、暴怒等,其中的每種情緒,都會觸發(fā)人們的心理情緒的變化、面部表情的變化,對人們的外在行為產(chǎn)生刺激和影響。通過分析,將可視化的方式展現(xiàn)的大眾面前。如:美國波士頓的爆炸案會引起人們情緒的低落,通過可視化的技術(shù)手段,可以讓用戶直觀的看到大數(shù)據(jù)解釋的規(guī)律和未來的發(fā)展趨勢。
3 大數(shù)據(jù)對企業(yè)與用戶關(guān)系的影響
(1)在互聯(lián)網(wǎng)的環(huán)境中,用戶對企業(yè)的管理不斷的增強,大數(shù)據(jù)、云計算改變的傳統(tǒng)商業(yè)運作模式,通過大數(shù)據(jù)可以對用戶進行分析,這也是未來企業(yè)的主要研發(fā)和發(fā)展的方向之一。這使得用戶和企業(yè)之間的關(guān)系發(fā)生了很大的變化,互聯(lián)網(wǎng)的環(huán)境能夠給企業(yè)提供更多的創(chuàng)新基礎(chǔ),這樣可以給用戶帶來更多的價值。(2)互聯(lián)網(wǎng)能夠讓企業(yè)和用戶之間無障礙的溝通,通過社區(qū)可以進行有效的溝通,這重創(chuàng)新的模式,可以增強企業(yè)研發(fā)能力,用戶也能隨時看到企業(yè)更新的動態(tài)。其次,大數(shù)據(jù)能夠有效的對用戶的信息進行分析,提升了用戶的議價能力,通過兩者有效的互動,可以推動企業(yè)創(chuàng)新與改良產(chǎn)品,更加滿足用戶的需求。
4 大數(shù)據(jù)背景下對用戶行為分析帶來的挑戰(zhàn)
4.1 信息范圍
大數(shù)據(jù)的數(shù)據(jù)來源主要是計算機生成的數(shù)據(jù)和社交網(wǎng)上的緩存數(shù)據(jù),不論是哪種類型的數(shù)據(jù),其中有原始數(shù)據(jù)和結(jié)構(gòu)化的數(shù)據(jù),但是數(shù)據(jù)的結(jié)構(gòu)和內(nèi)涵上,出現(xiàn)了真假不清的情況,因此會干擾對用戶的分析,影響了分析的結(jié)果。
4.2 數(shù)據(jù)的存儲
大數(shù)據(jù)的數(shù)據(jù)質(zhì)量和數(shù)據(jù)的質(zhì)量上都有一定的變化,與傳統(tǒng)數(shù)據(jù)存在很大的區(qū)別。對分析傳統(tǒng)的用戶行為主要以數(shù)據(jù)倉庫上的數(shù)據(jù)為主,但是大戶數(shù)據(jù)對用戶的分析,首先需要處理超大的數(shù)據(jù)庫進行分析,傳統(tǒng)的數(shù)據(jù)庫不能夠駕馭超大的數(shù)據(jù)庫,所以,必須要首先解決處理超大數(shù)據(jù)庫的處理和分析的能力。
4.3 信息安全的問題
大數(shù)據(jù)、云計算的發(fā)展中,很多用戶的隱私可能會被盜用或者暴露,如在進行個人的信息檢索的過程中,如果不注意就會暴露到自己的信息。因此,在大數(shù)據(jù)和云計算的時代發(fā)展中,需要對用戶的信息進行規(guī)范,要做好法律限定,避免個人信息的曝光,在大數(shù)據(jù)處理信息的過程中,一般都是在開放的環(huán)境下進行的,所以很難保證數(shù)據(jù)信息的安全,使得信息系統(tǒng)更加的不安全。這就給非法盜用信息的人員提供了可乘之機,對用戶的安全造成了不利的影響。
4.4 不斷的整理知識內(nèi)容 形成體系
在大數(shù)據(jù)、云計算的時代發(fā)展中,分析用戶行為是一個長期而復(fù)雜的過程,需要不斷的摸索積累經(jīng)驗,因為互聯(lián)網(wǎng)平臺的數(shù)據(jù),需要進行充分的處理和挖掘,云服務(wù)平臺中,需要大數(shù)據(jù)的知識進行整合,提高大數(shù)據(jù)的擴展性,這樣才能更好的各個行業(yè)中得到應(yīng)用和發(fā)展。
5 結(jié)語
綜上所述,在大數(shù)據(jù)、云計算的時代背景下,如果信息想要得到更好的使用,就需要對用戶的行為進行分析,是未來面臨的巨大的挑戰(zhàn)和發(fā)展的機遇。在對用戶的行為進行分析,可以將數(shù)據(jù)進行重新的構(gòu)建、對數(shù)據(jù)進行分析,再生成有益的信息,通過大數(shù)據(jù)的分析,能夠形成廣闊的視野,加強對大數(shù)據(jù)信息資源整合的分析,同時加強對用戶的行為理論的分析,才能推進社會經(jīng)濟的發(fā)展。
參考文獻
[1] 王兵.基于云計算技術(shù)的大數(shù)據(jù)用戶行為引擎設(shè)計[J].電腦知識與技術(shù),2016(05):1-2.
[2] 陳碩,李曉戈.大數(shù)據(jù)、云計算與用戶行為經(jīng)驗分析[J].信息記錄材料,2018(7):118-120.
[3] 張梅.云計算技術(shù)下的大數(shù)據(jù)用戶行為引擎設(shè)計研究[J].西安文理學院學報(自然科學版),2016(3):48-52.