舒煜
摘要:互聯(lián)網(wǎng)產(chǎn)業(yè)作為數(shù)據(jù)爆炸時代的典型代表,其在數(shù)據(jù)獲取、處理及利用方面存在天然性的優(yōu)勢,而如今看來數(shù)據(jù)本身其實是可以隱匿的,隱匿的數(shù)據(jù)與顯性的企業(yè)運作系統(tǒng)之間存在著很大的關聯(lián),這些關聯(lián)如何挖出是在現(xiàn)下的技術手段中是可以解決的,關鍵問題在于企業(yè)或者說行業(yè)內(nèi)可否發(fā)現(xiàn)這些數(shù)據(jù)匿藏點并加以處理。這些問題在成熟的解決辦法出來之前,一直會是研究者們探討和研究的重點。
關鍵詞:互聯(lián)網(wǎng)產(chǎn)業(yè);系統(tǒng)域;隱匿數(shù)據(jù);存留機制
中圖分類號:TP3-05 文獻標識碼:A
文章編號:1009-3044(2020)14-0058-02
1引言
當前產(chǎn)業(yè)互聯(lián)網(wǎng)促進各行業(yè)協(xié)同發(fā)展及轉(zhuǎn)型升級,同時帶動了各企業(yè)信息化系統(tǒng)的高度建設,這里信息化系統(tǒng)并非單純指的是操作及工作系統(tǒng),而是指包括了企業(yè)內(nèi)部用于協(xié)同辦公的各組織性子系統(tǒng)集合及對外開放式的移動(或非移動)應用端的整合體系。以目前在產(chǎn)業(yè)趨向于網(wǎng)絡生態(tài)化的角度來看,“大”系統(tǒng)(或者“大”整合)的概念已經(jīng)成為主流,在這大趨勢下的產(chǎn)業(yè)面向用戶分析也勢必會帶來新的突破和挑戰(zhàn),傳統(tǒng)信息分析方式和分析點是否能夠支撐現(xiàn)行用戶需求,能否成為以大數(shù)據(jù)為代表的決策支撐點都是有待考究,所以本文就以互聯(lián)網(wǎng)產(chǎn)業(yè)為代表性行業(yè),針對其整個內(nèi)外系統(tǒng)中是否存在隱匿用戶信息及信息獲取機制做出一定的分析,也是從數(shù)據(jù)整合角度出發(fā)對該類型問題做出探索。
2隱匿點獲取源分析
2.1企業(yè)內(nèi)部系統(tǒng)的可拓數(shù)據(jù)
由于互聯(lián)網(wǎng)產(chǎn)業(yè)存在特殊性,對信息數(shù)據(jù)的記錄及細節(jié)點都十分完善,各個環(huán)節(jié)的信息內(nèi)容都是存儲在相應的數(shù)據(jù)庫之中。就一般性的互聯(lián)網(wǎng)企業(yè)而言,其類BSS-CRM系統(tǒng)域中的產(chǎn)品及“套餐”系統(tǒng)(PPM系統(tǒng))、客戶管理系統(tǒng)、VIP客戶系統(tǒng)、互動服務系統(tǒng)及線上營銷系統(tǒng)等都存在詳實的用戶數(shù)據(jù)信息,但是有些信息可能需要挖掘技術方可轉(zhuǎn)換成價值信息。此外,在該類型企業(yè)的計費系統(tǒng)域中,在線費用計算系統(tǒng)、經(jīng)費管理包及賬務余額統(tǒng)計系統(tǒng)(ABM系統(tǒng))也可以為企業(yè)提供用戶信息的隱匿內(nèi)容,這種隱藏著的信息挖掘其實是在以大數(shù)據(jù)應用為代表的技術手段的實現(xiàn)。
比如,在互動服務系統(tǒng)中的用戶產(chǎn)品咨詢或故障報修率可以作為用戶是否具有產(chǎn)品脫離傾向的判斷和依據(jù);客戶管理系統(tǒng)和VIP客戶系統(tǒng)中消費能力可以作為定制化或一般化產(chǎn)品推薦的有力指向等,也就是說,這種企業(yè)內(nèi)部系統(tǒng)數(shù)據(jù)的挖掘程度越高,潛在的用戶信息就呈現(xiàn)得越明顯,見圖1所示。
2.2對外平臺系統(tǒng)的可拓信息
當前網(wǎng)絡平臺的呈現(xiàn)樣式不外乎三大類:企業(yè)常規(guī)網(wǎng)站、企業(yè)移動平臺(App應用端)及企業(yè)微平臺(企業(yè)微信及微博等),在此前關于企業(yè)網(wǎng)絡移動平臺的調(diào)研數(shù)據(jù)就顯示86%的用戶對App應用端存在“針對性使用”,即用戶使用存在針對性和有效性,那么企業(yè)通過對App應用端的分析以此來預測用戶心理也是具備針對性和有效性,由此可知,其不僅是外界與互聯(lián)網(wǎng)企業(yè)重要的交互窗口,更是可以來抓取用戶消費心理的重要渠道,評論區(qū)、者留言板塊及聊天記錄中都存在隱匿的數(shù)據(jù),整合有效信息整理及處理冗余數(shù)據(jù)并加以分析可以從一定程度上對互聯(lián)網(wǎng)產(chǎn)品在用戶心里的重要程度及改進內(nèi)容做出相應的指向。特別是根據(jù)App移動端的用戶下載量、退定量及更新比例等網(wǎng)絡平臺數(shù)據(jù),可以很好地預測用戶對于產(chǎn)品的依賴程度,見圖1所示。
3隱匿數(shù)據(jù)過濾處理
3.1系統(tǒng)域數(shù)據(jù)存留機制
當前系統(tǒng)數(shù)據(jù)對于企業(yè)來說,本身是可以做到海量保存。但是運用數(shù)據(jù)做分析時就必須得做到有效性,而有效的數(shù)據(jù)存留在龐大的數(shù)據(jù)庫中就得實時做數(shù)據(jù)庫的壓縮處理,即對與“敏感數(shù)據(jù)”(企業(yè)想要得到的信息關鍵詞)關聯(lián)度較高的數(shù)據(jù)內(nèi)容進行數(shù)據(jù)庫的壓縮,清理出冗余、無效的“脫敏數(shù)據(jù)”,以此在為數(shù)據(jù)做進一步分析前清理出計算空間。同時,根據(jù)企業(yè)想要得到的有價值信息內(nèi)容的不同,可以建立N個關聯(lián)詞設置,以將相應匹配值較高的敏感數(shù)據(jù)進行分類,建立N個有效數(shù)據(jù)庫,以備進一步挖掘之用。見圖2所示。
3.2隱匿數(shù)據(jù)過濾流程分析
由上述分析可知,通過有效數(shù)據(jù)庫的建立可以大大減少冗余、無效或脫敏數(shù)據(jù)的干擾,但是并不意味著有效數(shù)據(jù)就一定可以用做分析,因為數(shù)據(jù)分析還存在時效性和選擇性的問題,N個有效數(shù)據(jù)庫在不同的研究對象前可以是單獨的抓取,也可能是混合交叉抓取。所以在各個有效數(shù)據(jù)庫的信息數(shù)據(jù)大規(guī)模集中的同時,由于有效數(shù)據(jù)庫中也有可能存在相似或者時效性等問題,比如企業(yè)App應用端和微平臺中存在相似的用戶操作記錄、留言信息或用戶繳費數(shù)據(jù)等,故還需要對敏感數(shù)據(jù)進行精簡和處理。
因?qū)﹄[匿數(shù)據(jù)中各部分的原始數(shù)據(jù)已經(jīng)弱化數(shù)量、提高質(zhì)量,故數(shù)據(jù)的價值性有所提高,那么對于用戶潛在信息挖掘的程度也近一步增強。通過整合BSS-CRM系統(tǒng)域和對外平臺端系統(tǒng)的分布式數(shù)據(jù)挖掘,采取BI軟件技術等過濾及整合方式分析出用戶在產(chǎn)品方面的各種消費行為或產(chǎn)品本身質(zhì)量問題等,進而對企業(yè)在市場決策中起到關鍵作用。見圖3所示。
4結語
對于互聯(lián)網(wǎng)產(chǎn)業(yè)來說系統(tǒng)域本身就是一個載體,其承載的不僅是顯性數(shù)據(jù)資源及用戶信息,更重要的是讓其成為企業(yè)在挖掘用戶潛在價值信息及重要數(shù)據(jù)的支撐點,系統(tǒng)集成而帶來的內(nèi)部和外部子系統(tǒng)的可運用價值也會越來越高。數(shù)據(jù)本身其實是“靜止”的,不經(jīng)過濾和分析,其價值性可能無法直接體現(xiàn)出來,而信息的價值就是在于幫助行業(yè)來做相應的決策,所以在以當前產(chǎn)業(yè)互聯(lián)網(wǎng)帶動各領域轉(zhuǎn)型升級的趨勢來看,隱匿數(shù)據(jù)的挖掘和分析已經(jīng)成為各行業(yè)的重點技術手段并以此帶來更多的應用價值。