□高 宇 閆娟娟 孫 健
電子商務(wù)主要是借助計算機技術(shù)、網(wǎng)絡(luò)技術(shù)以及遠程通信技術(shù)來進行的商業(yè)活動。電子商務(wù)是現(xiàn)代信息技術(shù)和傳統(tǒng)經(jīng)濟相互融合的重要橋梁。Web數(shù)據(jù)挖掘?qū)儆谝豁椌C合性技術(shù),是科技發(fā)展的重要標志,能夠有效地促進電子商務(wù)行業(yè)的發(fā)展。
Web挖掘?qū)儆谝豁椌C合技術(shù),主要指的是數(shù)據(jù)挖掘在Web上的應(yīng)用,它通過數(shù)據(jù)挖掘技術(shù)從和Internet相關(guān)的資源以及行為中選擇大量的、有用的模式和隱含信息,以此提高Web技術(shù)的工作效率,包括Web技術(shù)、計算機語言學、統(tǒng)計學等各方面內(nèi)容。Web數(shù)據(jù)挖掘的最終目的就是從Web的訪問記錄中選擇對用戶有利的模式,而計算機服務(wù)器中則記錄了用戶的訪問信息,借助于Web數(shù)據(jù)挖掘技術(shù)就能夠根據(jù)用戶的訪問情況和興趣來調(diào)整頁面結(jié)構(gòu),進行有效的電子商務(wù)活動,進而滿足廣大用戶的不同需要。Web數(shù)據(jù)挖掘技術(shù)主要分為三種類型Web內(nèi)容挖掘、Web結(jié)構(gòu)挖掘和Web使用挖掘。挖掘?qū)ο笾饕ǎ篧eb數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫、空間數(shù)據(jù)庫、時序數(shù)據(jù)庫、DNA數(shù)據(jù)庫等;挖掘方法主要分為:統(tǒng)計方法、神經(jīng)網(wǎng)絡(luò)方法以及數(shù)據(jù)庫方法等;根據(jù)開采目標主要分為:關(guān)聯(lián)規(guī)則、分類、聚類、時間序列預(yù)測模型發(fā)現(xiàn)以及時序模式發(fā)現(xiàn)等。
(一)Web內(nèi)容挖掘。Web內(nèi)容挖掘主要是挖掘Web頁面內(nèi)容和后臺交易數(shù)據(jù)庫。按照網(wǎng)絡(luò)內(nèi)容、文檔和數(shù)據(jù)要求,從海量信息中選擇出有價值的數(shù)據(jù)信息,然后顯示出各種數(shù)據(jù)信息之間的關(guān)系,最終實現(xiàn)挖掘出網(wǎng)絡(luò)數(shù)據(jù)中或者文檔中隱藏的一些有用內(nèi)容。網(wǎng)絡(luò)容納了豐富多樣的資源信息,例如視頻、音頻、文本和圖像等類型的數(shù)據(jù)信息,依據(jù)這些數(shù)據(jù)類型,能夠把Web內(nèi)容挖掘劃分成兩種形式,媒體挖掘以及文本挖掘,目前文本挖掘被廣泛運用,多媒體挖掘處于探索階段。
(二)Web結(jié)構(gòu)挖掘。因為Web頁面結(jié)構(gòu)較為豐富,有價值的信息不但隱藏在頁面的內(nèi)容當中,也潛藏在頁面結(jié)構(gòu)當中,因此,Web結(jié)構(gòu)挖掘是通過Web文檔之間的超鏈接結(jié)構(gòu)來分析數(shù)據(jù),選取有價值信息。Web超鏈接信息能夠把Web頁面內(nèi)容的相關(guān)性、質(zhì)量以及結(jié)構(gòu)方面的信息挖掘出來,顯示文檔之間的關(guān)系。也可以說Web結(jié)構(gòu)挖掘主要是挖掘隱藏的鏈接結(jié)構(gòu)模式,主要分為頁面鏈接之間的關(guān)系、文檔結(jié)構(gòu)等方面內(nèi)容。
(三)Web使用挖掘。Web使用挖掘技術(shù)也就是日志挖掘,該項挖掘被廣泛應(yīng)用于電子商務(wù)領(lǐng)域。主要是經(jīng)過挖掘用戶訪問的Web服務(wù)器的相關(guān)記錄,挖掘出用戶訪問Web頁面采用的模式、興趣點和訪問頻率,掌握用戶使用情況,從而挖掘出更多的潛在用戶。一般挖掘用戶使用記錄信息的途徑分為分析日志文件和搜集、分析用戶對事件的點擊來獲取用戶的導(dǎo)航行為。運用Web使用挖掘技術(shù),能夠分析用戶的歷史瀏覽記錄,掌握用戶的喜好,然后搜索引擎就能夠根據(jù)喜好來篩選和擴展用戶的搜索結(jié)果。由此可見,Web日志的數(shù)據(jù)量大、內(nèi)容豐富、種類繁多。
在電子商務(wù)管理當中,Web服務(wù)器可以自動收集客戶瀏覽的信息數(shù)據(jù),然后以文本的形式保存這些日志數(shù)據(jù),并對這些數(shù)據(jù)進行分析,選擇出最有價值的信息,以此作為商家決策的重要依據(jù),進而提高電子商務(wù)管理效率。Web數(shù)據(jù)挖掘:第一,明確數(shù)據(jù)挖掘的目標;第二,準備數(shù)據(jù),準備數(shù)據(jù)的時候應(yīng)該搜索所有和業(yè)務(wù)對象相關(guān)的內(nèi)部以及外部數(shù)據(jù)信息,選擇和數(shù)據(jù)挖掘應(yīng)用相適應(yīng)的數(shù)據(jù)。接著對這些數(shù)據(jù)進行分析,來確定挖掘操作類型,把數(shù)據(jù)轉(zhuǎn)換為一個具體的分析模型,這是數(shù)據(jù)挖掘成功與否的核心環(huán)節(jié);第三,挖掘經(jīng)過轉(zhuǎn)換的數(shù)據(jù);第四,分析挖掘結(jié)果;第五,把分析到知識應(yīng)用到電子商務(wù)業(yè)務(wù)管理系統(tǒng)當中。使用Web數(shù)據(jù)挖掘來分析用戶的訪問信息和訪問模式,根據(jù)用戶的習慣、喜好等信息對網(wǎng)站進行優(yōu)化,進而滿足用戶的需求,也能使商家明確市場目標,提高其在市場中的競爭力。
(一)預(yù)處理。數(shù)據(jù)預(yù)處理的目標是為了實現(xiàn)數(shù)據(jù)挖掘的輸入。因為Web日志數(shù)據(jù)量巨大,種類繁多雜亂,必須對日志數(shù)據(jù)進行準確的預(yù)處理,才能保證數(shù)據(jù)質(zhì)量。預(yù)處理是有數(shù)據(jù)清洗和事務(wù)識別兩部分構(gòu)成。Web挖掘預(yù)處理可以完成識別切分訪問日志中的各字段,依據(jù)KPI統(tǒng)計的需求,自動生成不同訪問請求過濾數(shù)據(jù)的任務(wù),進而提高數(shù)據(jù)預(yù)處理的功能。
(二)發(fā)現(xiàn)用戶訪問模式。采用統(tǒng)計學、模式識別、數(shù)據(jù)挖掘等方面的先進技術(shù)分析和挖掘Web日記記錄中存在的規(guī)律,找出電子商務(wù)中的潛在客戶以及市場,根據(jù)客戶需求,改進Web服務(wù)器的系統(tǒng)功能,進行有針對性的電子商務(wù)活動。
(三)模式分析。Web使用挖掘中的模式分析目的是為了發(fā)現(xiàn)最有效的模式,研發(fā)出多種Web分析技術(shù)以及工具來提高模式的使用效率。
(一)數(shù)據(jù)挖掘能夠優(yōu)化企業(yè)資源。數(shù)據(jù)挖掘可以給企業(yè)提高有效的決策依據(jù),幫助企業(yè)調(diào)整發(fā)展策略,增強企業(yè)整體實力。企業(yè)要想實現(xiàn)較高的利潤就需要采取有效的措施來降低成本。Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用,可以使企業(yè)準確把握所有的過程業(yè)務(wù)環(huán)節(jié),而精準了解各類庫存的數(shù)據(jù),能夠使企業(yè)合理分配資源,做好預(yù)算工作。例如根據(jù)數(shù)據(jù)來確定企業(yè)的整體廣告投放量,可以有效地降低成本。因此,做好數(shù)據(jù)挖掘方面的相關(guān)問題,能夠增強企業(yè)的競爭力,促進企業(yè)發(fā)展。
(二)使用數(shù)據(jù)挖掘能夠使電子商務(wù)企業(yè)處理好和客戶之間的關(guān)系。企業(yè)盈利的對象是客戶,因此,必須滿足客戶的需求,才能提高企業(yè)的服務(wù)功能,進而提升經(jīng)濟效益。目前電子商務(wù)企業(yè)都在研究如何挖掘客戶和怎樣滿足客戶的需求,假如能夠根據(jù)客戶的消費情況和消費能力以及興趣等方面進行研究,可以把客戶的合理需要顯示出來,而數(shù)據(jù)挖掘技術(shù)的用戶畫像正好可以完成此項任務(wù)。這種功能能夠有效地提高客戶的滿意程度,長此以往,客戶就會非常信任電子商務(wù)商家,這是數(shù)據(jù)挖掘中的數(shù)據(jù)忠誠度的體現(xiàn),能夠幫助企業(yè)提高利潤。
(三)數(shù)據(jù)挖掘技術(shù)能夠提高電子商務(wù)企業(yè)的管理水平。有效的數(shù)據(jù)能夠幫助電子商務(wù)企業(yè)全面分析企業(yè)的內(nèi)在和外在發(fā)展狀況。然后采取有效措施來改革和完善企業(yè)自身存在的不足,使企業(yè)的管理水平和效率得以提升。
綜上所述,處于大數(shù)據(jù)時代,數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中發(fā)揮著不可替代的作用。電子商務(wù)活動當中存在的海量信息和數(shù)據(jù)是電子商務(wù)活動順利開展的前提,使用Web數(shù)據(jù)挖掘技術(shù)可以挖掘出電子商務(wù)中最有價值的信息,幫助企業(yè)合理決策,明確發(fā)展方向,提高經(jīng)濟效益。因此,Web數(shù)據(jù)挖掘和電子商務(wù)的融合能夠使電子商務(wù)企業(yè)獲得有價值的商業(yè)信息以及客戶信息,這對企業(yè)的發(fā)展有著重要意義。