王志俊
(山西建筑職業(yè)技術(shù)學(xué)院 山西省太原市 030006)
隨著科學(xué)技術(shù)的迅猛發(fā)展,信息技術(shù)在人們的生活中占據(jù)著越來越重要的地位。在這個(gè)科技日新月異的今天,我們又遇到了新的問題,信息爆炸讓人們每時(shí)每刻都在接觸各種消息,對(duì)個(gè)人來說,這些消息已經(jīng)過量,想要從復(fù)雜而無序的過量信息中提取有用信息,這就需要數(shù)據(jù)挖掘來發(fā)揮作用了。數(shù)據(jù)挖掘(Data Mining),由字面意思我們就能理解,它就是把各種各樣的、模糊的、隨機(jī)的數(shù)據(jù)進(jìn)行整理,提取出我們所需要的、事先不知的、有潛在利用價(jià)值的知識(shí)和信息。這個(gè)過程有利于我們把所發(fā)掘的知識(shí)用于信息管理、決策優(yōu)化、遠(yuǎn)程管控、策略支持,還可以用于數(shù)據(jù)系統(tǒng)的自身修復(fù)。我們還需要知道的是,數(shù)據(jù)挖掘和其他學(xué)科有很深的聯(lián)系,它是一門交叉性很廣的學(xué)科,這項(xiàng)技術(shù)地研究工作匯集了不同領(lǐng)域的專家和學(xué)者,特別是數(shù)據(jù)庫、人工智能、無人機(jī)、大數(shù)據(jù)等方面的學(xué)者和研究人員。
我們將GSM 網(wǎng)絡(luò)告警信息提取技術(shù)有效內(nèi)容提取出來,然后讓它和告警信息數(shù)據(jù)挖掘技術(shù)有機(jī)結(jié)合,將數(shù)據(jù)挖掘技術(shù)和網(wǎng)絡(luò)中的告警技術(shù)結(jié)合起來進(jìn)行分析,然后建立全新的以Apriori 算法為基礎(chǔ)的告警獲取和綜合分析系統(tǒng),這能給維護(hù)人員提供更多的便利,幫助他們快速有效地收集有用的告警信息,進(jìn)而能針對(duì)性地分析告警產(chǎn)生的原因,短時(shí)間內(nèi)及時(shí)處理機(jī)械故障。數(shù)據(jù)挖掘的基礎(chǔ)就是數(shù)據(jù)倉庫的建立和完善,數(shù)據(jù)挖掘的關(guān)鍵內(nèi)容是決策樹在市場(chǎng)預(yù)測(cè)中的積極作用。數(shù)據(jù)挖掘技術(shù)在移動(dòng)通信領(lǐng)域的綜合應(yīng)用,本文也進(jìn)行了充分的說明。
數(shù)據(jù)挖掘最開始形式是數(shù)據(jù)倉庫,之后慢慢發(fā)展成了現(xiàn)在的形式,隨著科學(xué)技術(shù)的不斷發(fā)展,數(shù)據(jù)庫技術(shù)和數(shù)據(jù)庫管理系統(tǒng)也在不斷普及,在人們?cè)谑褂眠^程中,數(shù)據(jù)庫中存儲(chǔ)的內(nèi)容會(huì)不斷地增大,然而,經(jīng)過調(diào)查我們發(fā)現(xiàn),市面上用于分析和處理這些數(shù)據(jù)的工具很少。大數(shù)據(jù)背后隱藏著許多我們所需要的信息,但是由于技術(shù)的局限,工具的缺乏,我們沒辦法將這些有效信息挖掘出來,這些信息能指導(dǎo)我們的實(shí)踐活動(dòng),企業(yè)需要通過技術(shù)改革來獲取它。目前的數(shù)據(jù)庫系統(tǒng)功能也只是局限于數(shù)據(jù)的存儲(chǔ),人們所獲取的信息只是數(shù)據(jù)庫整體中的一部分,很多的有效信息都隱藏在數(shù)據(jù)的整體描述和發(fā)展趨勢(shì)的預(yù)測(cè)上,這些信息在關(guān)鍵時(shí)期和決策階段都有很重要的參考意義。在數(shù)據(jù)庫不斷發(fā)展的同時(shí),人工智能領(lǐng)域開辟了一個(gè)新的分支,它就是機(jī)器學(xué)習(xí),人們?cè)谶@方面的研究也取得了巨大進(jìn)展。人們的學(xué)習(xí)方法千奇百怪,機(jī)器人學(xué)習(xí)的理論是依據(jù)人的學(xué)習(xí)理論模仿出來的,所以機(jī)器學(xué)習(xí)的方法也有很多種類型,例如,實(shí)例學(xué)習(xí)、觀察、發(fā)現(xiàn)學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、視網(wǎng)膜技術(shù)、動(dòng)手操作、遺傳算法等。一些人們熟知且常用的算法已經(jīng)被運(yùn)用到實(shí)際的計(jì)算機(jī)智能系統(tǒng)的設(shè)計(jì)上了。數(shù)據(jù)庫技術(shù)和機(jī)器學(xué)習(xí)技術(shù)的崛起,讓人們又產(chǎn)生了新的工作需要,數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生了。只有先建立好數(shù)據(jù)倉庫,我們才能運(yùn)用數(shù)據(jù)挖掘技術(shù),與傳統(tǒng)的事務(wù)處理機(jī)制不同,數(shù)據(jù)挖掘技術(shù)具有導(dǎo)向性、主題性、集成性、不可更新性、隨內(nèi)容變化等特征。數(shù)據(jù)倉庫的原始數(shù)據(jù)是多個(gè)聯(lián)機(jī)事務(wù)處理系統(tǒng),數(shù)據(jù)挖掘通過ETL 過程處理這些文件,而且按照不同的主題存儲(chǔ)和管理這些數(shù)據(jù)。通過和數(shù)據(jù)倉庫進(jìn)行對(duì)接,對(duì)倉庫中重要的客戶信息進(jìn)行聯(lián)機(jī)處理和數(shù)據(jù)挖掘。
圖1:數(shù)據(jù)挖掘步驟
在一個(gè)國際會(huì)議上,知識(shí)開發(fā)領(lǐng)域的一位著名學(xué)者提出了人們都能接受的定義:“對(duì)數(shù)據(jù)庫中未知的、有潛在應(yīng)用價(jià)值的、非凡的模式的提取”,其中,“模式”是指高級(jí)語言下的一種邏輯編碼含義,通常在數(shù)據(jù)庫中表示數(shù)據(jù)之間的邏輯關(guān)系,而“非凡”是指在數(shù)據(jù)挖掘工作中,知識(shí)發(fā)現(xiàn)過程的不確定性和它具有一定的自由度。對(duì)于存在確定的計(jì)算過程的模式,它可以利用員工的工資求出職工的平均工資和總工資,我們一般稱之為頻繁知識(shí),而這些頻繁知識(shí)并不是數(shù)據(jù)挖掘的目標(biāo)。
從已經(jīng)發(fā)現(xiàn)的數(shù)據(jù)挖掘系統(tǒng)來看,應(yīng)用數(shù)據(jù)挖掘技術(shù)的領(lǐng)域都具有以下特征,信息豐富、環(huán)境多變、沒有實(shí)際模型、需要知識(shí)幫助管理層進(jìn)行決策。美國市場(chǎng)研究公司曾經(jīng)推出過一個(gè)市場(chǎng)預(yù)測(cè)系統(tǒng),它主要應(yīng)用在飛機(jī)故障發(fā)現(xiàn)、醫(yī)療監(jiān)測(cè)、地殼運(yùn)動(dòng)監(jiān)測(cè)、宇宙成像這些方面。在應(yīng)用數(shù)據(jù)挖掘技術(shù)時(shí),我們首先要做的就是倉庫的建立。圖1 為數(shù)據(jù)挖掘的基本技術(shù),如圖所示,數(shù)據(jù)挖掘主要有五個(gè)步驟,最開始為數(shù)據(jù)選擇,找到合適的數(shù)據(jù)以后我們對(duì)這部分內(nèi)容進(jìn)行預(yù)處理,“物以類聚,人以群分”,我相信這句話大家都聽過,數(shù)據(jù)處理也是相同的原理,我們把抽象的對(duì)象按照屬性劃分為幾個(gè)不同的群體,每個(gè)群體中,對(duì)象都具有相似性,不同群體之間相似性高低有區(qū)別,一般情況下,一個(gè)群體只占據(jù)一類。前面都是準(zhǔn)備階段,之后就進(jìn)入正題,開始數(shù)據(jù)挖掘,先解決算法規(guī)則,然后充分運(yùn)用分類、聚類、關(guān)聯(lián)等方法處理,接下來就到了最后一個(gè)步驟:結(jié)果檢測(cè)和解釋評(píng)價(jià)過程。
隨著數(shù)據(jù)挖掘研究的不斷深入,人們對(duì)數(shù)據(jù)挖掘的理解也越來越深入,越來越全面,對(duì)它的定義也隨著時(shí)間的變化而不斷修改。數(shù)據(jù)挖掘是一種有利于我們進(jìn)行決策的技術(shù),它以AI、人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)原理作為基礎(chǔ),對(duì)企業(yè)的原始數(shù)據(jù)進(jìn)行自動(dòng)化的分析,自動(dòng)的歸納和整理數(shù)據(jù),挖掘潛在的、有價(jià)值的信息。同時(shí),它還能預(yù)測(cè)市場(chǎng),在更好地理解客戶需要的基礎(chǔ)上,幫助企業(yè)的管理者調(diào)整原有策略,進(jìn)而規(guī)避市場(chǎng)風(fēng)險(xiǎn),減少損失,做出正確的規(guī)劃。打造大數(shù)據(jù)下的統(tǒng)一共享平臺(tái)是移動(dòng)業(yè)務(wù)倉庫建立的重要目標(biāo)。這個(gè)數(shù)據(jù)倉庫將整合客戶信息,對(duì)數(shù)據(jù)加工處理之后,根據(jù)這些數(shù)據(jù)的特點(diǎn)把它們分類儲(chǔ)存起來,移動(dòng)運(yùn)營商根據(jù)這些數(shù)據(jù)資源深層次挖掘數(shù)據(jù)背后的有價(jià)值信息。如圖2 所示。
遵循它的原理,我們建立它的理論商業(yè)模型,這能幫助企業(yè)深層次的理解銷售活動(dòng)的影響,從而有針對(duì)性的設(shè)計(jì)更高效率的銷售方法。決策樹的算法有很多,我們普遍熟知是通過用戶群體的消費(fèi)特點(diǎn)和個(gè)人特征,設(shè)計(jì)不同的營銷策略,決策樹還能幫助移動(dòng)運(yùn)營商,讓他們提高效率,更好地服務(wù)客戶。
在充分了解了客戶的生活方式和社會(huì)關(guān)系之后,我們能根據(jù)他們的消費(fèi)習(xí)慣初步推測(cè)他們的購物習(xí)慣,然后再依靠分類分析的方法,通過客戶的通話行為判斷他們的需求方式。按照特征把客戶分類,這是大數(shù)據(jù)分析的第一步,分類是為了簡(jiǎn)化后期的運(yùn)算,節(jié)省人力和物力,運(yùn)營商對(duì)于不同的客戶群體采用不同的營銷策略,制定相應(yīng)的服務(wù)規(guī)則,這是數(shù)據(jù)挖掘方法在營銷活動(dòng)中的直接運(yùn)用。
我們都有過購物的階段,吸引我們購物的原因除了生活需要,很大一部分就是因?yàn)橛袃?yōu)惠,一個(gè)好的優(yōu)惠策略能夠讓市場(chǎng)反應(yīng)強(qiáng)烈,幫助我們?nèi)〉脻M意的營銷結(jié)果,但是一旦優(yōu)惠策略出錯(cuò),運(yùn)營商很可能既丟了客戶又賠了資金,這就是我們常說的“丟了夫人又折兵”。為了讓優(yōu)惠策略取得實(shí)際效果,我們需要構(gòu)建客戶的心理模型,通過仿真實(shí)驗(yàn)?zāi)M他們的心理活動(dòng),觀察他們對(duì)優(yōu)惠策略的反應(yīng),進(jìn)一步判斷這個(gè)策略是否有執(zhí)行的必要,這種仿真模擬能幫助我們很好的規(guī)避風(fēng)險(xiǎn)、減少損失、調(diào)整策略和優(yōu)化服務(wù)。
依靠用戶的消費(fèi)能力和費(fèi)用支出,建立客戶的價(jià)值模型,分析他們的忠誠度和對(duì)網(wǎng)絡(luò)運(yùn)營的依賴程度,充分了解客戶的價(jià)值傾向。運(yùn)營商的工作重點(diǎn)就是客戶,俗話說“知己知彼,百戰(zhàn)不殆”,就在充分了解用戶之后,我們才能制定有效的策略。運(yùn)營商的目的是提高市場(chǎng)的占有率,降低營銷成本,提高客戶的忠誠度,我們通過分析,給客戶提供高質(zhì)量的服務(wù),在用戶心中留下良好的印象,使他們形成依賴感,這樣用戶就不會(huì)輕易的改變網(wǎng)絡(luò)服務(wù)商了。
市場(chǎng)就是一塊大蛋糕,競(jìng)爭(zhēng)對(duì)手就是和我們一起食用蛋糕的人,誰的能力大,分得了蛋糕也就更大,競(jìng)爭(zhēng)越激烈,市場(chǎng)才越成熟。不同運(yùn)營商之間要做到互通互聯(lián),相互了解,建立合作渠道,這樣才能一起抵抗金融風(fēng)險(xiǎn),通過分析客戶和競(jìng)爭(zhēng)對(duì)手之間的聯(lián)系,了解競(jìng)爭(zhēng)對(duì)手的服務(wù)模型,然后再制定有針對(duì)性的策略,把用戶向我們拉攏,這能幫助我方擴(kuò)大市場(chǎng)份額和用戶量,提升我方的影響力。
圖2:數(shù)據(jù)倉庫模型圖
隨著移動(dòng)網(wǎng)絡(luò)通信技術(shù)的不斷發(fā)展,計(jì)算機(jī)開始在各行各業(yè)中廣泛應(yīng)用起來,用它處理的信息能幫助我們進(jìn)行行業(yè)管理,也有助于工作規(guī)劃和相關(guān)的決策,現(xiàn)如今,數(shù)據(jù)的生成、收集、存儲(chǔ)和處理能力都不斷增強(qiáng),數(shù)據(jù)垃圾也不斷增多,在信息爆炸的今天,我們要充分認(rèn)識(shí)數(shù)據(jù)的重要性。數(shù)據(jù)挖掘技術(shù)能夠幫助我們的實(shí)際生活,它提取的內(nèi)容可以在數(shù)據(jù)庫中進(jìn)行聯(lián)系,為數(shù)據(jù)庫的形成提供便利。