王峰 馮桂玲 上官霞 吳駿 蔡榮彥
摘 要: 針對傳統(tǒng)看板靈活性差、業(yè)務(wù)分析能力弱等問題,結(jié)合當(dāng)前的大數(shù)據(jù)技術(shù)、機(jī)器學(xué)習(xí)算法等,構(gòu)建了面向過程的敏銳決策動態(tài)分析看板。對此,結(jié)合大數(shù)據(jù)的相關(guān)技術(shù),將該看板平臺分為數(shù)據(jù)采集層、數(shù)據(jù)存儲與計算層、敏銳決策分析層、數(shù)據(jù)看板等,并將看板的功能劃分為分析可視化、智能分析和數(shù)據(jù)配置等模塊。在智能分析模塊,引入集成算法,包括擬合預(yù)測模型、聚類模型、分類模型等,并借助自然語言處理等技術(shù),實現(xiàn)對文本的處理和分類。最后,實現(xiàn)管理人員和業(yè)務(wù)人員對敏銳決策動態(tài)分析看板的全面應(yīng)用,驗證了上述方案在現(xiàn)代電力營銷中的效果。
關(guān)鍵詞: 敏銳決策; 機(jī)器算法; 擬合預(yù)測; 看板
中圖分類號: TP 393文獻(xiàn)標(biāo)志碼: A
Process-oriented and Keen Decision-making Dynamic
Analysis of Kanban Platform Design
WANG Feng, FENG Guiling, SHANGGUAN Xia, WU Jun, CAI Rongyan
(State Grid Fujian Electric Power Co. Ltd., Fuzhou, Fujian 350001, China)
Abstract: In view of the poor flexibility of traditional Kanban and weak business analysis ability, combined with the current big data technology and machine learning algorithm, a process-oriented keen decision dynamic analysis Kanban is constructed. In this regard, combined with the relevant technology of big data, the Kanban platform is divided into data acquisition layer, data storage and calculation layer, keen decision analysis layer, data Kanban, etc, and the function of Kanban is divided into analysis visualization, intelligent analysis and data configuration and other modules. In the intelligent analysis module, integrated algorithms are introduced, including fitting prediction models, clustering models, classification models, etc, and techniques such as natural language processing are used to process and classify texts. Finally, the comprehensive application of managers and business personnel to the keen decision-making dynamic analysis Kanban is realized, and the effect of the above scheme in modern power marketing is verified.
Key words: keen decision making; machine algorithm; fitting prediction; Kanban
0 引言
傳統(tǒng)的看板,仍處于基于報表等結(jié)構(gòu)化數(shù)據(jù)進(jìn)行指標(biāo)相關(guān)的統(tǒng)計分析階段,對單業(yè)務(wù)的分析較好,對跨業(yè)務(wù)的分析較弱,需要大量的人為介入分析和判斷,無法快速甄別有效信息,許多業(yè)務(wù)報告制作太過于詳細(xì),都是規(guī)范化的文檔,被靜態(tài)表格和各種圖表類型所夸大,也正是因為它,制約了從數(shù)字化向智能化發(fā)展。同時,現(xiàn)有看板系統(tǒng)基本上都是面向分析結(jié)果、按照“數(shù)據(jù)(結(jié)果)可視化”的方式而設(shè)計的,主要側(cè)重于對關(guān)鍵指標(biāo)的靜態(tài)展示,“只能看,不能點(diǎn)”,靈活性差,個性化需求均需要進(jìn)行開發(fā),周期長,成本高,響應(yīng)及時性差;分析的過程存在于分析人員的大腦中,水平高低依賴于分析人員的個人思維分析能力,是一種高度個人藝術(shù)化的行為,難以進(jìn)行體系化、工業(yè)化地改進(jìn),限制了業(yè)務(wù)分析的深度與廣度,制約了數(shù)據(jù)分析行業(yè)水平的提升[1]。鑒于以上原因,本文構(gòu)建一套具有看板指標(biāo)靈活定制能力、業(yè)務(wù)發(fā)展趨勢預(yù)測能力、業(yè)務(wù)風(fēng)險研判定位能力、非結(jié)構(gòu)數(shù)據(jù)分析能力及高效輔助分析能力的“能點(diǎn)能看”的決策分析看板,以突破現(xiàn)有信息化構(gòu)建的傳統(tǒng)靜態(tài)看板的思路與功能的瓶頸,實現(xiàn)面向分析過程的“敏銳”決策分析看板構(gòu)建。
1 系統(tǒng)整體架構(gòu)設(shè)計
結(jié)合大數(shù)據(jù)的架構(gòu),本文將該系統(tǒng)的整體架構(gòu)包括數(shù)據(jù)存儲及處理、數(shù)據(jù)服務(wù)層以及看板層。其中數(shù)據(jù)存儲及處理主要負(fù)責(zé)各種類型數(shù)據(jù)接入、計算及清洗等一些預(yù)處理工作;數(shù)據(jù)服務(wù)主要包括分析過程可視化組件、機(jī)器學(xué)習(xí)算法模型集成、自動報告組件及非結(jié)構(gòu)化數(shù)據(jù)處理組件等;看板層主要根據(jù)業(yè)務(wù)需要對看板進(jìn)行基于業(yè)務(wù)需求的個性化定制,可以靈活擴(kuò)展與刪減。如圖1所示。
2 系統(tǒng)功能模塊設(shè)計
結(jié)合圖1的功能架構(gòu),以及根據(jù)現(xiàn)有的電力看板系統(tǒng),本文將整體系統(tǒng)的功能模塊分為以下幾個部分:分析管理模塊、數(shù)據(jù)配置模塊及系統(tǒng)配置模塊。分析管理主要包含分析可視化、看板切換管理、智能分析算法等功能;數(shù)據(jù)配置主要包括數(shù)據(jù)接入及自定義語義等功能;系統(tǒng)配置主要包含系統(tǒng)配置與定制等相關(guān)功能[2]。具體功能模塊如圖2來所示。
3 看板功能詳細(xì)設(shè)計
3.1 分析可視化模塊設(shè)計
所謂的“分析可視化”技術(shù),在用戶的交互分析過程中同步記錄分析思路發(fā)展過程,用“導(dǎo)圖”方式予以展現(xiàn),將現(xiàn)有的“數(shù)據(jù)(結(jié)果)可視化”進(jìn)一步提升為“分析(過程)可視化”,揭示數(shù)據(jù)分析中的思考過程,讓隱性分析過程顯性化。在該模塊中,包含四個不同的模塊,分別為分析思路展示、節(jié)點(diǎn)拆分/合并、節(jié)點(diǎn)聯(lián)動、路徑保存/裝載[3-4]。
1) 分析思路展示:在用戶數(shù)據(jù)分析的過程中,自動組合圖形形成分析路徑,將用戶的分析思考過程“可視化”。
2) 節(jié)點(diǎn)聯(lián)動:當(dāng)某個節(jié)點(diǎn)的分析條件、分析參數(shù)發(fā)生變化時,后續(xù)節(jié)點(diǎn)的顯示內(nèi)容自動聯(lián)動,快速看到后續(xù)各個節(jié)點(diǎn)的分析結(jié)果變化。
3) 節(jié)點(diǎn)拆分/合并:根據(jù)對結(jié)果開展對比、分組的需求,支持分析節(jié)點(diǎn)合并、拆分、修改,或拓展新的分支,適應(yīng)分析思路復(fù)雜多變的要求。
4) 路徑保存/裝載:分析思路可以被保存、重新裝載打開,供隨時復(fù)盤研究,并可共享給其他用戶,開展協(xié)作式分析,實現(xiàn)分析思路的知識保存與傳承。
3.2 信息熵智能鉆取算法設(shè)計
由于業(yè)務(wù)人員的工作經(jīng)驗及業(yè)務(wù)知識熟悉程度的差異,會存在不同分析人員對同一個分析目標(biāo)的分析結(jié)果存在質(zhì)量的差異,同時業(yè)務(wù)人員在面對一個從未有過經(jīng)驗的問題時分析無從下手等情況[5-6]?;谝陨蠈嶋H情況,系統(tǒng)設(shè)計了基于信息熵的智能鉆取算法,對于指標(biāo)的多個分析維度,系統(tǒng)自動根據(jù)智能鉆取算法進(jìn)行自動鉆取,給出機(jī)器鉆取結(jié)果,替代人工思考分析過程。在原有手工拖拽分析維度的基礎(chǔ)上,實現(xiàn)分析維度的自動鉆取功能,并且鉆取路徑保存可以人工干預(yù)編輯。
信息熵是用來度量樣本集合純度最常用的指標(biāo)。熵越大,純度越大,則該特征的內(nèi)部類別的差異度越大。算法首先通過信息熵定位差異度最大的特征,然后計算特征各類別的離心距絕對值,離心距越大表示該類別與平均水平的差異越大,是數(shù)據(jù)異常點(diǎn),算法選擇離心距最大的類別作為下一步的鉆取指標(biāo)。如此不斷向下挖掘,層層定位數(shù)據(jù)異常點(diǎn)。具體實現(xiàn)的思路如圖3所示。
3.3 智能分析模塊設(shè)計
在該模塊中,結(jié)合電力的各項業(yè)務(wù),選取合適的算法構(gòu)建模型,以此對不同的電力業(yè)務(wù)需求進(jìn)行分析。在本文中,則嘗試引入電力風(fēng)險預(yù)測模型、工單智能分類模型、聚類模型、趨勢預(yù)測分析模型、風(fēng)險研判定位模型等。
1) 趨勢預(yù)測分析
看板系統(tǒng)的趨勢預(yù)測分析能夠通過有關(guān)指標(biāo)的各期對基期的變化趨勢的分析,計算出數(shù)據(jù)變化走向,測算未來數(shù)值變化情況,即敏銳決策分析看板的業(yè)務(wù)發(fā)展趨勢預(yù)測能力。趨勢預(yù)測分析包含多項式擬合、冪擬合、對數(shù)擬合、指數(shù)擬合以及時間序列等,集成了不同的擬合算法,如:Gauss-Newton、Levenberg-Marquardt、最小二乘法、時間序列擬合算法等。
2) 風(fēng)險研判定位
目前看板系統(tǒng)的風(fēng)險研判定位功能集成了聚類算法,通過聚類算法來定位異?;蛴酗L(fēng)險的群體,為業(yè)務(wù)人員快速定位,提前預(yù)防風(fēng)險。聚類是機(jī)器學(xué)習(xí)中的一個算法,就是按照某個特定標(biāo)準(zhǔn)(如距離)把一個數(shù)據(jù)集分割成不同的類或簇,使得同一個簇內(nèi)的數(shù)據(jù)對象的相似性盡可能大,同時不在同一個簇中的數(shù)據(jù)對象的差異性也盡可能地大。即聚類后同一類的數(shù)據(jù)盡可能聚集到一起,不同類數(shù)據(jù)盡量分離。聚類算法包含了K-Means(K均值)聚類、k-modes聚類、k-prototypes聚類、基于密度的聚類方法(DBSCAN)等[7-8]。
3) 文本數(shù)據(jù)分析能力集成
敏銳決策分析看板具備基于自然語言處理技術(shù)的非結(jié)構(gòu)化文本分析處理功能,自然語言技術(shù)是用來處理非機(jī)構(gòu)化文本數(shù)據(jù)的技術(shù),進(jìn)而實現(xiàn)文本的自動分類。為了實現(xiàn)自動分類,看板采用了文本清洗、文本分詞、文本向量化、模型分類等自然語言處理技術(shù)。如圖4所示。
在上述的流程中,文本清洗可以有效減少詞匯噪音,保留更有效的文本特征使得分類模型達(dá)到更高的精度。如去標(biāo)點(diǎn)符號、停用詞去除、消歧轉(zhuǎn)換、習(xí)慣用語去除等;文本分詞是指將文本切分成由詞語組成的序列,是中文自然語言處理技術(shù)的基礎(chǔ)環(huán)節(jié),文本分詞的效果好壞,決定了后續(xù)文本分類模型的性能優(yōu)劣;文本向量化是指向文字轉(zhuǎn)化為機(jī)器能夠識別的數(shù)字,以便進(jìn)行模型運(yùn)算分析;模型分類是看板實現(xiàn)文本分類的核心技術(shù),通過將向量化的文本輸入模型,即可輸出分類結(jié)果。
以電力客戶投訴工單文本挖掘為例,利用分詞技術(shù)分析投訴工單中的受理內(nèi)容,對分詞結(jié)果開展特征選取與降維處理,并進(jìn)行詞頻統(tǒng)計,運(yùn)用詞云分析技術(shù)進(jìn)行分析結(jié)果可視化展示,把控住當(dāng)下電力客戶投訴的主要問題,針對性的為不同類型的電力客戶提供差異化的服務(wù)策略,從而提高客戶滿意度和忠誠度。
4 系統(tǒng)實現(xiàn)
4.1 趨勢預(yù)測模塊實現(xiàn)
用戶可根據(jù)不同的擬合方式進(jìn)行參數(shù)配置,通過高級配置面板指定擬合的算法,從而得到更好的擬合曲線[9-10]。同時,用戶可指定是否直接利用該擬合算法進(jìn)行趨勢預(yù)測,可設(shè)置需要預(yù)測的期數(shù),從而得到趨勢預(yù)測的擬合曲線,以幫助用戶了解數(shù)據(jù)變化趨勢,把握業(yè)務(wù)發(fā)展規(guī)律,如圖5所示。
以長期投訴量趨勢預(yù)測為例,將時間序列數(shù)據(jù)分離成不同的成分,包括了長期趨勢、季節(jié)趨勢、周期波動以及隨機(jī)因素,分別對其進(jìn)行時間序列擬合。預(yù)測結(jié)果分析:2018年以來預(yù)測效果顯著下降,主要由于2018年以來投訴判定規(guī)則改變,導(dǎo)致長期趨勢擬合效果較差,如圖6所示。
4.2 業(yè)擴(kuò)工單聚類實現(xiàn)
選取2017-2018年業(yè)擴(kuò)歸檔工單和在途所有工單,對工單進(jìn)行分類,形成同一聯(lián)系人且同一個聯(lián)系電話辦理的業(yè)擴(kuò)項目用戶名數(shù)量和同一個聯(lián)系電話辦理的業(yè)擴(kuò)項目用戶名數(shù)量兩個特征,根據(jù)兩個特征進(jìn)行聚類分析,識別出“二哥”,且清晰地描述其特征[11-12],如圖7所示。
4.3 訴求熱點(diǎn)詞云分析
看板基于模型在四級分類差錯點(diǎn)的分類結(jié)果,進(jìn)行各差錯點(diǎn)投訴量統(tǒng)計分析,形成詞云,展示在數(shù)據(jù)看板上,直觀的呈現(xiàn)指定周期內(nèi)的投訴熱點(diǎn),使管理層對當(dāng)前的服務(wù)短板或者服務(wù)風(fēng)險有清晰的了解[13]。具體挖掘結(jié)果如圖8所示。
5 總結(jié)
通過上述對敏銳決策動態(tài)分析看板平臺的分析看出,電力企業(yè)圍繞云計算、機(jī)器學(xué)習(xí)算法等現(xiàn)代信息技術(shù),大力提高了電力營銷的信息化水平,也提高了自身的營銷服務(wù)水平。而通過本文的設(shè)計,可對業(yè)擴(kuò)、工單投訴、用電量預(yù)測等進(jìn)行全方位的智能化分析,從而提高了電力企業(yè)的決策水平,為今后電力供給改革提供了指導(dǎo)方向。
參考文獻(xiàn)
[1]
黃禹忠. 基于文本分類技術(shù)的客戶投訴智能分析系統(tǒng)的設(shè)計與實現(xiàn)[D].長沙:湖南大學(xué),2013.
[2] 李曦,張玉梅,陳永忠. 淺談webgis端數(shù)據(jù)質(zhì)量看板在電網(wǎng)工作中的運(yùn)用[J]. 中國戰(zhàn)略新興產(chǎn)業(yè),2018(4):71-72.
[3] 田華. 大數(shù)據(jù)與可視化在電力設(shè)備管理中的創(chuàng)新應(yīng)用[J]. 電力大數(shù)據(jù),2018,21(9):32-35.
[4] 吳剛勇,張千斌,吳恒超,等. 基于自然語言處理技術(shù)的電力客戶投訴工單文本挖掘分析[J]. 電力大數(shù)據(jù),2018,21(10):68-73.
[5] 王志堅. 基于大數(shù)據(jù)平臺的電力營銷信息化建設(shè)分析[J]. 內(nèi)蒙古電力技術(shù),2016,34(4):17-22.
[6] 李愷,陳曉,段軍麗,等. 基于看板管理的量化目標(biāo)管理提升企業(yè)經(jīng)營效益模式研究[J]. 中國管理信息化,2016,19(18):106-107.
[7] 李剛,劉燕,宋雨,等. 基于信息融合的電力大數(shù)據(jù)可視化預(yù)處理方法[J]. 廣東電力,2016,29(12):10-14.
[8] 李莉,朱永利,宋亞奇. 電力設(shè)備監(jiān)測數(shù)據(jù)的流式計算與動態(tài)可視化展示[J]. 電力建設(shè),2017,38(5):91-97.
[9] 劉曉娟,龔毅豪. 基于分段模糊擬合方法的用電量預(yù)測研究[J]. 上海電力學(xué)院學(xué)報,2017,33(2):206-209.
[10] 王一哲,郭泉輝,劉有飛,等. 95598投訴工單數(shù)據(jù)的分析與建議[J]. 江西電力,2017,41(10):2-4.
[11] 曾子民,吳訓(xùn). 基于大數(shù)據(jù)背景的電力營銷管理研究[J]. 信息記錄材料,2017,18(11):195-196.
[12] 何偉強(qiáng). 基于小波分析的我國居民生活能源消費(fèi)預(yù)測[J]. 科技廣場,2015(2):34-39.
[13] 張帆,劉杰鋒,李冰,等. 基于改進(jìn)Logistic模型階段劃分理論的飽和負(fù)荷預(yù)測[J]. 電力建設(shè),2015,36(10):105-110.
(收稿日期: 2019.11.15)
作者簡介:
王峰(1968-),男,碩士,高級工程師,研究方向:電力營銷。
馮桂玲(1969-),女,碩士,高級工程師,研究方向:電力營銷。
上官霞(1977-),男,本科,高級工程師,研究方向:電力信息技術(shù)。
吳駿(1978-),男,碩士,高級工程師,研究方向:電力營銷。
蔡榮彥(1984-),碩士,高級工程師,研究方向:信息安全。