盛 妍 ,朱 青 ,張明杰 ,宋 燦 ,陳 澤
(1.國家電網公司客戶服務中心,天津 300000;2.江蘇瑞中數據股份有限公司,江蘇 南京 210000)
數據表達一種事實,標簽表達一種結論和評判,是對數據高度提煉和歸納得到的特征標識,將信息系統(tǒng)數據及其分析結果自動翻譯并轉化為定性的、日常生產語境中大的語言文本,實現了普通業(yè)務人員無障礙理解和使用大數據分析結果[1]。正是由于這種特性,標簽可支撐業(yè)務快速做出決策,在大數據時代發(fā)揮越來越重要的作用。伴隨著業(yè)務數字化的發(fā)展,標簽也從手工時代發(fā)展到數倉時代。但日益龐大的業(yè)務所帶來的數據量使得傳統(tǒng)標簽建設變得愈發(fā)龐雜冗余,標簽也急需向智能化、統(tǒng)一化的方向發(fā)展。近年來,數據中臺[2-4]理念的誕生,也為標簽的進一步發(fā)展提供了方向。
標簽發(fā)展目前已經歷了兩個階段,分別是手工時代和數倉時代。
手工時代的標簽基本通過業(yè)務人員在業(yè)務過程中手動生成,服務于單一應用,并通過傳統(tǒng)數據庫進行存儲,整體生成過程為數據建?!謩哟驑撕灐鏅n。
數倉時代的標簽脫胎于對手工標簽的業(yè)務提取,通過對業(yè)務指標的統(tǒng)計,從而生成相應的標簽。標簽的存儲計算依賴于數據倉庫,整體生成過程為數據匯聚—數倉建?!?guī)則統(tǒng)計—存檔。
標簽的下步發(fā)展可稱之為智能標簽時代。相較于傳統(tǒng)標簽構建方式,智能標簽具備以下特點:
(1)低門檻:把數據轉化為體系化的業(yè)務標簽,降低服務人員使用大數據的門檻。
(2)易共享:把標簽變成業(yè)務可理解的數據服務,使數據更易共享和使用。
(3)工廠式生產:實現標簽生產的工廠化,降低標簽生產難度,提升標簽生產效率。
(4)閉環(huán)式生態(tài):基于上層應用標簽應用成效對標簽規(guī)則進行評估并開展迭代優(yōu)化工作,形成標簽運營生態(tài)閉環(huán)。
(5)統(tǒng)一平臺管理:無論是自動標簽還是手動標簽,實時標簽還是離線標簽,臨時標簽還是穩(wěn)態(tài)標簽,都統(tǒng)一套標簽系統(tǒng)統(tǒng)一進行管理并對外統(tǒng)一提供服務,以保障標簽對外業(yè)務口徑的統(tǒng)一。
現階段標簽構建方式是針對某一業(yè)務數據,根據業(yè)務規(guī)則進行提煉,并最終對某標簽主體給出結論化的定義,形成標簽主體與標簽名一一對應的結果集,從而支撐相應業(yè)務場景的應用。但傳統(tǒng)的標簽構建方式在實際生產應用中會出現以下的不足:
(1)標簽體系紊亂
構建基于數據挖掘理論的客戶標簽體系的首要步驟是設計提煉客戶標簽,包括客戶標簽維度選擇、指標細化等[5]。標簽多以業(yè)務需求直接驅動,具有明確的目的性,因標簽應用方向的不同會產生多套標簽,但因其相互獨立且各自存在體系,各業(yè)務方自行定義標簽,導致同一名稱的標簽會有不同含義,或同一含義的標簽有不同名稱,運用混亂。
(2)存儲計算開銷較大
多套標簽存在各自獨立的計算邏輯,且其更新頻率各不相同,為保障各自業(yè)務的不中斷,需獨立進行更新計算,但多套標簽中可能存在大量的重復計算工作,且都各自保留標簽計算結果,從而造成了大量的存儲、計算資源的開銷。
(3)統(tǒng)一管理難、應用難
因多套標簽的應用方式、標簽源數據、標簽體系等都相對獨立,因此對其進行統(tǒng)一的管理和應用,從而造成多套標簽體系共存,無法統(tǒng)一管理應用的問題。
(1)什么是數據中臺
數據中臺是聚焦“業(yè)務數據化”,踐行“數據業(yè)務化”,集數據的規(guī)劃、獲取、治理、分析、應用和價值變現為一體的數據服務體系。數據中臺核心目標是實現數據資產價值的最大化。數據中臺與數據倉庫、數據中心在核心定位、服務形式、數據匯聚、數據管理方面均存在差異。數據中臺距離業(yè)務更近,更重場景應用、更快速響應需求。數據中臺可以構建在數據中心之上,數據中心側重于數據之“聚”,數據中臺側重于之后的“用”。
數據中臺定位于為各專業(yè)、各單位提供數據共享和分析應用服務,根據數據共享和分析應用的需求,沉淀共性數據服務能力,通過數據服務滿足橫向跨專業(yè)間、縱向不同層級間的數據共享、分析挖掘和融通需求。
(2)數據中臺為標簽帶來了什么
①海量的數據資源:在單一數據源的標簽構建中,無法全方位地刻畫客戶特征,僅能從某一個層面或方向描述某一角度下的本體特征,因而構建過程中想要全方位地刻畫本體特征,則需滿足本體所需全部建模元語,進而能夠全方位描述及刻畫本體特征。相比于單一數據源系統(tǒng)及數據倉庫系統(tǒng),數據中臺包含企業(yè)內部各業(yè)務系統(tǒng)的業(yè)務數據,不同業(yè)務系統(tǒng)按業(yè)務域劃分存儲,同時也可接入外部數據,豐富數據體系,為標簽的多樣化建設提供數據支撐。
②統(tǒng)一的數據管理:數據中臺具備數據運營管理能力,能對各業(yè)務系統(tǒng)數據進行統(tǒng)一管理,實現對各類數據的企業(yè)級建模,解決各類數據間的業(yè)務口徑不一的問題,為企業(yè)級標簽體系的構建提供基礎。
③強大的計算調度能力:標簽構建中依賴平臺的支撐、特殊組件調用、海量數據的處理、算法的訓練、模型的運行等,單一數據計算環(huán)境無法提供上述資源,需依賴更為全面、高性能的基礎平臺。數據中臺計算架構基于大數據技術[6]構建,引入內存計算、批計算[7]、流式計算等技術,為標簽的實時及離線計算提供技術保障。
相較于傳統(tǒng)標簽的構建方法,智能標簽主要從標簽體系、數據支撐、標簽計算、標簽平臺和標簽應用五方面開展設計研究。
為保障企業(yè)多業(yè)務系統(tǒng)標簽不存在語義歧義及業(yè)務口徑不一的問題,需開展企業(yè)級標簽體系的設計工作。
以國網用電業(yè)務為例,客戶標簽從基礎屬性、客戶行為和客戶評估三方面對電力全業(yè)務特征進行歸類與提煉,形成一級主題;同時對一級主題分別進行細分,并根據電力業(yè)務特征將客戶行為從業(yè)務場景視角出發(fā),劃分為傳統(tǒng)業(yè)務(用電服務、客戶服務、繳費服務、市場開拓等)和新興業(yè)務(電動汽車、市場化售電、能源電商、能源金融、綜合能源服務、分布式電源、數據商業(yè)化、互聯網業(yè)務等),以業(yè)務視角形成二級主題,便于各業(yè)務線開展標簽管理與應用,有助于將客戶標簽與業(yè)務場景進行有效對應,開展客戶畫像與原有業(yè)務流程嵌入,開展特定業(yè)務客群劃分,增加標簽實用性,最終形成如圖1 所示的電力客戶智能標簽體系。
圖1 電力客戶智能標簽體系
中臺作為未來企業(yè)數據的主要載體,需對數據進行分層規(guī)劃,以實現存儲和計算資源的合理利用,為企業(yè)業(yè)務提供統(tǒng)一數據出口。參考阿里中臺數據分層[8-10],設計如圖2 所示的數據體系。
圖2 中臺數據體系
貼源層:參考ODS 層(Operational Data Store)及STG(Stage)層設計,貼源層定位為中臺核心數據基礎層,負責從各業(yè)務系統(tǒng)接入操作型數據(結構與源系統(tǒng)保持一致的全量數據),并對數據進行全量或增量的合并及數據清洗和標準化工作。該層基于數據主題開展標簽源數據的接入,為智能標簽的構建提供數據基礎。
共享層-明細區(qū):參考DWD 層(Data Warehouse Detail)設計,共享層明細區(qū)面向數據進行數據域分類、整合、清洗,并根據企業(yè)級數據建模標準(SG-SIM4.5),構建一套標準化數據模型。
共享層-匯總區(qū):參考DWS 層(Data Warehouse Subject)設計,共享層匯總區(qū)按分析對象的實體進行數據整合、輕度匯總。該層在對明細區(qū)的數據進行簡單的業(yè)務匯總后,支撐事實標簽、規(guī)則標簽的建設。
分析層:參考ADM 層(Application Data Market)設計,完全貼合前端應用。分析層由共享層數據參照業(yè)務需求,經過模型計算、算法分析生成對業(yè)務的重度匯總數據,支撐模型標簽的構建。
在標簽構建過程中,通過對基礎數據和業(yè)務指標的梳理分析,可定義生成標簽業(yè)務算子。標簽業(yè)務算子即為基于業(yè)務規(guī)則構建的單個標簽的計算過程或任務,是標簽生成的主要執(zhí)行者,也是構建智能標簽與傳統(tǒng)標簽的主要差異點。針對于復雜業(yè)務的標簽組合需求,可通過對標簽算子的編排組裝,生成完整的業(yè)務模型,交由中臺計算,實現標簽快速運算。
針對已完成構建的標簽業(yè)務算子和業(yè)務模型可發(fā)布成API 或周期性任務運行,實現標簽運算的自動化。智能標簽算子整體流程如圖3 所示。
圖3 智能標簽算子設計流程
基于數據中臺的數據資源及計算資源,需設計智能標簽系統(tǒng),構建智能標簽并進行統(tǒng)一管理。智能標簽平臺的設計主要包含以下功能:
(1)基礎源數據的讀取。通過讀取數據中臺共享層的明細數據及匯總數據,為標簽業(yè)務算子的構建提供數據源支撐。
(2)標簽屬性生成。根據標簽體系規(guī)范,結合業(yè)務邏輯,基于源數據構建標簽算子。針對基礎屬性,可直接生成自然類標簽;針對復雜屬性,可通過關聯計算、統(tǒng)計計算、挖掘計算等方式,結合業(yè)務規(guī)則,生成規(guī)則類標簽、統(tǒng)計類標簽、挖掘類標簽;針對一些特殊的臨時屬性,可定義臨時標簽,支持手動輸入,以支撐一些時效性業(yè)務場景。
(3)標簽業(yè)務算子的發(fā)布調度。構建完成的標簽算子及模型可通過定時任務或條件觸發(fā)等方式實現智能化調度,以保證標簽數據的實時性和可用性。
(4)標簽數據管理查詢。智能標簽平臺存儲著構建完成的應用標簽數據,可通過管理平臺進行管理和快速的定位查詢,也可通過API 的方式發(fā)布符合標簽要求的明細數據供其他業(yè)務系統(tǒng)使用。
(5)標簽組合及智能關聯分析?;谕瓿山ㄔO的標簽,構建標簽組合功能,使得業(yè)務人員能夠根據具體需求自由組合標簽,以滿足實際業(yè)務場景的建設。同時,提供標簽關聯分析功能,對標簽的數據價值進行二次挖掘,發(fā)掘標簽群體間的關聯關系,從而實現標簽的應用深化。
(6)標簽應用評估?;谝寻l(fā)布的標簽及其應用成效進行評估,設置評估指標,并對評估指標不理想的標簽進行下架或規(guī)則優(yōu)化,實現標簽的智能運營迭代。
在完成智能標簽的構建后,需開展基于業(yè)務的應用場景的設計,以發(fā)揮標簽的價值。以基于客戶構建的智能標簽為例,通過對客戶信息和相關行為數據的標簽化處理和探索,按照業(yè)務需求圈定群體范圍,實現對復雜群體數據的智能化統(tǒng)計、篩選、加工、沉淀,建立單實體360°全方位個性化檔案,通過關系圖譜展示、可視化線索分析、相似人員智能化推薦等來實現業(yè)務人員對于目標群體的精準定位,可開展如下業(yè)務應用場景:
(1)精準營銷:傳統(tǒng)的營銷方式不能精準針對客戶的需求進行營銷,盲目的營銷不僅會引起客戶的反感,而且極容易引發(fā)客戶投訴?;凇坝脩舢嬒瘛钡木珳释扑]方法可以幫助企業(yè)主動向用戶推薦感興趣或需要的商品,刺激需求,減少搜集信息成本,縮小比較范圍,提高決策效率,提高成交率[11]。通過對客戶行為標簽和客戶類型標簽的分析,構建客戶畫像,精準圈定潛在價值客戶群體,從而便捷高效地開展產品精準營銷工作。
(2)差異化服務:客戶在接收服務的過程中對服務的感知度高低是決定企業(yè)的差異化服務是否有效的關鍵。企業(yè)針對不同的客戶提供不同程度的優(yōu)質服務,客戶的感知度越高,客戶滿意度越高[12]。通過對客戶自然標簽和行為標簽的分析,結合客戶近期訴求情況,設定客戶服務臨時標簽,找出潛在投訴、舉報等較高風險的服務人群,針對性地提供精準服務,以降低客戶投訴舉報概率,提升客服服務滿意度。
(3)新業(yè)務拓展:通過對客戶理財、電商消費、業(yè)務偏好等行為標簽的綜合分析,評估客戶消費能力,劃分特征客戶群體,拓展?jié)撛诳蛻?。針對特征客戶群體,推廣金融、保險等相關新型業(yè)務。
(4)數據變現:可根據外部企業(yè)需求對客戶標簽進行組合關聯,形成對外部單位有價值的標簽數據,拓展面向互聯網電商、金融企業(yè)等的toB 和面向政府、征信單位等的toG 的數據變現業(yè)務。
(1)智能標簽是業(yè)務數據化的典型實例
業(yè)務數據化指業(yè)務相關信息以數字方式存儲并實現可用,即為業(yè)務生成數據。單純的業(yè)務數據存儲并無法滿足數據的可用需求,需通過數據的清洗、轉化、統(tǒng)一建模及匯總分析才可滿足業(yè)務需求,支撐業(yè)務運營工作。智能標簽即為業(yè)務數據化的典型實例,通過對基礎業(yè)務數據的統(tǒng)一化建模,并根據業(yè)務指標進行匯總計算分析,生成智能標簽對主體實現定性分群,支撐相關業(yè)務場景的建設,使得數據充分發(fā)揮業(yè)務價值,實現基礎業(yè)務信息到可存儲、可使用、可分析的數據化轉變。
(2)智能標簽[13]是數據業(yè)務化的重要支柱
數據業(yè)務化為業(yè)務數據化的延申,指的是通過對基礎數據的洞察分析實現對業(yè)務的進階探索,即為數據驅動業(yè)務。智能標簽源于基礎業(yè)務信息的數據化,基于業(yè)務規(guī)則對標簽主體進行定性,實現簡單的群體分類功能,但隨著基于該主體的標簽體系的不斷豐富,使得標簽不再只單純承載基本的群體分類功能。通過對標簽的組合及關聯分析等操作,可實現對業(yè)務的深度探索,并根據這些標簽衍生出更多的業(yè)務方向,實現數據對業(yè)務的反哺。
(3)智能標簽是數字孿生化[14]的理想載體
數字孿生簡單來說就是在一個設備或系統(tǒng)的基礎上,創(chuàng)造一個數字版的“克隆體”。以智能標簽為例,可通過標簽將客戶群體進行數字化[15]解析,生成相應的數字孿生體,通過對該客戶群體進行模擬運營及成效評估,得出高效且合理的運營方案,從而改進實際業(yè)務策略。同時根據實際業(yè)務運營的成效,對客戶群體的模擬運營進行干預和調優(yōu)。通過這種模擬運營指導實際執(zhí)行、實際成效優(yōu)化模擬運營方案的方式,可極大降低風險,提升整體運營服務質量。
本文主要論述了在數據中臺理念下的智能標簽建設和應用方向,提出了一套較為完善的智能標簽構建方法,為高效構建智能標簽及應用提供了方向。在數字化轉型的大趨勢下,下一步應深入探究標簽與具體業(yè)務融合,在具體業(yè)務場景下提高標簽落地應用效果。