詹曉航
(中國移動通信集團(tuán)廣東有限公司廣州分公司 廣東省廣州市 510110)
移動互聯(lián)網(wǎng)時代,無線數(shù)據(jù)通信技術(shù)雖然發(fā)展迅速,但通信運營商成本壓力卻不斷增加,運營商陷入“增量不增收”的困局。為解決困境,運營商都把注意力聚焦到了成本消耗最大的網(wǎng)絡(luò)運維上,要求通信技術(shù)(CT)團(tuán)隊向ICT 轉(zhuǎn)型(即IT+CT)。然而,現(xiàn)有存量CT 人員規(guī)模龐大,軟件工程能力薄弱,ICT 轉(zhuǎn)型舉步維艱。在重重壓力下,運維團(tuán)隊需研究如何以低成本構(gòu)建一套統(tǒng)一的專家系統(tǒng)平臺,打通核心網(wǎng)、傳輸網(wǎng)、無線網(wǎng)、數(shù)據(jù)網(wǎng)、網(wǎng)管網(wǎng)、城域網(wǎng)等各專業(yè)網(wǎng)絡(luò),并能讓CT 人員自行開發(fā)專家系統(tǒng)的知識庫和上層應(yīng)用、編排各種自動化任務(wù),減少現(xiàn)有繁多的煙囪式運維專家系統(tǒng)和數(shù)據(jù)孤島的困境,實現(xiàn)降本增效。
為降低CT 團(tuán)隊ICT 轉(zhuǎn)型的門檻,本課題研究了一套網(wǎng)絡(luò)運維知識工程體系建設(shè)方法,解決CT 人員開發(fā)專家系統(tǒng)知識庫和相關(guān)應(yīng)用層功能的困難,實現(xiàn)運營商CT 團(tuán)隊快速ICT 轉(zhuǎn)型目標(biāo)。
知識工程(Knowledge Engineering)研究的是如何用機器代表人類,實現(xiàn)知識的表示、獲取、推理、決策、包括機器定理證明,通過智能軟件而建立的專家系統(tǒng)。同時,還需要研究如何實現(xiàn)知識工程的知識工作自動化,以及如何運用知識,進(jìn)行問題的自動求解等。知識工程的研究使人工智能的研究從理論轉(zhuǎn)向應(yīng)用,從基于推理的模型轉(zhuǎn)向基于知識應(yīng)用的模型??梢姡R工程的研究其中一個重要目標(biāo)就是為了順利實現(xiàn)知識自動化。
知識自動化(Knowledge Automation) 是一種可執(zhí)行知識工作任務(wù)的智能軟件系統(tǒng)。知識自動化實現(xiàn)了人和機器的重新分工,有助于把知識技術(shù)人員從重復(fù)性勞動中解放出來,知識自動化將工程知識體系轉(zhuǎn)換為“工程智能”。
圖1:MME 設(shè)備故障定位知識表示過程
圖2:網(wǎng)絡(luò)運維知識工程體系架構(gòu)設(shè)計
CT 團(tuán)隊雖然有豐富的運維經(jīng)驗,但缺乏軟件工程能力。CT 團(tuán)隊建設(shè)專家系統(tǒng)時,必須依賴IT 團(tuán)隊開發(fā),這種方式導(dǎo)致成本、開發(fā)排期、需求變更、系統(tǒng)測試和上線都要受IT 團(tuán)隊制約。為扭轉(zhuǎn)困局,本課題為CT 團(tuán)隊提供了專家系統(tǒng)知識庫的可視化編程(無代碼開發(fā))能力,結(jié)合CT 團(tuán)隊自身優(yōu)勢,揚長避短,即可主導(dǎo)專家系統(tǒng)知識庫和任務(wù)編排的開發(fā)、知識工程體系設(shè)計、建設(shè)和測試工作等,無需IT 團(tuán)隊重度參與。
本課題研究的網(wǎng)絡(luò)運維知識工程是以網(wǎng)絡(luò)運維知識和專家經(jīng)驗為處理對象,借用工程化的思想,利用人工智能的原理和方法,設(shè)計、構(gòu)造和維護(hù)網(wǎng)絡(luò)運維知識體系。運維知識工程的重要過程包括網(wǎng)絡(luò)運維的知識獲取、知識表示與知識利用三大過程。為順利開展網(wǎng)絡(luò)運維知識自動化工作,在知識工程體系架構(gòu)建設(shè)的同時也要建立好網(wǎng)絡(luò)運維知識工程標(biāo)準(zhǔn)化工作。
運維知識獲取包括從文檔、設(shè)備運行日志、傳感器或消息信令獲取知識和信息,通常有三種方式:
(1)非自動知識獲取指知識由運維工程師通過閱讀有關(guān)文獻(xiàn)或與領(lǐng)域?qū)<医涣?,將原始知識進(jìn)行分析、歸納、整理,形成用自然語言表述的知識條目輸入系統(tǒng)數(shù)據(jù)庫。
(2)知識抽取是指系統(tǒng)能對專家的專業(yè)知識和經(jīng)驗(如故障處理經(jīng)驗)進(jìn)行識別、理解、篩選、格式化,可以把需要分析和處理的文件或事件中每個知識點或信息點抽取出來,并輸入到知識庫中。
(3)機器學(xué)習(xí)知識通過機器各種傳感器直接感知外部的信息(如網(wǎng)絡(luò)設(shè)備間傳送的信令信息等等),或者根據(jù)系統(tǒng)運行經(jīng)驗從已有的知識或?qū)嵗醒堇[、歸納出新知識,補充到知識庫中。例如,通過學(xué)習(xí)網(wǎng)絡(luò)中的大量信令信息,歸納出用戶畫像模型和用戶群體特征,并用此模型進(jìn)行精準(zhǔn)目標(biāo)搜索等。
知識表示是對知識庫的知識進(jìn)行知識編碼的活動,讓知識能方便被共享和調(diào)用。運維知識工程體系的架構(gòu)設(shè)計需重點研究如何進(jìn)行知識編碼。為提升知識編碼的效率,降低編碼難度,可采用可視化編程的形式??砂选傲鞒桃?規(guī)則引擎+解析引擎+可視化建模引擎”組合成“推理引擎”,方便運維專家進(jìn)行知識編碼。
例如圖1 中所展示的案例,運維人員日常維護(hù)時經(jīng)常發(fā)現(xiàn)設(shè)備性能下降影響業(yè)務(wù)時往往無告警產(chǎn)生,為解決問題,可在專家系統(tǒng)平臺上以可視化編程的方式開發(fā)“板卡故障診斷”的自動化檢查流程。由系統(tǒng)將檢查流程相關(guān)知識(如性能指標(biāo)、指令、日志結(jié)果)編譯成計算機語言,形成一組可執(zhí)行的軟件程序存入知識庫,即完成一次故障定位經(jīng)驗流程的知識編碼工作:
(1)監(jiān)控MME 設(shè)備性能指標(biāo),出現(xiàn)異常觸發(fā)流程;
(2)檢查MME 的關(guān)鍵指標(biāo),確認(rèn)業(yè)務(wù)是否受影響;
(3)向指定MME 發(fā)送指令檢查板卡異常情況;
(4)反饋板卡檢查ping 指令結(jié)果的異常情況,如有異常即生成告警。
對于該設(shè)備,如果其他運維專家具備另外一種硬件的故障定位方法,也可以按類似的方法編譯到知識庫中。以此類推,每個專家都可以把本專業(yè)涉及的故障定位知識編譯到知識庫中。這樣,機器就可以學(xué)習(xí)到大量人類專家的故障定位經(jīng)驗和知識,讓人類專家從繁重的工作中釋放出來。
知識利用包括知識搜索以及知識推理。例如,網(wǎng)絡(luò)運維專家可在系統(tǒng)平臺上根據(jù)自己專業(yè)領(lǐng)域發(fā)現(xiàn)的問題去搜索同行或者不同專業(yè)的專家的類似經(jīng)驗知識,找到可參考的經(jīng)驗知識后進(jìn)行應(yīng)用評估、推理和場景適配,快速形成本專業(yè)的解決方案。
為順利實現(xiàn)運維知識自動化,還需對運維知識工程的過程進(jìn)行標(biāo)準(zhǔn)化,總結(jié)歸納各專業(yè)網(wǎng)絡(luò)運維工作場景和內(nèi)容,對重要功能模塊進(jìn)行標(biāo)準(zhǔn)化設(shè)計。這樣,專家在部署自動化流程時,就能輕松調(diào)用各種組件靈活拼裝,并配置規(guī)則:
(1)運維信息表示的標(biāo)準(zhǔn)化:如設(shè)備信息、資源信息、組織架構(gòu)信息、性能指標(biāo)數(shù)據(jù)、系統(tǒng)接口信息等;
(2)流程引擎組件的標(biāo)準(zhǔn)化:如流程中元知識種類的組件定義、組件的名稱、功能范圍等,目前應(yīng)用較多的組件有:數(shù)據(jù)庫節(jié)點、邏輯節(jié)點、腳本節(jié)點、爬蟲節(jié)點、IA 算法節(jié)點等;
(3)日志或指令解析組件的標(biāo)準(zhǔn)化:如日志或指令解析文件中元知識對應(yīng)的組件、各組件名稱、功能范圍等;
(4)知識符號邏輯表示的標(biāo)準(zhǔn)化:使知識具備顯式語義表達(dá)能力和傳播能力;
(5)信息輸入、輸出和呈現(xiàn)標(biāo)準(zhǔn)化:包括信息輸入輸出的粒度、并發(fā)要求、呈現(xiàn)方式等等。
圖3:廣州移動智能維護(hù)機器人
運維知識工程體系可根據(jù)知識工程的三個重要過程(知識獲取、知識表示與知識利用)設(shè)計架構(gòu)進(jìn)行建設(shè)(如圖2)。
知識工程過程中,知識獲取被許多研究者和實踐者作為一個瓶頸,限制了專家系統(tǒng)、人工智能系統(tǒng)的發(fā)展。因此,在架構(gòu)設(shè)計時需考慮系統(tǒng)如何能提供各種接口自動采集數(shù)據(jù)、信息的能力,并形成元知識存儲到系統(tǒng)數(shù)據(jù)庫中供上層的“知識表示層”編譯和調(diào)用。
本課題以通信運維專家主導(dǎo)開發(fā)的知識自動化統(tǒng)一開發(fā)平臺作為“知識表示層”,需具備知識庫、以及與“推理引擎”相關(guān)的模塊或引擎?!巴评硪妗笨捎伞傲鞒桃妗?、“規(guī)則引擎”和“解析引擎”組成,為提供無代碼開發(fā)環(huán)境給通信專家使用,還需要考慮增加“可視化建模引擎”。如知識量、數(shù)據(jù)量、運算量龐大,還要考慮增加“大數(shù)據(jù)處理引擎”、“AI 處理引擎”等等。
網(wǎng)絡(luò)通信的知識自動化開展可以通過把各專業(yè)運維技術(shù)體系模型化,形成網(wǎng)絡(luò)運維知識工程體系架構(gòu),然后將模型移植到網(wǎng)絡(luò)運維專家系統(tǒng)的設(shè)計與制造平臺上,通過平臺調(diào)動各專業(yè)人員部署各種場景智能軟件的開發(fā)和迭代升級,如:設(shè)備健康智能巡檢、故障定位、配置檢查、安全審計、高危操作預(yù)警、資源智能調(diào)度等。從而由機器完成原先需要人去完成的大部分工作,讓人類有更多時間進(jìn)行創(chuàng)造性、決策性工作。
本課題的研究成果在廣州移動網(wǎng)絡(luò)智能維護(hù)機器人Dr.Who 開發(fā)平臺上經(jīng)過長達(dá)4年現(xiàn)網(wǎng)運行驗證(如圖3),廣州核心網(wǎng)人員僅用2年便順利實現(xiàn)了ICT 轉(zhuǎn)型,具備代碼編寫能力員工占比20%,可視化編程能力占比100%,并擴(kuò)展到在傳輸網(wǎng)、無線網(wǎng)、承載網(wǎng)、網(wǎng)管網(wǎng)等專業(yè),提供了支撐多專業(yè)的智能運維解決方案。希望本文能為行業(yè)相關(guān)人員對知識工程的理解和落地提供參考,共同推動知識工程技術(shù)發(fā)展。