王建民 清華大學(xué)軟件學(xué)院副院長(zhǎng),教授,博士生導(dǎo)師
?
網(wǎng)絡(luò)技術(shù)——工業(yè)互聯(lián)網(wǎng)專題
工業(yè)大數(shù)據(jù)技術(shù)
王建民清華大學(xué)軟件學(xué)院副院長(zhǎng),教授,博士生導(dǎo)師
工業(yè)大數(shù)據(jù)是指工業(yè)領(lǐng)域相關(guān)的海量數(shù)據(jù),包括信息化數(shù)據(jù)、物聯(lián)網(wǎng)數(shù)據(jù)以及跨界數(shù)據(jù),已成為新工業(yè)革命的核心動(dòng)力。本文分析了工業(yè)大數(shù)據(jù)的主體來(lái)源,闡述了工業(yè)大數(shù)據(jù)“多模態(tài)、強(qiáng)關(guān)聯(lián)、高通量”的數(shù)據(jù)特點(diǎn)和“物理信息、產(chǎn)業(yè)鏈、跨界”三層次融合的應(yīng)用特點(diǎn),歸納了工業(yè)大數(shù)據(jù)管理與分析技術(shù)的關(guān)鍵問(wèn)題,給出了我國(guó)工業(yè)大數(shù)據(jù)典型應(yīng)用案例,最后對(duì)自主發(fā)展的工業(yè)大數(shù)據(jù)提出了建議。
大數(shù)據(jù);工業(yè)大數(shù)據(jù);數(shù)據(jù)特點(diǎn);應(yīng)用特點(diǎn);關(guān)鍵技術(shù);應(yīng)用案例
金融危機(jī)以來(lái),為了尋找經(jīng)濟(jì)增長(zhǎng)的新出路,特別是在云計(jì)算、大數(shù)據(jù)和物聯(lián)網(wǎng)等新興技術(shù)的推動(dòng)下,全球掀起了以制造業(yè)轉(zhuǎn)型升級(jí)為首要任務(wù)的新一輪工業(yè)變革,其中以德國(guó)工業(yè)4.0和美國(guó)工業(yè)互聯(lián)網(wǎng)為典型代表。方興未艾的新工業(yè)革命以數(shù)字化為基礎(chǔ)、網(wǎng)絡(luò)化為核心、智能化為目標(biāo),將新一代信息技術(shù)與現(xiàn)代制造業(yè)、生產(chǎn)性服務(wù)業(yè)等深度融合,以推動(dòng)產(chǎn)業(yè)轉(zhuǎn)型升級(jí)。根據(jù)麥肯錫全球研究院發(fā)布的研究報(bào)告表明,美國(guó)制造領(lǐng)域擁有的數(shù)據(jù)規(guī)模為各領(lǐng)域之首,大數(shù)據(jù)作為工業(yè)從自動(dòng)化到智能化跨越發(fā)展的核心動(dòng)力,其重要性不言而喻。
隨著大數(shù)據(jù)技術(shù)與開(kāi)源社區(qū)的不斷成熟,大數(shù)據(jù)軟件生態(tài)系統(tǒng)繁榮發(fā)展,商業(yè)配套工具日益豐富。IBM、EMC、華為等企業(yè)都在開(kāi)源大數(shù)據(jù)軟件之上封裝了各自的商業(yè)版數(shù)據(jù)管理產(chǎn)品。這些技術(shù)的成熟為數(shù)據(jù)技術(shù)向工業(yè)界滲透提供了必要的條件,同時(shí)也為高端制造企業(yè)提供了巨大的市場(chǎng)機(jī)會(huì)。近年來(lái),國(guó)際知名工業(yè)企業(yè)、軟件公司和科研機(jī)構(gòu)紛紛研發(fā)面向制造業(yè)轉(zhuǎn)型升級(jí)的大數(shù)據(jù)產(chǎn)品和系統(tǒng)。
美國(guó)通用電氣(GE)公司聯(lián)合Pivotal向全球開(kāi)放工業(yè)互聯(lián)網(wǎng)云平臺(tái)Predix,將各種工業(yè)資產(chǎn)設(shè)備接入云端提供資產(chǎn)性能管理(APM)和運(yùn)營(yíng)優(yōu)化服務(wù);美國(guó)PTC公司收購(gòu)了物聯(lián)網(wǎng)云平臺(tái)公司Axeda,打造智能互聯(lián)產(chǎn)品Thing Worx;丹麥維斯塔斯(Vestas)公司聯(lián)合IBM基于BigInsights大數(shù)據(jù)平臺(tái)分析氣象、傳感器、衛(wèi)星、地圖數(shù)據(jù)支持風(fēng)場(chǎng)選址、運(yùn)行評(píng)估等工作;德國(guó)西門(mén)子公司面向工業(yè)大數(shù)據(jù)應(yīng)用,整合遠(yuǎn)程維護(hù)、數(shù)據(jù)分析及網(wǎng)絡(luò)安全等一系列現(xiàn)有技術(shù)和新技術(shù),推出Sinalytics數(shù)字化服務(wù)平臺(tái),作為其實(shí)現(xiàn)工業(yè)4.0的重要抓手;德國(guó)SAP公司開(kāi)發(fā)了面向物聯(lián)網(wǎng)應(yīng)用和實(shí)時(shí)數(shù)據(jù)處理的HANA大數(shù)據(jù)平臺(tái),并利用其在傳統(tǒng)企業(yè)信息化ERP系統(tǒng)上的優(yōu)勢(shì),推動(dòng)HANA與信息化系統(tǒng)的集成;美國(guó)航空航天局(NASA)對(duì)外開(kāi)放自身數(shù)據(jù),幫助進(jìn)行火星生命探測(cè)和天文觀測(cè)等。此外,硅谷新興創(chuàng)業(yè)公司也在積極投入工業(yè)數(shù)據(jù)的技術(shù)和產(chǎn)品研發(fā),典型代表有Uptake Tech公司,為建筑、航空、采礦行業(yè)提供分析與預(yù)測(cè)軟件服務(wù)。
國(guó)內(nèi)工業(yè)大數(shù)據(jù)平臺(tái)建設(shè)方面也有一定進(jìn)展,主要依托國(guó)內(nèi)互聯(lián)網(wǎng)應(yīng)用的基礎(chǔ),面向輕資產(chǎn)設(shè)備數(shù)據(jù)接入搭建通用平臺(tái),例如中國(guó)移動(dòng)物聯(lián)網(wǎng)開(kāi)放平臺(tái)、騰訊QQ物聯(lián)平臺(tái)等;在高端裝備方面仍然是以龍頭企業(yè)自建方式為主,例如陜鼓動(dòng)力的鼓風(fēng)機(jī)遠(yuǎn)程監(jiān)測(cè)平臺(tái)、三一集團(tuán)工程機(jī)械物聯(lián)網(wǎng)平臺(tái)、遠(yuǎn)景格林威治風(fēng)電云平臺(tái)、紅領(lǐng)制衣板型數(shù)據(jù)平臺(tái)、南方航空公司航空大數(shù)據(jù)平臺(tái)等。這些工業(yè)領(lǐng)域的大數(shù)據(jù)平臺(tái)存在技術(shù)架構(gòu)差異大、建設(shè)水平參差不齊、應(yīng)用效果不明顯等瓶頸問(wèn)題。
未來(lái),隨著我國(guó)人口紅利逐步消失,環(huán)境壓力日益加大,工業(yè)數(shù)據(jù)作為戰(zhàn)略核心資產(chǎn)將成為我國(guó)制造業(yè)轉(zhuǎn)型過(guò)程中實(shí)現(xiàn)價(jià)值留存和新價(jià)值創(chuàng)造的關(guān)鍵要素。在此背景下,國(guó)家相繼出臺(tái)《國(guó)務(wù)院關(guān)于加快發(fā)展生產(chǎn)性服務(wù)業(yè)促進(jìn)產(chǎn)業(yè)結(jié)構(gòu)調(diào)整升級(jí)的指導(dǎo)意見(jiàn)》等指導(dǎo)性文件,制定《“互聯(lián)網(wǎng)+”行動(dòng)計(jì)劃》,頒布《中國(guó)制造2025》戰(zhàn)略規(guī)劃,特別是國(guó)務(wù)院《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》與《中國(guó)制造2025重點(diǎn)領(lǐng)域技術(shù)路線圖》都將工業(yè)大數(shù)據(jù)作為重點(diǎn)發(fā)展方向。
工業(yè)大數(shù)據(jù)是指工業(yè)領(lǐng)域所產(chǎn)生的海量數(shù)據(jù),包括信息化數(shù)據(jù)、物聯(lián)網(wǎng)數(shù)據(jù)以及跨界數(shù)據(jù)。
首先,企業(yè)信息系統(tǒng)存儲(chǔ)了高價(jià)值密度的核心業(yè)務(wù)數(shù)據(jù)。20世紀(jì)60年代以來(lái),信息技術(shù)加速應(yīng)用于工業(yè)領(lǐng)域,形成了產(chǎn)品生命周期管理(PLM)、企業(yè)資源規(guī)劃(ERP)、供應(yīng)鏈管理(SCM)和客戶關(guān)系管理(CRM)等企業(yè)信息系統(tǒng)。這些系統(tǒng)中積累的產(chǎn)品研發(fā)數(shù)據(jù)、生產(chǎn)制造數(shù)據(jù)、供應(yīng)鏈數(shù)據(jù)以及客戶服務(wù)數(shù)據(jù),存在于企業(yè)或產(chǎn)業(yè)鏈內(nèi)部,是工業(yè)領(lǐng)域傳統(tǒng)數(shù)據(jù)資產(chǎn)。
以某裝備企業(yè)2013年P(guān)LM系統(tǒng)數(shù)據(jù)為例,其管理零部件總數(shù)達(dá)165.5637萬(wàn)個(gè),每周增長(zhǎng)量為8182個(gè);管理的Word文檔數(shù)量共162.7929萬(wàn)個(gè),每周增長(zhǎng)量為9149個(gè);管理的圖紙共235.9777萬(wàn)張,每周增長(zhǎng)量1.1486萬(wàn)張;數(shù)據(jù)總量為15.8T,日增長(zhǎng)約11GB。
其次,隨著物聯(lián)網(wǎng)技術(shù)的快速發(fā)展,裝備物聯(lián)網(wǎng)成為工業(yè)大數(shù)據(jù)新的、增長(zhǎng)最快的來(lái)源,它實(shí)時(shí)自動(dòng)采集了車(chē)間內(nèi)生產(chǎn)設(shè)備和交付給用戶的產(chǎn)品狀態(tài)與工況數(shù)據(jù)。一方面,機(jī)床等生產(chǎn)設(shè)備物聯(lián)網(wǎng)數(shù)據(jù)為智能工廠生產(chǎn)調(diào)度、質(zhì)量控制和績(jī)效管理提供了實(shí)時(shí)數(shù)據(jù)基礎(chǔ);另一方面,2012年美國(guó)通用電氣公司提出的工業(yè)大數(shù)據(jù)(狹義的),專指裝備使用過(guò)程中由傳感器采集的大規(guī)模時(shí)間序列數(shù)據(jù),包括裝備狀態(tài)參數(shù)、工況負(fù)載和作業(yè)環(huán)境等信息,可以幫助用戶提高裝備運(yùn)行效率,拓展制造維修服務(wù)(Maintenance Repair and Overhaul,MRO)。
以風(fēng)機(jī)裝備為例,IEC61400-25標(biāo)準(zhǔn)由IECTC88技術(shù)委員會(huì)起草制定,是IEC 61850標(biāo)準(zhǔn)在風(fēng)力發(fā)電領(lǐng)域內(nèi)的延伸,專門(mén)面向風(fēng)電廠的監(jiān)控系統(tǒng)通信,旨在實(shí)現(xiàn)風(fēng)電廠中不同供應(yīng)商設(shè)備之間的自由通信,通過(guò)對(duì)風(fēng)電廠信息進(jìn)行抽象化、模型化、標(biāo)準(zhǔn)化,實(shí)現(xiàn)各設(shè)備之間的相互通信,使各設(shè)備之間具有互聯(lián)性、互操作性和可擴(kuò)展性。根據(jù)該標(biāo)準(zhǔn),單臺(tái)風(fēng)機(jī)每秒產(chǎn)生225k字節(jié)傳感器數(shù)據(jù),每臺(tái)風(fēng)機(jī)按每年7000運(yùn)行小時(shí)計(jì)算,單臺(tái)風(fēng)機(jī)每年生成6TB傳感器數(shù)據(jù),金風(fēng)科技目前擁有2萬(wàn)臺(tái)風(fēng)機(jī),6.0TB/臺(tái)/年×2萬(wàn)臺(tái)=120PB/年。
最后,今天的互聯(lián)網(wǎng)與工業(yè)深度融合,企業(yè)外部跨界數(shù)據(jù)已成為工業(yè)大數(shù)據(jù)不可忽視的來(lái)源。21世紀(jì)初,日本企業(yè)就開(kāi)始利用互聯(lián)網(wǎng)數(shù)據(jù)分析獲取用戶的產(chǎn)品評(píng)價(jià),今天小米手機(jī)利用社交媒體數(shù)據(jù)成功實(shí)現(xiàn)產(chǎn)品創(chuàng)新研發(fā);此外,外部企業(yè)還存在著海量的“跨界”數(shù)據(jù),如影響裝備作業(yè)的氣象數(shù)據(jù)、影響產(chǎn)品市場(chǎng)預(yù)測(cè)的宏觀經(jīng)濟(jì)數(shù)據(jù)、影響企業(yè)生產(chǎn)成本的環(huán)境法規(guī)數(shù)據(jù)等。
以風(fēng)電場(chǎng)運(yùn)營(yíng)業(yè)務(wù)為例,來(lái)自氣象部門(mén)的跨界數(shù)據(jù)、模式數(shù)據(jù)與衛(wèi)星數(shù)據(jù),其每天處理數(shù)據(jù)增量為200TB,年70PB;來(lái)自環(huán)保部門(mén)的跨界數(shù)據(jù)、實(shí)時(shí)監(jiān)控?cái)?shù)據(jù)、環(huán)評(píng)數(shù)據(jù)、審批業(yè)務(wù)數(shù)據(jù)年增量為1PB。
工業(yè)大數(shù)據(jù)本身不僅具有廣義大數(shù)據(jù)的3V或4V特點(diǎn),還呈現(xiàn)出“多模態(tài)”、“強(qiáng)關(guān)聯(lián)”和“高通量”3個(gè)特點(diǎn)。
(1)多模態(tài)
所謂多模態(tài),是指非結(jié)構(gòu)化類(lèi)型工程數(shù)據(jù),包括設(shè)計(jì)制造階段的概念設(shè)計(jì)、詳細(xì)設(shè)計(jì)、制造工藝、包裝運(yùn)輸?shù)?5大類(lèi)業(yè)務(wù)數(shù)據(jù),以及服務(wù)保障階段的運(yùn)行狀態(tài)、維修計(jì)劃、服務(wù)評(píng)價(jià)等14大類(lèi)數(shù)據(jù)。例如,在運(yùn)載火箭研制階段,將涉及氣動(dòng)力數(shù)據(jù)、氣動(dòng)力熱數(shù)據(jù)、載荷與力學(xué)環(huán)境數(shù)據(jù)、彈道數(shù)據(jù)、控制數(shù)據(jù)、結(jié)構(gòu)數(shù)據(jù)、總體試驗(yàn)數(shù)據(jù)等。
(2)強(qiáng)關(guān)聯(lián)
所謂強(qiáng)關(guān)聯(lián),一方面是指產(chǎn)品生命周期的設(shè)計(jì)、制造、服務(wù)等不同環(huán)節(jié)的數(shù)據(jù)之間需要進(jìn)行關(guān)聯(lián),即把設(shè)計(jì)制造階段的業(yè)務(wù)數(shù)據(jù)正向傳遞到服務(wù)保障階段,同時(shí)將服務(wù)保障階段的數(shù)據(jù)反饋到設(shè)計(jì)制造階段;另一方面,在產(chǎn)品生命周期的統(tǒng)一階段會(huì)涉及到不同學(xué)科、不同專業(yè)的數(shù)據(jù)。例如,民用飛機(jī)預(yù)研過(guò)程中會(huì)涉及總體設(shè)計(jì)方案數(shù)據(jù),總體需求數(shù)據(jù),氣動(dòng)設(shè)計(jì)及氣動(dòng)力學(xué)分析數(shù)據(jù),聲學(xué)模型數(shù)據(jù)及聲學(xué)分析數(shù)據(jù),飛機(jī)結(jié)構(gòu)設(shè)計(jì)數(shù)據(jù),零部件及組裝體強(qiáng)度分析數(shù)據(jù),多電系統(tǒng)模型數(shù)據(jù),多電系統(tǒng)設(shè)計(jì)仿真數(shù)據(jù),各個(gè)航電系統(tǒng)模型仿真數(shù)據(jù),導(dǎo)航系統(tǒng)模型仿真數(shù)據(jù),系統(tǒng)及零部件健康模型數(shù)據(jù),系統(tǒng)及零部件可靠性分析數(shù)據(jù)等,這些數(shù)據(jù)需要進(jìn)行關(guān)聯(lián)。
(3)高通量
所謂高通量,即工業(yè)傳感器要求瞬時(shí)寫(xiě)入超大規(guī)模數(shù)據(jù)。嵌入傳感器的智能互聯(lián)產(chǎn)品已成為工業(yè)互聯(lián)網(wǎng)時(shí)代的重要標(biāo)志,是未來(lái)工業(yè)發(fā)展的方向,機(jī)器數(shù)據(jù)已成為工業(yè)大數(shù)據(jù)的主體。以風(fēng)機(jī)裝備為例,風(fēng)機(jī)故障狀態(tài)其數(shù)據(jù)采樣頻率為50Hz,每臺(tái)平均125個(gè)測(cè)點(diǎn),金風(fēng)科技公司擁有2萬(wàn)臺(tái)風(fēng)機(jī),其最高瞬時(shí)數(shù)據(jù)寫(xiě)入量超過(guò)1億數(shù)據(jù)點(diǎn)/s。
工業(yè)大數(shù)據(jù)應(yīng)用特點(diǎn)集中體現(xiàn)在物理信息、產(chǎn)業(yè)鏈以及跨界3個(gè)層次的融合,這與其他領(lǐng)域大數(shù)據(jù)應(yīng)用具有明顯差異,因此需要從數(shù)據(jù)模型、語(yǔ)義、查詢操作3個(gè)層面對(duì)工業(yè)大數(shù)據(jù)進(jìn)行一體化管理。
●“物理信息融合”表現(xiàn)在設(shè)計(jì)開(kāi)發(fā)階段主要管理數(shù)字產(chǎn)品,而在制造服務(wù)階段主要管理物理產(chǎn)品,跨生命周期管理需要融合數(shù)字產(chǎn)品和物理產(chǎn)品,從而構(gòu)建工業(yè)信息物理融合系統(tǒng)(Cyber-physical System,CPS)。
●“產(chǎn)業(yè)鏈融合”表現(xiàn)在互聯(lián)網(wǎng)大數(shù)據(jù)環(huán)境下,以資源整合優(yōu)化為目標(biāo)的云制造模式得以迅速發(fā)展,智能產(chǎn)業(yè)鏈需要突破傳統(tǒng)企業(yè)邊界,實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)的業(yè)務(wù)過(guò)程集成。
●“跨界融合”是指在“互聯(lián)網(wǎng)+”環(huán)境下,企業(yè)需要將外部跨界數(shù)據(jù)源進(jìn)行集成,如美國(guó)某農(nóng)機(jī)公司將天氣數(shù)據(jù)、灌溉數(shù)據(jù)、種子數(shù)據(jù)以及農(nóng)機(jī)數(shù)據(jù)進(jìn)行綜合利用,為農(nóng)場(chǎng)提供糧食增產(chǎn)服務(wù)。
擁有大數(shù)據(jù)不是目的,發(fā)掘其價(jià)值才是關(guān)鍵。由企業(yè)信息化數(shù)據(jù)、裝備物聯(lián)網(wǎng)數(shù)據(jù)和外部互聯(lián)網(wǎng)數(shù)據(jù)匯聚而成的工業(yè)大數(shù)據(jù),蘊(yùn)藏著巨大價(jià)值。例如,通過(guò)分析用戶使用數(shù)據(jù)改進(jìn)產(chǎn)品,如波音公司通過(guò)對(duì)737型號(hào)運(yùn)行數(shù)據(jù)分析創(chuàng)新翼尖小翼;通過(guò)分析現(xiàn)場(chǎng)測(cè)量數(shù)據(jù)提高工件加工水平,如高端機(jī)床設(shè)備通過(guò)實(shí)時(shí)測(cè)量數(shù)據(jù)動(dòng)態(tài)優(yōu)化進(jìn)刀參數(shù);工況數(shù)據(jù)進(jìn)行產(chǎn)品健康管理,如羅羅公司通過(guò)對(duì)發(fā)動(dòng)機(jī)工況數(shù)據(jù)支持售賣(mài)飛行小時(shí)新型商業(yè)模式等。
工業(yè)大數(shù)據(jù)技術(shù)可以分為兩個(gè)層次,即大數(shù)據(jù)管理技術(shù)和大數(shù)據(jù)分析技術(shù)。
(1)工業(yè)大數(shù)據(jù)管理技術(shù)的關(guān)鍵問(wèn)題
●數(shù)據(jù)質(zhì)量控制問(wèn)題
原始數(shù)據(jù)(生數(shù)據(jù))質(zhì)量決定分析結(jié)果的質(zhì)量。企業(yè)信息系統(tǒng)數(shù)據(jù)質(zhì)量仍然存在問(wèn)題,例如2014年某大型機(jī)車(chē)企業(yè)ERP系統(tǒng)中近20%物料存在“一物多碼”問(wèn)題。裝備物聯(lián)網(wǎng)數(shù)據(jù)質(zhì)量堪憂,某大型制造企業(yè)一個(gè)月的狀態(tài)工況數(shù)據(jù)中,無(wú)效工況(如盾構(gòu)機(jī)傳回了工程車(chē)工況)、重名工況(同一狀態(tài)工況使用不同名字)、時(shí)標(biāo)混亂(如當(dāng)前時(shí)間為1999年,或時(shí)標(biāo)對(duì)不齊)等數(shù)據(jù)質(zhì)量問(wèn)題約30%。
●一體化管理問(wèn)題
層次化的物料表(Bill Of Material,BOM)定義了企業(yè)信息系統(tǒng)數(shù)據(jù)的核心語(yǔ)義結(jié)構(gòu)。針對(duì)裝備物聯(lián)網(wǎng)數(shù)據(jù)和外部互聯(lián)網(wǎng)數(shù)據(jù),可以根據(jù)其綁定的物理對(duì)象(零部件或產(chǎn)品)與相應(yīng)的BOM節(jié)點(diǎn)相關(guān)聯(lián)。從而,以BOM為橋梁關(guān)聯(lián)3個(gè)不同來(lái)源的工業(yè)大數(shù)據(jù)。具體實(shí)現(xiàn)機(jī)制可以分為3個(gè)層面:邏輯層負(fù)責(zé)統(tǒng)一數(shù)據(jù)建模,定義數(shù)字與物理對(duì)象模型,完成底層數(shù)據(jù)模型到對(duì)象模型映射;概念層實(shí)現(xiàn)數(shù)據(jù)語(yǔ)義層面的融合,通過(guò)語(yǔ)義提取與語(yǔ)義關(guān)聯(lián),形成RDF形態(tài)的知識(shí)圖譜,提供基于SPARQL的查詢接口;操作執(zhí)行層負(fù)責(zé)異構(gòu)數(shù)據(jù)管理引擎的查詢協(xié)同優(yōu)化,對(duì)外提供SQL以及REST API形式的統(tǒng)一查詢接口。
●大數(shù)據(jù)系統(tǒng)集成問(wèn)題
工業(yè)大數(shù)據(jù)其來(lái)源更加廣泛,并且裝備物聯(lián)網(wǎng)數(shù)據(jù)(半結(jié)構(gòu)化數(shù)據(jù))和外部互聯(lián)網(wǎng)數(shù)據(jù)(非結(jié)構(gòu)化數(shù)據(jù))都要與企業(yè)信息系統(tǒng)(結(jié)構(gòu)化數(shù)據(jù))進(jìn)行集成,因此要重構(gòu)數(shù)據(jù)管理平臺(tái),甚至替換“舊”系統(tǒng)。
●工業(yè)大數(shù)據(jù)安全問(wèn)題
工業(yè)大數(shù)據(jù)及其系統(tǒng)是工業(yè)互聯(lián)網(wǎng)的知識(shí)與大腦。由于暴露在無(wú)所不在、無(wú)所不控、虛實(shí)結(jié)合、多域融合的工業(yè)信息物理融合系統(tǒng)中,工業(yè)大數(shù)據(jù)系統(tǒng)安全威脅和風(fēng)險(xiǎn)控制技術(shù),是國(guó)家工業(yè)主權(quán)與產(chǎn)業(yè)安全的重要保障。
(2)工業(yè)大數(shù)據(jù)分析技術(shù)的關(guān)鍵問(wèn)題
●多時(shí)間尺度數(shù)據(jù)綜合分析
與傳統(tǒng)商務(wù)智能(Business Intelligence,BI)應(yīng)用場(chǎng)景不同,工業(yè)大數(shù)據(jù)包括秒/小時(shí)尺度的機(jī)器工況數(shù)據(jù)、天/周尺度的車(chē)間調(diào)度數(shù)據(jù)和月/年尺度的管理決策數(shù)據(jù),在工業(yè)大數(shù)據(jù)應(yīng)用中不同時(shí)間尺度的工業(yè)數(shù)據(jù)需要綜合使用才能驅(qū)動(dòng)智慧企業(yè)。例如,智慧礦山企業(yè)需要根據(jù)跨界數(shù)據(jù)預(yù)測(cè)礦石品質(zhì)需求,依據(jù)品質(zhì)需求生成裝備作業(yè)計(jì)劃,根據(jù)裝備作業(yè)計(jì)劃實(shí)時(shí)控制裝備操作。
●專業(yè)分析算法與構(gòu)件
針對(duì)時(shí)間序列、時(shí)空等弱結(jié)構(gòu)化數(shù)據(jù),應(yīng)提供豐富的特征模板庫(kù),方便對(duì)典型物理事件(如風(fēng)速平穩(wěn)時(shí)段、發(fā)電機(jī)轉(zhuǎn)速快速下降、環(huán)境溫度逐漸上升等)進(jìn)行描述;另外,還應(yīng)提供豐富的時(shí)間序列、時(shí)空模式、序列模式的深度挖掘算法庫(kù),提升工業(yè)數(shù)據(jù)分析的建模效率。
●實(shí)時(shí)交互分析
工業(yè)大數(shù)據(jù)分析必須能夠滿足大規(guī)模、分散控制和交互迭代等需求。在實(shí)時(shí)處理上,傳統(tǒng)的商業(yè)數(shù)據(jù)分析系統(tǒng)不能有效支持面向大規(guī)模數(shù)據(jù)狀態(tài)下的低等待時(shí)間復(fù)雜事件檢測(cè)。在離線分析上,查詢檢索與分析建模應(yīng)緊密協(xié)同,同時(shí)前臺(tái)探索展現(xiàn)與工業(yè)大數(shù)據(jù)平臺(tái)要無(wú)縫整合,支持大數(shù)據(jù)集上的交互挖掘。
●遺留算法并行化
針對(duì)重要的應(yīng)用需求,工業(yè)企業(yè)通常具有一定的分析工具和科學(xué)計(jì)算軟件積累,然而這些工具通常沒(méi)有考慮大數(shù)據(jù)架構(gòu)。如何有效重用這些分析算法工具,是工業(yè)大數(shù)據(jù)分析應(yīng)用不能回避的技術(shù)問(wèn)題。
●領(lǐng)域知識(shí)自動(dòng)化
工業(yè)大數(shù)據(jù)中存在著大量的非結(jié)構(gòu)化數(shù)據(jù),將當(dāng)前深度學(xué)習(xí)、自然語(yǔ)言處理等人工能力融入到工業(yè)大數(shù)據(jù)分析中來(lái),可以有效輔助把專家知識(shí)進(jìn)行有效的沉淀、萃取和自動(dòng)化。
金風(fēng)科技股份有限公司通過(guò)將風(fēng)機(jī)大數(shù)據(jù)技術(shù)作為抓手,實(shí)現(xiàn)企業(yè)的工業(yè)化和信息化的深度融合,通過(guò)每臺(tái)風(fēng)機(jī)上安裝的百種傳感器,金風(fēng)科技每天收集的數(shù)據(jù)超過(guò)TB的量級(jí)。通過(guò)這些數(shù)據(jù)技術(shù),可以在實(shí)現(xiàn)全量風(fēng)機(jī)的在線預(yù)警以及定期體檢上,尋找更迅速、更有效的解決方案,提升設(shè)備的可靠性,而風(fēng)場(chǎng)運(yùn)營(yíng)商通過(guò)這些數(shù)據(jù),可以做到更精準(zhǔn)的預(yù)測(cè)、檢測(cè)和數(shù)據(jù)采集以節(jié)約人力和時(shí)間成本,實(shí)現(xiàn)風(fēng)場(chǎng)效益最大化。通過(guò)機(jī)器大數(shù)據(jù)技術(shù)對(duì)風(fēng)機(jī)數(shù)據(jù)進(jìn)行管理,為金風(fēng)創(chuàng)造了可觀的經(jīng)濟(jì)效益,典型案例如下:
●快速響應(yīng)客戶需求
在美國(guó)德州Rattlesnake風(fēng)場(chǎng)建設(shè)項(xiàng)目投標(biāo)中,金風(fēng)公司基于大數(shù)據(jù)平臺(tái)成功以3小時(shí)47分的速度完成招標(biāo)方提出近250萬(wàn)個(gè)文件的處理要求,加工出風(fēng)速、溫度、發(fā)電機(jī)轉(zhuǎn)速、功率、槳距角、風(fēng)機(jī)狀態(tài)等結(jié)果,使回應(yīng)速度由100多天縮短到2天。
●風(fēng)速儀對(duì)風(fēng)優(yōu)化
在風(fēng)場(chǎng)對(duì)風(fēng)機(jī)的變槳數(shù)據(jù)進(jìn)行調(diào)優(yōu)?;谄脚_(tái)在5小時(shí)31分完成基于全量歷史數(shù)據(jù)(包括1.7萬(wàn)臺(tái)風(fēng)機(jī)、300多億條歷史記錄)的對(duì)風(fēng)偏差估計(jì)和優(yōu)化,使得原本需要400多天才能完成的運(yùn)維調(diào)優(yōu)任務(wù)得以周期性實(shí)施。據(jù)測(cè)算,每年由此調(diào)優(yōu)獲得額外發(fā)電量可達(dá)2億元人民幣以上。
●齒形帶斷裂預(yù)警
齒形帶是變槳系統(tǒng)的一個(gè)重要部件。齒形帶斷裂會(huì)造成非計(jì)劃性停機(jī)及葉片失控等次生災(zāi)害。因?yàn)闆](méi)有直接的傳感器監(jiān)測(cè),目前檢測(cè)手段根據(jù)斷裂后引起的振動(dòng)、槳距角異常等次生故障判斷,通常有10余秒的滯后。大數(shù)據(jù)分析基于大量風(fēng)場(chǎng)的歷史故障信息,對(duì)SCADA(Supervisory Control and Data Acquisition,監(jiān)控和數(shù)據(jù)采集系統(tǒng))瞬時(shí)數(shù)據(jù)的時(shí)間序列模式提取,挖掘槳距角一致性、變槳過(guò)程曲線模態(tài)、振動(dòng)模式、變槳電機(jī)溫差、ng5充電電流差異等斷裂征兆模式,通過(guò)多模型融合和深度學(xué)習(xí),提前90h進(jìn)行斷裂預(yù)警,通過(guò)預(yù)防性維修消除重大故障隱患。大數(shù)據(jù)還對(duì)20ms數(shù)據(jù)進(jìn)行分析,分析斷裂后發(fā)電機(jī)轉(zhuǎn)速、風(fēng)速、功率、電磁扭矩等多指標(biāo)時(shí)間序列模式變化,將當(dāng)前PLC超短時(shí)報(bào)警提前1s,降低故障可能的破壞風(fēng)險(xiǎn)。
●機(jī)組健康管理
建立并完善系統(tǒng)安全體系;建立整機(jī)、大部件健康評(píng)估模型,實(shí)現(xiàn)預(yù)警功能;建立風(fēng)電場(chǎng)級(jí)健康安全管理及優(yōu)化體系;建立解決方案中心,實(shí)現(xiàn)模型引擎的遠(yuǎn)端運(yùn)行,達(dá)到既能做出風(fēng)力發(fā)電機(jī)組健康綜合評(píng)估診斷也能做出解決方案的“醫(yī)院”級(jí)功能,成為健康評(píng)估模型中探索模型的“試驗(yàn)平臺(tái)”,可實(shí)現(xiàn)各類(lèi)模型的快速迭代優(yōu)化。
工業(yè)大數(shù)據(jù)是實(shí)現(xiàn)智能制造的基礎(chǔ)原料,是提升工業(yè)生產(chǎn)力、競(jìng)爭(zhēng)力、創(chuàng)新力的關(guān)鍵要素。中國(guó)不僅是制造大國(guó)更是使用大國(guó),在裝備應(yīng)用過(guò)程中產(chǎn)生的海量機(jī)器數(shù)據(jù)正是工業(yè)大數(shù)據(jù)的主體,為我國(guó)智能制造創(chuàng)新發(fā)展提供了獨(dú)特而豐富的戰(zhàn)略資源;同時(shí),對(duì)于國(guó)計(jì)民生息息相關(guān)的裝備制造業(yè)而言,工業(yè)大數(shù)據(jù)更是事關(guān)國(guó)家安全與主權(quán)。工業(yè)大數(shù)據(jù)是一個(gè)正在發(fā)展的學(xué)科領(lǐng)域,在內(nèi)涵外延、模型理論、技術(shù)方法及其實(shí)施策略等方面,我國(guó)和國(guó)際巨頭處在同一起跑線上。必須緊密結(jié)合中國(guó)國(guó)情認(rèn)真實(shí)踐,加大投入,快速研發(fā),走出中國(guó)工業(yè)大數(shù)據(jù)自主發(fā)展之路,實(shí)現(xiàn)國(guó)產(chǎn)化工業(yè)大數(shù)據(jù)軟件技術(shù)的彎道超車(chē)與應(yīng)用的自主可控,支撐制造強(qiáng)國(guó)戰(zhàn)略目標(biāo)落地實(shí)現(xiàn)。
Industrial big data technologies
WANG Jianmin
Industrial big data consist of enterprise data, IOT data and external data, whose volume is very huge and which is a primary driven-force of the new-round industry revolution.Where do the industrial big data come from is explored first. Next,the data characteristics,“heterogeneous, interrelated and high- throughput”, and the application characteristics,“physicalcyber,inter-enterprises and cross-domain”data integration, are described. The technical challenges on data management and analysis are presents thereafter.An industrial big data use case on wind turbine farm are given. Finally we suggest we should build an industrial big data software platform by ourselves.
big data, industrial big data; data characteristics; application characteristics; key technologies; use case
2016-07-21)