鞏會(huì)龍 王 菁 郭陳虹 郭浩浩 丁美至 楊詩怡
(1.北方工業(yè)大學(xué)信息學(xué)院 北京 100144)
(2.北方工業(yè)大學(xué)大規(guī)模流數(shù)據(jù)集成與分析技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室 北京 100144)
隨著互聯(lián)網(wǎng)的發(fā)展與萬物互聯(lián)時(shí)代的到來,IoT 服務(wù)的技術(shù)水平也在不斷提高。IoT 服務(wù)是指通過互聯(lián)網(wǎng)連接的IoT 設(shè)備提供的各種服務(wù)[1]。IoT 服務(wù)事件是指由IoT 設(shè)備在運(yùn)行過程中產(chǎn)生的業(yè)務(wù)事件,這些事件可以被用來監(jiān)控設(shè)備的狀態(tài)和行為。通過對(duì)IoT設(shè)備生成的業(yè)務(wù)事件進(jìn)行頻繁關(guān)聯(lián)模式挖掘,可以發(fā)現(xiàn)設(shè)備的事件模式。由于在科研協(xié)作、船舶運(yùn)輸、城市應(yīng)急等IoT應(yīng)用領(lǐng)域服務(wù)組合邏輯難以預(yù)先定義,如果用戶利用這些頻繁關(guān)聯(lián)模式與業(yè)務(wù)流程中的IoT 服務(wù)推薦相結(jié)合,動(dòng)態(tài)的調(diào)整服務(wù)組合邏輯,“邊執(zhí)行邊構(gòu)造”探索式的構(gòu)建業(yè)務(wù)流程[2],可以優(yōu)化資源利用率為用戶提供更加智能化、高效化、個(gè)性化的服務(wù),從而構(gòu)建出更能符合實(shí)際業(yè)務(wù)場(chǎng)景的業(yè)務(wù)流程。
二是從監(jiān)管鏈條的角度看,專員辦應(yīng)當(dāng)更加注重績(jī)效監(jiān)控結(jié)果反饋的及時(shí)性?!凹s束有力”是預(yù)算績(jī)效管理改革遵循的基本原則,專員辦監(jiān)督成果向財(cái)政部的及時(shí)反饋是保證激勵(lì)約束機(jī)制有效落實(shí)的重要一環(huán)。專員辦應(yīng)定期將屬地中央預(yù)算單位預(yù)算績(jī)效管理的整體情況,特別是重點(diǎn)項(xiàng)目績(jī)效運(yùn)行管理情況以專題報(bào)告的形式報(bào)告財(cái)政部,突出上下聯(lián)動(dòng)機(jī)制的落實(shí)。及時(shí)揭示執(zhí)行偏離目標(biāo),目標(biāo)進(jìn)度不達(dá)預(yù)期的問題,分析反映造成偏差的原因,著重反映績(jī)效一般的項(xiàng)目的改進(jìn)進(jìn)度,對(duì)交叉重復(fù)、碎片化項(xiàng)目提出調(diào)整意見,對(duì)低效無效資金、長(zhǎng)期沉淀資金提出削減或收回資金,統(tǒng)籌用于亟需支持的領(lǐng)域的建議,供財(cái)政部決策參考。
以液化天然氣船舶運(yùn)輸監(jiān)控為例,液化天然氣(Liquefied Natural Gas,LNG)作為世界公認(rèn)的優(yōu)質(zhì)、清潔、高效能源,在我國(guó)能源結(jié)構(gòu)中得到廣泛的重視和利用,由于LNG 本身具有易做易保特性和嚴(yán)苛的儲(chǔ)存運(yùn)輸條件,導(dǎo)致LNG 一旦發(fā)生泄漏,尤其是LNG 儲(chǔ)罐泄漏,極有可能引發(fā)連鎖事故效應(yīng),造成災(zāi)難性的后果[3]。使用IoT 服務(wù)技術(shù)可以實(shí)時(shí)感知監(jiān)控LNG 罐箱運(yùn)輸?shù)腎oT 設(shè)備產(chǎn)生的業(yè)務(wù)事件,并通過事件頻繁關(guān)聯(lián)模式結(jié)合業(yè)務(wù)流程推薦相應(yīng)的IoT 服務(wù)。因此IoT 服務(wù)推薦方案應(yīng)該考慮IoT 服務(wù)的新特征,然而傳統(tǒng)的服務(wù)推薦方案,如基于內(nèi)容的過濾方法、協(xié)同過濾方法和混合系統(tǒng)方法[4],并不適用于IoT 服務(wù)推薦。傳統(tǒng)的服務(wù)推薦方案主要針對(duì)互聯(lián)網(wǎng)環(huán)境,然而,在IoT 服務(wù)推薦中,不僅要考慮到IoT服務(wù)事件之間的關(guān)聯(lián),還要考慮IoT服務(wù)事件發(fā)生的時(shí)間約束。一般的頻繁關(guān)聯(lián)模式挖掘并沒有考慮事件頻繁關(guān)聯(lián)模式中事件之間的時(shí)間延時(shí)屬性,導(dǎo)致利用挖掘出的頻繁關(guān)聯(lián)模式來進(jìn)行推薦可能不夠準(zhǔn)確、不夠及時(shí),產(chǎn)生一些不符合實(shí)際情況的推薦結(jié)果。
本文就針對(duì)如何挖掘出IoT服務(wù)事件之間的時(shí)間關(guān)系,并應(yīng)用于業(yè)務(wù)流程中的IoT服務(wù)推薦,提高業(yè)務(wù)流程中IoT 服務(wù)推薦的準(zhǔn)確率,提出了一種考慮事件頻繁關(guān)聯(lián)模式延時(shí)性的IoT 服務(wù)推薦方法。實(shí)驗(yàn)結(jié)果表明,與同類推薦方法相比,本文提出的方法在業(yè)務(wù)流程中IoT服務(wù)推薦的準(zhǔn)確率得到了進(jìn)一步提升。
頻繁關(guān)聯(lián)模式挖掘是一種數(shù)據(jù)挖掘技術(shù),在實(shí)際應(yīng)用中,它被廣泛應(yīng)用于在業(yè)務(wù)流程分析、用戶行為預(yù)測(cè)、生產(chǎn)過程優(yōu)化等領(lǐng)域。對(duì)于頻繁關(guān)聯(lián)模式的挖掘主要分為基于序列模式和基于關(guān)聯(lián)規(guī)則的頻繁關(guān)聯(lián)模式挖掘?;谛蛄心J降念l繁關(guān)聯(lián)模式挖掘是指在序列數(shù)據(jù)集中挖掘出更具代表性的序列模式集合[5],比如劉豫航等為挖掘電力系統(tǒng)故障序列中的故障序列模式,基于PrefixSpan 算法提出了CFPMA 算法,來辨識(shí)和挖掘電力系統(tǒng)故障數(shù)據(jù)中的連鎖故障模式[6],從而對(duì)提前預(yù)知和感知即將發(fā)生的連鎖故障,積極做出應(yīng)對(duì)。由于在序列模式挖掘過程中會(huì)產(chǎn)生大量不頻繁候選集,Philippe Fournier-Viger 等[7]提出了一種稱為CMAP的修剪結(jié)構(gòu),用來減少頻繁候選項(xiàng)以及提高挖掘效率,并結(jié)合SPADE 算法,使用一種名為CM-SPADE的算法驗(yàn)證該結(jié)構(gòu)的有效性?;陉P(guān)聯(lián)規(guī)則的頻繁關(guān)聯(lián)模式挖掘可以利用一些度量指標(biāo)分辨數(shù)據(jù)集中存在的強(qiáng)相關(guān)性的關(guān)聯(lián)規(guī)則,通過對(duì)關(guān)聯(lián)規(guī)則的挖掘,能夠發(fā)現(xiàn)大量隱含的頻繁關(guān)聯(lián)模式[8],文獻(xiàn)[9]基于改進(jìn)的Apriori 算法,對(duì)地鐵設(shè)備故障數(shù)據(jù)進(jìn)行挖掘,利用挖掘出的關(guān)聯(lián)規(guī)則作為地鐵故障頻繁模式分析的重要依據(jù)。
業(yè)務(wù)流程設(shè)計(jì)在流程管理中起到了非常關(guān)鍵的作用,推薦技術(shù)作為業(yè)務(wù)流程的重要組成部分,國(guó)內(nèi)外學(xué)者對(duì)此做了許多研究。當(dāng)前用于服務(wù)推薦的方法根據(jù)推薦服務(wù)的依據(jù)不同大體分為語義匹配算法、協(xié)同過濾算法和關(guān)聯(lián)關(guān)系算法這三類。在基于語義匹配算法[10]的服務(wù)推薦中,首先將服務(wù)相關(guān)參數(shù)信息描述為文本并進(jìn)行語義匹配,然后對(duì)服務(wù)之間的相似度進(jìn)行計(jì)算并將相似度高的服務(wù)推薦給用戶。該方法簡(jiǎn)單、直接,且僅僅利用了服務(wù)的靜態(tài)語義信息,因此會(huì)推薦大量的無意義服務(wù),而且沒有考慮到用戶與服務(wù)的交互性,難以滿足用戶需求?;趨f(xié)同過濾算法[11]的服務(wù)推薦是比較常用且典型的方法,由于傳統(tǒng)協(xié)同過濾僅利用用戶和服務(wù)之間的低緯和線性交互,Yi Wenzhang等[12]提出了一種位置感知深度的服務(wù)推薦模型,該模型不僅可以進(jìn)一步學(xué)習(xí)用戶與服務(wù)之間的互動(dòng)信息而且還可以學(xué)習(xí)用戶與服務(wù)之間的高緯和非線性交互,并以此獲得候選服務(wù)為用戶進(jìn)行推薦。基于關(guān)聯(lián)關(guān)系算法的服務(wù)推薦,該算法通過挖掘出的關(guān)聯(lián)關(guān)系,利用這些關(guān)系為用戶進(jìn)行服務(wù)推薦。文獻(xiàn)[2]通過對(duì)gSpan 算法進(jìn)行擴(kuò)展,聚焦于失敗服務(wù)模式,挖掘出其中的服務(wù)派生關(guān)系并將生成的服務(wù)模式應(yīng)用于服務(wù)推薦。
IoT 服務(wù)事件發(fā)生時(shí)間作為IoT 服務(wù)事件的一個(gè)屬性,由于IoT 服務(wù)事件之間并不是簡(jiǎn)單的先后發(fā)生關(guān)系,還有兩個(gè)源事件發(fā)生才引起目標(biāo)事件發(fā)生這種特殊關(guān)系,這就要考慮兩個(gè)源事件之間發(fā)生的時(shí)間差異,這就給IoT 服務(wù)事件頻繁關(guān)聯(lián)模式的延時(shí)性挖掘帶來了挑戰(zhàn)。為挖掘出帶有延時(shí)屬性的IoT 服務(wù)事件頻繁關(guān)聯(lián)模式應(yīng)用于IoT 服務(wù)推薦,并且提高挖掘效率,本文最終選擇基于CM-SPADE算法進(jìn)行改進(jìn),以挖掘出帶有延時(shí)屬性的IoT 服務(wù)事件頻繁關(guān)聯(lián)模式,使其能更好的凸顯出IoT 服務(wù)事件關(guān)聯(lián)之間延時(shí)應(yīng)用的重要性,同時(shí)將挖掘出的IoT 服務(wù)事件頻繁關(guān)聯(lián)模式映射為IoT服務(wù)頻繁關(guān)聯(lián)模式,并結(jié)合業(yè)務(wù)流程,使IoT服務(wù)事件關(guān)聯(lián)模式更好的應(yīng)用于業(yè)務(wù)流程中的IoT服務(wù)推薦。
在IoT 系統(tǒng)中,IoT 服務(wù)事件通常是指在IoT 環(huán)境下,物理世界中身處于不同位置的設(shè)備、傳感器、節(jié)點(diǎn)等進(jìn)行交互時(shí),所產(chǎn)生的業(yè)務(wù)事件。在這個(gè)過程中,需要對(duì)IoT數(shù)據(jù)進(jìn)行分析和處理,從而提取出與業(yè)務(wù)相關(guān)的信息,最終形成一個(gè)具有意義的業(yè)務(wù)事件。IoT 服務(wù)事件頻繁關(guān)聯(lián)模式是指在IoT 服務(wù)事件序列中,發(fā)現(xiàn)某些事件在特定時(shí)間段內(nèi)頻繁出現(xiàn)的關(guān)聯(lián)模式。如果這些事件在一段時(shí)間內(nèi)頻繁出現(xiàn),可能會(huì)對(duì)IoT服務(wù)產(chǎn)生影響,導(dǎo)致服務(wù)中斷或數(shù)據(jù)丟失。
頻繁關(guān)聯(lián)模式挖掘的目標(biāo)是從序列數(shù)據(jù)集中挖掘出所有頻繁出現(xiàn)的關(guān)聯(lián)模式。具體來說,它通過掃描序列數(shù)據(jù)集,統(tǒng)計(jì)每個(gè)關(guān)聯(lián)模式在數(shù)據(jù)中出現(xiàn)的頻率(即支持度),并根據(jù)設(shè)定的支持度閾值來篩選出頻繁關(guān)聯(lián)模式。頻繁關(guān)聯(lián)模式通常被認(rèn)為是數(shù)據(jù)中的重要模式,因?yàn)樗鼈兛赡芊从沉藬?shù)據(jù)中的重要規(guī)律和關(guān)聯(lián)性,有助于對(duì)數(shù)據(jù)進(jìn)行分析、預(yù)測(cè)和決策。
2015-2016年,恒山景區(qū)的旅游接待人數(shù)在重要的節(jié)日上增幅較快。每年的五月初五、恒山廟會(huì)四月初八、旅游節(jié)5月19日,恒山景區(qū)都會(huì)實(shí)行免門票、打折等優(yōu)惠的措施,使得這些重要節(jié)日的接待量的增長(zhǎng)速度也比平常高很多。其中增幅較快的還是恒山廟會(huì)四月初八和國(guó)慶期間,分別是7.1%和6.7%。3月8日是恒山當(dāng)?shù)氐膫鹘y(tǒng)祭祀節(jié)日,景區(qū)加大了服務(wù)和安保力度等基礎(chǔ)性服務(wù),使得這個(gè)節(jié)日的每年人數(shù)增長(zhǎng)百分比最高。國(guó)慶節(jié)等法定節(jié)假日,恒山景區(qū)實(shí)行五折、七五折等門票優(yōu)惠措施,吸引了大量的游客,也呈增長(zhǎng)趨勢(shì)。相比之下,在旅游節(jié)上,人數(shù)增長(zhǎng)較慢,原因是五一旅游高峰期剛過,相應(yīng)的旅游人數(shù)有所減少。
定義1 IoT 服務(wù)事件序列。IoT 服務(wù)事件可以表示為一個(gè)四元組e =(sourceid,eventid,timestamp,type),其中:
sourceid代表產(chǎn)生IoT服務(wù)事件e的IoT服務(wù)id;
線形生產(chǎn)建設(shè)項(xiàng)目在施工過程中或多或少都會(huì)存在占?jí)汉蛿_動(dòng)土地和植被的現(xiàn)象,使原有水土保持設(shè)施的功能降低或喪失,加重原有地表水土流失。線形生產(chǎn)建設(shè)項(xiàng)目包括鐵路、公路、輸氣管線、輸油管線、輸變電線路等,其水土流失常以“點(diǎn)狀”和“線形”綜合的形式出現(xiàn),具有水土流失量大、集中突發(fā)性強(qiáng)、危害大等特點(diǎn)。
timestamp是e產(chǎn)生的時(shí)間戳;
type 是事件類型,指包含e 在內(nèi)的一組具有相似特征的事件集合標(biāo)簽。
令S ={e1,e2,…,en}是不同IoT 設(shè)備產(chǎn)生的按時(shí)間順序構(gòu)建的IoT服務(wù)事件序列。一個(gè)序列中所包含事件的個(gè)數(shù)稱為序列的長(zhǎng)度,長(zhǎng)度為l 的序列記為l-序列。
①在新建資源池網(wǎng)絡(luò)中引入SDN組網(wǎng),實(shí)現(xiàn)網(wǎng)絡(luò)靈活部署。②傳統(tǒng)數(shù)據(jù)中心在滿足現(xiàn)有業(yè)務(wù)需求的情況下,暫不進(jìn)行SDN改造,以免影響現(xiàn)網(wǎng)業(yè)務(wù),后續(xù)根據(jù)集團(tuán)公司指導(dǎo)意見和發(fā)展情況另行考慮。
定義2 序列包含關(guān)系。設(shè)存在序列A={a1,a2,…,an},B={b1,b2,…,bm},如果存在整數(shù)1 ≤j1<j2<…jn≤jm,使得a1?bj1,,a2 ?bj2,…,an?bjn,則稱序列A 為序列B 的子序列,也稱序列B 包含A 序列,記為A ?B。
3)考慮到有些關(guān)聯(lián)事件與罐內(nèi)液體翻滾事件之間的延時(shí)非常短,可能在罐內(nèi)液體翻滾事件后接著發(fā)生,若此時(shí)僅考慮推薦罐內(nèi)液體翻滾事件的下一個(gè)事件對(duì)應(yīng)的IoT服務(wù)很有可能因?yàn)闆]有捕捉到直接相連的關(guān)聯(lián)事件而錯(cuò)過正確的推薦結(jié)果。因此令t=t2-t1,首先過濾P中與罐內(nèi)液體翻滾事件之間延時(shí)小于t 的事件,并將與罐內(nèi)液體翻滾事件之間時(shí)間間隔滿足大于等于t 的第一個(gè)事件對(duì)應(yīng)的IoT服務(wù)作為推薦結(jié)果放入到推薦結(jié)果集中并對(duì)結(jié)果集中的事件進(jìn)行去重。
在傳統(tǒng)的頻繁序列模式挖掘中,通常假設(shè)事件之間的延時(shí)是固定的或者是可以忽略的,但在實(shí)際應(yīng)用中,事件之間往往具有一定的延時(shí)約束。為了從IoT服務(wù)事件序列數(shù)據(jù)集中挖掘出帶有延時(shí)約束的IoT 服務(wù)事件頻繁關(guān)聯(lián)模式,從而為業(yè)務(wù)流程的探索式構(gòu)建推薦更為貼合當(dāng)時(shí)情景的IoT 服務(wù),實(shí)現(xiàn)業(yè)務(wù)流程的動(dòng)態(tài)構(gòu)造執(zhí)行。
以業(yè)務(wù)流程檢測(cè)到液體翻滾事件為例,根據(jù)IoT 服務(wù)事件頻繁關(guān)聯(lián)模式,在業(yè)務(wù)流程運(yùn)行時(shí)即時(shí)推薦IoT服務(wù)步驟如下:
E 是IoT 服 務(wù) 事 件 節(jié) 點(diǎn) 的 有 限 集 合E={e1,e2,…,en}。
V 是有向邊的有限集合,v=(e1,e2,w)。事件節(jié)點(diǎn)e1是有向邊v 的源節(jié)點(diǎn),表示事件e1與事件e2之間存在一條有向邊v,事件節(jié)點(diǎn)e2是有向邊e1的目標(biāo)節(jié)點(diǎn),表示事件e2在事件e1之后發(fā)生,w表示有向邊v 的權(quán)值,即事件e2發(fā)生的時(shí)間戳減去事件e1發(fā)生的時(shí)間戳,即v的時(shí)間延時(shí)。p中,每條邊v?V表示一種事件之間時(shí)間延時(shí)關(guān)系。邊的方向從e1指向e2,表示在e1之后發(fā)生事件e2。給定minsup 為用戶設(shè)定的支持度閾值,若模式p 在序列數(shù)據(jù)集中出現(xiàn)的頻率大于等于minsup,則稱模式p 為帶有延時(shí)屬性的頻繁關(guān)聯(lián)模式。
(5)砼工程中砼標(biāo)號(hào)分多種強(qiáng)度等級(jí)和不同的配合比,一般情況應(yīng)該把砼配合比單獨(dú)歸納到一章內(nèi),套定額時(shí),再根據(jù)不同標(biāo)號(hào)在本章節(jié)中查找換算。但考慮到系統(tǒng)內(nèi)填寫檢修計(jì)劃委托書的是設(shè)備點(diǎn)檢員,定額編制組在編制砼澆筑子目時(shí),直接將廠內(nèi)常用的強(qiáng)度等級(jí)混凝土按照不同標(biāo)號(hào)編制在砼澆筑子目?jī)?nèi)。這樣,使用者就不用選定子目后再進(jìn)行查找、換算操作了。
定義4 支持度。序列a 在序列數(shù)據(jù)集SDS 中出現(xiàn)的次數(shù)為序列a 在序列數(shù)據(jù)集SDS 中的支持度,記為supSDS(a),若上下文無歧義可以寫作sup(a)。
在調(diào)查的航運(yùn)服務(wù)企業(yè)中,有近54%的企業(yè)認(rèn)為中美貿(mào)易戰(zhàn)一旦發(fā)生,業(yè)務(wù)量將減少10%以內(nèi)或減少10%~30%,僅37%企業(yè)認(rèn)為中美貿(mào)易戰(zhàn)對(duì)公司業(yè)務(wù)影響不大??梢姡竭\(yùn)服務(wù)企業(yè)總體認(rèn)為中美貿(mào)易戰(zhàn)對(duì)航運(yùn)相關(guān)服務(wù)業(yè)務(wù)會(huì)帶來一定程度的影響。
本文結(jié)合CM-SPADE 算法,在CM-SPADE 算法基礎(chǔ)上引入時(shí)間約束的概念,提出TCCM-SPADE 算法。首先將IoT 服務(wù)事件序列數(shù)據(jù)集S 中的事件做預(yù)處理,僅保留事件發(fā)生的時(shí)間戳與事件類型兩個(gè)屬性。將處理好的IoT服務(wù)事件序列數(shù)據(jù)集S與支持度閾值minSup作為算法的輸入,然后掃描S 創(chuàng)建垂直數(shù)據(jù)庫并生成頻繁關(guān)聯(lián)模式列表F1。遍歷F1,將里面的兩個(gè)模式合并得到新模式r,F(xiàn)1中的模式兩兩合并,接著先判斷r 是i-extension 類型的擴(kuò)展還是s-extension 類型的擴(kuò)展,通過CMAP(i)或CMAP(s)來判斷以模式r 為前綴的模式是否為非頻繁模式,以i-extenstion 修剪為例(s-extension 修剪同理),若為前綴的模式r 是非頻繁的,則將r 丟棄,避免了對(duì)r 的連接的處理。若以r 為前綴的模式是頻繁的,保存該頻繁模式然后計(jì)算該模式中相鄰兩事件之間的時(shí)間間隔,最終Res中保存所有的頻繁關(guān)聯(lián)模式及其事件之間的延時(shí)屬性。這樣就在擴(kuò)展頻繁模式的過程中,將頻繁模式各項(xiàng)之間的時(shí)間延時(shí)屬性也保存下來了,同時(shí)對(duì)于兩個(gè)源事件發(fā)生才引起目標(biāo)事件發(fā)生的頻繁模式也都保存了下來。在完成所有的擴(kuò)展后,可以方便地對(duì)具有相同頻繁關(guān)聯(lián)模式部分的關(guān)聯(lián)模式計(jì)算平均時(shí)間間隔作為時(shí)間約束。
回路矩陣C的方向可以提前約定,其反映了裂隙段之間的關(guān)系,有以下性質(zhì):每一行中非零元素的個(gè)數(shù)等于該行代表的回路的維數(shù)。
IoT 服務(wù)事件頻繁關(guān)聯(lián)模式如圖1 所示。其中每個(gè)節(jié)點(diǎn)代表一個(gè)IoT 服務(wù)事件,節(jié)點(diǎn)之間邊的指向代表源節(jié)點(diǎn)與目標(biāo)節(jié)點(diǎn)的關(guān)系,即當(dāng)源節(jié)點(diǎn)發(fā)生后目標(biāo)節(jié)點(diǎn)在?t時(shí)間內(nèi)發(fā)生。
沒有一朵花會(huì)因?yàn)榧竟?jié)和環(huán)境而改變自己,它努力地綻放,只為遇見那個(gè)懂它、欣賞它的人。此時(shí),我們站著,不說話,就十分美好。只有懂得,才能心領(lǐng)神會(huì),無言才是最好的表達(dá)。
圖1 IoT服務(wù)事件頻繁關(guān)聯(lián)模式圖
為驗(yàn)證帶有時(shí)間約束的頻繁序列模式應(yīng)用于IoT 服務(wù)推薦的效果,以LNG 安全物流案例為例,基于上文提出的TCCM-SPADE 算法探究頻繁關(guān)聯(lián)模式中的延時(shí)屬性對(duì)于IoT服務(wù)推薦的影響。
本文采用LNG 安全物流簡(jiǎn)化的原有業(yè)務(wù)流程案例,該業(yè)務(wù)流程是LNG 罐箱以海運(yùn)方式從大連港運(yùn)輸?shù)綗熍_(tái)港的物流作業(yè),該過程中主要涉及到物流公司的海運(yùn)運(yùn)輸作業(yè)部門和煙臺(tái)海事處。在運(yùn)輸過程中,海運(yùn)運(yùn)輸?shù)淖鳂I(yè)部門對(duì)船舶運(yùn)輸作業(yè)的相關(guān)內(nèi)容下達(dá)指示,監(jiān)管職能部門收到來自海運(yùn)運(yùn)輸部門傳送的具體信息后進(jìn)行相應(yīng)的事件處理。LNG船舶運(yùn)輸業(yè)務(wù)流程圖如圖2所示。
圖2 LNG船舶運(yùn)輸業(yè)務(wù)流程圖
定義5 帶有延時(shí)屬性的事件頻繁關(guān)聯(lián)模式。設(shè)帶有延時(shí)屬性的事件頻繁關(guān)聯(lián)模式p=(E,V),其中:
1)當(dāng)正在運(yùn)行的業(yè)務(wù)流程中的罐內(nèi)液體監(jiān)控服務(wù)檢測(cè)到罐內(nèi)液體翻滾事件時(shí),記錄當(dāng)前時(shí)間為t1并遍歷所有挖掘出的IoT 服務(wù)事件頻繁關(guān)聯(lián)模式,考慮所有包含該事件的頻繁關(guān)聯(lián)模式。
eventid是事件id,同時(shí)也是ε的唯一標(biāo)識(shí)符;
2)將所有包含罐內(nèi)液體翻滾事件的頻繁關(guān)聯(lián)模式放入到集合P中并記錄當(dāng)前時(shí)間為t2。
定義3 IoT 服務(wù)事件序列集。序列數(shù)據(jù)集SDS是一個(gè)由二元組
4)將推薦結(jié)果按照時(shí)間緊迫程度進(jìn)行排序,排序后的IoT 服務(wù)集合為最終推薦結(jié)果,用戶可根據(jù)推薦結(jié)果選擇IoT 服務(wù)對(duì)業(yè)務(wù)流程的動(dòng)態(tài)調(diào)整,實(shí)現(xiàn)業(yè)務(wù)流程的探索式構(gòu)建。
IoT 服務(wù)推薦算法如下,其中算法輸入R 為挖掘出的IoT 服務(wù)事件關(guān)聯(lián)模式,IoTBusinessEvent為業(yè)務(wù)流程建模時(shí)預(yù)先構(gòu)建的IoT服務(wù)所監(jiān)測(cè)的業(yè)務(wù)事件。
(1)抑塵和防塵措施。在煤炭、矸石或其他干物料的貯、裝、運(yùn)、破碎、篩分過程中,采取產(chǎn)塵較少的工藝和設(shè)備,并采用適當(dāng)?shù)囊謮m和防塵措施。如精煤貯存用圓筒倉(cāng)代替精煤露天貯煤場(chǎng);設(shè)置擋風(fēng)抑塵墻,封閉轉(zhuǎn)載點(diǎn)以及在原煤儲(chǔ)煤廠安設(shè)噴水裝置,嚴(yán)格控制噴水量。
本文以真實(shí)的LNG 船舶運(yùn)輸航線為研究,航線數(shù)據(jù)來自于中國(guó)渤海區(qū)域構(gòu)建的海洋航道網(wǎng)絡(luò)數(shù)據(jù),以及國(guó)家海洋科學(xué)數(shù)據(jù)中心海洋水文分類中國(guó)臺(tái)站觀測(cè)數(shù)據(jù)渤海區(qū)域2018年6月到2018年12月的真實(shí)氣象數(shù)據(jù)。通過團(tuán)隊(duì)基于上述航道數(shù)據(jù)及氣象數(shù)據(jù)對(duì)IoT 服務(wù)進(jìn)行實(shí)驗(yàn)得到的565 例航行軌跡數(shù)據(jù),并通過該航行軌跡數(shù)據(jù)對(duì)LNG 船舶運(yùn)輸過程中產(chǎn)生的IoT 服務(wù)事件進(jìn)行模擬,將LNG 船的儲(chǔ)罐溫度和壓力等數(shù)據(jù)映射為IoT傳感器設(shè)備中的溫度和壓力數(shù)據(jù);通過將LNG 船舶航行軌跡數(shù)據(jù)中的時(shí)間信息與其他傳感器設(shè)備的數(shù)據(jù)相結(jié)合,可以生成更加完整的IoT 服務(wù)事件序列,基于以上模擬數(shù)據(jù)共得到500 條IoT 服務(wù)事件序列。去除對(duì)事件頻繁關(guān)聯(lián)模式挖掘無關(guān)的屬性,僅保留IoT 服務(wù)事件的時(shí)間戳與事件類型,作為TCCM-SPADE算法的輸入數(shù)據(jù)。IoT服務(wù)事件序列數(shù)據(jù)樣例如表1 所示。如IoT 服務(wù)事件ε=(36,SP1,2018-11-21 4:45:00:00,S1),代表IoT 服務(wù)36 在2018 年11 月21日4:45:00產(chǎn)生了儲(chǔ)罐內(nèi)達(dá)補(bǔ)氣壓力事件(事件id:FSCAS1)。
表1 IoT服務(wù)事件序列數(shù)據(jù)樣例
本文以從海上LNG 運(yùn)輸過程中抽取的部分場(chǎng)景為例,根據(jù)上述船舶航行軌跡數(shù)據(jù),創(chuàng)建了可運(yùn)行的50 個(gè)LNG 船舶運(yùn)輸業(yè)務(wù)流程,并用于實(shí)驗(yàn)驗(yàn)證。本實(shí)驗(yàn)是在一臺(tái)16GB i5-10400 CPU 2.90GHz PC 機(jī)上完成的,操作系統(tǒng)是Windows,所有算法均使用JDK 1.8.5在Java中實(shí)現(xiàn)。
實(shí)驗(yàn)主要分析基于SPADE 算法、CM-SPADE算法與TCCM-SPADE 算法所挖掘出的IoT 服務(wù)事件頻繁關(guān)聯(lián)模式應(yīng)用于業(yè)務(wù)流程中IoT服務(wù)推薦過程中對(duì)于IoT服務(wù)推薦的數(shù)量以及準(zhǔn)確率的影響。
實(shí)驗(yàn)通過對(duì)比觀察業(yè)務(wù)流程中IoT服務(wù)節(jié)點(diǎn)捕獲到IoT 服務(wù)事件時(shí),SPADE 算法、CM-SPADE 算法與TCCM-CMSPADE 算法推薦出的IoT 服務(wù)數(shù)量及推薦結(jié)果的準(zhǔn)確性。
首先,本文提出的推薦方法考慮了IoT 服務(wù)推薦過程中的延時(shí)屬性,過濾掉了一部分不滿足條件的IoT 服務(wù),因此相比原算法,推薦的IoT 服務(wù)數(shù)量較少。而SPADE 算法與CM-SPADE算法沒有考慮到IoT 服務(wù)推薦的延時(shí)性問題,因此在推薦IoT 服務(wù)時(shí)具有一定的盲目性。其次在業(yè)務(wù)流程捕獲到IoT 服務(wù)事件時(shí),使用SPADE 算法或CM-SPADE 算法作為推薦算法很可能因被捕獲事件與其關(guān)聯(lián)事件之間的時(shí)間間隔較短而推薦出監(jiān)測(cè)已經(jīng)發(fā)生事件對(duì)應(yīng)的IoT 服務(wù),從而錯(cuò)過后續(xù)關(guān)聯(lián)事件的捕獲導(dǎo)致準(zhǔn)確率降低。本文所提出的方法考慮了IoT服務(wù)之間的延時(shí)關(guān)系,可以計(jì)算出具有相關(guān)延時(shí)性的IoT服務(wù),提高推薦的準(zhǔn)確率。
本研究以油料作物甘藍(lán)型油菜為實(shí)驗(yàn)材料,選擇其BR合成與信號(hào)轉(zhuǎn)導(dǎo)過程中的一些重要基因,分析它們?cè)诟仕{(lán)型油菜不同部位的組織表達(dá)特異性,并觀察植株幼苗對(duì)BR及BR合成抑制劑BRZ的響應(yīng),闡明BR合成基因是否受到BR信號(hào)的反饋抑制。本研究進(jìn)一步克隆了與擬南芥BR信號(hào)通路重要轉(zhuǎn)錄因子BZR1同源的甘藍(lán)型油菜BnBZL2基因,并對(duì)該基因的功能及BR對(duì)BnBZL2的調(diào)控機(jī)制進(jìn)行研究,比較甘藍(lán)型油菜中BR信號(hào)及BR對(duì)其生長(zhǎng)發(fā)育的調(diào)控與模式植物擬南芥的異同,以期為深入分析植物BR響應(yīng)和信號(hào)調(diào)控機(jī)制研究奠定基礎(chǔ)。
實(shí)驗(yàn)結(jié)果如圖3 所示,隨著業(yè)務(wù)流程數(shù)量的增多,使用本文所提出算法所推薦出的IoT 服務(wù)推數(shù)量要始終少于原算法,并且IoT 服務(wù)推薦準(zhǔn)確率也要高于原算法,且隨著業(yè)務(wù)流程數(shù)量的增多,本文所提出的IoT服務(wù)推薦方法準(zhǔn)確率逐漸趨于穩(wěn)定。
圖3 IoT服務(wù)推薦數(shù)量與準(zhǔn)確率
本文重點(diǎn)討論了從IoT服務(wù)事件序列中挖掘出IoT 服務(wù)事件頻繁關(guān)聯(lián)模式應(yīng)用于業(yè)務(wù)流程中IoT服務(wù)推薦的研究。根據(jù)業(yè)務(wù)流程的探索式構(gòu)建的特點(diǎn),為挖掘出IoT 服務(wù)事件頻繁關(guān)聯(lián)模式中事件之間的時(shí)間關(guān)聯(lián)屬性,提高IoT 服務(wù)推薦的準(zhǔn)確率提出了一種基于CM-SPADE 算法改進(jìn)的算法—TCCM-SPADE 算法,該算法可以發(fā)現(xiàn)事件之間的延時(shí)屬性,從而挖掘出帶有延時(shí)屬性的IoT 服務(wù)事件頻繁關(guān)聯(lián)模式。利用該頻繁關(guān)聯(lián)模式的延時(shí)屬性,在業(yè)務(wù)流程執(zhí)行時(shí),可以降低IoT服務(wù)推薦的冗余度,提高IoT服務(wù)推薦的準(zhǔn)確度,在此基礎(chǔ)上優(yōu)化業(yè)務(wù)流程探索式構(gòu)建中的IoT服務(wù)推薦問題。本文通過采用模擬數(shù)據(jù)集對(duì)算法進(jìn)行試驗(yàn)評(píng)估,將TCCM-SPADE 算法與CM-SPADE 算法進(jìn)行對(duì)比,驗(yàn)證了本文方法的有效性和實(shí)用性。
挖掘IoT服務(wù)事件頻繁關(guān)聯(lián)模式延時(shí)屬性具有廣泛的潛在應(yīng)用,比如通過分析事件之間的時(shí)間屬性,可以發(fā)現(xiàn)設(shè)備故障的模式和趨勢(shì),進(jìn)而進(jìn)行故障預(yù)測(cè)和維護(hù);通過分析事件之間的時(shí)間屬性,可以了解設(shè)備、傳感器或資源之間的時(shí)間關(guān)系,從而優(yōu)化資源的調(diào)度和利用;通過分析事件之間的時(shí)間屬性,可以了解用戶的行為模式和習(xí)慣等。然而本文存在一定的缺陷,如忽略了業(yè)務(wù)流程上下文信息對(duì)于IoT 服務(wù)推薦準(zhǔn)確率的影響的問題,這也將是未來工作努力的方向。