王曉悅 方賢文 曹芮浩
摘要:隱變遷是指一些存在于過程模型中,但沒有出現(xiàn)在日志序列中的變遷。這樣的變遷會(huì)大量存在于現(xiàn)實(shí)的模型中。從事件日志中尋找挖掘隱變遷的方法是過程挖掘技術(shù)的一個(gè)重要的難題。目前針對自由選擇網(wǎng)有一些解決辦法,但是對于復(fù)雜的過程模型有一定的局限性。本文提出了基于Petri網(wǎng)行為輪廓尋找隱變遷的方法。首先根據(jù)發(fā)生頻率最高日志序列得出源模型,再根據(jù)剩余的日志序列一步步優(yōu)化源模型從而找到隱變遷,最后通過評價(jià)指標(biāo)來判定模型的合理性。
關(guān)鍵詞:事件日志;行為輪廓;隱變遷;過程模型
在近幾年,隨著計(jì)算機(jī)的發(fā)展,各大企業(yè)都在尋找一種不但可以滿足客戶要求還可以通過提高業(yè)務(wù)水平節(jié)約成本的辦法,換句話說就是用更短的時(shí)間生產(chǎn)更多的產(chǎn)品給客戶提供更好的服務(wù),從而提出了業(yè)務(wù)流程挖掘這項(xiàng)技術(shù)。但是挖掘業(yè)務(wù)流程模型的過程中往往會(huì)出現(xiàn)一些存在于過程模型中,但沒有出現(xiàn)在日志序列中的變遷,同時(shí)這樣的變遷又大量存在于現(xiàn)實(shí)的模型中。從事件日志中挖掘隱變遷可以很好的還原模型,提高操作的運(yùn)轉(zhuǎn)效率,既而達(dá)到高效率的生產(chǎn)及服務(wù)。
在日志中挖掘不可見變遷最開始是由W.M.P.van der Aalst等人提出來的,他分析了不可見任務(wù)產(chǎn)生的原因。在文獻(xiàn)中提出了Petri的相關(guān)概念。在文獻(xiàn)中有提到不可見任務(wù)在哪幾種情形下產(chǎn)生。在過程挖掘中常常會(huì)因?yàn)轭愃频脑虺霈F(xiàn)一些存在于過程模型中,但沒有出現(xiàn)在日志序列中的變遷。這樣的變遷稱之為隱變遷。然而從事件日志中挖掘隱變遷在流程挖掘中是一個(gè)巨大挑戰(zhàn)。文獻(xiàn)中提出了判定日志與模型一致性的分析方法,通過日志序列在模型中重放來計(jì)算其合理性和適當(dāng)性。國外學(xué)者van derAalst已經(jīng)做了很多關(guān)于不可見任務(wù)挖掘的文章,文獻(xiàn)中給出了Petri網(wǎng)的相關(guān)知識(shí)。文獻(xiàn)講述了有關(guān)流程挖掘的方法。文獻(xiàn)先介紹了行為輪廓的相關(guān)概念,之后Weidlich.M等人又提出因果行為輪廓的概念,因果行為輪廓是行為輪廓的一個(gè)補(bǔ)充及擴(kuò)展在原來的三種關(guān)系基礎(chǔ)上添加了共生關(guān)系。在文獻(xiàn)中基于流程挖掘提出了一種新穎的方法去解決異常的事件日志,這種方法能夠形成一個(gè)與源模型相關(guān)的新的進(jìn)程模型,最后基于新的進(jìn)程模型重新執(zhí)行事件日志。在文獻(xiàn)中把流程挖掘的技術(shù)運(yùn)用到社會(huì)網(wǎng)絡(luò)服務(wù)中檢測異常行為的出現(xiàn),使得社會(huì)網(wǎng)絡(luò)服務(wù)系統(tǒng)更加完善。
在流程挖掘方面,文獻(xiàn)中給出了日志的相關(guān)概念。在文獻(xiàn)里給出了一個(gè)新的建模方法,此建模方法支持精確流程建模。文獻(xiàn)提出了一種與Web服務(wù)的相關(guān)的挖掘。文獻(xiàn)將流程挖掘技術(shù)運(yùn)用到現(xiàn)實(shí)的結(jié)賬過程中,結(jié)果會(huì)對其產(chǎn)生影響并取得進(jìn)步。文獻(xiàn)說明了流程挖掘這項(xiàng)技術(shù)可以運(yùn)用在醫(yī)療方面,介紹了基于過程挖掘這項(xiàng)技術(shù)來分析門診的流程,并對其數(shù)據(jù)進(jìn)行集成、探索和分析。提出了PALIA算法,把流程挖掘這項(xiàng)技術(shù)運(yùn)用到衛(wèi)生保健的設(shè)計(jì)和質(zhì)量控制的流程。文獻(xiàn)在挖掘過程中分別從用戶、時(shí)間的角度來對比方法的可用性。文獻(xiàn)將流程挖掘技術(shù)運(yùn)用在現(xiàn)實(shí)教育中,通過對學(xué)生行為的分析來促進(jìn)流程比較。
本文主要通過行為輪廓的關(guān)系來挖掘事件日志中的隱變遷。通過發(fā)生篇頻率最高的且最長的日志序列得出源模型,再通過剩余的序列一步步優(yōu)化。最后通過計(jì)算合理性及適當(dāng)性得出所挖掘出模型的完備性。這種方法能夠方便快捷的挖掘出日志中的隱變遷,從而使得模型更加完備。
1.研究動(dòng)機(jī)
在本文的介紹中,已經(jīng)提到了挖掘隱變遷的重要性,并且介紹了挖掘隱變遷的算法。在實(shí)際生活中,不乏存在不可見任務(wù)的業(yè)務(wù)流程日志。本節(jié)中利用一個(gè)簡單的例子來證明隱變遷的存在性及挖掘隱變遷的重要性。下面給出了一個(gè)操作記錄的日志序列 L:{ABCEDFGHJ,ABEDFGHJ,ABJ,ABCEGHJ,ABEGHJ,ABCDEFGHJ,ABDEFGHJ,ABDCEFGHJ,ABDFCEGHJ,ABCEGDFHJ,AB-CEDGFHJ,ABCDEGFHJ,ABDCEGFHJ}
a算法挖掘出來的模型如圖1、圖2所示。
分析圖1與圖2可知,這兩個(gè)模型的合理性與行為適當(dāng)性的值偏低。在運(yùn)轉(zhuǎn)的過程中會(huì)出現(xiàn)死鎖的情況。而且它們產(chǎn)生的日志軌跡并不符合過程挖掘的準(zhǔn)則。在過程挖掘中所得到的模型必須完全覆蓋所有的日志軌跡。在本文的第四部分就介紹了基于行為輪廓挖掘日志中的隱變遷的合理性。
2基本知識(shí)
這部分介紹了petri網(wǎng)的相關(guān)概念。