郭 鑫
(安徽理工大學(xué)數(shù)學(xué)與大數(shù)據(jù)學(xué)院,安徽 淮南 232001)
Petri網(wǎng)作為一種建模工具,不但可以進(jìn)行建模還可以利用其性質(zhì)對(duì)模型進(jìn)行評(píng)價(jià),因此目前被廣泛應(yīng)用各行業(yè)的業(yè)務(wù)流程中[1-3]。此前并沒有學(xué)者將Petri網(wǎng)應(yīng)用在視頻審核領(lǐng)域,但做了一些相關(guān)工作,例如:文獻(xiàn)[4]從語義分析和卷積神經(jīng)網(wǎng)絡(luò)的角度,將不同領(lǐng)域的技術(shù)進(jìn)行融合,促進(jìn)了視頻審核技術(shù)的提高。文獻(xiàn)[5]論證了視頻版權(quán)保護(hù)的必要性,分析了視頻版權(quán)保護(hù)的現(xiàn)狀及應(yīng)對(duì)的方法。專利[6]提出了一種視頻審核的調(diào)度機(jī)制,根據(jù)視頻內(nèi)容賦予一個(gè)調(diào)度因子,利用該因子進(jìn)行調(diào)度優(yōu)先等級(jí)排序,達(dá)到提高審核資源利用率的目的。文獻(xiàn)[7]提出了一種基于深度學(xué)習(xí)的臺(tái)標(biāo)檢測(cè)方法,可以將其應(yīng)用在視頻審核中,作為檢測(cè)侵權(quán)的一個(gè)指標(biāo)。
運(yùn)用Petri網(wǎng)中行為輪廓的相關(guān)知識(shí),建立基于自由選擇Petri網(wǎng)的審核流程模型,覆蓋從用戶投稿、平臺(tái)審核到最后發(fā)布的基本流程。提出一種優(yōu)化分析方案,主要從版權(quán)審查、檢測(cè)效率、人工資源利用三個(gè)方面入手,對(duì)原模型進(jìn)行優(yōu)化,并給出優(yōu)化后的模型。利用PM4PY、PIPE軟件對(duì)模型進(jìn)行仿真實(shí)驗(yàn)表明,優(yōu)化后的模型穩(wěn)定、有界、安全且無死鎖。
定義1[8](流程模型Petri網(wǎng)) 一個(gè)流程模型Petri網(wǎng)PM=(P,T,F,C,s,e)是一個(gè)六元組,滿足下列條件:
(1)P是有限庫所集,T是有限活動(dòng)變遷集;
(2)P≠?,T≠?=且P∩T≠?;
(3)F?(P×T)∪(T×P)表示PN的流關(guān)系且(P∪T,F)是強(qiáng)連通圖;
(4)dom(F)∪cod(F)=P∪T,其中
dom(F){x∈P∪T|?y∈P∪T,(x,y∈)}
cod(F)={x∈P∪T|?y∈P∪T,(y,x∈F)}
(5)C={and,xor,or}是流程網(wǎng)的結(jié)構(gòu)類型;
(6)M0是網(wǎng)的初始標(biāo)識(shí),Mj是網(wǎng)的終止標(biāo)識(shí),且Mj是死標(biāo)識(shí);
(7)s∈T是活動(dòng)開始的變遷,e∈T是活動(dòng)終止的變遷.
則稱該網(wǎng)為流程模型Petri網(wǎng)。在此定義上,定義了網(wǎng)的前集和網(wǎng)的后集。
定義2[8](變遷發(fā)生規(guī)則) 一個(gè)四元組PN=(P,T;F,M0)稱為Petri網(wǎng),并具有下面的變遷發(fā)生規(guī)則:
(1)變遷t∈T具有發(fā)生權(quán),當(dāng)且僅當(dāng)對(duì)?p∈t:M(p)≥1,記作M[t>;
(2)在標(biāo)識(shí)M下能使得變遷t經(jīng)發(fā)生后,得到一個(gè)新的標(biāo)識(shí)M′,記作M[t>M′,則有
定義3[9](行為輪廓) 設(shè)(N,M0)是一個(gè)網(wǎng)系統(tǒng),其中N=(P,T,F),M0是初始標(biāo)識(shí),?(t1,t2)∈(T×T)滿足如下關(guān)系:
(1)若t1?t2且t2≯t1,則稱嚴(yán)格序關(guān)系,記作t1→t2;
(2)若t1?t2且t2≯t1,則稱排他序關(guān)系,記作t1+t2;
(3)若t1?t2且t2≯t1,則稱交叉序關(guān)系,記作t1‖t2;
若t1≯t2且t2?t1,則稱嚴(yán)格逆序關(guān)系,記作t1→-1t2,并將以上幾種關(guān)系構(gòu)成網(wǎng)N的行為輪廓,記為BP={→,→-1,+,‖}。
在視頻審核中,雖然目前引進(jìn)了計(jì)算機(jī)技術(shù)和人工智能學(xué)習(xí)算法,但仍需大量的人工對(duì)視頻進(jìn)行審核、抽測(cè),審核流程是否合理極大影響視頻審核的效率。依據(jù)某A網(wǎng)站的視頻審核流程,利用Petri網(wǎng)建立了模型如圖1所示(以下稱原模型):
圖1 視頻審核流程原模型
表1 圖1中變遷符號(hào)的含義
由圖1可知,原模型的流程為:在用戶投稿t0發(fā)生后,進(jìn)入平臺(tái)審核流程t1。t2和t6是排他關(guān)系記做t2+t6,根據(jù)用戶上傳時(shí)聲明的轉(zhuǎn)載還是原創(chuàng)進(jìn)入不同的流程。t2發(fā)生聲明轉(zhuǎn)載后,會(huì)對(duì)視頻進(jìn)行版權(quán)歸屬的檢查t3,t2和t3屬于嚴(yán)格序關(guān)系,記做t2→t3。根據(jù)該用戶對(duì)該視頻擁有的權(quán)利進(jìn)入排他關(guān)系的t4和t5中,沒有版權(quán)的t4發(fā)生后就會(huì)對(duì)稿件進(jìn)行退回,等待用戶處理;有版權(quán)的t5發(fā)生后會(huì)和原創(chuàng)的視頻的流程進(jìn)行合并。在t6原創(chuàng)發(fā)生后,進(jìn)行t7聲畫抽幀檢測(cè)和t10人工復(fù)檢的流程,檢測(cè)通過則進(jìn)入t13,檢測(cè)未通過則退回給用戶t14。聲畫抽幀檢測(cè)會(huì)過濾掉大部分的問題稿件,可以大大緩解人工檢測(cè)的壓力。
對(duì)于退回給用戶的稿件,用戶修改稿件(t15)后可以重新投稿,平臺(tái)會(huì)再次進(jìn)行審核。在此過程中,t14、t15和t0處于嚴(yán)格序關(guān)系,記做t14→t15→t0。
圖1構(gòu)建的原模型雖然較為完善,但在實(shí)際應(yīng)用中仍然存在以下問題:
1)侵權(quán)審查環(huán)節(jié)薄弱。由圖1可以看出,平臺(tái)只會(huì)依據(jù)用戶上傳時(shí)是否聲明原創(chuàng)而采取不同的措施,但有的稿件中可能夾雜著其他作者的視頻,或進(jìn)行了二次創(chuàng)作,或惡意聲明原創(chuàng)。又沒有利用技術(shù)手段進(jìn)行審查,很難將這些行為篩查出來,導(dǎo)致視頻侵權(quán)行為時(shí)有發(fā)生。
2)審核效率較低。由圖1可以看出整個(gè)審核過程只有一條流程,因此從上傳到發(fā)布需要等待較長(zhǎng)時(shí)間,特別是周末節(jié)假日等自媒體創(chuàng)作的高峰期,審核流程已經(jīng)飽和,無法加快審核速度,導(dǎo)致等待時(shí)間更長(zhǎng);或是在某個(gè)熱點(diǎn)爆發(fā)的時(shí)候,會(huì)有大量的稿件集中爆發(fā),如果還是按正常的流程審核的話可能會(huì)錯(cuò)過該熱點(diǎn)。
圖2 視頻審核流程優(yōu)化后模型
3)人工資源利用率低。調(diào)查顯示95%的網(wǎng)絡(luò)視頻是符合發(fā)布標(biāo)準(zhǔn)的,但是剩余的5%卻產(chǎn)生極大的社會(huì)危害。從圖1中可以看出,對(duì)所有的稿件都采用相同標(biāo)準(zhǔn)的人工復(fù)檢率,造成了人力資源的浪費(fèi)。人工審查應(yīng)重點(diǎn)應(yīng)用于敏感問題的審查,對(duì)于國(guó)家法律法規(guī)明令禁止的信息,機(jī)器在識(shí)別和判斷上有一定的限制,人工資源的優(yōu)勢(shì)將在這個(gè)環(huán)節(jié)凸顯。
針對(duì)問題1,平臺(tái)需要加強(qiáng)版權(quán)審查。提出在原模型基礎(chǔ)上增加部分檢測(cè)。對(duì)原創(chuàng)稿件增加臺(tái)標(biāo)檢測(cè)t7和重復(fù)片段檢測(cè)t12,臺(tái)標(biāo)是視頻平臺(tái)對(duì)本平臺(tái)視頻增加的一個(gè)標(biāo)識(shí),可以一定程度上說明版權(quán)歸屬問題,同時(shí)對(duì)故意抹除、打碼臺(tái)標(biāo)位置的稿件進(jìn)行重點(diǎn)檢查。重復(fù)片段可以證明稿件的原創(chuàng)率,綜合考量稿件的原創(chuàng)性。
針對(duì)問題2,增加一個(gè)審核排序因子,由該因子來決定調(diào)度也就是審核順序的問題,為了計(jì)算出調(diào)度因子,需要獲取該用戶相關(guān)信息t18-t28,計(jì)算出歷史被舉報(bào)概率t19、視頻熱點(diǎn)等級(jí)t22、影響力因子t26、歷史審核通過率t29、視頻號(hào)質(zhì)量t30,最終計(jì)算出審核排序因子t31,交由系統(tǒng)調(diào)度審核。
針對(duì)上述問題3,設(shè)置兩個(gè)人工復(fù)檢概率,對(duì)于一般主題的稿件采取低人工復(fù)查率t35,對(duì)于特殊主題稿件采取搞人工復(fù)查率t39,充分利用人工資源。t34、t38處于排他序關(guān)系,記做t34+t38,同樣t36和t37也屬于排他序關(guān)系,記做t36+t37。
表2 圖2中變遷符號(hào)的含義
PM4Py(process mining for python)是由弗勞恩霍夫應(yīng)用信息技術(shù)學(xué)院(FIT)的processmining小組開發(fā)的一款基于python的開源工具。該工具設(shè)計(jì)用于學(xué)術(shù)界和工業(yè)界,是一個(gè)領(lǐng)先的開源的過程挖掘平臺(tái)。因此,利用PM4PY建模并驗(yàn)證模型的穩(wěn)定性。
from pm4py.visualization.petrinet import PetriNet, Marking,factory as pn_vis_factory
from pm4py.objects.petri import check_soundness , utils
net = PetriNet("model2")# creating an empty Petri net
p_0 = PetriNet.Place("p_0")# creating place
......
p_45 = PetriNet.Place("p_45")
net.places.add(p_0)# add the places to the Petri Net
......
net.places.add(p_45)
t_0 = PetriNet.Transition("t_0", "t0")# Create transitions
......
t_42 = PetriNet.Transition("t_42", "t42")
net.transitions.add(t_0)# Add the transitions to the Petri Net
......
net.transitions.add(t_42)
utils.add_arc_from_to(p_0, t_1, net)# Add arcs
......
utils.add_arc_from_to(p_2, t_17, net)
initial_marking = Marking()# Adding tokens
initial_marking[p_0] = 1
initial_marking[p_45] = 1
final_marking = Marking()
final_marking[p_42] = 1
gviz = pn_vis_factory.apply(net, initial_marking,final_marking)#output graph
pn_vis_factory.save(gviz, "model2.svg")#save graph
checkr_result=check_soundness.check_stability_wfnet(net)#check soundness
圖3 程序自動(dòng)生成的原模型圖
圖4 程序自動(dòng)生成的優(yōu)化后模型圖
為了驗(yàn)證優(yōu)化模型是否具有良好的性質(zhì),利用PIPE(Petri網(wǎng)分析軟件)進(jìn)行仿真實(shí)驗(yàn),結(jié)果如圖5所示,優(yōu)化后的模型是有界、安全且無死鎖的。
圖5 優(yōu)化后的模型狀態(tài)空間分析結(jié)果
現(xiàn)階段的視頻審核的業(yè)務(wù)流程存在檢測(cè)效率低,檢測(cè)質(zhì)量不高等問題,增加了分時(shí)審核因子、臺(tái)標(biāo)檢測(cè)等步驟,優(yōu)化了視頻平臺(tái)檢測(cè)的流程模型,還加強(qiáng)了版權(quán)保護(hù)方面的驗(yàn)證,為視頻版權(quán)保護(hù)貢獻(xiàn)平臺(tái)力量。通過仿真實(shí)驗(yàn)表明,優(yōu)化后的模型有較好的穩(wěn)定性,并且是有界、安全和無死鎖的。因此可以將優(yōu)化后的模型應(yīng)用到視頻審核流程中。在研究中提出了幾個(gè)優(yōu)化的方向,未能給出具體的措施,僅僅是將其加入到模型中,未來考慮精進(jìn)優(yōu)化的方向及措施。文中引入PM4PY這個(gè)過程挖掘平臺(tái)來進(jìn)行驗(yàn)證工作,未來的研究著眼于提出更好的算法來輔助建模工作。