楚丹琪,李睿智,高洪皓,張 康
(1.上海大學(xué) 實(shí)驗(yàn)設(shè)備處,上海 200444; 2.上海大學(xué) 計(jì)算機(jī)學(xué)院,上海 200444; 3.上海大學(xué) 計(jì)算中心,上海 200444)
實(shí)驗(yàn)室是科技的搖籃,安全、健康、環(huán)保、節(jié)能是實(shí)驗(yàn)室的基本要素[1-3]。實(shí)驗(yàn)室安全教育是安全管理的重要內(nèi)容之一,充實(shí)的安全教育可以提高人們的認(rèn)識(shí)和安全素質(zhì),也是保障實(shí)驗(yàn)人員安全的第一道也是最重要的屏障。為了防患于未然,全方位保護(hù)實(shí)驗(yàn)人員和實(shí)驗(yàn)設(shè)備的安全十分必要。智慧實(shí)驗(yàn)室是以“互聯(lián)網(wǎng)+”為基礎(chǔ),采用先進(jìn)的信息化技術(shù)手段和軟硬件設(shè)備,實(shí)現(xiàn)對(duì)實(shí)驗(yàn)教學(xué)、科研和管理等實(shí)驗(yàn)室信息的收集、處理、監(jiān)管、存儲(chǔ)、傳輸和調(diào)用[4-5],使實(shí)驗(yàn)室資源得以充分優(yōu)化利用。
高校實(shí)驗(yàn)室的信息化存在以下亟待解決的問題:
(1)設(shè)備管理非自動(dòng)化。教學(xué)儀器和設(shè)備分布離散、管理難度大、無專人管理和保養(yǎng)等;信息獲取被動(dòng),存在空間障礙,對(duì)設(shè)備數(shù)量和種類繁多的實(shí)驗(yàn)室,管理人員難以準(zhǔn)確快速定位、跟蹤設(shè)備使用和維護(hù)。
(2)安全管理非智能化。實(shí)驗(yàn)室安全管理難以形成穩(wěn)固的體系,對(duì)各類潛在危險(xiǎn)的警告系統(tǒng)尚不完善[6],只能依賴于管理人員的責(zé)任心。隨著大量開放式實(shí)驗(yàn)教學(xué)的開展,對(duì)人員的智能監(jiān)控要求越來越高。
(3)環(huán)境管理非低碳化。機(jī)房的溫濕度、粉塵、噪聲等指標(biāo)未實(shí)現(xiàn)統(tǒng)一監(jiān)控和管理;實(shí)驗(yàn)室照明、設(shè)備供電、機(jī)器用電難以實(shí)現(xiàn)自動(dòng)化調(diào)節(jié),造成資源浪費(fèi)。
(4)資源管理非共享化。不同院系實(shí)驗(yàn)室之間資源利用和分配不協(xié)調(diào),資源共享難以實(shí)現(xiàn),存在“信息孤島”現(xiàn)象。
目前,國內(nèi)高校實(shí)驗(yàn)室安全工作多數(shù)由多個(gè)部門共同負(fù)責(zé),相關(guān)處室工作側(cè)重點(diǎn)不同。在這種不同職能處室分塊管理的管理體制下,容易出現(xiàn)部分管理職責(zé)交叉重復(fù)的現(xiàn)象,導(dǎo)致管理效率不高[7-8]。同時(shí),每個(gè)實(shí)驗(yàn)室面對(duì)的用戶群體不同,使用的儀器設(shè)備不同,如果全都進(jìn)行相同的實(shí)驗(yàn)室安全教育,會(huì)浪費(fèi)大量的人力、物力和財(cái)力,并達(dá)不到相應(yīng)的教育和預(yù)防效果。
在信息化不斷發(fā)展的時(shí)代,良好、真實(shí)的數(shù)據(jù)統(tǒng)計(jì)與挖掘可以為政策的制定提供有力的支持[9-10]。上海大學(xué)思安網(wǎng)是上海大學(xué)針對(duì)實(shí)驗(yàn)室安全和保護(hù)展開的全方位平臺(tái)。上海大學(xué)思安網(wǎng)不僅整合了上海大學(xué)用戶信息、在線學(xué)習(xí)、在線考試、上課考勤,而且記錄分析用戶的操作習(xí)慣和事故記錄。借助以上真實(shí)的數(shù)據(jù),文中提出安全信用的模型,通過這個(gè)模型可以將用戶的安全知識(shí)和安全技能的掌握情況進(jìn)行量化,從而為每個(gè)實(shí)驗(yàn)室具有針對(duì)性的安全事故預(yù)測(cè)奠定了基礎(chǔ)。
安全信用,是上海大學(xué)思安網(wǎng)運(yùn)用大數(shù)據(jù)分析技術(shù)客觀呈現(xiàn)個(gè)人的安全信用狀況。安全信用的評(píng)測(cè)通過對(duì)海量信息數(shù)據(jù)的綜合處理和評(píng)估,主要包含了用戶特質(zhì)、行為偏好、學(xué)習(xí)能力、考試成績、課程考勤和事故歷史六個(gè)維度。最后,通過歸一化處理綜合計(jì)算得出用戶的安全信用分?jǐn)?shù)。
安全信用主要包含用戶特質(zhì)、行為偏好、學(xué)習(xí)能力、考試成績、課程考勤、事故記錄六個(gè)維度,分別從用戶的各個(gè)方面反映其安全意識(shí)和安全行為。單維度評(píng)價(jià)方式中每一維度的最高分為100分,最低分0分。
用戶特質(zhì)主要從用戶身份、用戶背景綜合分析。用戶身份主要分為本科生、碩士生和博士生;相較于本科生而言,碩士生和博士生在安全信用方面具有知識(shí)積累的優(yōu)勢(shì);用戶背景主要考察用戶的學(xué)院和專業(yè)背景,尤其對(duì)于文科專業(yè)會(huì)有一定的背景優(yōu)勢(shì);同時(shí),不同的專業(yè)年級(jí)對(duì)安全知識(shí)積累沉淀也會(huì)有所不同[11]。
定義1:用戶特質(zhì)S1。
S1=α×(Pe+Pg)+β×(Pm+Pr)
(1)
其中,α表示學(xué)歷層次和專業(yè)年級(jí)在評(píng)價(jià)中所占權(quán)重,β表示專業(yè)性質(zhì)在評(píng)價(jià)中所占權(quán)重,并且滿足條件α+β=1;Pe,Pg,Pm,Pr表示學(xué)歷、年級(jí)、專業(yè)和高危專業(yè)的權(quán)重。
行為偏好主要從用戶的操作行為進(jìn)行分析,用戶的操作習(xí)慣往往可以反映用戶現(xiàn)實(shí)生活中的習(xí)慣,比如:用戶是否具有良好的登錄和注銷的習(xí)慣,用戶學(xué)習(xí)和考試是否存在作弊現(xiàn)象。
定義2:行為偏好S2。
S2=∑α×Nc-∑β×Ne
(2)
其中,α和β分別表示某類良好習(xí)慣和不良習(xí)慣發(fā)生的權(quán)重;Nc和Ne表示某類良好習(xí)慣和不良習(xí)慣發(fā)生的次數(shù)。
學(xué)習(xí)能力主要從用戶在線學(xué)習(xí)進(jìn)行分析,人的注意力集中的時(shí)間跟年齡、學(xué)習(xí)時(shí)間和學(xué)習(xí)難度有聯(lián)系。用戶的年齡直接影響用戶學(xué)習(xí)的注意力,為了方便計(jì)算,針對(duì)年齡采用線性變換。
定義3:年齡S3。
S3=100-Ua
(3)
其中,Ua表示用戶的年齡。
用戶每天平均學(xué)習(xí)時(shí)間的長短、學(xué)習(xí)時(shí)間段均是影響用戶學(xué)習(xí)程度的因素,下面給出學(xué)習(xí)時(shí)間的定義。
定義4:學(xué)習(xí)時(shí)間S4。
(4)
其中,T表示正常學(xué)習(xí)時(shí)間中間值,按照正常學(xué)習(xí)時(shí)間范圍40~60 min之間,故T應(yīng)該取值50;η表示不同時(shí)間段的權(quán)重系數(shù),將24小時(shí)劃分為4部分:深夜、上午、下午、夜晚,每部分的權(quán)重系數(shù)分別為0.1、0.8、0.6、0.5。
上海大學(xué)思安網(wǎng)針對(duì)每類資源均定義了學(xué)習(xí)難度,學(xué)習(xí)的內(nèi)容難度越大,表示用戶的學(xué)習(xí)能力越高,于是下面給出了學(xué)習(xí)難度的定義。
定義5:學(xué)習(xí)難度S5。
(5)
其中,N表示學(xué)習(xí)資源總數(shù);σi表示第i個(gè)資源的難度系數(shù)。
所有用戶的學(xué)習(xí)能力可以看作是符合正態(tài)分布,同時(shí)根據(jù)定義3~5,給出學(xué)習(xí)能力的定義。
定義6:用戶學(xué)習(xí)能力S6。
(6)
其中,c1,c2,c3表示用戶年齡、學(xué)習(xí)時(shí)間、學(xué)習(xí)難度的權(quán)重系數(shù);α表示整體權(quán)重系數(shù);μ表示正態(tài)分布的位置參數(shù),μ=75。
考試成績主要從用戶參加考試的考試結(jié)果進(jìn)行分析,用戶的考試成績?cè)礁?,其安全知識(shí)掌握程度越高。
定義7:考試成績S7。
(7)
其中,N表示用戶參加的考試數(shù)目;Score(i)表示用戶參加的第i個(gè)安全考試的考試成績。
課程考勤主要從用戶上課考勤情況進(jìn)行分析,上課情況可以從側(cè)面反映出用戶的學(xué)習(xí)態(tài)度。
定義8:課程考勤S8:
(8)
其中,n表示出勤次數(shù);N表示應(yīng)該出勤次數(shù);T表示課程總數(shù)。
信用歷史主要從用戶過去發(fā)生過的安全事故和安全預(yù)防的事件進(jìn)行計(jì)算,這是最客觀反映用戶安全信用的方式。文中信用歷史采用指數(shù)函數(shù)表示,以提高初始的變化率。
定義9:信用歷史S9。
S9=-e-(α×Np-β×Na)+100
(9)
其中,α,β分別表示預(yù)防事故的權(quán)重和安全事故發(fā)生的權(quán)重,α+β=1;Np,Na分別表示預(yù)防事故的數(shù)量和安全事故發(fā)生的數(shù)量。
文中的安全信用評(píng)價(jià)方式主要是通過對(duì)每一個(gè)維度分別進(jìn)行評(píng)價(jià),最后綜合計(jì)算得出用戶的安全信用分?jǐn)?shù)。安全信用分?jǐn)?shù)的高低可以反映出用戶的安全知識(shí)和安全技術(shù)的掌握情況。那么,如何將六個(gè)維度歸一化成安全信用,文中采用六個(gè)維度來計(jì)算安全信用,并將這六個(gè)維度放置到一個(gè)六維坐標(biāo)系中。安全信用值的計(jì)算如下所示:
(10)
實(shí)驗(yàn)室事故預(yù)測(cè)主要是基于用戶安全信用的六個(gè)維度來進(jìn)行。首先根據(jù)用戶六個(gè)維度,將用戶聚集為三類:高危人群、潛在危險(xiǎn)人群、安全人群,下面會(huì)詳細(xì)介紹用戶的分類方法;接著根據(jù)實(shí)驗(yàn)室面對(duì)的人群重點(diǎn)分析高危人群和潛在問題人群,從學(xué)習(xí)內(nèi)容和考試成績中重點(diǎn)分析知識(shí)漏洞,從而預(yù)測(cè)安全事故。
根據(jù)安全信用公式計(jì)算出用戶的安全信用后,根據(jù)用戶安全信用進(jìn)行第一次聚類[12-13],這次聚類主要分為兩類人群:安全人群和危險(xiǎn)人群。聚類原則如下:
(1)安全人群應(yīng)該滿足安全信用分大于等于220分,安全信用分達(dá)到這個(gè)層次可以表明用戶的六個(gè)維度的平均分不低于90分,用戶具有良好的安全知識(shí)和安全技術(shù)的積累。
(2)危險(xiǎn)人群滿足安全信用分?jǐn)?shù)低于220分,這部分用戶在安全意識(shí)方面還有一定的欠缺。
根據(jù)第一次用戶聚類方式可以區(qū)分安全人群和危險(xiǎn)人群,但是在危險(xiǎn)人群中,并非每一個(gè)用戶需要進(jìn)行關(guān)注。那么,文中采用K-means算法對(duì)第一次聚類中的危險(xiǎn)人群進(jìn)行了第二次聚類[14],這次聚類主要分為:高危人群和潛在問題人群。聚類算法如下:
(1)首先根據(jù)用戶信用分與閾值220分做比較,如果大于等于220分則將該用戶劃分至安全人群中,如果低于220分則劃分至危險(xiǎn)人群中;
(2)確定用戶行為向量,經(jīng)過實(shí)際分析,公式為:
V={a1,a2,…,a6}
(11)
其中,a1,a2,…,a6分別為某個(gè)用戶的六個(gè)維度。
(3)隨機(jī)選擇k個(gè)初始聚類中心:
Centerk={C1k,C2k,…,C6k}
(12)
其中,k應(yīng)滿足k=2。
(4)s∈S,其中S為樣本集合,根據(jù)歐幾里得公式計(jì)算S距離所有聚類中心的距離,將s劃分到距離最近的中心Center的集合內(nèi)。
(5)重新計(jì)算聚類Center的中心,使用各個(gè)點(diǎn)的坐標(biāo)的平均值來求點(diǎn)群新的中心點(diǎn)。若產(chǎn)生新的中心點(diǎn),執(zhí)行第3步;若中心點(diǎn)不再發(fā)生改變,執(zhí)行第5步。
(6)使用歐幾里得公式計(jì)算2個(gè)聚類中心距離原點(diǎn)的距離,聚類中心距離原點(diǎn)更近的聚類簇為高危人群,距離較遠(yuǎn)的聚類簇為潛在問題人群。
聚類算法如下:
算法1:用戶聚類算法。
輸入:用戶安全信用的六個(gè)維度信息及S1,S2,S6,S7,S8,S9評(píng)價(jià)分S
輸出:安全人群Groupsafe、高危人群Groupdanger和潛在問題人群Grouppotential
BEGIN
n=0
FOR EACHi=1 TOm
IFSi≥220 THEN
Groupsafe=Groupsafe∪i
ELSE
vi={a1,a2,a6,a7,a8,a9}
n=n+1
ENDIF
ENDFROEACH
FOR EACHi=1 TO 2
Random(Centeri)
ENDFROEACH
Group1={}
Group2={}
WHILE (Center is not change)
FOR EACHiINn
IFDisCenter1≥DisCenter2THEN
Group1=Group1∪i
ELSE
Group2=Group2∪i
ENDIF
ENDFOREACH
FOR EACHi=1 TO 2
Update(Centeri)
ENDIF
ENDWHILE
IFDisO&Center1≥DisO&Center2THEN
Grouppotential=Group1
Groupdanger=Group2
ELSE
Groupdanger=Group1
Grouppotential=Group2
ENDIF
END
根據(jù)3.1節(jié),將用戶聚類為高危人群、潛在危險(xiǎn)人群、安全人群三類,本節(jié)的安全事故預(yù)測(cè)算法將重點(diǎn)關(guān)注高危人群和潛在危險(xiǎn)人群。將安全事故定義為五類:火或水災(zāi)性事故、毒害性事故、爆炸性事故、機(jī)械性事故和電氣性事故;上海大學(xué)思安網(wǎng)中的安全知識(shí)學(xué)習(xí)和考試也分為六類:通識(shí)類、化學(xué)類、輻射類、醫(yī)學(xué)生物類、電氣類和機(jī)械類。定義的對(duì)應(yīng)關(guān)系如表1所示。
表1 安全事故、學(xué)習(xí)和考試分類對(duì)應(yīng)關(guān)系
在現(xiàn)實(shí)生活中每一個(gè)實(shí)驗(yàn)室或高危場所都面對(duì)一些固定的用戶群,根據(jù)3.1節(jié)可以將固定的用戶群進(jìn)行用戶類型劃分,從而抽取高危人群和潛在危險(xiǎn)人群的數(shù)據(jù)進(jìn)行分析。每一類事故發(fā)生的概率取決于兩類人群發(fā)生事故的概率,于是得到每一類事故發(fā)生的概率公式:
Pc=α×Pd+β×Pp
(13)
其中,Pd和Pp表示高危人群和潛在危險(xiǎn)人群在該類事故中發(fā)生的概率;α和β表示權(quán)重系數(shù)。
那么,某類人群發(fā)生某類安全事故的概率,則可以直接由這類人群學(xué)習(xí)情況和考試情況來進(jìn)行反映,于是可以得到如下公式:
(14)
(15)
其中,Learni表示第i個(gè)用戶學(xué)習(xí)某類資源的數(shù)量;Total表示某類學(xué)習(xí)資源的總量;Examij表示第i個(gè)用戶參加某類第j次考試的成績;N表示該用戶參加考試的總數(shù);group表示人群總數(shù)。
可得到某類人群發(fā)生某類安全事故的概率公式:
Pgroup=η×PL+σ×PE
(16)
其中,η,σ表示權(quán)重系數(shù),并且滿足η+σ=1。
文中的安全信用評(píng)價(jià)體系和實(shí)驗(yàn)室安全事故預(yù)測(cè)算法均在上海大學(xué)思安網(wǎng)中實(shí)現(xiàn),實(shí)際運(yùn)行過程中分析相關(guān)數(shù)據(jù)量可以參考表2(截止2016年7月25日星期一)。算法中相關(guān)權(quán)重系數(shù)對(duì)的參數(shù)初始化可以參考表3。
表2 算法分析相關(guān)數(shù)據(jù)量
通過對(duì)上海大學(xué)所有用戶進(jìn)行安全信用評(píng)價(jià),并且針對(duì)5個(gè)實(shí)驗(yàn)室進(jìn)行安全事故預(yù)測(cè)來驗(yàn)證算法的合理性。上海大學(xué)思安網(wǎng)自動(dòng)根據(jù)用戶的相關(guān)數(shù)據(jù)進(jìn)行六個(gè)維度的評(píng)價(jià)(相關(guān)維度定義參考2.1節(jié)),最終給出用戶的安全信用維度評(píng)價(jià),可以參考圖1。
表3 相關(guān)權(quán)重系數(shù)對(duì)的參數(shù)初始化
圖1 用戶的安全信用維度示意圖
上海大學(xué)思安網(wǎng)在完成維度評(píng)價(jià)后,根據(jù)2.2節(jié)進(jìn)行歸一化處理。系統(tǒng)默認(rèn)展示用戶近半年的安全信用變化情況,可以參考表4。
表4 安全信用變化情況(學(xué)生14721185)
安全事故預(yù)測(cè)的重點(diǎn)是根據(jù)用戶群的知識(shí)漏洞來預(yù)測(cè)實(shí)驗(yàn)室事故。表5展示的是4個(gè)實(shí)驗(yàn)室安全事故預(yù)測(cè)統(tǒng)計(jì)情況,標(biāo)注了事故類型和事故發(fā)生的概率。
表5 實(shí)驗(yàn)室安全事故預(yù)測(cè)統(tǒng)計(jì)情況 %
上海大學(xué)實(shí)驗(yàn)室安全教育綜合管理平臺(tái)是針對(duì)高校實(shí)驗(yàn)室安全的問題提出的一種新型教育模式;同時(shí)在智慧實(shí)驗(yàn)的背景下,提出了安全信用的概念,將用戶的安全知識(shí)和安全技能的掌握情況進(jìn)行量化,形成一套完整的評(píng)價(jià)體系。根據(jù)用戶的安全信用,將用戶進(jìn)行分類,找出危險(xiǎn)用戶和知識(shí)漏洞,從而預(yù)測(cè)實(shí)驗(yàn)室安全事故。在后續(xù)的工作中將把安全信用評(píng)價(jià)應(yīng)用到更加廣泛的實(shí)驗(yàn)室預(yù)約等功能中,為更安全、更便捷的實(shí)驗(yàn)室管理提供保障。
參考文獻(xiàn):
[1] MASSIE D L,CAMPBELL K L,WILLIAMS A F.Traffic accident involvement rates by driver age and gender[J].Accident Analysis and Prevention,1995,27(1):73-87.
[2] KOO J,KIM S,KIM H,et al.A systematic approach towards accident analysis and prevention[J].Drug Discovery Today,2015,20(7):856-862.
[3] WU Lirong,JIANG Zhongan,CHENG Weimin,et al.Major accident analysis and prevention of coal mines in China from the year of 1949 to 2009[J].Mining Science & Technology,2011,21(5):693-699.
[4] AKYUZ E,CELIK M,AKYUZ E,et al.Utilisation of cognitive map in modelling human error in marine accident analysis and prevention[J].Safety Science,2014,70:19-28.
[5] 鄭 祿,常 佳.基于Arduino與Python的實(shí)驗(yàn)室聯(lián)動(dòng)門禁報(bào)警系統(tǒng)設(shè)計(jì)[J].軟件導(dǎo)刊,2017,16(1):76-77.
[6] 張 博.基于GA-BP神經(jīng)網(wǎng)絡(luò)的高校實(shí)驗(yàn)室安全評(píng)價(jià)研究[J].微處理機(jī),2016,37(2):51-55.
[7] MARSAGLIA G.Evaluating the normal distribution[J].Journal of Statistical Software,2004,11(5):1-11.
[8] RANI A J M,PARTHIPAN L.Clustering analysis by improved particle swarm optimization and K-means algorithm[C]//IET Chennai 3rd international conference on sustainable energy and intelligent systems.[s.l.]:[s.n.],2012:83-88.
[9] 王國強(qiáng),吳 敏.實(shí)驗(yàn)室安全防范智能化系統(tǒng)的組成與應(yīng)用[J].實(shí)驗(yàn)技術(shù)與管理,2008,25(4):151-155.
[10] 吳文華,馬升燈,沈水富.提高安全意識(shí),預(yù)防高校實(shí)驗(yàn)室安全事故發(fā)生[J].科技風(fēng),2015(23):189.
[11] 丁智斌,袁 方,董賀偉.數(shù)據(jù)挖掘在高校學(xué)生學(xué)習(xí)成績分析中的應(yīng)用[J].計(jì)算機(jī)工程與設(shè)計(jì),2006,27(4):590-592.
[12] 馬 闖,吳 濤,段夢(mèng)雅.基于K近鄰隸屬度的聚類算法研究[J].計(jì)算機(jī)工程與應(yīng)用,2016,52(10):55-58.
[13] 徐向平,魯海燕,徐 迅.基于環(huán)形鄰域的混沌粒子群聚類算法[J].計(jì)算機(jī)工程與應(yīng)用,2016,52(2):54-60.
[14] HAMIDA E B,JAVED M A.Channel-aware ECDSA signature verification of basic safety messages with K-Means clustering in VANETs[C]//International conference on advanced information networking and applications.Crans-Montana,Switzerland:IEEE,2016:603-610.