王紅霞,董沖沖,陳 亮
(沈陽理工大學(xué) a.信息科學(xué)與工程學(xué)院;b.自動化與電氣工程學(xué)院,沈陽 110159)
卷積神經(jīng)網(wǎng)絡(luò)在藥品冷鏈監(jiān)控系統(tǒng)中的應(yīng)用
王紅霞a,董沖沖b,陳 亮b
(沈陽理工大學(xué) a.信息科學(xué)與工程學(xué)院;b.自動化與電氣工程學(xué)院,沈陽 110159)
為了低溫藥品在倉儲、運輸?shù)人嗅t(yī)藥冷鏈環(huán)節(jié)中,能夠保證藥品的療效,即針對藥品的環(huán)境敏感性強、保存期限短、追溯需求大等問題,基于卷積神經(jīng)網(wǎng)絡(luò)算法,設(shè)計了藥品冷鏈監(jiān)控系統(tǒng)。通過不斷改變卷積神經(jīng)網(wǎng)絡(luò)中的卷積核和抽取比例來得出最適合本系統(tǒng)的網(wǎng)絡(luò)參數(shù),從而能夠更加準確地判斷出藥品庫房中的溫濕度數(shù)據(jù)是否存在人為干擾日常記錄及故障現(xiàn)象。實驗結(jié)果表明:選取的輸入數(shù)據(jù)為2×160,第一層的卷積核為2×17,抽取比例為1∶3;第二層選取的卷積核為1×11,抽取比例為1∶2,這時得出的錯誤率最低為1.2%。
藥品冷鏈監(jiān)控系統(tǒng);卷積神經(jīng)網(wǎng)絡(luò);卷積核;抽取比例;人為干擾日常記錄
在醫(yī)藥產(chǎn)品中,人們越來越關(guān)注冷藏藥品的安全,它直接關(guān)系著民生和社會穩(wěn)定[1]。疫苗、血液、生物藥劑等冷鏈藥品市場不斷擴大,對藥品冷鏈的要求也逐步提高,藥品冷鏈質(zhì)量管理面臨著重大的機遇和挑戰(zhàn)[2]。然而由于藥品庫房(冷庫、陰涼庫、常溫庫、冷藏車、保溫箱…)種類較多,當(dāng)用戶進入藥品庫房現(xiàn)場查看溫濕度數(shù)據(jù)時,需要把每個庫房都檢查一次,這樣不僅浪費了大量的時間,而且管理水平較低,效果也不是很明顯,由此可見人為操作不易達到隨時隨地監(jiān)控的目的。在此情形下發(fā)展起來的藥品冷鏈監(jiān)控系統(tǒng)成為人們熱點關(guān)注的應(yīng)用技術(shù)之一,它不僅節(jié)省了時間,效率變得更高,而且適應(yīng)性更強,以方便、直觀、信息內(nèi)容全面而被廣泛應(yīng)用于各種藥品庫房當(dāng)中。
近年來,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network)是廣泛應(yīng)用的一種高效識別方法,已經(jīng)成為許多科學(xué)領(lǐng)域的研究熱點之一,尤其是在二維圖像處理、機器視覺和模式識別中[3-4]。卷積神經(jīng)網(wǎng)絡(luò)是計算機深度學(xué)習(xí)的一種算法,是一種前饋神經(jīng)網(wǎng)絡(luò)。CNN包括比權(quán)重更多的連接,這時結(jié)構(gòu)本身就類似于實現(xiàn)了一種形式的正則化[5]。另外因為CNN本身結(jié)構(gòu)的復(fù)雜關(guān)系,還有某種程度上的平移不變性。在輸入過程中,這種特別的CNN以數(shù)據(jù)驅(qū)動的形式通過自動學(xué)習(xí)過濾器的方法來提取圖像特征[6]。本文采用傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),包括輸入層、卷積層、子采樣層、全連接層、輸出層[7],在溫濕度數(shù)據(jù)適度預(yù)處理條件下,通過不斷訓(xùn)練卷積核和抽取比例使卷積神經(jīng)網(wǎng)絡(luò)能夠更加有效地提取特征,獲得更好的識別效果。
常見的5種藥品庫房的溫度和濕度的數(shù)據(jù)標準范圍如表1所示。
表1 溫濕度標準數(shù)據(jù)
在某段時間內(nèi)采集到的藥品常溫庫的溫濕度數(shù)據(jù)如表2所示,其中T和H表示的是溫度和濕度。
表2 溫濕度數(shù)據(jù)
以藥品常溫庫庫房為例,在現(xiàn)場每2min采集一次溫濕度數(shù)據(jù),然后選取某一段時間的溫度和濕度數(shù)據(jù)作為輸入數(shù)據(jù)。標準輸出結(jié)果(故障診斷情況)如表3所示。正常數(shù)據(jù)指在藥品庫房里測到的無任何改動的原始數(shù)據(jù);人為干擾數(shù)據(jù)指藥品庫房內(nèi)的溫濕度在不達標的情況下,庫房的管理者在測量溫濕度表的附近采取一些能夠調(diào)整數(shù)據(jù)的措施,來使這些數(shù)據(jù)達標,這時測到的數(shù)據(jù)為人為干擾數(shù)據(jù)。
表3 標準輸出結(jié)果
卷積神經(jīng)網(wǎng)絡(luò)是一個多層的神經(jīng)網(wǎng)絡(luò),每層由多個二維平面組成,每個平面由多個獨立神經(jīng)元組成[8]。卷積神經(jīng)網(wǎng)絡(luò)的特征檢測層通過訓(xùn)練數(shù)據(jù)來進行學(xué)習(xí),避免了顯式的特征提取,是隱式地從訓(xùn)練數(shù)據(jù)中進行學(xué)習(xí)特征,且由于同一特征映射面上的神經(jīng)元權(quán)值相同,所以網(wǎng)絡(luò)可以并行學(xué)習(xí)[9]。
將經(jīng)過預(yù)處理的大量的藥品庫房的溫濕度數(shù)據(jù)輸入卷積神經(jīng)網(wǎng)絡(luò)中,采用與LeNet-5[10]結(jié)構(gòu)類似的網(wǎng)絡(luò),通過對卷積層和子采樣層的優(yōu)化,診斷出人為干擾日常記錄狀況。對應(yīng)特征的提取與分類的模型[11],如圖1所示。
圖1 卷積神經(jīng)網(wǎng)絡(luò)模型
卷積神經(jīng)網(wǎng)絡(luò)有許多種網(wǎng)絡(luò)結(jié)構(gòu),藥品冷鏈監(jiān)控系統(tǒng)用到的卷積神經(jīng)網(wǎng)絡(luò)的卷積過程如圖2所示,其主要由輸入層、卷積層、子采樣層、全連接層、輸出層組成。
圖2 CNN的卷積過程
2.1 卷積層
在一個卷積層中,前層的特征映射數(shù)據(jù)是先進行卷積核運算,然后再放入一個激活函數(shù)來得到特征映射數(shù)據(jù)作為輸出,每個輸出數(shù)據(jù)由許多個數(shù)據(jù)的卷積組合而成,如式(1)所示。
(1)
2.2 子采樣層
一個子采樣層可以生成輸入數(shù)據(jù)的下采樣版本。如圖2所示,在第一次卷積(C1層)有M個特征數(shù)據(jù)輸入,那么在第一次采樣(S1層)就有M個特征數(shù)據(jù)輸出;在第二次卷積(C2層)有N個特征數(shù)據(jù)輸入,那么在第二次采樣(S2層)就有N個特征數(shù)據(jù)輸出。M和N可以相等,子采樣層的公式為
(2)
式中down(·)為一個子采樣函數(shù)。通常這個函數(shù)會在第一個子采樣層(C1層到S1層之間的子采樣層)輸入數(shù)據(jù)中每個不同的1×m的塊上執(zhí)行加操作,這樣這個輸出數(shù)據(jù)在時間維度上就達到原來的1/m;這個函數(shù)會在第二個子采樣層(C2層到S2層之間的子采樣層)輸入數(shù)據(jù)中每個不同的1×n的塊上執(zhí)行操作,這時這個輸出數(shù)據(jù)在時間維度上就是原來的1/n。每個輸出數(shù)據(jù)都有自己相對應(yīng)的乘性偏置參數(shù)β和一個加性偏置參數(shù)b。第一次卷積完之后得到的數(shù)據(jù),在經(jīng)過C1層到S1層之間的子采樣層時,抽取數(shù)據(jù)的比例為1∶m,這個比例表明在每m個數(shù)據(jù)當(dāng)中選取最大的一個數(shù)據(jù),作為子采樣層的輸出,經(jīng)過該層后壓縮了時間維度上的數(shù)據(jù)。在第二次卷積完之后,經(jīng)過C2層到S2層之間的二次子采樣時,抽取的比例為1∶n,此時這個比例表明在每n個數(shù)據(jù)當(dāng)中選取最大的一個數(shù)據(jù),m和n可以相等,然后一直循環(huán)下去,最后輸出訓(xùn)練的結(jié)果。
3.1 損失函數(shù)
經(jīng)過數(shù)據(jù)預(yù)處理和權(quán)重初始化之后,需要有一個評估準則去評估預(yù)測值和真實結(jié)果之間的吻合度,也就是損失函數(shù)。實際上是計算出了每個樣本上的Loss,再求平均之后的一個形式,如式(3)所示。
(3)
式中N是訓(xùn)練數(shù)據(jù)的個數(shù)。由于系統(tǒng)中的數(shù)據(jù)集中每個樣本都有一一對應(yīng)的標簽,所以選擇的損失函數(shù)為Softmax分類器中的互熵損失,如式(4)所示。
(4)
式中f表示激活函數(shù)。
3.2 網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)
卷積層當(dāng)中的卷積核和子采樣層中的抽取比例的選取決定著訓(xùn)練溫濕度數(shù)據(jù)結(jié)果的錯誤率。針對三種不同大小的樣本,分別選取不同的卷積核和抽取比例,訓(xùn)練網(wǎng)絡(luò)并計算輸出結(jié)果的錯誤率。每種溫濕度數(shù)據(jù)樣本包含人為干擾數(shù)據(jù)樣本和正常數(shù)據(jù)樣本各1000個,從中任意選取1400個樣本作為訓(xùn)練集,再從這1400個樣本當(dāng)中任意選取400個樣本作為驗證集,剩下的600個樣本作為測試集。
由于在現(xiàn)場是2min記錄一次數(shù)據(jù),所以一天24h記錄720個數(shù)據(jù),圖3為某藥品常溫庫房某一整天的人為干擾的溫濕度走勢圖,1代表濕度,變化的范圍為50~70,2代表溫度,變化的范圍為10~20。
圖3 24h的溫濕度走勢圖
方案一:保存藥品庫房的溫濕度會隨著外界環(huán)境的溫濕度變化而變化,所以人為干擾有可能發(fā)生在全天或在某個時間段內(nèi),并且為了把開門取藥這一時間段的微小擾動和一些正常的擾動及發(fā)生故障的擾動囊括進來,選取一個樣本集為2×40,每個樣本里有溫度和濕度數(shù)據(jù)各40個。選取不同的卷積核和抽取比例訓(xùn)練的錯誤率如表4所示。錯誤率的公式為
(5)
式中FP(False positives)指被錯誤地劃分為正例的個數(shù),即實際為負例但被分類器劃分為正例的實例數(shù);FN(False negatives)指被錯誤地劃分為負例的個數(shù),即實際為正例但被分類器劃分為負例的實例數(shù);P表示所有正例的個數(shù);N表示所有負例的個數(shù)。正確率的公式為
accuracy=1-errorrate
(6)
表4 方案一卷積核和抽取比例的選取
由表4得出:在方案一里,C1層選取的卷積核為2×5,S1層選取的抽取比例為1∶3;C2層選取的卷積核為1×3,S2層選取的抽取比例為1∶2,這時得出的錯誤率最低為3.3%。
方案二:選取一個樣本集為2×160,每個樣本里有溫度和濕度數(shù)據(jù)各160個。為了能夠更加清楚地表示出一天不同的時間段所對應(yīng)的溫濕度的變化情況,這個樣本集主要在早上、中午和晚上這三個時間段內(nèi)選取。選取不同的卷積核和抽取比例訓(xùn)練的錯誤率如表5所示。
表5 方案二卷積核和抽取比例的選取
由表5得出:在方案二里,C1層選取的卷積核為2×17,S1層選取的抽取比例為1∶3;C2層選取的卷積核為1×11,S2層選取的抽取比例為1∶2,這時得出的錯誤率最低為1.2%。
方案三:考慮到每天的溫濕度都在變化,選取一個樣本集為2×720,每個樣本里有溫度和濕度數(shù)據(jù)各720個,這樣既表明了白天的變化也了解了晚上的情況。選取不同的卷積核和抽取比例訓(xùn)練的錯誤率如表6所示。
表6 方案三卷積核和抽取比例的選取
由表6得出:在方案三里,C1層選取的卷積核為2×79,S1層選取的抽取比例為1∶3;C2層選取的卷積核為1×55,S2層選取的抽取比例為1∶2,這時得出的錯誤率最低為4.3%。
通過比較以上三個方案的結(jié)果得出,方案二的結(jié)果比較理想。由圖3可以得出24h的溫濕度變化情況,其中每160個數(shù)據(jù)既能包含不同階段的變化情況,又能包括正常的擾動情況和發(fā)生故障的情況??紤]到藥品庫房的溫濕度數(shù)據(jù)樣本采集不易,選取一個樣本集為2×160。方案二不僅在采集樣本上節(jié)約了時間,而且既能包括方案一所涉及到的問題又能包括方案三所考慮的問題,所以選用這一方案用來測試某一時間段內(nèi)的數(shù)據(jù)是否存在人為干擾較為準確。如果測試某一天或連續(xù)幾天時,這時方案三比較簡捷,但方案三的準確率不是很高。另外樣本的數(shù)據(jù)量比較大;采集數(shù)據(jù)花費的時間比較多;樣本不易獲取。因此本系統(tǒng)選擇方案二中所設(shè)計的參數(shù)為C1層選取的卷積核2×17,S1層選取的抽取比例1∶3;C2層選取的卷積核1×11,S2層選取的抽取比例1∶2。本方案的錯誤率不是很理想,對實驗的條件和方法還有待提高。C1(卷積)層的訓(xùn)練結(jié)果如圖4所示,x軸表示卷積核內(nèi)數(shù)值變化的范圍,y軸表示訓(xùn)練的次數(shù),z軸表示經(jīng)過訓(xùn)練之后卷積核內(nèi)某一數(shù)值的個數(shù)。
圖4 C1層的卷積結(jié)果
關(guān)于損失函數(shù)(吻合度)的訓(xùn)練結(jié)果如圖5所示,x軸代表訓(xùn)練的次數(shù),y軸代表loss的值,值越小表示吻合度越高,從而錯誤率越低,網(wǎng)絡(luò)的識別效果就越好。
圖5 損失函數(shù)的訓(xùn)練結(jié)果
本文設(shè)計的藥品冷鏈監(jiān)控系統(tǒng)主要是通過卷積神經(jīng)網(wǎng)絡(luò)算法辨別出藥品庫房中的溫濕度數(shù)據(jù)是否存在人為干擾現(xiàn)象及故障情況,從而保證藥品庫房中的溫濕度能夠達到保存藥品的指標。通過以上三個方案得出,方案二當(dāng)中的卷積核和抽取比例,能夠使此算法達到最佳的理想效果,更加準確地判斷出是否出現(xiàn)故障或是正常的干擾。缺點:方案二所達到的錯誤率不是很理想,中間出的差錯較多,另外在采集樣本時要考慮多方條件,所以本方案還有待提高。
本系統(tǒng)利用卷積神經(jīng)網(wǎng)絡(luò)算法快速、高效地分類壓縮溫度、濕度數(shù)據(jù),提取有效特征,從而診斷出不同的故障情況。此算法在本文中是用來對藥品冷鏈的溫濕度數(shù)據(jù)的處理,這與以往在圖像當(dāng)中的應(yīng)用有所不同,完善了藥品冷鏈監(jiān)控系統(tǒng)。
[1] 郭莉莎.第三方冷鏈物流企業(yè)營銷策略研究[J].中國科技信息,2010(20):194-195.
[2] 張曉歡.我國醫(yī)藥冷鏈物流的發(fā)展狀況與對策研究[J].管理觀察,2015(8):151-154.
[3] 蔡娟,蔡堅勇,廖曉東,等.基于卷積神經(jīng)網(wǎng)絡(luò)的手勢識別初探[J].計算機系統(tǒng)應(yīng)用,2015,24(4):113-117.
[4] Lawrence S,Giles C L,Tsoi A C,et al.Face recognition:A convolutional neural network approach[J].IEEE Trans.on Neural Networks,1997,8(1):98-113.
[5] 呂國豪,羅四維,黃雅平,等.基于卷積神經(jīng)網(wǎng)絡(luò)的正則化方法[J].計算機研究與發(fā)展,2014,51(9):1891-1900.
[6] Ji S,Yang M,Yu K.3D Convolutional Neural Networks for Human Action Recognition[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2013,35(1):221-231.
[7] 費建超,芮挺,周遊,等.基于梯度的多輸入卷積神經(jīng)網(wǎng)絡(luò)[J].光電工程,2015,42(3):33-38.
[8] Silver D,Huang A,Maddison C J,et al.Mastering the game of Go with deep neural networks and tree search.[J].Nature,2016,57(6):484-489.
[9] 王力,王小華,王莉.神經(jīng)網(wǎng)絡(luò)在車牌識別中的應(yīng)用[J].微型機與應(yīng)用,2011,30(5):38-40.
[10] Lecun Y,Bottou L,Bengio Y,et al.Gradient-based learning applied to document recognition[J].Proceedings of the IEEE,1998,86(11):351-356.
[11] 趙志宏,楊紹普,馬增強.基于卷積神經(jīng)網(wǎng)絡(luò) LeNet-5 的車牌字符識別研究[J].系統(tǒng)仿真學(xué)報,2010,22(3):638-641.
[12] Bouvrie J.Notes on Convolutional Neural Networks[J].Neural Nets,2006(6):123-127.
(責(zé)任編輯:馬金發(fā))
ApplicationofConvolutionNeuralNetworkinDrugColdChainMonitoringSystem
WANG Hongxia,DONG Chongchong,CHEN Liang
(Shenyang Ligong University,Shenyang 110159,China)
For low-temperature drugs in storage,transportation and all pharmaceutical cold chain links,drug cold chain monitoring system is designed to ensure drug efficacy by the convolution neural network algorithm,which could solve proktems of strong environmental sensitivity,short shelf life and large traceability.Through changing the convolution kernel and decimation ratio in the convolution neural network,the convolution neural network parameters to be obtained are the most suitable for system,which means that the temperature and humidity data can be judged more accurately for existence of human disturbance daily record and false phenomenon in drug storehouse.The experimental results show that the input data is 2×160,the convolution kernel of the first layer is 2×17 and the extraction ratio is 1∶3;the convolution kernel of the second layer is 1×11 and the extraction ratio is 1∶2,the error rate is 1.2%.
drug cold chain monitoring system;convolution neural network;convolution kernel;extraction proportion;human disturbance daily record
TP274.5
A
2017-04-01
王紅霞(1977—),女,教授,博士,研究方向:網(wǎng)絡(luò)管理技術(shù)、信息安全技術(shù)、信息柵格及系統(tǒng)仿真技術(shù)。
1003-1251(2017)05-0034-05