(北京物資學(xué)院 北京 101149)
近些年,我國物流發(fā)展迅速,同時(shí)出現(xiàn)現(xiàn)代化、智能化的趨勢。現(xiàn)在的物流環(huán)節(jié)中主要存在著兩個(gè)問題,其一是訂單增長過快,傳統(tǒng)人工模式,響應(yīng)不夠及時(shí),完成效果有明顯不足,其二是場地,人工等成本的增長,讓物流企業(yè)承擔(dān)著較大的壓力。因此機(jī)器人已經(jīng)廣泛的應(yīng)用于工業(yè)與物流的各個(gè)環(huán)節(jié)之中,不僅降低了物流企業(yè)的成本,同時(shí)提高了物流企業(yè)各個(gè)環(huán)節(jié)的效率。隨著各種智能配件與傳感器等應(yīng)用于物流機(jī)器人中,解除了機(jī)器人自身的各種限制,使得機(jī)器人擁有了感知能力,讓機(jī)器人可以識(shí)別、處理、收集各種信息,例如RFID技術(shù),通過電磁波實(shí)現(xiàn)電子標(biāo)簽的讀寫與通信。
識(shí)別技術(shù)也廣泛的應(yīng)用于我們的生活之中,語音識(shí)別,圖像識(shí)別等,例如解鎖用到的指紋解鎖,人臉解鎖等,用于翻譯的文字識(shí)別等。這些技術(shù)的廣泛應(yīng)用都依靠機(jī)器視覺。機(jī)器視覺是用機(jī)器人與攝像頭的配合實(shí)現(xiàn)對(duì)人眼功能的模擬,特點(diǎn)是應(yīng)用方便、速度快、精度高、控制簡單。機(jī)器視覺使用攝像機(jī)采集場景圖像,并通過圖像處理與分析[1]。機(jī)器視覺在工業(yè)生產(chǎn)過程中,應(yīng)用于識(shí)別、檢測、分揀等過程,機(jī)器視覺的應(yīng)用既降低了成本,又提高了效率。
人工智能一直是各種研究的熱點(diǎn),而機(jī)器學(xué)習(xí)是人工智能的核心,是讓機(jī)器擁有智能的重要途徑。而深度學(xué)習(xí)是近些年研究的新方向與熱點(diǎn)。通過對(duì)于人工神經(jīng)的模擬,實(shí)現(xiàn)對(duì)數(shù)據(jù)的利用,取得知識(shí)。深度學(xué)習(xí)的發(fā)展加強(qiáng)了目標(biāo)識(shí)別與定位技術(shù)的發(fā)展。隨著卷積神經(jīng)網(wǎng)絡(luò)的深入研究,被廣泛的應(yīng)用于圖像識(shí)別。在2013年的Image Net大規(guī)模視覺識(shí)別挑戰(zhàn)比賽大部分參賽隊(duì)伍都用上了深度卷積網(wǎng)絡(luò)。
深度學(xué)習(xí)在信息技術(shù)發(fā)展的現(xiàn)代,在大數(shù)據(jù)背景的下,可以自主的進(jìn)行學(xué)習(xí),無需人工參與的學(xué)習(xí)方法,無疑會(huì)成為研究熱點(diǎn),并深刻的影響人們的生活。
機(jī)器學(xué)習(xí)主要分為兩類研究方向:第一類是傳統(tǒng)機(jī)器學(xué)習(xí)的研究,該類研究主要是研究學(xué)習(xí)機(jī)制,注重探索模擬人的學(xué)習(xí)機(jī)制;第二類是大數(shù)據(jù)環(huán)境下機(jī)器學(xué)習(xí)的研究,該類研究主要是研究如何有效利用信息,注重從巨量數(shù)據(jù)中獲取隱藏的、有效的、可理解的知識(shí)。
圖像識(shí)別的主要目的是對(duì)圖像、圖片、景物、文字等信息經(jīng)過處理和識(shí)別,來解決計(jì)算機(jī)與外部環(huán)境的直接通信過程[2]。圖像識(shí)別主要分為三個(gè)階段:獲取圖像、處理圖像、圖像分類。圖像獲取,是指在通過攝像頭進(jìn)行獲取或者在輸入需要識(shí)別的圖像后,對(duì)其進(jìn)行轉(zhuǎn)化,使得機(jī)器可以識(shí)別和處理輸入圖像。圖像處理,包括預(yù)處理與特征提取,預(yù)處理是指將輸入圖像進(jìn)行優(yōu)化改善,以便于加快后續(xù)識(shí)別與處理的速度與精度。特征提取是將輸入圖像的高層特征轉(zhuǎn)化為底層特征,這些底層特征可以一定程度上表示圖像包含的元素和數(shù)值,同時(shí)與設(shè)定特征進(jìn)行比較,進(jìn)而進(jìn)行圖像的識(shí)別。圖像分類,即根據(jù)圖像處理后的結(jié)果,通過其中的特征、信息等數(shù)據(jù)與設(shè)定進(jìn)行對(duì)比,進(jìn)而進(jìn)行對(duì)輸入圖像的識(shí)別、定位、分類。
圖像的特征提取,主要分為兩部分,高層特征與底層特征。相對(duì)來說,底層特征較為簡單,是通過簡單處理就可以得到的,就像是一眼可以看出來的特征,例如形狀特征,顏色特征。而高層特征就像是人的思考模式,人的思維所確定的特征。傳統(tǒng)的機(jī)器學(xué)習(xí)工作時(shí),用于描述圖像的特征一般是由人為設(shè)定,這稱為特征工程,所以設(shè)定的特征好壞很大程度影響到識(shí)別效果。即使采用的人為設(shè)定特征的方法,高層特征也會(huì)面臨諸多問題,特征相近卻錯(cuò)誤,特征不全導(dǎo)致識(shí)別錯(cuò)誤等。所以普通的發(fā)展很難提取合適的高層特征,即使提取了高層特征,也無法很好的體現(xiàn)輸入圖像的高層特征,也就造成了圖像識(shí)別的發(fā)展的瓶頸。但是大數(shù)據(jù)環(huán)境下的機(jī)器學(xué)習(xí)的研究一定程度上解決了高層特征的問題。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)在大數(shù)據(jù)環(huán)境下熱門的研究領(lǐng)域。深度學(xué)習(xí)始于神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)的初衷是想通過像人一樣的神經(jīng)網(wǎng)絡(luò),賦予機(jī)器人像人一樣的思維模式與思考方式,進(jìn)而可以像人一樣識(shí)別和處理圖像、文字、語音等。深度學(xué)習(xí)通過神經(jīng)網(wǎng)絡(luò)的配合用于從底層特征中提取更加深層的高層特征,可以更好的表現(xiàn)圖像的分布式特征,更豐富的表達(dá)圖像的內(nèi)在信息。深度學(xué)習(xí)的發(fā)展有三個(gè)主要的原因,首先,計(jì)算機(jī)計(jì)算能力的提升,即GPU性能足夠進(jìn)行深度學(xué)習(xí)的計(jì)算;其次,是訓(xùn)練數(shù)據(jù)增加與共享,使得學(xué)習(xí)的成本降低;最后,是深度學(xué)習(xí)模型規(guī)模的改變。
深度學(xué)習(xí)算法在高層特征的提取中,有兩個(gè)方面的重點(diǎn),第一個(gè)是多層次的非線性信息處理,第二個(gè)是學(xué)習(xí)過程中是否有監(jiān)督學(xué)習(xí)。深度學(xué)習(xí)的高層特征由底層特征綜合學(xué)習(xí)得到,這種過程因?yàn)槭亲灾鲗W(xué)習(xí),減少了人為因素的影響,同時(shí)可以更全面、更抽象的表達(dá)特征。而有監(jiān)督的深度學(xué)習(xí),可以讓訓(xùn)練結(jié)果更加接近設(shè)計(jì)目標(biāo)。深度學(xué)習(xí)可以使用一種更加簡單的方式完成較大的函數(shù)集合的嵌套,一個(gè)復(fù)雜函數(shù),一般的單層結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)很難表達(dá),而多層神經(jīng)網(wǎng)絡(luò),可以看成函數(shù)的嵌套,就可以使用簡單的方式表達(dá)復(fù)雜函數(shù),在表達(dá)的同時(shí)還可以不破壞原有函數(shù)的線性表達(dá)。
深度學(xué)習(xí)的常用方法主要包括兩種,分別是深度信念網(wǎng)絡(luò)(DBN)和卷積神經(jīng)網(wǎng)絡(luò)(CNN)。
深度信念網(wǎng)絡(luò)由多層學(xué)習(xí)模型所組成,以深度神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),使用其訓(xùn)練結(jié)果作為初始權(quán)值,再使用其他算法對(duì)權(quán)值調(diào)整,以達(dá)到目標(biāo)。深度信念網(wǎng)絡(luò)由多層限制性玻爾茲曼機(jī)構(gòu)成,可以通過有效的無監(jiān)督貪婪訓(xùn)練方法進(jìn)行訓(xùn)練。深度信念網(wǎng)絡(luò)適用于缺少訓(xùn)練數(shù)據(jù)的情況。通過合適的算法進(jìn)行對(duì)初始權(quán)值的確定,有益于模型的性能,提高模型速度。
卷積神經(jīng)網(wǎng)絡(luò)由多個(gè)卷積層、池化層和全連接層組成。卷積神經(jīng)網(wǎng)絡(luò)具有表征學(xué)習(xí)(representation learning)能力,能夠按其階層結(jié)構(gòu)對(duì)輸入信息進(jìn)行平移不變分類(shift-invariant classification),因此也被稱為“平移不變?nèi)斯ど窠?jīng)網(wǎng)絡(luò)(Shift-Invariant Artificial Neural Networks,SIANN)”[3]。
深度學(xué)習(xí)作為人工智能重要的研究方向,通過對(duì)圖像數(shù)據(jù)的學(xué)習(xí),自主的發(fā)現(xiàn)圖像的特征。卷積神經(jīng)網(wǎng)絡(luò)的出現(xiàn),極大的提高了特征提取的處理速度和識(shí)別精度。將深度學(xué)習(xí)用于目標(biāo)識(shí)別,可以減少物流企業(yè)中的成本與工作效率。