王孝艷,王志遠(yuǎn),陳子陽(yáng),蒲繼雄
(華僑大學(xué)信息科學(xué)與工程學(xué)院,福建省光傳輸與變換重點(diǎn)實(shí)驗(yàn)室,福建 廈門 361021)
具有螺線型相位分布的光束被稱為渦旋光束,1992年,Allen等[1]的研究表明渦旋光束的光子攜帶軌道角動(dòng)量。渦旋光束的軌道角動(dòng)量可以傳遞給微粒,從而驅(qū)動(dòng)微粒轉(zhuǎn)動(dòng)[2,3]。2004年,Gibson等[4]將渦旋光束軌道角動(dòng)量應(yīng)用于自由空間的信息編碼與傳輸。由于渦旋光束的軌道角動(dòng)量理論上有無限的取值,因此這種新型的光信息編碼方式具有更高的信息容量[5];此外,該研究還表明這種編碼方式具有更好的保密性[5]。渦旋光束的獨(dú)特性質(zhì)引起了研究人員的廣泛關(guān)注,相關(guān)研究陸續(xù)開展[6?8]。
準(zhǔn)確測(cè)量渦旋光束的軌道角動(dòng)量對(duì)于渦旋光束的應(yīng)用具有重要意義[9,10]。研究人員提出了一系列基于干涉和衍射的渦旋光束軌道角動(dòng)量測(cè)量方法,例如與球面波進(jìn)行干涉[11]、Mach-Zehnder干涉[12]、雙縫干涉[13]、多點(diǎn)干涉[14]、三角形衍射[15]、角透鏡衍射[16]等,但是這些方法大多只適用于渦旋光束在自由空間中的傳輸。在光信息傳輸和醫(yī)學(xué)診斷等諸多應(yīng)用中,常涉及到光經(jīng)過各種隨機(jī)介質(zhì)的傳輸,例如毛玻璃、多模光纖、生物組織等[17?19]。這些介質(zhì)的隨機(jī)散射和折射率不均勻分布導(dǎo)致了光束相位的畸變,并形成光強(qiáng)無序分布的散斑。因此當(dāng)渦旋光束經(jīng)過這類隨機(jī)介質(zhì)傳輸后不再保持螺線型相位分布,上述傳統(tǒng)測(cè)量方法無法準(zhǔn)確測(cè)量渦旋光束軌道角動(dòng)量。
盡管渦旋光束經(jīng)過隨機(jī)介質(zhì)后形成了散斑狀光強(qiáng)分布,但是散射過程實(shí)際上可以被認(rèn)為是一個(gè)光場(chǎng)信息的重新分布過程,即散斑場(chǎng)中仍然包含了入射光的信息,只是其信息被打亂。直接從散斑場(chǎng)中提取入射光的信息是具有重要意義同時(shí)又極具挑戰(zhàn)性的研究。光束經(jīng)過隨機(jī)介質(zhì)的傳輸是一個(gè)非常復(fù)雜的過程,可以將該傳輸過程用傳輸矩陣表述,通過測(cè)量隨機(jī)介質(zhì)的傳輸矩陣并進(jìn)行反演,可以從散斑場(chǎng)中還原出入射光場(chǎng)的信息,但是傳輸矩陣的測(cè)量需要較為復(fù)雜的光學(xué)系統(tǒng)、耗時(shí)的測(cè)量過程以及繁瑣的算法[20,21]。深度學(xué)習(xí)技術(shù)是另外一種從散斑場(chǎng)中恢復(fù)入射光場(chǎng)信息的有效方法,該技術(shù)通過采集一定量的入射光場(chǎng)及其對(duì)應(yīng)的散斑場(chǎng),利用這些數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò),將未參與訓(xùn)練過程的散斑光強(qiáng)圖樣輸入網(wǎng)絡(luò)就可以預(yù)測(cè)入射光場(chǎng)的信息。目前已有一些相關(guān)研究從散斑場(chǎng)中還原了入射渦旋光束的拓?fù)浜蓴?shù),然而這些研究中入射光場(chǎng)通常只是單一渦旋結(jié)構(gòu)[22?24]。提高渦旋光束軌道角動(dòng)量信息傳輸能力的一個(gè)可行方法是采用空間復(fù)用技術(shù),即利用一束光同時(shí)傳輸多個(gè)渦旋結(jié)構(gòu)。
本文針對(duì)這種空間復(fù)用信息編碼技術(shù),基于深度學(xué)習(xí)方法從單幀散斑場(chǎng)中實(shí)現(xiàn)了多個(gè)渦旋光束軌道角動(dòng)量的測(cè)量。相較于傳統(tǒng)方法,深度學(xué)習(xí)方法具有以下優(yōu)勢(shì):深度學(xué)習(xí)模型的泛化能力及魯棒性強(qiáng),同時(shí)具有光路設(shè)計(jì)簡(jiǎn)單、實(shí)驗(yàn)裝置精度要求低的優(yōu)點(diǎn);對(duì)于訓(xùn)練好的網(wǎng)絡(luò),僅需采集一張散斑圖就可以同時(shí)自動(dòng)識(shí)別多個(gè)光渦旋的信息;不要求渦旋結(jié)構(gòu)具有確定的螺線型相位分布,也能準(zhǔn)確識(shí)別非理想相位分布的渦旋結(jié)構(gòu)信息。
為了獲得足夠的網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù),本研究組設(shè)計(jì)了如圖1所示的實(shí)驗(yàn)裝置,激光器(Onefive Origami-10XP,400 fs,1 MHz)發(fā)射波長(zhǎng)為1028 nm的紅外激光,其經(jīng)過偏振片P后照射在反射式空間光調(diào)制器(SLM,HAMAMATSU,X13138-03)上,SLM加載多束渦旋光的相位圖,將入射光調(diào)制為空間復(fù)用的多渦旋結(jié)構(gòu)光束。渦旋相位圖的大小為400 pixel×400 pixel。三渦旋相位圖中,第一個(gè)渦旋相位奇點(diǎn)位置位于相位圖中心左邊100 pixel,該位置圍繞相位圖中心順時(shí)針旋轉(zhuǎn)120°兩次依次獲得第二、三個(gè)渦旋相位奇點(diǎn)位置,每個(gè)圓形渦旋相位直徑為160 pixel;類似地,五渦旋相位圖中,第一個(gè)渦旋相位奇點(diǎn)位置位于相位圖中心左邊100 pixel,該位置圍繞相位圖中心順時(shí)針旋轉(zhuǎn)72°依次獲得第二、三、四、五個(gè)渦旋相位奇點(diǎn)位置,每個(gè)圓形渦旋相位直徑為104 pixel。此處所加載的渦旋光相位圖周邊分布有隨機(jī)相位,從而避免多個(gè)渦旋結(jié)構(gòu)之間出現(xiàn)干涉條紋。調(diào)制后的多束渦旋光沿入射方向返回,由BS分束后其中一束入射至物鏡(O,10X,NA=0.25)中。多渦旋結(jié)構(gòu)光經(jīng)過O聚焦照射在毛玻璃(GGD,Thorlabs,DG10-220,220 grit)上,其產(chǎn)生的散射光斑被工業(yè)相機(jī)(CCD,AVT,Pike F421B)拍攝采集,工業(yè)相機(jī)采集的散斑大小為256 pixel×256 pixel,并由計(jì)算機(jī)保存。實(shí)驗(yàn)采集了兩組多渦旋光束散斑數(shù)據(jù)集,分別為3束渦旋光散斑以及5束渦旋光散斑,詳細(xì)參數(shù)見表1。
圖1 實(shí)驗(yàn)裝置圖Fig.1 Schematic of experimental setup
表1 多束渦旋光散斑數(shù)據(jù)集信息Table 1 Detail of the speckle datasets of multi-vortex beams
實(shí)驗(yàn)分別采集了3束渦旋光與5束渦旋光的散斑數(shù)據(jù)集,兩組數(shù)據(jù)軌道角動(dòng)量數(shù)的變化范圍分別為1~20與1~6,間隔為1;在兩個(gè)數(shù)據(jù)集中分別隨機(jī)選取了25%、25.7%的數(shù)據(jù)作為測(cè)試集,不參與訓(xùn)練過程,剩余的數(shù)據(jù)分別作為訓(xùn)練集用于網(wǎng)絡(luò)訓(xùn)練。
網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示,256 pixel×256 pixel的散斑圖輸入到網(wǎng)絡(luò)后,經(jīng)過16個(gè)步長(zhǎng)為1、4×4大小的卷積核卷積后輸出256×256×16的張量,之后經(jīng)過7次大小為4×4、步長(zhǎng)為2、不同數(shù)目的卷積核卷積后輸出2×2×128的張量,經(jīng)過全局池化層后輸出1×1×128的張量。散斑圖中包含的所有軌道角動(dòng)量以獨(dú)熱編碼(One-hot encoding)表示,即用M位狀態(tài)寄存器來表示M個(gè)軌道角動(dòng)量的狀態(tài)。輸出層使用N(渦旋光束數(shù)目)個(gè)激活函數(shù)為Softmax的全連接層連接,每個(gè)全連接層的節(jié)點(diǎn)數(shù)等于每束渦旋光軌道角動(dòng)量的種類M。最后,基于Softmax函數(shù)輸出的張量最大概率所在位置,網(wǎng)絡(luò)通過反獨(dú)熱編碼即可輸出該位置所代表的軌道角動(dòng)量。Softmax函數(shù)表達(dá)式為
圖2 網(wǎng)絡(luò)簡(jiǎn)圖Fig.2 Diagram of network structure
式中:zi為第i個(gè)節(jié)點(diǎn)的輸出,n為輸出節(jié)點(diǎn)的數(shù)目,即所有的軌道角動(dòng)量種類。本研究中網(wǎng)絡(luò)對(duì)渦旋光的識(shí)別準(zhǔn)確率定義為
網(wǎng)絡(luò)使用步長(zhǎng)為2的卷積核替代池化層,在對(duì)輸入張量進(jìn)行卷積操作的同時(shí)起到了下采樣的作用;卷積核全部采用ReLU為激活函數(shù),每次卷積操作后通過批量歸一化(Batch-Normalization,momentum=0.95)避免梯度消失或爆炸。全連接層的Dropout概率為0.3,以避免過擬合。
網(wǎng)絡(luò)運(yùn)行環(huán)境基于TensorFlow2.6,使用GPU(NVIDIA,RTX2080SUPER)運(yùn)算數(shù)據(jù),選用Adam[25]作為網(wǎng)絡(luò)優(yōu)化器。優(yōu)化器的初始學(xué)習(xí)率設(shè)置為1×10?3,網(wǎng)絡(luò)在第10代及第15代時(shí)優(yōu)化器學(xué)習(xí)率在原基礎(chǔ)上減小10倍,網(wǎng)絡(luò)訓(xùn)練迭代次數(shù)為20。
三個(gè)渦旋結(jié)構(gòu)光束的軌道角動(dòng)量依次由1變化至20,間隔為1,共計(jì)獲得8000張包含不同組合軌道角動(dòng)量的散斑。隨機(jī)選取2000張作為測(cè)試集,剩余6000張作為訓(xùn)練集輸入至網(wǎng)絡(luò)訓(xùn)練,網(wǎng)絡(luò)由3個(gè)節(jié)點(diǎn)數(shù)目為20的全連接層輸出。訓(xùn)練過程中損失及準(zhǔn)確率變化曲線如圖3(a)所示,由圖可見:10代之前,由于學(xué)習(xí)率較大,網(wǎng)絡(luò)模型處于訓(xùn)練初期,且在全連接層的隨機(jī)失活作用下,網(wǎng)絡(luò)的損失曲線下降迅速且伴隨浮動(dòng);當(dāng)網(wǎng)絡(luò)訓(xùn)練至第10代及第15代時(shí),由于及時(shí)調(diào)整優(yōu)化器學(xué)習(xí)率,網(wǎng)絡(luò)模型趨于穩(wěn)定,使得損失曲線的浮動(dòng)消失,并具有較為明顯的下降;同時(shí)可以看出在及時(shí)調(diào)整優(yōu)化器學(xué)習(xí)率后,網(wǎng)絡(luò)在第11代后訓(xùn)練集準(zhǔn)確率收斂于100%且穩(wěn)定不變。網(wǎng)絡(luò)在測(cè)試集上對(duì)三束渦旋光的識(shí)別準(zhǔn)確率分別為:99.5%,98.7%,99.7%。
圖3 (a)3束及(b)5束渦旋光訓(xùn)練過程中損失與準(zhǔn)確率變化曲線Fig.3 Evolution of the loss and accuracy of(a)3 vortex beams and(b)5 vortex beams in the training process
類似地,5束渦旋光軌道角動(dòng)量依次由1變化至6,間隔為1,最終獲得7776張散斑圖。隨機(jī)選取2000張作為測(cè)試集,訓(xùn)練集為5778張散斑圖。網(wǎng)絡(luò)使用5個(gè)節(jié)點(diǎn)數(shù)目為6的全連接層輸出,其訓(xùn)練過程中訓(xùn)練集損失與準(zhǔn)確率的變化曲線如圖3(b)所示。與3束渦旋光訓(xùn)練時(shí)的曲線變化相似:網(wǎng)絡(luò)在第10代及時(shí)調(diào)整優(yōu)化器學(xué)習(xí)率后,在第12代時(shí)網(wǎng)絡(luò)訓(xùn)練的損失曲線與準(zhǔn)確率曲線均趨于平穩(wěn),訓(xùn)練集準(zhǔn)確率在第12代后穩(wěn)定趨近于100%。最終網(wǎng)絡(luò)在測(cè)試集上對(duì)五束渦旋光的識(shí)別準(zhǔn)確率分別為:99.95%,99.7%,99.2%,99.3%,99.1%。
網(wǎng)絡(luò)使用了步長(zhǎng)為2的卷積核,其對(duì)來自上一層的張量均會(huì)起到類似于下采樣的作用。為了驗(yàn)證該方案在本實(shí)驗(yàn)中的優(yōu)勢(shì),使用傳統(tǒng)的卷積層加最大池化層的方法構(gòu)建了一個(gè)結(jié)構(gòu)類似的卷積神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)除了所有的卷積核步長(zhǎng)為1以及每次卷積后經(jīng)過一個(gè)池化核為(2,2)的最大池化層外,其余所有參數(shù)均與原網(wǎng)絡(luò)相同,3束渦旋光與5束渦旋光在訓(xùn)練過程中的損失變化曲線以及驗(yàn)證集的損失變化曲線如圖4所示,其中Maxpool為帶有最大池化層的卷積神經(jīng)網(wǎng)絡(luò)。
圖4 (a)3束及(b)5束渦旋光散斑訓(xùn)練集及驗(yàn)證集損失變化曲線Fig.4 Evolution of the loss of training set and test set of(a)3 vortex beams and(b)5 vortex beams
由圖4可見,帶有最大池化層的卷積神經(jīng)網(wǎng)絡(luò)在訓(xùn)練集及驗(yàn)證集的表現(xiàn)均不如本研究所提出的網(wǎng)絡(luò)。盡管隨著訓(xùn)練次數(shù)的增加,訓(xùn)練集的損失有所下降,但其驗(yàn)證集的損失曲線在第11代后幾乎保持不變,不再下降,說明網(wǎng)絡(luò)出現(xiàn)了過擬合現(xiàn)象。這兩個(gè)網(wǎng)絡(luò)在測(cè)試集的識(shí)別準(zhǔn)確率表現(xiàn)對(duì)比如表2所示。
表2 本研究所提出網(wǎng)絡(luò)與帶有最大池化層網(wǎng)絡(luò)的測(cè)試集準(zhǔn)確率對(duì)比Table 2 Comparison of the accuracy on test set between the proposed network and the network with max-pooling layers
由表2可以看出,本研究所提出的網(wǎng)絡(luò)識(shí)別效果較帶有最大池化層的卷積神經(jīng)網(wǎng)絡(luò)更佳,軌道角動(dòng)量識(shí)別準(zhǔn)確率最高達(dá)99.95%。
針對(duì)多渦旋結(jié)構(gòu)光束經(jīng)過散射介質(zhì)后其攜帶的軌道角動(dòng)量無法被有效識(shí)別的問題,提出了一種基于深度學(xué)習(xí)方法的軌道角動(dòng)量識(shí)別方案,利用神經(jīng)網(wǎng)絡(luò)識(shí)別輸入的散斑圖片中所包含的軌道角動(dòng)量信息,同時(shí)識(shí)別光束中多個(gè)渦旋光束的軌道角動(dòng)量。所采用的神經(jīng)網(wǎng)絡(luò)模型使用步長(zhǎng)為2的卷積核替代池化層,同時(shí)起到特征提取與下采樣的作用,與帶有池化層的卷積神經(jīng)網(wǎng)絡(luò)相比具有明顯優(yōu)勢(shì)。所設(shè)計(jì)的網(wǎng)絡(luò)在識(shí)別三束渦旋光束散斑圖的情況下同時(shí)輸出其包含的三個(gè)軌道角動(dòng)量,最低準(zhǔn)確率為98.7%;在識(shí)別五束渦旋光束散斑圖時(shí),其最低準(zhǔn)確率為99.1%。所提出方法在基于渦旋光束的信息編碼與傳輸、圖像識(shí)別等領(lǐng)域具有一定的應(yīng)用價(jià)值。