王巍巍,王愛蓮,宋 韌
(吉林財(cái)經(jīng)大學(xué),吉林 長春 130117)
智慧校園將校園生活、管理、科研以及教學(xué)完美的充分融合,方便校園生活、豐富校園文化,形成透明高效的校務(wù)治理機(jī)制。由于 IP地址具有不方便記憶和無法顯示地址組織的性質(zhì),因此設(shè)計(jì)了域名,并利用網(wǎng)域名稱系統(tǒng)將域名和 IP地址相互映射,可直接由計(jì)算機(jī)讀取 IP地址數(shù)串,使人們更方便地訪問因特網(wǎng)。而在智慧校園內(nèi),學(xué)生、教師以及其他人員,對電腦的應(yīng)用都必不可少,所以需要構(gòu)建校園智慧網(wǎng)絡(luò)并分類識(shí)別其用戶的多標(biāo)簽域名,便于管理。
文獻(xiàn)[1]采用DGA算法躲避檢測,提出了一種基于ASCII編碼方式定義域名編/解碼器,并進(jìn)行進(jìn)行分類器訓(xùn)練和性能評估,對最新產(chǎn)生的DGA域名進(jìn)行識(shí)別,用于DGA域名檢測器的訓(xùn)練評估。文獻(xiàn)[2]提出城市管理案件目標(biāo)識(shí)別算法,利用移動(dòng)端設(shè)備自帶的攝像頭拍攝案發(fā)現(xiàn)場視頻并在MobileNet中增加新的超參數(shù),優(yōu)化輸入輸出圖像的通道數(shù)與每個(gè)通道所產(chǎn)生的特征圖數(shù)量,優(yōu)化IOS移動(dòng)設(shè)備分類與識(shí)別效果。文獻(xiàn)[3]以智能技術(shù)為手段,構(gòu)建了情報(bào)領(lǐng)域的系統(tǒng)辨識(shí)過程框架,集成系統(tǒng)輸入、輸出的數(shù)據(jù),不斷地去優(yōu)化系統(tǒng)識(shí)別模型。
但收到域名分類識(shí)別方法精度較低、過程較為復(fù)雜等因素影響,用戶實(shí)際應(yīng)用需求難以滿足,為此本文提出一種基于FIT AP的智慧網(wǎng)絡(luò)網(wǎng)多標(biāo)簽用戶域名分類識(shí)別方法,該方法創(chuàng)新之處是在無線網(wǎng)絡(luò)管理框架中,使用管理隧道進(jìn)行接入點(diǎn)服務(wù)管理、監(jiān)控與配置,并經(jīng)過條件熵、信息熵以及聯(lián)合熵,獲取用戶身份特征的集合信息增益,有效提升分類識(shí)別效率。
智慧校園的主要核心特征是為校園師生提供全面智能的環(huán)境感知以及綜合服務(wù)信息平臺(tái),并基于校園特色的個(gè)性化服務(wù),即利用智能感知環(huán)境與綜合信息服務(wù)平臺(tái),形成一個(gè)能夠互相交流以及互相感知的接口,將學(xué)校和外部世界共聯(lián)。其中,域名是通過一串用點(diǎn)分隔的名字構(gòu)成的,作為intemet上某一臺(tái)計(jì)算機(jī)或者是計(jì)算機(jī)組的名稱,主要應(yīng)用在在數(shù)據(jù)傳輸時(shí),對無線網(wǎng)絡(luò)的集中管理,其中,無線AC(接入控制器)和AP(無線接入點(diǎn))二者之間可利用LWAPP協(xié)議構(gòu)建數(shù)據(jù)與管理通道。再接上控制器利用管理隧道進(jìn)行接入點(diǎn)服務(wù)配置、監(jiān)控以及管理,利用接入控制器為無線接入用戶提供網(wǎng)絡(luò)服務(wù)[4]。
在集中框架管理無線網(wǎng)絡(luò)內(nèi),接入控制器就是整體無線網(wǎng)絡(luò)核心,能夠?qū)崿F(xiàn)該無線網(wǎng)絡(luò)服務(wù)管理,所有接入點(diǎn)成功與接入控制器構(gòu)建鏈接,而在接入控制器中得到對應(yīng)服務(wù)配置之后,就能夠?yàn)闊o線網(wǎng)絡(luò)提供接入服務(wù)。
接入控制器與集中管理框架無線網(wǎng)絡(luò)接入點(diǎn)二者間,全部是利用LWAPP協(xié)議所建立的,可以同時(shí)支持IPv4以及IPv6協(xié)議。
即將接入控制器作為服務(wù)器,能夠連接IPv4與IPv6網(wǎng)絡(luò)接入點(diǎn),接收請求,同時(shí)接入點(diǎn)能夠利用IPv4或IPv6動(dòng)態(tài)選取接入控制器,進(jìn)行連接創(chuàng)建[5]。
在設(shè)備啟動(dòng)時(shí),能夠自動(dòng)發(fā)現(xiàn)控制器并進(jìn)行訪問,并選擇當(dāng)前能夠提供最佳服務(wù)的訪問控制器構(gòu)建鏈接。由于接入點(diǎn)的配置為零,因此無法判斷當(dāng)前所訪問的網(wǎng)絡(luò)是IPv4網(wǎng)絡(luò)還是IPv6網(wǎng)絡(luò),因此如果接入點(diǎn)未成功通過IPv4網(wǎng)絡(luò)與接入控制器連接,則接入點(diǎn)應(yīng)首先與IPv6網(wǎng)絡(luò)發(fā)現(xiàn)連接,然后接入點(diǎn)將切換到IPv6,以完成接入控制器發(fā)現(xiàn)處理和連接。
另外,無線接入用戶使用的是IPv4網(wǎng)絡(luò)還是IPv6網(wǎng)絡(luò),對無線網(wǎng)絡(luò)用戶來說,是透明的,而無線設(shè)備只是實(shí)現(xiàn)了無線接入用戶數(shù)據(jù)的二層轉(zhuǎn)發(fā)。兩個(gè)接入控制器和接入點(diǎn)之間將使用 LWAPP隧道完成轉(zhuǎn)發(fā),但無論接入控制器或接入點(diǎn),都是基于二層信息完成轉(zhuǎn)發(fā),而且 LWAPP隧道的封裝負(fù)載,也是二層協(xié)議的報(bào)文。作為 LWAPP協(xié)議的一部分, LWAPP不關(guān)心上層用戶的無線訪問協(xié)議,而無線訪問用戶也不需要關(guān)心 LWAPP數(shù)據(jù)隧道應(yīng)用的IPv4協(xié)議或IPv6協(xié)議[6]。
FIT AP設(shè)備作為零配置的設(shè)備,相對于AP與AC構(gòu)建的IPv4隧道或者是IPv6隧道,F(xiàn)IT AP能夠自助完成,且控制器能夠同時(shí)支持IPv4以及IPv6隧道。
FIT AP構(gòu)建隧道的過程如圖1所示。
1)確保 FIT AP正常工作;
2)在 LWAPP客戶端啟動(dòng)時(shí)連接 AC,并啟動(dòng) AC的動(dòng)態(tài)連接,在這個(gè)過程中, FITAP只是成功地構(gòu)建到 AC,以便更好地提供服務(wù)。
3) LWAPP客戶端首先在IPv4隧道和 AC之間建立完整的連接。
4)如果應(yīng)用IPv4隧道,則無法找到 AC連接,并與 AC建立的連接,因此把 LWAPP客戶端切換到IPv6隧道,否則, FITAP使用IPv4隧道提供服務(wù)。
5)如果應(yīng)用IPv6隧道,同樣也則無法找到 AC并 AC建立連接。因此把 LWAPP客戶端切換到IPv4隧道,否則, FITAP使用IPv4隧道提供服務(wù)。
FITAP設(shè)備可以在所有網(wǎng)絡(luò)中使用。通過上面提到的自動(dòng)IPv4和IPv6隧道機(jī)制,將FITAP安裝在IPv4網(wǎng)絡(luò)中,即 FITAP可以利用IPv4隧道與 AC建立連接。相反,在 FIT AP安裝了IPv6網(wǎng)絡(luò)之后, FIT AP就無法應(yīng)用IPv4隧道構(gòu)建與 AC之間的連接,從而能夠構(gòu)建AC與IPv6隧道的連接并開始提供服務(wù)[7-8]。
具體某高校的IPv6無線網(wǎng)絡(luò)接入方式,如圖2所示。
圖2 IPv6無線網(wǎng)絡(luò)接入示意圖
通過圖2能夠看出,接入控制器AC與IPv6無線網(wǎng)絡(luò)進(jìn)行連接,該接入控制器AC在無線網(wǎng)絡(luò)內(nèi)起到了IPv6的Portal的功能,完成無線網(wǎng)絡(luò)和IPv6網(wǎng)絡(luò)連接,即而構(gòu)建IPv6的無線網(wǎng)絡(luò)模式。而接入點(diǎn)FIT AP是經(jīng)過IPv4骨干的網(wǎng)絡(luò)與接入控制器進(jìn)行連接與創(chuàng)建的,完成穿越IPv4網(wǎng)絡(luò),從而提供的無線網(wǎng)絡(luò)接入服務(wù),在無線接入的用戶成功與接入點(diǎn)AP所創(chuàng)建的無線鏈路連接,這樣就能夠成功的與IPv6無線網(wǎng)絡(luò)完成連接。
通過無線網(wǎng)絡(luò)提供的接入服務(wù),無線終端完成了與IPv6網(wǎng)絡(luò)的連接后,終端就可以動(dòng)態(tài)地獲取IPv6地址,也可以在靜態(tài)IPv6地址上進(jìn)行設(shè)置,然后,無線終端就可以訪問IPv6網(wǎng)絡(luò)的所有服務(wù)。與此同時(shí),無線終端的所有數(shù)據(jù),都是通過無線網(wǎng)絡(luò)接入點(diǎn)和接入控制器之間的通道進(jìn)行傳輸?shù)模鵁o線接入的用戶,在使用IPv6接入網(wǎng)絡(luò)時(shí),則不必?fù)?dān)心是否通過IPv4網(wǎng)絡(luò)[9]。
在利用智慧校園網(wǎng)對用戶特征的分類進(jìn)行識(shí)別時(shí),利用條件熵、信息熵以及聯(lián)合熵獲取用戶身份特征的集合信息增益,對用戶域名與標(biāo)簽二者之間關(guān)系完成區(qū)分,以此完成用戶域名特征的多標(biāo)簽分類識(shí)別,提升分類識(shí)別的效率。
將X設(shè)成表示智慧校園內(nèi)一個(gè)實(shí)例,L表示候選用戶域名的特征標(biāo)簽集合。Y表示實(shí)例X相應(yīng)用戶域名特征的標(biāo)簽集合,就是Y?L,O表示多標(biāo)簽的數(shù)據(jù)集合,而在集合O內(nèi)具有t個(gè)樣本,具體多標(biāo)簽的數(shù)據(jù)集合公式是
O={(Xi,Yi)|1≤i≤t}
(1)
式中:Xi表示智慧校園的用戶域名特征向量,Yi表示用戶域名特征的向量相應(yīng)標(biāo)簽集合。
將H(A)設(shè)成表示集合A={a1,a2,…,am}信息熵,具體H(A)的公式為
(2)
式中:p(ai)表示元素ai先驗(yàn)的概率。在將H(B|A)設(shè)置成表示集合A的基礎(chǔ)中集合B={b1,b2,…,bn}條件熵,具體H(B|A)的計(jì)算公式為
(3)
當(dāng)處于集合A基礎(chǔ)之下的集合B不確定程度,經(jīng)過條件熵H(B|A)完成衡量,把H(AB)設(shè)置成表示集合A和集合B聯(lián)合熵,具體公式為
(4)
而聯(lián)合熵、條件熵以及信息熵三者之間的關(guān)系,具體如下所示
H(AB)=H(A)+H(B|A)
(5)
式中,將IG(B|A)設(shè)置表示信息增益,經(jīng)過信息增益對集合A與集合B有關(guān)程度完成衡量,具體計(jì)算公式為
IG(B|A)=H(A)+H(B)-H(AB)
(6)
在集合A與集合B信息增益越大時(shí),那么說明集合之間有關(guān)的程度就越大。經(jīng)過信息增益對標(biāo)簽與用戶域名特征的關(guān)系完成區(qū)分。
根據(jù)所獲得的信息增益選擇用戶域名特征候選集的首項(xiàng),并通過類標(biāo)簽間的相關(guān)性計(jì)算類標(biāo)簽重要度,根據(jù)計(jì)算得到的類標(biāo)簽重要度與用戶的域名特征權(quán)重相結(jié)合,完成用戶域名特征排序,再利用用戶域名的特征相關(guān)度選擇用戶域名特征,設(shè)定閾值,并將滿足條件的特征引入最終用戶域名特征集內(nèi),從而完成校園智慧網(wǎng)多標(biāo)簽用戶域名分類識(shí)別。
經(jīng)過信息增益求出候選用戶域名特征集合H首項(xiàng),依據(jù)上述獲取信息增益的最大用戶域名特征Xi作為特征集合H首項(xiàng)。
經(jīng)過類標(biāo)簽相關(guān)性計(jì)算用戶域名特征的類標(biāo)簽重要程度W(Yi),具體W(Yi)的計(jì)算公式是
(7)
式中:O(Yi,Yj)表示校園智慧網(wǎng)的用戶域名特征標(biāo)簽間相關(guān)度。將W(Xi)設(shè)成表示校園智慧網(wǎng)用戶域名特征屬性權(quán)重,具體W(Xi)計(jì)算公式為
W(Xi)=O′(Xi,Y)-R(Xi,H)
(8)
式中:O′(Xi,Y)表示類標(biāo)簽集合Y和用戶域名特征屬性Xi二者間相關(guān)度,R(Xi,H)表示特征集合H和用戶域名特征屬性Xi間具有的冗余度。經(jīng)過上式進(jìn)行計(jì)算能夠獲得用戶域名特征屬性權(quán)重,且與類標(biāo)簽的重要度進(jìn)行結(jié)合,把權(quán)值最高用戶域名特征屬性引進(jìn)特征集合內(nèi),對上述步驟重復(fù)進(jìn)行,一直完成校園智慧網(wǎng)絡(luò)的用戶域名特征排序。
將O(H,Y)設(shè)置成表示用戶域名的特征組和類標(biāo)簽二者間相關(guān)度,具體計(jì)算公式為
(9)
式中:O(Xi,Yj)表示用戶域名特征與標(biāo)簽二者之間的相關(guān)度,|H|表示特征集合H內(nèi)具有元素總數(shù)目,|Y|表示多標(biāo)簽集合Y內(nèi)具有的元素個(gè)數(shù)。
(10)
式中:N表示整體用戶域名特征屬性個(gè)數(shù)。能夠滿足下式用戶域名特征組Hi引入最后用戶域名特征的集合X′。具體公式為
(11)
(12)
將{Hi|Hi∩X′≠Hi}設(shè)置成表示無選取剩下用戶域名的特征集合,在將ΔO(Hi,Y)設(shè)置成表示用戶特征的集合Hi增益,具體計(jì)算公式為
ΔO(Hi,Y)=O(Hi,Y)-O(Hi-1,Y)
(13)
設(shè)閾值ε,而閾值ε計(jì)算公式為
(14)
式中:|X′|表示已選用戶域名特征集合X′總數(shù)目,r表示用戶域名特征組增益的標(biāo)記。在選取用戶域名特征組Hi要滿足Hi∩X′≠H并且ΔO(Hi,Y)>ε時(shí),把Hi所相應(yīng)的第i個(gè)用戶域名特征,加入最后用戶域名身份特征的集合X′內(nèi)。
通過上述方法就能夠?qū)π@智慧網(wǎng)絡(luò)的多標(biāo)簽用戶域名進(jìn)行分類識(shí)別。
為了驗(yàn)證本文方法的有效性,計(jì)算機(jī)硬件選擇In-tel Core2 Quad 2.3 GHz,2GB內(nèi)存,軟件操作系統(tǒng)選擇Windows7系統(tǒng)。
選取某學(xué)校1000名用戶學(xué)生的域名進(jìn)行測試實(shí)驗(yàn),最后在同一條件下,將本文方法與文獻(xiàn)[1]、文獻(xiàn)[2]、文獻(xiàn)[3]方法進(jìn)行對比,具體對比結(jié)果如圖3所示。
圖3 不同方法的識(shí)別精度對比結(jié)果
依據(jù)圖3能夠看出,其它文獻(xiàn)方法對用戶的識(shí)別精度越來越低,而在600條之前識(shí)別精度的曲線波動(dòng)趨勢較小,而在600條之后出現(xiàn)非常明顯的波動(dòng)趨勢。而本文方法的識(shí)別精度一直保持在90%左右,雖然出現(xiàn)輕微的上下浮動(dòng),不過浮動(dòng)較小,可以忽略不計(jì)。
將本文方法與文獻(xiàn)[1]、文獻(xiàn)[2]、文獻(xiàn)[3]方法在識(shí)別時(shí)間方面進(jìn)行對比。對比結(jié)果如圖4所示。
圖4 本文方法與傳統(tǒng)方法對比結(jié)果示意圖
通過圖3能夠看出,本文方法的識(shí)別精度要明顯高于其它方法,且在識(shí)別的過程較為簡單,魯棒性良好,說明用戶人員一旦在智慧網(wǎng)絡(luò)中上傳數(shù)據(jù),本文分類識(shí)別方法就可以對其進(jìn)行管理,滿足實(shí)際應(yīng)用需求。
無線終端在訪問IPv6網(wǎng)絡(luò)所有服務(wù)的過程中,需要獲得用戶域名特征屬性權(quán)重,且與類標(biāo)簽的重要度進(jìn)行結(jié)合,這個(gè)結(jié)合的過程用用戶域名特征屬性的排序效果即影響識(shí)別效果反映,因此進(jìn)行類標(biāo)簽的重要度結(jié)合效果實(shí)驗(yàn),驗(yàn)證整體識(shí)別效果。對比結(jié)果如圖5所示。
圖5 用戶域名特征屬性權(quán)重對比結(jié)果
如圖5可知,在12個(gè)排序階段的情況下,本文方法的用戶域名特征屬性的排序效果即影響識(shí)別效果較強(qiáng),皆高于文獻(xiàn)方法,最高權(quán)重為1,說明在整體識(shí)別上,本文方法魯棒性較佳。
1)基于FIT AP,對智慧網(wǎng)絡(luò)網(wǎng)多標(biāo)簽用戶域名分類識(shí)別方法,利用條件熵、信息熵以及聯(lián)合熵獲取用戶域名特征集合的信息增益,區(qū)分用戶域名與標(biāo)簽二者之間的關(guān)系,對用戶域名特征的多標(biāo)簽分類識(shí)別。
2)識(shí)別精度一直保持在90%左右,解決精度較低,且過程較為復(fù)雜等問題。
3)整體智慧網(wǎng)絡(luò)網(wǎng)多標(biāo)簽用戶域名分類識(shí)別過程簡單高效,用戶域名特征屬性的排序權(quán)重為1,可以提供一種全面感知、協(xié)作性、網(wǎng)絡(luò)化與數(shù)據(jù)化一體的生活服務(wù)、管理、科研以及教學(xué)的校園環(huán)境。