• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于機(jī)器學(xué)習(xí)的認(rèn)知雷達(dá)資源管理

      2021-09-13 18:53:38楊潔李國(guó)騰曾耀平
      無(wú)線互聯(lián)科技 2021年10期
      關(guān)鍵詞:機(jī)器學(xué)習(xí)

      楊潔 李國(guó)騰 曾耀平

      摘 要:現(xiàn)代雷達(dá)可以設(shè)計(jì)成多種功能,如監(jiān)視、跟蹤和火災(zāi)控制。每個(gè)功能都要求雷達(dá)執(zhí)行許多收發(fā)任務(wù)。這就出現(xiàn)了將雷達(dá)資源分配給不同任務(wù)的問(wèn)題。具體而言,雷達(dá)資源管理(RRM)模塊對(duì)這些任務(wù)的參數(shù)選擇、優(yōu)先級(jí)和調(diào)度進(jìn)行決策,在超負(fù)荷情況下,RRM變得特別具有挑戰(zhàn)性,有些任務(wù)可能需要延遲甚至放棄。隨著多通道雷達(dá)變得越來(lái)越智能,大大提高了執(zhí)行任務(wù)的能力,但它也使任務(wù)調(diào)度復(fù)雜化。之前的研究選擇使用分支和約束(B&B)方法來(lái)解決這一問(wèn)題。文章使用B&B方法的結(jié)果來(lái)訓(xùn)練一個(gè)基于機(jī)器學(xué)習(xí)的調(diào)度器,通過(guò)使用神經(jīng)網(wǎng)絡(luò)估計(jì)搜索樹(shù)節(jié)點(diǎn)的值來(lái)加快B&B方法。結(jié)果表明,使用神經(jīng)網(wǎng)絡(luò)結(jié)合B&B方法得到了一個(gè)接近最優(yōu)解,同時(shí)顯著降低了計(jì)算復(fù)雜度。

      關(guān)鍵詞:機(jī)器學(xué)習(xí);認(rèn)知雷達(dá);分支定界法

      0? ? 引言

      認(rèn)知雷達(dá)(CR)被定義為一種進(jìn)行智能信號(hào)處理的雷達(dá),它建立在通過(guò)雷達(dá)與周?chē)h(huán)境[1]的交互學(xué)習(xí)的基礎(chǔ)上。CR的關(guān)鍵要素是通過(guò)觀察獲取知識(shí),并在實(shí)際決策中使用這些知識(shí)。本文考慮了一種多功能認(rèn)知雷達(dá)(MFR)中雷達(dá)資源管理(RRM)的方法。

      MFR通過(guò)執(zhí)行一些收發(fā)任務(wù)來(lái)處理各種功能,如廣域監(jiān)視和跟蹤多個(gè)目標(biāo)在這種情況下,可用的雷達(dá)資源,特別是時(shí)間、頻率和能量,需要以有效的方式分配給不同的任務(wù)。RRM模塊對(duì)[2]參數(shù)選擇、優(yōu)先級(jí)和任務(wù)調(diào)度進(jìn)行決策。通常,在某些過(guò)載情況下,任務(wù)數(shù)量超過(guò)MFR的能力,其中一些任務(wù)可能需要延遲甚至放棄,因此RRM變得特別具有挑戰(zhàn)性。

      目前已經(jīng)開(kāi)發(fā)了多種技術(shù)用于多功能雷達(dá)的資源管理[3-4],由于是RRM,任務(wù)調(diào)度通常是一個(gè)NP難題,需要考慮的一個(gè)共同主題是將RRM分為兩個(gè)步驟[2]。第一步是確定任務(wù)參數(shù),例如優(yōu)先級(jí)、停留時(shí)間和重訪間隔,方法是針對(duì)每一個(gè)任務(wù)單獨(dú)使用基于規(guī)則的方法,或者在考慮所有任務(wù)的情況下,通過(guò)對(duì)所有任務(wù)進(jìn)行聯(lián)合優(yōu)化來(lái)實(shí)現(xiàn)整體效用函數(shù)資源約束[3]。確定參數(shù)后,第二步是任務(wù)選擇和調(diào)度。在選擇階段,根據(jù)資源限制選擇任務(wù)的子集,并制定績(jī)效因數(shù),其余的任務(wù)被刪除。在調(diào)度階段,將時(shí)隙分配給任務(wù),以上步驟也可以反復(fù)迭代以提高性能。

      在單獨(dú)的軌道上,多通道、多頻率雷達(dá)變得越來(lái)越可行。多通道雷達(dá)帶來(lái)了在不同信道上同時(shí)執(zhí)行多個(gè)任務(wù)的可能性。然而,這種額外的能力也使已經(jīng)困難的RRM問(wèn)題復(fù)雜化。除了調(diào)度外,任務(wù)現(xiàn)在必須分配給通道。本文考慮了多通道多功能雷達(dá)的聯(lián)合資源管理問(wèn)題,即一個(gè)能夠同時(shí)執(zhí)行多個(gè)任務(wù)的聯(lián)合雷達(dá)。在考慮多通道雷達(dá)的RRM時(shí),本團(tuán)隊(duì)以往都是使用的最優(yōu)的分支定界(B&B)技術(shù)[5]。但是,正如任何NP難問(wèn)題的解決方案都必須考慮指數(shù)計(jì)算復(fù)雜性,并且對(duì)于任何超出任務(wù)列表的事情,都不能期望它可以實(shí)時(shí)執(zhí)行。由于需要平衡性能和復(fù)雜性,本文將機(jī)器學(xué)習(xí)(ML)技術(shù)引入到多通道MFR的RRM問(wèn)題中。本研究的ML方法學(xué)習(xí)了以前執(zhí)行的B&B算法(在訓(xùn)練階段)。然后將所獲得的知識(shí)用于未來(lái)的調(diào)度問(wèn)題。具體來(lái)說(shuō),本研究使用神經(jīng)網(wǎng)絡(luò)來(lái)估計(jì)B&B方法中與節(jié)點(diǎn)相關(guān)的值,從而收斂到接近最優(yōu)解,同時(shí)顯著地減少了計(jì)算負(fù)擔(dān)。該值是從給定節(jié)點(diǎn)開(kāi)始可以獲得的完整解決方案的最小成本,并且如果它離最優(yōu)解太遠(yuǎn),則從樹(shù)中消除節(jié)點(diǎn)及其子分支。

      使用監(jiān)督學(xué)習(xí)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。通過(guò)運(yùn)行得到訓(xùn)練數(shù)據(jù)集(標(biāo)記數(shù)據(jù)),B&B算法離線處理相對(duì)較小的問(wèn)題,生成的訓(xùn)練數(shù)據(jù)使本研究能夠訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),本研究的仿真結(jié)果表示,計(jì)算負(fù)載的性能損耗低。

      1? ? 問(wèn)題分析

      問(wèn)題如下:本研究考慮在一個(gè)時(shí)間窗口內(nèi),在K個(gè)相同的通道上執(zhí)行N個(gè)任務(wù)。任務(wù)可以在不同的通道上同時(shí)執(zhí)行,但不能在給定的時(shí)間軸上重疊。此外,本研究考慮了非搶占式調(diào)度場(chǎng)景,其中正在運(yùn)行的任務(wù)直到完成才停止。對(duì)于每個(gè)任務(wù),都有一個(gè)起始時(shí)間rn,之后才可以執(zhí)行任務(wù)。還有一個(gè)截止時(shí)間Dn,在此之后,任務(wù)被刪除。這第n個(gè)(1≤n≤N)任務(wù)的執(zhí)行時(shí)間(駐留時(shí)間)用ln表示。

      例如,考慮一個(gè)跟蹤任務(wù)。任務(wù)的開(kāi)始時(shí)間由所需的跟蹤精度和最后一次測(cè)量的時(shí)間決定。截止時(shí)間取決于雷達(dá)的波束寬度和目標(biāo)的估計(jì)軌跡。在假定目標(biāo)已從雷達(dá)波束中移出后,該任務(wù)將不會(huì)執(zhí)行,因此,它被丟棄將產(chǎn)生一定的成本,所以,需要采取進(jìn)一步措施來(lái)補(bǔ)償下降。

      一個(gè)計(jì)劃的但延遲的任務(wù)的延遲成本在這里被建模為與延遲成線性比例,令en為任務(wù)n開(kāi)始執(zhí)行的時(shí)間,延遲成本由ωn(en-rn)給出,其中ωn為衡量延遲的權(quán)重。讓二進(jìn)制變量xnk表示任務(wù)n是否在第k個(gè)時(shí)間軸上調(diào)度(=1)。如果xnk=? ?0k,則刪除任務(wù)n。然后第n個(gè)任務(wù)相關(guān)的成本為。本研究的聯(lián)合任務(wù)選擇和調(diào)度問(wèn)題是總成本C的最小化,由下式給出:

      在此,優(yōu)化變量是xnk和en。如果計(jì)劃了任務(wù),即xnk=1,對(duì)于一些k,則還需要確定執(zhí)行時(shí)間en。因此,本研究的優(yōu)化問(wèn)題是:

      第二個(gè)約束,確保在計(jì)劃時(shí)將任務(wù)僅分配給單個(gè)時(shí)間軸。沒(méi)有任務(wù)丟失的調(diào)度問(wèn)題是NP難題[6]??梢钥闯?,聯(lián)合任務(wù)的選擇和調(diào)度也是NP難題。

      2? ? 解決方法

      在公式(2)[5]中,可以采用B&B過(guò)程來(lái)找到問(wèn)題的最優(yōu)解。B&B方法的主要缺點(diǎn)是執(zhí)行時(shí)間,在任務(wù)數(shù)量上可能是指數(shù)的。執(zhí)行時(shí)間取決于任務(wù)參數(shù),B&B過(guò)程是重尾的,也就是說(shuō),雖然許多執(zhí)行在合理的時(shí)間內(nèi)是可能的,但有一些情況需要一個(gè)較長(zhǎng)的執(zhí)行時(shí)間。為了降低B&B算法的復(fù)雜度,本文提出了一種利用神經(jīng)網(wǎng)絡(luò)加速搜索的近似方法。

      B&B方法隱式地列舉了搜索樹(shù)上所有可能的解決方案。樹(shù)的根節(jié)點(diǎn)表示整個(gè)解決方案空間。其余節(jié)點(diǎn)與解空間的子集相關(guān)聯(lián)。分支操作將父節(jié)點(diǎn)的空間分割成結(jié)果子節(jié)點(diǎn)的子空間。每個(gè)子空間表示部分解。在搜索過(guò)程中,使用邊界和優(yōu)勢(shì)規(guī)則從樹(shù)中消除節(jié)點(diǎn)。除了這些規(guī)則外,本研究還建議使用神經(jīng)網(wǎng)絡(luò)來(lái)促進(jìn)從搜索樹(shù)中消除未產(chǎn)生的節(jié)點(diǎn)。一旦對(duì)整個(gè)樹(shù)進(jìn)行了遍歷,就會(huì)返回搜索中找到最佳解決方案。

      對(duì)于公式(2)的問(wèn)題,該樹(shù)的每個(gè)節(jié)點(diǎn)代表一個(gè)部分調(diào)度,包括任務(wù)的子集。本研究搜索任務(wù)的最佳執(zhí)行時(shí)間,可以變換為搜索任務(wù)的最佳排列。本研究通過(guò)以下方式構(gòu)造搜索樹(shù)。根節(jié)點(diǎn)為空序列,一個(gè)分支代表選擇還沒(méi)有被安排在父節(jié)點(diǎn)和其限期尚未通過(guò)的任務(wù)。所選任務(wù)將附加到父節(jié)點(diǎn)的序列中,以獲取結(jié)果子節(jié)點(diǎn)的序列。使用“序列到計(jì)劃的映射”[5]獲得計(jì)劃,該計(jì)劃在序列的元素上進(jìn)行迭代,并將每個(gè)任務(wù)放在最早可用的時(shí)間軸上。使用這種技術(shù),尋找最佳序列。

      優(yōu)勢(shì)規(guī)則是特定于問(wèn)題的,并且經(jīng)過(guò)數(shù)學(xué)驗(yàn)證的規(guī)則,用于從搜索樹(shù)中消除節(jié)點(diǎn)。如果可以證明所有解決方案的性能在給定的節(jié)點(diǎn)S1比另一個(gè)節(jié)點(diǎn)S2的解決方案的性能更差,那么S1是由S2主導(dǎo)的,因此可以從樹(shù)中消除S1。

      下界和上界也可以用于修剪搜索樹(shù)的節(jié)點(diǎn)。如果給定節(jié)點(diǎn)S的所有解的代價(jià)上的下界大于最優(yōu)解的代價(jià)上界UB,則可以得出S不包括最優(yōu)解。因此,S可以從樹(shù)中消除。上界可以使用啟發(fā)式方法初始化,并且可以在搜索過(guò)程中使用最佳解決方案發(fā)現(xiàn)-到目前為止進(jìn)行更新。

      在與節(jié)點(diǎn)關(guān)聯(lián)的部分時(shí)間表中,一組任務(wù)被安排在特定的時(shí)間表上,具有已知的執(zhí)行時(shí)間和延遲成本。此外,截止時(shí)間已經(jīng)超過(guò)所有時(shí)間表的任務(wù)也被取消。其余的任務(wù)還沒(méi)有安排或放棄。狀態(tài)v*(s)定義為部分調(diào)度節(jié)點(diǎn)的表示。它包括任務(wù)的初始參數(shù)以及它們?cè)谙鄳?yīng)的部分時(shí)間表中的狀態(tài)(計(jì)劃、刪除或未計(jì)劃)。

      假設(shè)有一個(gè)值函數(shù)v*(s),其確定一個(gè)完整的時(shí)間表,表示從一個(gè)給定狀態(tài)S開(kāi)始至少達(dá)到的成本,這里的價(jià)值函數(shù)是S子空間中最佳解決方案的成本。搜索的深度可通過(guò)截?cái)鄻?shù)S的價(jià)值函數(shù)得到,替換的最佳時(shí)間表的成本中的子樹(shù)在S內(nèi)是降低的。本研究使用神經(jīng)網(wǎng)絡(luò),產(chǎn)生價(jià)值函數(shù)的近似vθ(s)≈v*(s),在這θ表示價(jià)值網(wǎng)絡(luò)的權(quán)重。以狀態(tài)作為輸入,輸出給定狀態(tài)的近似最優(yōu)值。這樣的網(wǎng)絡(luò)可以使用B&B算法脫機(jī)執(zhí)行獲得的標(biāo)記數(shù)據(jù)進(jìn)行訓(xùn)練。價(jià)值網(wǎng)絡(luò)在給定節(jié)點(diǎn)S處所做的預(yù)測(cè)與UB進(jìn)行比較,如果預(yù)測(cè)的成本足夠大,則可以從搜索樹(shù)中消除節(jié)點(diǎn)S。這樣,B&B方法通過(guò)刪除不太可能最終得到最優(yōu)解的節(jié)點(diǎn)而變得更快。標(biāo)有"*"的用于記錄數(shù)據(jù),而不用于算法的必需部分。搜索樹(shù)已實(shí)現(xiàn)使用堆棧數(shù)據(jù)結(jié)構(gòu)。深度優(yōu)先搜索策略用于遍歷樹(shù)的節(jié)點(diǎn),本研究修改了[7]的B&B方法以包括任務(wù)刪除。堆棧的每個(gè)元素都是一個(gè)元組,元組由一系列任務(wù)T(代表部分調(diào)度),在T之后立即安排的一組任務(wù)PF,一組未計(jì)劃的任務(wù)NS和已刪除的一組任務(wù)DR組成。增強(qiáng)分支定界法的具體步驟如下:

      在節(jié)點(diǎn)S,分支是通過(guò)從PF中選擇具有最小起始時(shí)間的任務(wù)a來(lái)執(zhí)行的。然后,將任務(wù)a從PF中刪除,并添加到NS中,a被安排在當(dāng)前分支中,對(duì)于S的其余分支,它還沒(méi)有被安排。因此,它被添加到NS集中。這樣,當(dāng)在節(jié)點(diǎn)S處添加一個(gè)新的分支時(shí),將NS集的任務(wù)與PF集的元素合并,形成第一組可能的節(jié)點(diǎn)。在根節(jié)點(diǎn),可能的第一組節(jié)點(diǎn)被初始化為包含所有任務(wù),NS和DR被設(shè)置為空。上界UB包含在搜索過(guò)程中獲得的最佳調(diào)度的成本。UB最初設(shè)置為無(wú)窮大,根節(jié)點(diǎn)被推到堆棧的頂部,然后,只要堆棧不是空的,就執(zhí)行以下過(guò)程:在每次迭代時(shí),檢查堆棧頂部的節(jié)點(diǎn),如果可能的第一組PF為空,則節(jié)點(diǎn)將從堆棧中刪除,在刪除節(jié)點(diǎn)之前,檢查未調(diào)度集合NS中是否有任何任務(wù),如果NS為空,則節(jié)點(diǎn)是終端,并表示完整的解決方案。在這種情況下,將總體成本C與UB進(jìn)行比較,如果有改進(jìn),則應(yīng)該更新UB。在堆棧頂部可能的第一組節(jié)點(diǎn)不是空的情況下,使用PF任務(wù)生成一個(gè)新節(jié)點(diǎn)。具體來(lái)說(shuō),設(shè)置一個(gè)PF中最小的任務(wù)開(kāi)始時(shí)間。本研究從PF中刪除a并在T的末尾附加它以獲得新節(jié)點(diǎn)的序列T'。新節(jié)點(diǎn)PF的可能第一組PF'被設(shè)定為PF和NS的并集。刪除的任務(wù)DR'是從DR繼承的,新節(jié)點(diǎn)NS的未計(jì)劃集合被設(shè)置為空。然后,將任務(wù)a添加到NS。

      在生成新節(jié)點(diǎn)后,應(yīng)該確定是否應(yīng)該將其添加到堆棧中,以便下一次迭代時(shí)進(jìn)行進(jìn)一步的研究,或者可以忽略它,從而進(jìn)行修剪。要做到這一點(diǎn),本研究首先對(duì)T'這條規(guī)則規(guī)定檢查,第T'任務(wù)的執(zhí)行時(shí)間的順序應(yīng)該不減少啟動(dòng)時(shí)間的主導(dǎo)地位規(guī)則,否則,T'占主導(dǎo)地位,無(wú)法得出最優(yōu)解。接下來(lái)本研究檢查PF'中的任務(wù),任何截止時(shí)間在頻道最早可用時(shí)間之前的任務(wù)都被刪除。此時(shí),可以計(jì)算新的部分解的延遲和下降成本之和,再?gòu)脑摴?jié)點(diǎn)導(dǎo)出的任何完整解上提供一個(gè)下界C'。如果這個(gè)成本不低于UB,則可以忽略新節(jié)點(diǎn)。此外,如果T'不能映射到活動(dòng)計(jì)劃,則它可以被丟棄。一個(gè)較好的時(shí)間表是沒(méi)有任務(wù)可以提前完成,也不延遲另一個(gè)任務(wù)。對(duì)PF'中的任務(wù)檢查,它們中的任何一個(gè)是否可以在T'中的最后一個(gè)任務(wù)之前進(jìn)行調(diào)度且不造成延誤,以確定T'是否是活動(dòng)的。

      接下來(lái),本研究檢查T(mén)'是否是一個(gè)最低調(diào)度。一個(gè)最低活動(dòng)時(shí)間表是不交換兩個(gè)相鄰的任務(wù)就可以改善時(shí)間表。任務(wù)a的相鄰任務(wù)被定義為在調(diào)度任務(wù)a之前,在每個(gè)時(shí)間線的最終時(shí)隙上調(diào)度的任務(wù)集。檢查時(shí)間表是否為最低活動(dòng)的條件與上面相同,但也需要考慮任務(wù)刪除。在這種情況下,考慮時(shí)間軸的可用時(shí)間而不是完成時(shí)間,下降成本取代延遲成本。如果新節(jié)點(diǎn)是最低活動(dòng)的,則檢查它是否也是一個(gè)完整的解決方案。在這種情況下,更新父節(jié)點(diǎn)的統(tǒng)計(jì)數(shù)據(jù),以便進(jìn)行數(shù)據(jù)記錄。

      除了檢查C是否小于UB之外,還可以使用價(jià)值網(wǎng)絡(luò)從新節(jié)點(diǎn)得到預(yù)計(jì)的最低最終成本,并將其與UB進(jìn)行比較。如果估計(jì)值大于UB×α,則從搜索中刪除該節(jié)點(diǎn)。引入縮放系數(shù)α≥1以使該算法對(duì)估計(jì)誤差具有魯棒性。使用較大的α值可以實(shí)現(xiàn)更好的性能,但這意味著從搜索樹(shù)中刪除更少的節(jié)點(diǎn)。如果通過(guò)了邊界和優(yōu)勢(shì)規(guī)則,則新節(jié)點(diǎn)將被推到堆棧的頂部。完成此步驟后,搜索將繼續(xù)進(jìn)行下一個(gè)迭代。最后,一旦探索了整個(gè)樹(shù),就會(huì)返回找到的最佳解決方案就。

      2.1? 數(shù)據(jù)記錄

      本研究在搜索過(guò)程中記錄節(jié)點(diǎn)的統(tǒng)計(jì)信息,將它們用作標(biāo)記數(shù)據(jù)以監(jiān)督學(xué)習(xí)價(jià)值神經(jīng)網(wǎng)絡(luò)。對(duì)于給定的節(jié)點(diǎn)S,有一個(gè)標(biāo)志∏s,表示是否已經(jīng)達(dá)到至少一個(gè)完整搜索過(guò)程。在∏s終止的情況下,記錄其最佳終端解決方案的成本。

      如上一節(jié)中所述,在分支步驟中,本研究檢查新的子節(jié)點(diǎn)S'是否為最低活動(dòng)狀態(tài),如果為真,則接下來(lái)檢查∏s是否為完整解決方案,如果∏s的可能第一集合為空,則代表到達(dá)了終端節(jié)點(diǎn),即完整的解決方案。在這種情況下,父節(jié)點(diǎn)S的統(tǒng)計(jì)信息將被更新。如果∏s為假或S'的成本小于∏s的最佳終端成本,則S將設(shè)置為真并且最佳終端成本的S將被設(shè)置為s'的成本。

      在B&B程序中,在從堆棧中刪除給定節(jié)點(diǎn)S之前,本研究檢查其是否終止,即∏s是否為真。在這種情況下,S的父節(jié)點(diǎn)的統(tǒng)計(jì)信息將更新。此外,節(jié)點(diǎn)S及其所有統(tǒng)計(jì)信息都被記錄下來(lái)。而且,記錄的給定節(jié)點(diǎn)的最佳終端成本是v*(s),記錄的標(biāo)記數(shù)據(jù)(s,v*(s))用于價(jià)值網(wǎng)絡(luò)的監(jiān)督學(xué)習(xí)中。

      2.2? 價(jià)值網(wǎng)絡(luò)架構(gòu)

      本研究使用6層卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)價(jià)值網(wǎng)絡(luò)[8]。前三層是卷積的,最后三層是完全連接的。在每個(gè)卷積層,將輸入與濾波器卷積以產(chǎn)生輸出特征。濾波器的系數(shù)是使用監(jiān)督學(xué)習(xí)獲得。每個(gè)層的輸出經(jīng)過(guò)一個(gè)非線性函數(shù)(整流函數(shù)),然后傳遞到下一層。網(wǎng)絡(luò)的最終輸出是一個(gè)標(biāo)量數(shù),表示輸入部分調(diào)度的估計(jì)最小總體成本。網(wǎng)絡(luò)的輸入是一個(gè)矩陣,每個(gè)列表示一個(gè)任務(wù),每一行表示相應(yīng)任務(wù)的一個(gè)特征。

      在本文中,考慮了給出的每個(gè)任務(wù)的14個(gè)特征(見(jiàn)表2)。假設(shè)有4個(gè)通道可用于任務(wù)調(diào)度。每個(gè)通道都有一個(gè)輸入特性,本團(tuán)隊(duì)使用一個(gè)熱編碼來(lái)表示任務(wù)被調(diào)度的通道。對(duì)于每個(gè)任務(wù),對(duì)應(yīng)于任務(wù)計(jì)劃所在信道的輸入特征設(shè)置為1,其余輸入時(shí)間軸特征設(shè)置為0。

      對(duì)于卷積層,使用寬度為7的過(guò)濾器(查看每個(gè)步幅的? ?7個(gè)連續(xù)任務(wù)的特征)。每層使用64個(gè)濾波器,每個(gè)卷積層的輸出具有64個(gè)特征。本研究已經(jīng)為第一個(gè)完全連接的層考慮了512個(gè)隱藏單元。第二個(gè)完全連接的層具有128個(gè)隱藏單元,最后一層具有一個(gè)標(biāo)量。

      訓(xùn)練階段通常使用正則化方法,以避免訓(xùn)練樣本過(guò)擬合神經(jīng)網(wǎng)絡(luò)的問(wèn)題。這些方法的一般模式是幫助網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練樣本的[9],而不是記憶它們。本研究使用正則化最常用的方法退火技術(shù)[10],在訓(xùn)練階段,每個(gè)層的單位的固定百分比被隨機(jī)丟棄,導(dǎo)致了基本網(wǎng)絡(luò)的訓(xùn)練子網(wǎng)絡(luò),是一個(gè)好的特性。在訓(xùn)練階段中,還使用批歸一化來(lái)改進(jìn)優(yōu)化過(guò)程。設(shè)H是給定激活層的的一部分。為了規(guī)范H,本研究用H'代替它

      其中μ和σ分別表示單位的均值和標(biāo)準(zhǔn)差。對(duì)于卷積層,這些矩是在H的前三個(gè)維度上得到的,因此它們的長(zhǎng)度為64。對(duì)于完全連接的層,矩是在H行上計(jì)算的,因此,它們的長(zhǎng)度等于隱藏單元的數(shù)目。通過(guò)廣播來(lái)執(zhí)行公式(3)中的減法和除法運(yùn)算。在訓(xùn)練過(guò)程中,使用當(dāng)前批次的樣本均值和方差獲得μ和σ。在推理過(guò)程中,μ和σ可以被訓(xùn)練期間收集的運(yùn)行平均值所取代。將卷積層的激活標(biāo)準(zhǔn)化可能會(huì)降低網(wǎng)絡(luò)的表現(xiàn)力。因此,歸一化批次H'被γH'+β所取代,γ和β是在訓(xùn)練階段學(xué)習(xí)的變量。

      網(wǎng)絡(luò)的權(quán)重可以通過(guò)使用梯度下降對(duì)訓(xùn)練狀態(tài)結(jié)果(s,v*(s))進(jìn)行回歸來(lái)找到,以最小化估計(jì)值vθ(s)和目標(biāo)值之間的均方誤差(MSE)[11]。相應(yīng)的真實(shí)結(jié)果v*(s)如下:

      培訓(xùn)數(shù)據(jù)是通過(guò)離線執(zhí)行B&B方法獲得的,如上面所述。該網(wǎng)絡(luò)使用90 000個(gè)樣本進(jìn)行了訓(xùn)練。通過(guò)使用自適應(yīng)矩估計(jì)優(yōu)化方法使損失最小化來(lái)獲得權(quán)重。對(duì)于大小為100的迷你批處理,本研究使用100 000步的隨機(jī)改組(RR)方法進(jìn)行處理。

      3? ? 仿真結(jié)果

      本研究現(xiàn)在給出了仿真結(jié)果,說(shuō)明了該方法的性能。本研究考慮一種具有K=4個(gè)相同信道的多通道雷達(dá)。有N=35個(gè)任務(wù)分布在100 ms的時(shí)間線窗口上。目標(biāo)是安排任務(wù),使公式(2)中的目標(biāo)最小。在本研究的仿真中,任務(wù)的開(kāi)始時(shí)間均勻分布在100 ms的時(shí)間窗口上。其中,。

      對(duì)于每個(gè)任務(wù),起始時(shí)間和截止時(shí)間之間的間隔,即dn-rn從μ(2,12)中采樣。任務(wù)長(zhǎng)度ln是根據(jù)μ(2,11)分配的。此外,下降成本Dn和拖延權(quán)重ωn分別分布在μ(100,500)和μ(1,5)上。在仿真中,本研究使用蒙特卡洛方法進(jìn)行100次試驗(yàn),以獲得每種方法的平均性能。

      B&B的運(yùn)行時(shí)間和所提出的方法與訪問(wèn)節(jié)點(diǎn)的數(shù)量成正比。正如預(yù)期的那樣,B&B算法具有最佳的性能和最高的復(fù)雜度。B&B方法的平均訪問(wèn)節(jié)點(diǎn)為13 134個(gè)。在使用α=1的價(jià)值網(wǎng)絡(luò)的情況下,平均訪問(wèn)節(jié)點(diǎn)數(shù)下降到僅342個(gè)節(jié)點(diǎn),這比沒(méi)有價(jià)值網(wǎng)絡(luò)的B&B方法的訪問(wèn)節(jié)點(diǎn)數(shù)少了大約38倍。然而,這種復(fù)雜性降低導(dǎo)致性能下降。本研究通過(guò)增加縮放系數(shù)可以獲得更好的性能。用α=2,平均成本為49。得到3個(gè)顯著低于啟發(fā)式方法的平均成本。然而,這時(shí)訪問(wèn)節(jié)點(diǎn)的平均數(shù)量增加到962個(gè),但仍然比B&B算法中的平均訪問(wèn)節(jié)點(diǎn)少約14倍。性能可以隨著α=3而進(jìn)一步提高,但是計(jì)算負(fù)擔(dān)略有增加。EST和ED分別是最早開(kāi)始時(shí)間最早和最早截止時(shí)間最早的方法。SW指的是任務(wù)交換技術(shù)。最后三個(gè)列是使用具有不同比例系數(shù)的價(jià)值網(wǎng)絡(luò)增強(qiáng)的B&B方法的,結(jié)果如表3和表4所示。

      4? ? 結(jié)語(yǔ)

      本文考慮了多通道多功能雷達(dá)的雷達(dá)資源管理問(wèn)題,介紹了如何利用機(jī)器學(xué)習(xí)技術(shù)在雷達(dá)運(yùn)行過(guò)程中獲取知識(shí),在未來(lái)的決策中使用這些知識(shí)。

      分支定界算法為任務(wù)調(diào)度問(wèn)題找到了最優(yōu)解,但計(jì)算負(fù)擔(dān)較高。本研究展示了如何使用機(jī)器學(xué)習(xí)方法來(lái)降低分支定界方法的復(fù)雜性。在搜索樹(shù)的每個(gè)節(jié)點(diǎn)上使用一個(gè)價(jià)值網(wǎng)絡(luò)來(lái)預(yù)測(cè)節(jié)點(diǎn)的給定部分計(jì)劃中可以實(shí)現(xiàn)的最小成本。價(jià)值網(wǎng)絡(luò)是使用監(jiān)督學(xué)習(xí)和從最佳分支定界方法的離線執(zhí)行中獲得的數(shù)據(jù)樣本進(jìn)行訓(xùn)練的。雖然這大大減少了搜索樹(shù)的訪問(wèn)節(jié)點(diǎn)數(shù)量,但性能不會(huì)受到太大的影響。

      [參考文獻(xiàn)]

      [1]HAYKIN S.Cognitive radar:a way of the future[J].IEEE Signal Processing Magazine,2006(1):30-40.

      [2]MOO P W,DING Z.Adaptive radar resource management[J].Adaptive Radar Resource Management,2015(2):141–148.

      [3]CHARLISH A,WOODBRIDGE K,Griffiths H.Phased array radar resource management using continuous double auction[J].Ieee Transactions on Aerospace and Electronic Systems,2015(3)2212–2224.

      [4]MIRANDA S L C,BAKER C J,WOODBRIDGE K,et al.Comparison of scheduling algorithms for multifunction radar[J].IET Radar Sonar and Navigation,2007(6):414–424.

      [5]SHAGHAGHI M,ADVE R S.Task selection and scheduling in multifunction multichannel radars[C].Seattle:In 2017 IEEE Radar Conference(RadarConf),2017.

      [6]LENSTRA J K,KAN A R,BRUCKER P.Complexity of machine scheduling problems[J].Annals of Discrete Mathematics,1977(1):343–362.

      [7]JOUGLET A,SAVOUREY D.Dominance rules for the parallel machine total weighted tardiness scheduling problem with release dates[J].Computers & Operations Research,2011(9):1259–1266,2011.

      [8]童行行.基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)流量分析研究[D].北京:清華大學(xué),2015.

      [9]顧依依,談詢滔,袁玉波.基于凸邊界的學(xué)習(xí)樣本抽取方法[J].計(jì)算機(jī)應(yīng)用,2019(8):2281-2287.

      [10]曾靖,李文,李宏民,等.基于模擬退火算法的連續(xù)時(shí)間系統(tǒng)的時(shí)域綜合[J].電子測(cè)量與儀器學(xué)報(bào),2019(12):189-195.

      [11]姜鵬飛,蔡之華.基于遺傳算法和梯度下降的RBF神經(jīng)網(wǎng)絡(luò)組合訓(xùn)練方法[J].計(jì)算機(jī)應(yīng)用,2007(2):366-368.

      (編輯 何 琳)

      猜你喜歡
      機(jī)器學(xué)習(xí)
      基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
      基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
      基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
      前綴字母為特征在維吾爾語(yǔ)文本情感分類(lèi)中的研究
      下一代廣播電視網(wǎng)中“人工智能”的應(yīng)用
      活力(2016年8期)2016-11-12 17:30:08
      基于支持向量機(jī)的金融數(shù)據(jù)分析研究
      基于Spark的大數(shù)據(jù)計(jì)算模型
      基于樸素貝葉斯算法的垃圾短信智能識(shí)別系統(tǒng)
      基于圖的半監(jiān)督學(xué)習(xí)方法綜述
      機(jī)器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
      奉节县| 连城县| 宝清县| 宜君县| 门源| 天柱县| 满城县| 屏东县| 新丰县| 天峨县| 平湖市| 厦门市| 泸水县| 遂平县| 兴隆县| 淄博市| 德兴市| 仁寿县| 祁门县| 景德镇市| 金平| 色达县| 奉化市| 玛曲县| 罗甸县| 唐河县| 海晏县| 罗平县| 临猗县| 黄骅市| 永丰县| 辽源市| 施秉县| 三明市| 麻栗坡县| 河源市| 扶沟县| 江山市| 盐城市| 德庆县| 孝昌县|