孫徑舟,王樂涵,孫宇璇,周盛,牛志升
(清華大學電子工程系,北京 100084)
過去幾十年,音/視頻業(yè)務以其大帶寬需求成為無線網絡發(fā)展的主要推動力。而隨著通信技術的發(fā)展,機器型通信、低時延高可靠通信成為新的焦點,通信網絡承載的主要內容將從人與人之間的通信擴展至人與物、物與物之間的通信。這一轉變催生了大量的垂直行業(yè)應用:借助V2X(vehicle-to-everything)通信,車與車之間可以通過交互信息增強感知能力[1-2];工業(yè)物聯(lián)網中,機器通過無線連接降低部署成本[3];虛擬現(xiàn)實及增強現(xiàn)實應用中,頭戴式設備可以通過無線網絡與服務器連接[4]。但由于機器感知速度遠高于人類反應速度,對此類垂直行業(yè)應用通常也有著較高的時延要求,如車聯(lián)網、工業(yè)物聯(lián)網中時延通常要求在10 ms。盡管5G相關研究已經達到了1 ms的用戶面時延和少于20 ms的控制面時延[5],但這些實驗通常是在輕負載的情況下完成的。事實上,在通信資源非常寬裕情況下,通過分配專用的通信資源以實現(xiàn)超可靠低時延通信(ultra reliable low latency communication,uRLLC)并不困難。因此,對于大量機器類型業(yè)務,僅提供低時延服務并不夠。在B5G及6G中,應聯(lián)合考慮信息產生、傳輸以及信道狀態(tài)進行系統(tǒng)設計。
針對這一問題,近年來興起了對信息時效性的研究。為了解釋信息時效性概念,考慮如圖1所示的狀態(tài)更新系統(tǒng):發(fā)送端對某個過程進行采樣,通過無線信道發(fā)送給接收方,由接收方做出決策并返回。在這個系統(tǒng)中,接收方做出決策時所利用的信息與真實信息之間的差距將影響決策質量。信息偏差越小,決策質量越好,信息時效性越高??梢钥闯?,信息時效性與時延有著明顯的差別。時延是基于單一數(shù)據(jù)包所定義的度量,而信息時效性則針對信息流。提高信息時效性需要低時延通信,但低時延并不意味著高信息時效性。仍以圖1中的系統(tǒng)為例,為了提高信息時效性,發(fā)送端希望提高自己的采樣頻率,但通信信道缺會因為需要傳輸大量數(shù)據(jù)包而擁塞,反而導致接收端信息時效性降低。因此提高信息時效性需要綜合考慮信息的產生、傳輸以及處理的全過程。
圖1 狀態(tài)更新系統(tǒng)示意圖
基于信息時效性的研究需要定義信息時效性的度量。按照對于發(fā)送端過程具體狀態(tài)不同的利用程度,研究者們提出了不同的度量指標,見表1。本文將對這些信息時效性度量進行介紹、比較,并討論相關研究工作。
表1 信息時效性度量對比
信息年齡(age of information)最早由參考文獻[6]提出,接收端Rx在t時刻的信息年齡h(t)定義為Rx所接收的最新數(shù)據(jù)包的產生時刻與當前時刻的偏差值,即:
其中,Si為第i個成功接收到的數(shù)據(jù)的產生時間,而Di為該數(shù)據(jù)的接收時間。信息年齡演化曲線如圖2所示,S1時刻采樣產生的數(shù)據(jù)在D1時刻被成功接收,那么D1的信息年齡從D1下降為D1-S1。現(xiàn)有研究大多關注兩個性能指標:平均信息年齡和峰值信息年齡。平均信息年齡指在一段時間內的信息年齡累加并除以時長,即圖2中著色區(qū)域面積比上時間長度。而峰值信息年齡,即在接收端收到新的數(shù)據(jù)包之前時刻的信息年齡,即圖2中圈出的區(qū)域,如D2時刻的峰值信息年齡為D2-S1。
圖2 信息年齡演化曲線
以車聯(lián)網的典型場景編隊駕駛(platooning)和路口調度為例,進一步說明信息年齡的物理意義。在編隊駕駛中,頭車(leader)需要將自身狀態(tài)信息(包括但不限于車輛的速度、加速度、位置等)頻繁地發(fā)送給編隊中的跟隨車輛(follower),從而保證整個編隊系統(tǒng)的穩(wěn)定性和安全。在編隊駕駛中,跟隨車輛收到的來自頭車的狀態(tài)信息的信息年齡越大,說明跟隨車輛對頭車當前狀態(tài)的認知越不及時,信息時效性越低。信息年齡較大時,跟隨車輛僅能根據(jù)來自頭車的過時信息控制自身的運動,無法對突發(fā)的緊急情況做出及時的應對,從而產生危險。同理,在路口調度中,路側單元(road side unit)也需要盡可能地基于路口附近車輛最新的、信息年齡最小的狀態(tài)信息實時地得出調度策略,從而保證車輛安全高效地通過路口。
可見,信息年齡的定義有著明確的物理意義,但并未涉及信息的內容。信息年齡本身隨著時間線性增長,但有研究工作指出,所關心的系統(tǒng)性能有時可表示為信息年齡的函數(shù)形式,如參考文獻[7]中,對于高斯-馬爾可夫塊衰落信道,信道容量表達可以被表示成信道狀態(tài)信息(channel state information,CSI)的信息年齡的函數(shù)。
在典型的狀態(tài)更新系統(tǒng)中,將有多個傳感器分別向控制中心上傳狀態(tài)信息。IEEE 802.11協(xié)議、LTE以及5G NR的隨機接入信道均采用CSMA(carrier-sense multiple access)、ALOHA等經典的MAC(medium access control)層接入機制,但此類機制主要以吞吐量最優(yōu)為目標,并未考慮信息年齡的需求。因此,有大量工作研究如何設計調度與接入機制以優(yōu)化信息年齡。筆者將從調度機制、網絡拓撲、優(yōu)化目標等幾個角度分別介紹相關進展。
在參考文獻[8-11]中,研究者們考慮集中式調度機制,即假設存在一個掌握全局信息的中心控制節(jié)點,并由其選擇當前時刻應該由哪些終端接入信道上報狀態(tài)信息,且均考慮優(yōu)化長時平均信息年齡。參考文獻[8]考慮節(jié)點被調度時會進行采樣并產生包含最新狀態(tài)信息的數(shù)據(jù)包。同時在參考文獻[8]中,信道狀態(tài)被抽象為服從伯努利分布的隨機過程,即傳輸成功和失敗概率固定。其中分別研究了貪心調度策略、基于虛擬隊列的調度策略以及基于懷特指數(shù)(Whittle’s index)的調度策略,仿真結果顯示,在不同的網絡參數(shù)下,后兩種調度策略性能均接近最優(yōu)值。參考文獻[9]同樣采用了懷特指數(shù)來設計調度策略,與參考文獻[8]不同的是,參考文獻[9]中假設狀態(tài)采樣過程不可控,而是在每個時隙以一定概率產生新的數(shù)據(jù)包。同時,為了簡化分析,參考文獻[9]中假設每個發(fā)送端僅在采樣時刻進行傳輸,也就是零緩沖假設。由于之前時刻采樣的數(shù)據(jù)包即使未在采樣時刻發(fā)送,仍然能夠帶來信息年齡增益,因此零緩沖將帶來一定的性能損失。在參考文獻[10]中,研究者們假設每個信源能夠保留最近一次采樣的數(shù)據(jù)包,而不是直接丟棄,并計算得到信道理想情況下的懷特指數(shù)。參考文獻[11]進一步擴展到采樣隨機且信道非理想場景,提出了近似調度指標。
大多數(shù)狀態(tài)更新系統(tǒng)中并不存在一個掌握全局信息的中心調度節(jié)點,因此,考慮分布式接入機制尤為重要。表2給出了相關代表性工作的總結。
表2 分布式接入研究總結
在參考文獻[12]中,作者考慮非理想信道以及調度時刻采樣,分別研究了集中式調度與基于ALOHA接入兩種策略下的平均信息年齡性能。對于集中式調度,調度中心依次調度各個節(jié)點上傳狀態(tài)信息,傳輸失敗時不考慮HARQ機制,而是重新采樣上傳,直到傳輸成功或達到最大重傳次數(shù)S。而基于ALOHA的接入機制中,各個節(jié)點以一定概率接入信道進行狀態(tài)信息傳輸。其中給出了兩種情況下平均信息年齡的閉式表達式。當要求各個用戶的平均信息年齡相同時,基于ALOHA的接入機制下的平均信息年齡為帶有重傳機制的集中式調度的2e倍。這顯示了集中式調度與單純的ALOHA協(xié)議相比的優(yōu)勢。前述工作均考慮離散時間系統(tǒng),而參考文獻[13]考慮連續(xù)時間系統(tǒng):假設傳輸與退避時間均服從負指數(shù)分布,研究調度采樣和隨機采樣兩種情況下CSMA協(xié)議的平均信息年齡,并分別給出了閉式表達式和性能上界?;谛阅鼙磉_式,可以通過調節(jié)退避時長(back-off time)以優(yōu)化協(xié)議性能。該研究指出,最優(yōu)退避時長與采樣過程無關。參考文獻[12-13]主要對現(xiàn)有協(xié)議性能進行分析,并沒有做出改進。
在參考文獻[13]的基礎上,參考文獻[14]針對現(xiàn)有協(xié)議與最優(yōu)值之間的差距進行分析。這里的最優(yōu)值是假設存在掌握全局狀態(tài)信息的調度節(jié)點時,調度算法所能達到的最小平均信息年齡性能。參考文獻[14]中指出,通過調整退避時長,隨著系統(tǒng)中用戶數(shù)增長,使用CSMA協(xié)議在漸進意義下的平均信息年齡為最小平均信息年齡的2倍。研究者們同時提出基于簡單的輪詢策略(round-robin)進行調度,即每個時隙依次調度用戶接入信道。其中證明了隨著用戶數(shù)增長,輪詢策略下平均信息年齡接近最優(yōu)值。需要指出的是,由于輪詢策略的最優(yōu)性是漸近最優(yōu),在用戶數(shù)較少或者隨機采樣頻率低的情況下性能并不理想。
現(xiàn)有分布式接入?yún)f(xié)議的目標是盡可能減少沖突,提高吞吐量。而基于信息年齡設計的接入?yún)f(xié)議則需要實現(xiàn)兩個目標:減少沖突和傳輸能夠帶來較高時效性增益的數(shù)據(jù)。一個直觀的設計思路可以同步達成這兩個目標,即只讓具有高時效增益的用戶接入信道。此時由于接入信道的用戶數(shù)減少,沖突概率也隨之下降。因此,問題轉化為如何使得用戶自行判斷是否應該接入信道。在參考文獻[15]中,作者采用懷特指數(shù)作為判斷數(shù)據(jù)時效性增益高低的指標,懷特指數(shù)越大,意味著用戶進行傳輸?shù)臅r效性增益越高。通過設置懷特指數(shù)閾值,只有懷特指數(shù)大于該閾值的用戶被允許進行傳輸,這樣就減少了競爭信道的用戶數(shù)。同時為了減少沖突,這部分用戶采用CSMA的方式競爭信道。仿真結果證明該帶有優(yōu)先級的CSMA協(xié)議下平均信息年齡接近最優(yōu)值。但參考文獻[15]并沒有詳細分析如何進行閾值設置,而是通過一維搜索進行選擇。在參考文獻[16]中,作者分析了如何設置閾值,并基于平均場理論(mean-field theory)給出了各個用戶的閾值表達式。對于集中式調度,只需從信息年齡大于各自閾值的用戶中隨機挑選接入信道即可,可以證明,這種調度方法的性能在用戶數(shù)趨于無窮的條件下是漸近最優(yōu)的。同時,由于該策略只需要用戶將自身信息年齡與閾值比較,因此也可以設計基于ALOHA或者CSMA的分布式接入機制。
上述工作主要考慮平均信息年齡,還有一部分工作考慮平均峰值信息年齡性能。在參考文獻[17]中,作者考慮用戶可以劃分為多個可行集的場景。同一可行集中的用戶可以同時接入信道,而不同可行集之間存在干擾,不能同時接入。其中指出對于峰值年齡,存在一個最優(yōu)策略是隨機策略,即每個時隙按照相同的概率分布選擇一個可行集接入信道,此時平均峰值信息年齡最優(yōu)。這主要是由于平均峰值信息年齡可以表示為調度頻率的倒數(shù)。而對于平均信息年齡,可以證明這種隨機策略所達到的平均信息年齡不超過最優(yōu)值兩倍。
除了平均性能之外,部分應用更關心信息年齡不超過一定閾值。參考文獻[18]分析了當信息年齡具有閾值約束時的調度策略設計??紤]理想信道,尋找滿足閾值約束的調度算法被轉化為在有向圖上尋找環(huán)路問題。由于尋找環(huán)路問題復雜度過高,因此作者首先對一組具有特殊結構的閾值約束進行分析,即不同用戶閾值具有倍數(shù)關系。針對這種特殊結構閾值,其中提出了一種低復雜度調度算法。而對于一般閾值約束要求,作者提出了一個映射算法,將一般閾值約束映射為具有特殊結構的閾值約束,并證明了大部分閾值約束都可以被映射成具有特殊結構的類型。當信道存在非理想因素時,參考文獻[19]將硬閾值約束松弛為超過閾值的概率約束,與參考文獻[18]提出一種周期性調度算法類似,并證明該算法滿足約束條件。
信息年齡定義簡潔,物理意義明確,但信息年齡并不能準確地反映接收端對發(fā)送端狀態(tài)信息的認知情況。根據(jù)信息年齡的定義,即便接收端已經獲知發(fā)送端的真實狀態(tài)信息,只要沒有收到來自發(fā)送端的新的狀態(tài)更新,信息年齡便會不斷增大。因此,對于狀態(tài)變化快速的發(fā)送端,較小的信息年齡并不意味著接收端準確獲得狀態(tài)信息,對于狀態(tài)變化緩慢的發(fā)送端,較大信息年齡也可能意味著準確的狀態(tài)信息認知??紤]發(fā)送端狀態(tài)未發(fā)生改變時,沒有必要進行狀態(tài)信息傳輸,參考文獻[20]引入同步信息年齡(age of synchronization)這一新指標來刻畫發(fā)送端與接收端狀態(tài)信息不同的影響,t時刻的同步信息年齡hS(t)定義為:
其中,US(t)為最近一次接收端發(fā)送端狀態(tài)不同步的時間(若當前時刻已同步,則US(t)等于t)。同步信息年齡定義與信息年齡不同,只有當發(fā)送端狀態(tài)信息發(fā)生改變時才會開始增長,即發(fā)送端與接收端狀態(tài)存在差異將觸發(fā)同步信息年齡增加,這就是“同步”概念的由來。圖3中的實線展示了同步信息年齡的演化曲線。同時為了便于與信息年齡區(qū)分,圖3中使用虛線標出了信息年齡的演化曲線??梢钥吹剑赟1時刻產生狀態(tài)更新后,接收端和發(fā)送端狀態(tài)存在差異,因此同步信息年齡開始增長,直到D1時刻傳輸完成后,二者再次同步。
圖3 同步信息年齡演化曲線
在參考文獻[20]中,作者考慮一個緩存更新系統(tǒng),多個遠程節(jié)點向中心服務器備份各自所緩存的信息。考慮離散時間系統(tǒng),每個時隙中遠程節(jié)點所緩存的內容更新s事件服從伯努利分布。中心服務器周期性地提取遠程節(jié)點緩存內容。其中計算了周期性提取策略下的平均同步信息年齡。由于網絡帶寬有限,假設存在最大的總提取頻率約束,計算得到此時各個遠程節(jié)點的提取頻率。當總提取頻率遠大于節(jié)點緩存內容更新頻率時,各個節(jié)點提取頻率為緩存內容更新頻率的立方根形式。而當總提取頻率小于節(jié)點緩存內容更新頻率時,各節(jié)點提取頻率為緩存內容更新頻率平方根形式。
雖然周期性調度便于實現(xiàn),但通常并不一定是最優(yōu)的。因此參考文獻[21]對此展開了進一步的分析,研究在信道不理想時的調度策略。參考文獻[21]將原問題建模為馬爾可夫決策問題,并證明最優(yōu)策略具有閾值結構?;谶@一性質,進一步設計了基于懷特指數(shù)的調度算法。在該算法下,當同步信息年齡相同時,信道傳輸成功概率越高,或狀態(tài)更新概率越小的節(jié)點,調度優(yōu)先級越高。
從信息年齡和同步信息年齡的定義可知,兩種度量都會在收到下個更新前始終隨著時間線性增長,因此它們不能很好地度量信息時效性對系統(tǒng)性能造成的非線性影響。以遠程估計(remote estimation)問題為例,參考文獻[22]考慮遠程觀測一個維納過程,當采樣策略考慮發(fā)送端實際狀態(tài)時,遠程估計的均方誤差并不能表示為信息年齡的函數(shù)形式。為了解決上述問題,參考文獻[23]提出了錯誤信息年齡(age of incorrect information),將錯誤信息年齡 ΔAoII(t)定義為一個關于時間的非減效用函數(shù)f(t)和函數(shù)的乘積,即:
盡管錯誤信息年齡能解決信息年齡存在的問題并準確反映接收端對發(fā)送端的認知情況,但在實現(xiàn)中卻更加復雜。接收端在計算信息年齡時只需觀察收到的狀態(tài)更新數(shù)據(jù)包上的時間戳,但無法通過上述方法計算得到錯誤信息年齡。為了得出錯誤信息年齡,接收端必須在成功收到狀態(tài)更新數(shù)據(jù)包的時候發(fā)送ACK通知發(fā)送端,此外,收發(fā)雙端也必須約定狀態(tài)估計算法,這樣發(fā)送端才能實時地準確獲知接收端的狀態(tài)估計,并進一步得出錯誤信息年齡。
參考文獻[24]在遠程監(jiān)控單一對稱二值馬爾可夫信息源的離散時間場景下對錯誤信息年齡進行了研究。在該場景中,存在一個二值馬爾可夫數(shù)據(jù)源作為發(fā)送端和一個接收端,發(fā)送端發(fā)出的狀態(tài)信息需要經歷一個服從幾何分布的隨機時延才能到達接收端。當接收端收到狀態(tài)信息后將立刻發(fā)送ACK告知發(fā)送端信道資源已經被釋放,此時發(fā)送端可以選擇是否進行采樣,并發(fā)送一個新的狀態(tài)信息。參考文獻[24]基于3種不同度量:平均實時錯誤(real-time error)、平均信息年齡和平均錯誤信息年齡分別給出了最優(yōu)采樣策略。其中,平均實時錯誤是指,符號I表征示性函數(shù)。其中發(fā)現(xiàn)在3種策略中平均信息年齡最優(yōu)策略與平均實時錯誤最優(yōu)策略一致,都是在馬爾可夫數(shù)據(jù)源狀態(tài)變化時進行更新,這說明最小化錯誤信息年齡等同于最小化系統(tǒng)的實時錯誤性能,而最小化信息年齡則并不能保證接收端對發(fā)送端的準確認知。參考文獻[25-26]則分別研究了上述場景中傳輸能量受限和平均傳輸頻率受限時的平均錯誤信息年齡最小的策略。
參考文獻[27]進一步考慮了多發(fā)送端的遠程監(jiān)控問題,假設離散時間系統(tǒng)中存在多個發(fā)送端通過塊衰落信道向調度中心傳輸狀態(tài)信息,每個時隙同時傳輸狀態(tài)信息的發(fā)送端不能超過M個,調度中心實時將資源分配給部分發(fā)送端傳輸數(shù)據(jù)。由于調度中心不能實時獲知估計誤差,上述優(yōu)化問題被建模為部分可觀察的馬爾可夫決策過程問題,該文進一步基于懷特指數(shù)得出了調度策略,即每時隙調度M個懷特指數(shù)最大的發(fā)送端傳輸更新。
除了不能衡量過時信息的非線性效應外,信息年齡忽視了發(fā)送端所處的情境對信息時效性的影響。例如在編隊駕駛中,頭車與跟隨車輛之間的信息交互扮演著重要的角色。一方面,車輛移動性較強,編隊所處情境變化迅速,在某些情境下,例如車輛編隊經過路口時,或車輛編隊經歷超車等突發(fā)的緊急事件時,頭車的狀態(tài)信息應當更加頻繁地向跟隨車輛進行更新,以保證交通安全。因此,受限的無線通信資源應當主要分配給處于緊急狀態(tài)中的車輛。為了聯(lián)合反映發(fā)送端對接收端的認知情況以及發(fā)送端的情境信息,筆者在參考文獻[28-29]基于情境信息和狀態(tài)信息可知的系統(tǒng),提出了度量信息時效性的新指標:信息緊迫度(urgency of information)。t時刻的信息緊迫度定義為情境感知權重ω(t)和狀態(tài)估計誤差Q(t)的函數(shù)δ(Q(t))的乘積,即:
狀態(tài)估計誤差Q(t)的變化為:
其中,gt是t時刻之前收到的最新狀態(tài)信息更新的產生時間,A(t)是t時隙內估計誤差的增量。D(t)表示接收端是否收到發(fā)送端發(fā)送的狀態(tài)更新,D(t)=1表示接收端收到狀態(tài)信息。可以看出,信息緊迫度同樣是一個普適的信息時效性度量:
(1)當函數(shù)δ是線性函數(shù)、情境權重不隨時間改變、估計誤差的增量A(t)是1時,信息緊迫度等同于信息年齡;
(2)當函數(shù)δ是非線性函數(shù)、情境權重不隨時間改變、估計誤差的增量A(t)是1時,信息緊迫度等同于基于信息年齡的非線性效用函數(shù);
(3)當函數(shù)δ(Q(t)) =Q(t)2、情境權重隨時間發(fā)生改變時,信息緊迫度等同于均方誤差。
根據(jù)上述定義,可以看出,在編隊駕駛中,跟隨車輛收到的來自頭車的狀態(tài)信息的信息緊迫度表示頭車不及時或不準確的狀態(tài)信息對跟隨車輛造成的影響。車輛編隊所處的情況越緊急,跟隨車輛對頭車的狀態(tài)信息認知越不及時,或越不準確,信息緊迫度越大,此時,跟隨車輛不得不在緊急情況下根據(jù)頭車的過時信息或不準確信息來控制自身運動,給編隊系統(tǒng)帶來巨大風險。
基于信息緊迫度的優(yōu)化主要包括兩個方面,即平均更新頻率受限時的單發(fā)送端狀態(tài)信息更新調度策略[29-30]和接入受限時的多發(fā)送端狀態(tài)更新調度策略[31]。
對于單發(fā)送端離散時間系統(tǒng),參考文獻[29]假設發(fā)送端通過一個塊衰落無線信道向控制中心發(fā)送狀態(tài)更新信息,即該發(fā)送端狀態(tài)信息傳輸成功率為p。記第t個時隙的更新策略和傳輸結構分別為U(t)和S(t)。發(fā)送端選擇更新則U(t)=1,否則為0。狀態(tài)信息成功傳輸則S(t)= 1,否則為0。當接收端收到狀態(tài)更新后,會向發(fā)送端發(fā)送反饋信息,否則不發(fā)送。對于狀態(tài)估計方法,接收端會將收到的最新狀態(tài)信息直接視作當前狀態(tài)信息的估計。另一方面,由于無線資源受限,發(fā)送端不能時時占用信道,因此平均更新頻率應當受限,假設最大更新頻率為ρ。優(yōu)化目標是最小化系統(tǒng)的平均信息年齡。
由于上述優(yōu)化問題存在平均更新頻率應當小于給定值的限制條件,首先引入虛擬隊列H(t),并將滿足該限制條件轉化為保證該虛擬隊列平均速率穩(wěn)定(mean rate stable)。該虛擬隊列遵從:H(t+ 1) = [H(t) -ρ+U(t)]+,其中ρ為平均更新頻率。進一步定義李雅普諾夫函數(shù)和效用函數(shù),并證明李雅普諾夫漂移和效用函數(shù)的和的上界就是平均信息緊迫度上界,再代入每個時隙更新概率為ρ的隨機更新策略,即可求出平均信息緊迫度的上界。通過最小化該上界,可以得出動態(tài)門限更新策略。在該策略中,動態(tài)門限為李雅普諾夫優(yōu)化方法中的收斂系數(shù)和虛擬隊列長度的乘積。每個時隙開始時,發(fā)送端首先基于估計誤差和下一時隙的情境權重求出更新指數(shù),僅當更新指數(shù)大于動態(tài)門限時,發(fā)送端向接收端發(fā)送更新信息。信息緊迫度最優(yōu)的更新策略、動態(tài)門限更新策略和信息年齡最優(yōu)的更新策略性能對比如圖4所示,仿真結果顯示基于信息緊迫度的更新策略相較基于信息年齡的更新策略,能夠達到更低的平均信息緊迫度。這說明基于信息緊迫度的更新策略傾向于將通信資源分配給緊急情況下的狀態(tài)更新,從而保證系統(tǒng)安全。
圖4 信息緊迫度最優(yōu)的更新策略、動態(tài)門限更新策略和信息年齡最優(yōu)的更新策略性能對比
參考文獻[29]中的策略雖然簡潔易于實現(xiàn),但需要知道下個時隙準確的情境權重(即ω(t+ 1)) 來計算更新指數(shù),而ω(t+ 1)在實際系統(tǒng)中往往難以獲知。為了解決這一問題,參考文獻[30]提出的動態(tài)門限更新策略僅需用到下個時隙情境權重的條件期望,即E[ω(t+ 1)|ω(t)]。但該方法需要獲知情境權重的完整狀態(tài)轉移概率,而在實際系統(tǒng)中轉移概率往往不能獲知或隨著時間發(fā)生變化,因此參考文獻[30]進一步采用在線強化學習算法SARSA學習出發(fā)送端情境權重的變化和相應的更新策略。仿真顯示,動態(tài)門限更新策略和基于SARSA的更新策略在更新頻率較大時都能達到近似最優(yōu)的性能,而在更新頻率較小時,基于SARSA的更新策略顯著優(yōu)于動態(tài)門限更新策略。仿真結果顯示,動態(tài)門限更新策略和基于SARSA的更新策略在更新頻率較大時性能均接近最優(yōu),而在更新頻率較小時,基于SARSA的更新策略顯著優(yōu)于動態(tài)門限更新策略。
參考文獻[31]則考慮接入受限的多發(fā)送端場景。離散時間系統(tǒng)中存在N個發(fā)送端和一個控制中心,每個發(fā)送端都通過一個塊衰落信道向控制中心發(fā)送狀態(tài)信息,第i個發(fā)送端的傳輸成功概率為pi。系統(tǒng)中每個時隙僅允許K個發(fā)送端同時向控制中心傳輸狀態(tài)更新信息。優(yōu)化目標是在上述系統(tǒng)中最小化平均信息緊迫度。該文首先通過李雅普諾夫優(yōu)化方法得出了集中式的調度策略,每個時隙開始時控制中心基于發(fā)送端的下一時隙情境權重和估計誤差計算每個發(fā)送端對應的更新指數(shù),并調度更新指數(shù)最大的K個發(fā)送端向控制中心傳輸狀態(tài)更新信息。
集中式調度雖然性能優(yōu)越,但在實際系統(tǒng)控制中心往往難以獲得所有發(fā)送端的估計誤差和情境權重。因此參考文獻[31]進一步提出了基于CSMA/CA的動態(tài)門限分布式調度算法。該策略中的動態(tài)門限由每個發(fā)送端在本地維護,但所有發(fā)送端的動態(tài)門限是一致的。僅有更新指數(shù)大于動態(tài)門限的發(fā)送端才能在每個時隙的競爭階段參與信道競爭,競爭成功的K個發(fā)送端進入此后的傳輸階段。在長度為W個微時隙(mini-slot)的競爭階段中,所有競爭者隨機獲得一個避讓時間。若競爭者避讓時間結束,仍有剩余的傳輸機會,則該競爭者競爭成功。若競爭結束后可用信道未能被完全占用,則降低動態(tài)門限,增加發(fā)送端競爭機會,而動態(tài)門限較低時則會導致劇烈競爭,此時應當增加門限。仿真顯示,所提動態(tài)門限分布式調度算法性能對于發(fā)送端數(shù)目的魯棒性較強,能很好地適應海量接入場景。
本文從狀態(tài)更新系統(tǒng)中的信息時效性出發(fā),闡述了在通信資源受限情況下現(xiàn)有的低時延高可靠概念并不足以全面刻畫信息時效性;進而介紹了當前領域關于信息時效性度量的定義,以及在無線網絡中基于這些度量的相關優(yōu)化工作。
面向狀態(tài)信息時效性的通信系統(tǒng)設計不同于現(xiàn)有以時延和吞吐量為優(yōu)化目標的系統(tǒng),主要區(qū)別有兩點:狀態(tài)信息時效性不僅涉及通信時延,還包括調度時延、網絡擁塞情況等因素;狀態(tài)信息時效性與發(fā)送端本身狀態(tài)變化過程有關,因此要考慮狀態(tài)信息對于系統(tǒng)性能的影響。這意味著基于狀態(tài)信息時效性的網絡優(yōu)化應綜合考慮上述因素的影響。
可以看到,信息年齡、同步信息年齡、錯誤信息年齡、信息緊迫度這些度量對于實際狀態(tài)信息的利用程度依次提升。但這并不意味著現(xiàn)有的度量就足以滿足狀態(tài)更新系統(tǒng)的需求,而更應該被視為在這一領域的嘗試?,F(xiàn)有的工作往往對于信道條件、發(fā)送端狀態(tài)變化過程等有不同程度的抽象,而針對實際場景的考慮不足,未能充分刻畫狀態(tài)變化、信道條件等因素的影響。研究者們需要回答:(1)如何刻畫信息時效性與對應物理系統(tǒng)性能之間的關系?(2)如何適應變化復雜的信道環(huán)境以及刻畫發(fā)送端狀態(tài)變化過程?(3)如何設計具有面向大量接入場景的可擴展性機制?回答第一個問題需要理解控制系統(tǒng)在不同時延情況下的系統(tǒng)性能;而第二個問題可以借助人工智能技術的強大表征能力,適應環(huán)境和狀態(tài)的變化;針對第三個問題,需要對現(xiàn)有的系統(tǒng)做出調整,設計支持新業(yè)務的網絡架構。綜上,推進狀態(tài)信息時效性研究有賴于通信、控制、人工智能等多個學科領域的交叉融合,這也展示了該方向廣闊的研究前景。