范 靖,彭 濤,王文博
(北京郵電大學(xué)泛網(wǎng)無線通信教育部重點(diǎn)實(shí)驗(yàn)室,北京100876)
TD-SCDMA是我國通信歷史上第一個(gè)擁有自主知識(shí)產(chǎn)權(quán)的3G國際標(biāo)準(zhǔn),截至2013年4月,TDSCDMA用戶數(shù)已經(jīng)達(dá)到1.2億。隨著用戶的迅速發(fā)展壯大,市場對TD-SCDMA終端的需求也成倍增加,同時(shí)終端市場正往多模、多核的趨勢發(fā)展?,F(xiàn)階段有關(guān)TD-SCDMA多核手機(jī)芯片的實(shí)現(xiàn)方案研究符合市場的發(fā)展需要。
作為終端開機(jī)的第一步,下行同步直接影響了終端的整體性能。下行導(dǎo)頻時(shí)隙(DwPTS)搜索和載波頻偏估計(jì)在下行同步中是最關(guān)鍵的問題。文獻(xiàn)[1-2]總結(jié)和比較了現(xiàn)有的主要DwPTS搜索算法,文獻(xiàn)[3]總結(jié)和比較了現(xiàn)有的主要載波頻偏估計(jì)算法。本文首先介紹了下行同步過程[4],然后結(jié)合各種主要的DwPTS搜索算法和載波頻偏估計(jì)算法的比較,設(shè)計(jì)了快速的非信令下行同步方案,最后根據(jù)Tensilica多核DSP芯片的特點(diǎn)充分優(yōu)化了該方案的實(shí)現(xiàn),給出了同步性能分析。
下行同步包括下行同步捕獲和下行同步跟蹤兩個(gè)過程。
同步捕獲是指用戶開機(jī)搜索到駐留到合適的小區(qū)的過程,主要包括以下步驟:
(1)考察TDD頻帶2010~2025 MHz內(nèi)9個(gè)頻點(diǎn)的功率,選擇最大功率的頻點(diǎn)開始搜索;
(2)搜索 DwPTS,實(shí)現(xiàn)5 ms子幀同步,找出下行同步碼(SYNC_DL)碼號(hào);
(3)利用SYNC_DL進(jìn)行頻偏估計(jì),調(diào)整初始大頻偏;
(4)根據(jù)第2步解出的SYNC_DL碼與Midamble碼組的對應(yīng)關(guān)系找出Midamble碼和擾碼;
(5)根據(jù)Midamble碼進(jìn)行頻偏估計(jì),進(jìn)行頻偏精調(diào);
(6)解 SYNC_DL相位,實(shí)現(xiàn)傳輸時(shí)間間隔(TTI)同步,解廣播信道。根據(jù)步驟2~6的結(jié)果判斷是否返回步驟1更換頻點(diǎn)。
2.1.1 DwPTS 搜索算法
DwPTS搜索是指找到子幀中的SYNC_DL位置以及碼號(hào),實(shí)現(xiàn)5 ms同步。目前已有的DwPTS搜索算法主要有標(biāo)準(zhǔn)時(shí)域相關(guān)法、標(biāo)準(zhǔn)頻域相關(guān)法、Alessandro頻域改善法、特征窗法以及相應(yīng)的改進(jìn)算法、幀結(jié)構(gòu)搜索法等[2]。由于文章篇幅限制,下面只對特征窗法做相應(yīng)介紹。
設(shè)接收到的一個(gè)子幀數(shù)據(jù)為 ri,i=1,2,…,6400。32組長度為64的本地SYNC_DL碼調(diào)制符號(hào)序列為sj
k,k=1,2,…,64;j=1,2,…,32。特征窗法[4]包括DwPTS位置粗搜和SYNC_DL碼確認(rèn)兩個(gè)步驟。DwPTS位置粗搜是指根據(jù)幀結(jié)構(gòu),64 chip的SYNC_DL碼的左邊有32 chip的保護(hù)間隔(GP),右邊有96 chip的GP。由于GP的功率很小,SYNC_DL碼的功率較大,利用接收信號(hào)的功率形狀建立功率“特征窗”的方法來搜索DwPTS的大致位置。計(jì)算步驟如下所述。
(1)計(jì)算接收信號(hào)碼片功率
(2)計(jì)算特征窗功率比值
其中,step為特征窗移動(dòng)步長,可以取1、2、4、8 等。
(3)找出Ri的最大值
假設(shè)其標(biāo)號(hào)為im,則相對初始幀定時(shí)的DwPTS的大致位置為
SYNC_DL碼確認(rèn)是指,從 Pos處開始取128 chip數(shù)據(jù) r2,其中第 k個(gè)元素表示為 r2,k,k=0,…,127,第 i組復(fù)值 SYNC_DL碼為 si,其中第 k個(gè)元素表示為 si,k,i=0,1,…,31;k=0,1,…,63,計(jì)算接收信號(hào)與32個(gè)SYNC_DL碼的復(fù)相關(guān)功率。先在SYNC_DL碼后補(bǔ)64個(gè)0,再計(jì)算復(fù)相關(guān):
找出每個(gè)powi,k的最大值pow_maxi,并找出32個(gè)pow_maxi的最大值pow_MAXm,則確認(rèn)SYNC_DL碼的編號(hào)為m,根據(jù)最大值pow_MAXm的位置position可以算出DwPTS的起始位置為Pos+position。
特征窗法的改進(jìn)算法[2]主要有兩個(gè):一是將除法改進(jìn)為乘法;二是為了降低DwPTS的誤判率,引入了平均功率準(zhǔn)則。
2.1.2 頻偏估計(jì)算法
頻偏是指由于終端的晶振抖動(dòng)、老化等因素,導(dǎo)致了接收機(jī)本振的頻率與基站頻率不匹配。頻偏會(huì)嚴(yán)重影響接收機(jī)和同步保持的性能,因此需要對頻偏進(jìn)行估計(jì)并調(diào)整、補(bǔ)償。由于終端的非信令模式主要是用于生產(chǎn)測試,采用AWGN信道模擬,用于頻偏估計(jì)的系統(tǒng)模型如圖1所示。
圖1 頻偏估計(jì)系統(tǒng)模型Fig.1 Frequency offset estimation system model
圖中:
式中,si為Midamble碼或SYNC_DL碼序列,N為Midamble碼或者SYNC_DL碼長度,Tc為碼片速率。s(t)經(jīng)過AWGN信道后得到r(t):
式中,Δf是需要估計(jì)的頻偏,θ是均勻分布于[0,2π)內(nèi)的隨機(jī)相位,τ是時(shí)延,n(t)是復(fù)加性高斯白噪聲,nk=nk,c+jnk,s,{nk,c} 和 { nk,s}是相互獨(dú)立的零均值高斯白噪聲序列,其方差均為σ2/2。由于發(fā)送的訓(xùn)練序列已知,即,可以算出用于頻偏估計(jì)的輸入序列
以下是常用的頻偏估計(jì)算法,由于本文篇幅限制只給出計(jì)算公式。
(1)Kay 算法[6]
(2)Fitz算法[7]
(3)L&R 算法[8]
(4)Kay&R 算法
(5)差分相關(guān)算法[2]
下行同步跟蹤是指在下行捕獲成功之后,不斷地跟蹤檢測時(shí)偏和頻偏,并做出相應(yīng)的調(diào)整。
Tensilica公司能夠根據(jù)應(yīng)用需求定制出結(jié)合高計(jì)算性能、低功耗、高集成度等優(yōu)點(diǎn)的可擴(kuò)展Xtensa處理器,為現(xiàn)今高容量嵌入式系統(tǒng)提供最優(yōu)良的解決方案。本文中的非信令TD-SCDMA物理層框架是基于Tensilica公司Atlas LTE解決方案加Maxim射頻芯片設(shè)計(jì)的。Atlas系統(tǒng)主要包括一個(gè)ConnX BSP3核、一個(gè) ConnX SSP16核、一個(gè) ConnX Turbo16MS以及3個(gè)ConnX BBE16核,每種DSP核由于設(shè)計(jì)方法不同分別擅長不同的運(yùn)算處理,根據(jù)各個(gè)核擅長的運(yùn)算設(shè)計(jì)了如圖2所示的物理層框架。
圖2 TD-SCDMA物理層整體框圖Fig.2 The framework of TD-SCDMA L1
本文實(shí)現(xiàn)的下行同步主要用到了圖2中的BSP3主控核、BBE16_Rx1核、BBEL2緩存和Maxim射頻芯片組。
DwPTS搜索作為下行同步的第一步,需要選擇計(jì)算量小、搜索成功率高、穩(wěn)定性好的算法。文獻(xiàn)[2]中給出了主要算法性能比較,標(biāo)準(zhǔn)時(shí)域相關(guān)法和標(biāo)準(zhǔn)頻域相關(guān)法及其改進(jìn)算法相較于其他算法運(yùn)算量都很大,同時(shí)考慮到同步建立時(shí)間,最佳的Dw-PTS搜索算法就集中于特征窗搜索系列算法。在特征窗搜索算法中,在DSP實(shí)現(xiàn)時(shí)采用乘法比較相較于除法比較計(jì)算更準(zhǔn)確,計(jì)算開銷更小,而平均功率判決的改進(jìn)能使系統(tǒng)在更低的信噪比下搜索成功??紤]到非信令模式下,終端直連與終測儀,系統(tǒng)信噪比很高,因此綜合各種因素,最佳的DwPTS搜索算法為基于乘法比較的特征窗搜索算法。圖3給出了DwPTS搜索成功率與信噪比的關(guān)系,信道采用AWGN信道模擬。
圖3 不同SNR下特征窗法DwPTS搜索成功率Fig.3 The success rate of power window method
由于Midamble碼比SYNC_DL碼長,采用Midamble碼進(jìn)行頻偏估計(jì)相較于采用SYNC_DL碼進(jìn)行頻偏估計(jì)會(huì)有2~3 dB的增益。下面針對1 kHz頻偏信號(hào)給出基于Midamble碼的各頻偏估計(jì)算法的性能比較。根據(jù)圖4可知,各算法在信噪比大于2 dB時(shí)均值都穩(wěn)定于1000 Hz左右,當(dāng)信噪比低于0 dB時(shí),F(xiàn)itz、L&R、差分相關(guān)算法的性能優(yōu)于Kay、Kay&R 算法。
圖4 不同SNR下基于Midamble碼的頻偏估計(jì)均值Fig.4 Mean frequency offset estimation with M
根據(jù)圖5可知,各算法的頻偏估計(jì)標(biāo)準(zhǔn)差隨著信噪比的增加而降低,當(dāng)信噪比高于0 dB時(shí),Kay&R算法最差,其余各算法性能相近。
圖5 不同SNR基于Midamble碼的頻偏估計(jì)標(biāo)準(zhǔn)差Fig.5 MSE of frequency offset estimation with M
從表1比較分析可知,F(xiàn)itz、Kay&R算法計(jì)算量最大,L&R算法計(jì)算量稍大,Kay算法計(jì)算量較小,差分相關(guān)算法計(jì)算量最小。
表1 頻偏估計(jì)算法計(jì)算量比較Table 1 The complexity of different frequency offset estimation algorithms
綜合以上仿真分析,頻偏估計(jì)采用基于Midamble碼的差分相關(guān)算法相比于其他各種算法具有更低的計(jì)算復(fù)雜度,且性能很好,所以采用相關(guān)差分算法實(shí)現(xiàn)頻偏調(diào)整是最優(yōu)選擇。
基于非信令綜測儀發(fā)送 DwPTS和PCCPCH(Primary Common Control Physical Channel)及DPCH的特點(diǎn),以及以上算法分析,設(shè)計(jì)了一種簡單可行的下行同步方案,如圖6所示。
圖6 下行同步方案框圖Fig.6 Framework of downlink synchronization
方案主要分為兩步,即同步捕獲和同步跟蹤。同步捕獲包括DwPTS同步、確定Midamble碼、頻偏估計(jì)(由于綜測儀和終端約定了頻點(diǎn),不會(huì)出現(xiàn)非常大的頻偏,可以直接利用Midamble碼進(jìn)行頻偏精調(diào))、TTI同步;同步跟蹤用廣播信道的 Midamble碼,包括用信道估計(jì)峰值跟蹤時(shí)偏和用相關(guān)差分法估計(jì)頻偏。
在同步捕獲成功后,一次性地調(diào)整同步調(diào)整量T(如圖7所示),使當(dāng)前幀直接與系統(tǒng)幀的TTI開頭對齊,這使得同步捕獲的處理流程變得簡單。
圖7 同步捕獲成功后時(shí)偏調(diào)整Fig.7 Time adjustment after sync capture
下行同步算法中主要的運(yùn)算類型有實(shí)數(shù)或復(fù)數(shù)加法、實(shí)數(shù)或復(fù)數(shù)乘法、數(shù)組求最值位置、實(shí)數(shù)或復(fù)數(shù)FFT運(yùn)算,BBE16_Rx1核的設(shè)計(jì)非常適合這類數(shù)據(jù)密集型運(yùn)算。BBE16_Rx1核支持單指令多數(shù)據(jù)(Single Instruction Multiple Data,SIMD)技術(shù),這種技術(shù)可以使用單一的指令對多個(gè)連續(xù)的數(shù)據(jù)進(jìn)行并發(fā)操作,從而成倍地提高運(yùn)算速度。同時(shí),Tensilica公司提供適合該核特點(diǎn)的高度優(yōu)化過的信號(hào)處理函數(shù)庫,包括極快的FFT庫函數(shù)。為了提高數(shù)據(jù)吞吐量,所有算法用到的數(shù)組都以16字節(jié)為單位進(jìn)行內(nèi)存邊界對齊。
對于單一的實(shí)數(shù)或復(fù)數(shù)加法、乘法、乘累加運(yùn)算等,都可以通過合理地設(shè)計(jì)程序結(jié)構(gòu)和數(shù)據(jù)組織形式,充分利用SIMD技術(shù)和自動(dòng)向量化技術(shù)來提高運(yùn)算速度。BBE16核區(qū)分內(nèi)存數(shù)據(jù)類型和寄存器數(shù)據(jù)類型,用于運(yùn)算的數(shù)據(jù)自動(dòng)進(jìn)行由內(nèi)存數(shù)據(jù)類型到寄存器數(shù)據(jù)類型的擴(kuò)展,16 b的內(nèi)存數(shù)據(jù)類型被擴(kuò)展成20 b的寄存器數(shù)據(jù)類型,32 b的內(nèi)存數(shù)據(jù)類型被擴(kuò)展成40 b的寄存器數(shù)據(jù)類型,當(dāng)運(yùn)算完成時(shí)寄存器數(shù)據(jù)類型經(jīng)過飽和處理自動(dòng)轉(zhuǎn)換到內(nèi)存數(shù)據(jù)類型。對于實(shí)數(shù)或復(fù)數(shù)的加法和乘法運(yùn)算,通過采用SIMD技術(shù)能成倍地降低運(yùn)算時(shí)間。圖8為SIMD并行實(shí)現(xiàn)4組復(fù)數(shù)并行乘法示意圖。
圖8 SIMD并行實(shí)現(xiàn)4組復(fù)數(shù)并行乘法Fig.8 Parallel complex multiplication using SIMD
DwPTS同步過程中的最值位置運(yùn)算也是影響處理時(shí)延的關(guān)鍵運(yùn)算。最值位置運(yùn)算通過兩兩比較得到最值并更新最值位置,經(jīng)過反復(fù)往后迭代即可得到數(shù)值中最值位置,由于循環(huán)里面有if比較結(jié)構(gòu),編譯器不能進(jìn)行自動(dòng)向量化,每次循環(huán)只能處理一次比較。由于BBE16提供了向量化的比較運(yùn)算和數(shù)據(jù)交換操作,可以一次進(jìn)行8組16 b實(shí)數(shù)的比較(圖9),大大提高了邏輯運(yùn)算的吞吐量。
圖9 SIMD實(shí)現(xiàn)8組16 b實(shí)數(shù)并行比較Fig.9 Parallel comparison using SIMD
經(jīng)過以上優(yōu)化處理,最終同步捕獲用時(shí)400 μs左右,同步跟蹤用時(shí)40 μs左右,同步處理時(shí)延非常小,尤其同步跟蹤響應(yīng)極快。
圖10給出了SNR為10 dB時(shí)終端頻偏估計(jì)均值和標(biāo)準(zhǔn)差的收斂情況。
圖10 SNR為10 dB時(shí)終端頻偏估計(jì)均值和標(biāo)準(zhǔn)差不斷收斂Fig.10 Mean and MSE of frequency offset estimation when continuing to converge at 10 dB
圖10表明了隨著系統(tǒng)的運(yùn)行,頻偏估計(jì)的均值收斂于10 Hz左右,頻偏估計(jì)的標(biāo)準(zhǔn)差收斂于32 Hz左右。在這樣的同步性能下,接收鏈路的Raw BER(信道譯碼前誤碼率)幾乎為0,完全能滿足系統(tǒng)要求,因此采用這種非信令模式的下行同步設(shè)計(jì)能夠極大地簡化多核終端的生產(chǎn)測試。
本文系統(tǒng)性地總結(jié)分析了TD-SCDMA系統(tǒng)下行同步過程,比較了下行同步中的關(guān)鍵問題DwPTS同步和頻偏估計(jì)的各種算法,根據(jù)非信令模式的特點(diǎn)合理地設(shè)計(jì)了下行同步方案,并根據(jù)多核手機(jī)芯片的特點(diǎn)充分優(yōu)化了該方案的實(shí)現(xiàn)。最終實(shí)現(xiàn)結(jié)果表明,該下行同步方案處理時(shí)延低,同步捕獲成功率為100%,同步跟蹤階段沒有發(fā)現(xiàn)時(shí)間偏移。
[1]任修坤,胡捍英.TD-SCDMA中下行引導(dǎo)時(shí)序搜索算法研究與比較[J].信息工程大學(xué)學(xué)報(bào),2006,7(4):370-372,386.REN Xiu-kun,HU Han-ying.Research on and Comparison of Algorithms of Searching DwPTS in TD-SCDMA[J].Journal of Information Engineering University,2006,7(4):370-372,386.(in Chinese)
[2]趙慧慧,易準(zhǔn),安世全.TD-SCDMA系統(tǒng)下行鏈路同步技術(shù)研究[J].通信技術(shù),2007,40(11):199-201,243.ZHAO Hui-h(huán)ui,YI Zhun,AN Shi-quan.Analysis on Technologys for Searching DwPTS in TD-SCDMA [J].Communications Technology,2007,40(11):199-201,243.(in Chinese)
[3]任修坤,白曉洛,沈戰(zhàn)峰,等.TD-SCDMA系統(tǒng)頻偏估計(jì)算法[J].光通信研究,2008,34(1):65-70.REN Xiu-kun,BAI Xiao-luo,SHEN Zhan-feng.Frequency offset estimation algorithm for TD-SCDMA systems[J].Study on Optical Communications,2008,34(1):65-70.
[4]簡偉,余建國,王琳,等.TD-SCDMA下行小區(qū)快速搜索的關(guān)鍵問題研究[J].電信科學(xué),2009,25(1):57-61.JIAN Wei,YU Jian-guo,WANG Lin,et al.Study on Monitoring,Management and Control of Self- organized Network[J].Telecommunication Science,2009,25(1):57-61.(in Chinese)
[5]Ventura A,Hindelng T.A Low Complexity Algorithm for Frame Synchronization in TDD-LCR System[C]//Proceedings of the 13th IEEE International Symposium on Personal,Indoor and Mobile Radio Communications.Lisbon,Portugal:IEEE,2002,75-78.
[6]Kay S.A Fast and Accurate Single Frequency Estimator[J].IEEE Transactions on Acoustic,Speech,and Signal Processing,1989,37(12):1987-1990.
[7]Fitz M P.Further result in the fast estimation of a single frequency[J].IEEE Transactions on Communications,1994,42(2,3,4):862-864.
[8]Luise M,Reggiannini R.Carried frequency recovery in all-digital modems for burst-mode transmissions [J].IEEE Transactions on Communications,1995,43(2,3,4):1169-1178.