• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    OOFDM-PON系統(tǒng)的FFT/IFFT字長(zhǎng)聯(lián)合優(yōu)化設(shè)計(jì)與實(shí)現(xiàn)

    2016-10-20 03:31:52王凱吳琦李家齊薛子威張俊杰
    關(guān)鍵詞:蝶形處理器運(yùn)算

    王凱,吳琦,李家齊,薛子威,張俊杰

    (上海大學(xué)通信與信息工程學(xué)院,上海 200444)

    OOFDM-PON系統(tǒng)的FFT/IFFT字長(zhǎng)聯(lián)合優(yōu)化設(shè)計(jì)與實(shí)現(xiàn)

    王凱,吳琦,李家齊,薛子威,張俊杰

    (上海大學(xué)通信與信息工程學(xué)院,上海 200444)

    在基于現(xiàn)場(chǎng)可編程門(mén)陣列(field programmable gate array,FPGA)平臺(tái)實(shí)現(xiàn)的實(shí)時(shí)光正交頻分復(fù)用無(wú)源光網(wǎng)(optical orthogonal frequency division multiplexing-passive optical network,OOFDM-PON)系統(tǒng)中,由于實(shí)時(shí)全并行快速傅里葉變換/快速傅里葉反變換(fast Fourier transform/inverse fast Fourier transform,FFT/IFFT)模塊計(jì)算復(fù)雜度高,成為實(shí)時(shí)OOFDM-PON系統(tǒng)設(shè)計(jì)的主要瓶頸之一.構(gòu)建OOFDM-PON發(fā)送與接收仿真平臺(tái),通過(guò)聯(lián)合優(yōu)化OOFDM-PON發(fā)送端的IFFT與接收端FFT蝶形運(yùn)算的旋轉(zhuǎn)因子和輸出字長(zhǎng)來(lái)降低模塊的系統(tǒng)邏輯資源占用率.采用基于縮短字長(zhǎng)界限范圍的方法來(lái)減少最優(yōu)化字長(zhǎng)的搜索時(shí)間,同時(shí)構(gòu)建了實(shí)時(shí)OOFDM-PON系統(tǒng)的基于DIF-2的64點(diǎn)IFFT/FFT的字長(zhǎng)優(yōu)化映射表.該映射表在離線OOFDM-PON平臺(tái)上的驗(yàn)證結(jié)果與仿真結(jié)果之間的誤差控制在0.5 dB,驗(yàn)證了該優(yōu)化算法的正確性.與Spiral設(shè)計(jì)方案相比,該設(shè)計(jì)的基于上述映射表的FFT模塊可以節(jié)約大約37.2%的邏輯資源.

    光正交頻分復(fù)用無(wú)源光網(wǎng);快速傅里葉變換/快速傅里葉反變換;字長(zhǎng)優(yōu)化;反向誤差向量幅度

    自從提出光正交頻分復(fù)用無(wú)源光網(wǎng)(optical orthogonal frequency division multiplexingpassive optical network,OOFDM-PON)的思路后[1],OOFDM-PON在光通信領(lǐng)域引起了廣泛的關(guān)注.為了驗(yàn)證實(shí)時(shí)OOFDM-PON的通信性能以及評(píng)估實(shí)時(shí)OOFDM-PON的算法復(fù)雜度,國(guó)內(nèi)外多家學(xué)術(shù)機(jī)構(gòu)開(kāi)發(fā)了實(shí)時(shí)OOFDM-PON的演示平臺(tái)[2-5].然而隨著OOFDMPON系統(tǒng)中模擬數(shù)字轉(zhuǎn)換器/數(shù)字模擬轉(zhuǎn)換器(analog-to-digital converter/digital-to-analog converter,ADC/DAC)采樣頻率(達(dá)到10GS/s)以及子載波數(shù)(1024)的提升,OOFDM-PON算法所占用的資源尤其是OOFDM-PON中的快速傅里葉反變換(inverse fast Fourier transform,IFFT)計(jì)算已經(jīng)達(dá)到了現(xiàn)有頂級(jí)現(xiàn)場(chǎng)可編程門(mén)陣列(field programmable gate array,F(xiàn)PGA)資源的82%[3].因此,OOFDM-PON的快速傅里葉變換/快速傅里葉反變換(fast Fourier transform/IFFT,F(xiàn)FT/IFFT)算法占用的邏輯資源已經(jīng)成為制約OOFDM-PON實(shí)時(shí)系統(tǒng)演示的主要瓶頸之一.

    在如何減少FFT/IFFT運(yùn)算占用邏輯資源方面,國(guó)內(nèi)外已經(jīng)開(kāi)展了大量的相關(guān)研究.在低吞吐率的應(yīng)用場(chǎng)景下,F(xiàn)FT/IFFT的優(yōu)化主要聚焦在結(jié)構(gòu)上的優(yōu)化上,文獻(xiàn)[6]使用的就是采取單路徑延遲反饋方式來(lái)減少存儲(chǔ)器資源的使用,但基于串行結(jié)構(gòu)的FFT/IFFT會(huì)產(chǎn)生比較大的運(yùn)算延遲,不能滿足實(shí)時(shí)OOFDM系統(tǒng)對(duì)FFT/IFFT算法高吞吐率的需求.在現(xiàn)有的實(shí)時(shí)OOFDM-PON演示系統(tǒng)中,F(xiàn)FT/IFFT的設(shè)計(jì)與實(shí)現(xiàn)大多采用Spiral IP核[7],用戶可以通過(guò)在線網(wǎng)站輸入系統(tǒng)設(shè)計(jì)參數(shù)(如FFT點(diǎn)數(shù)、蝶形結(jié)構(gòu)等),生成所需要的FFT/IFFT邏輯代碼.基于Spiral的FFT/IFFT在線設(shè)計(jì)所采用的旋轉(zhuǎn)因子為固定字長(zhǎng),而且沒(méi)有優(yōu)化FFT/IFFT每級(jí)蝶形的輸出字長(zhǎng).

    為滿足高速實(shí)時(shí)的系統(tǒng)要求,IFFT/FFT需要采用全并行流水線結(jié)構(gòu).此時(shí)減少使用系統(tǒng)資源的主要策略是對(duì)IFFT/FFT的字長(zhǎng)進(jìn)行優(yōu)化.在FFT字長(zhǎng)優(yōu)化方面,主要考慮如何合理地分配蝶形運(yùn)算中每級(jí)輸出字長(zhǎng).文獻(xiàn)[8]使用了仿真實(shí)驗(yàn)的方法優(yōu)化8 192點(diǎn)FFT處理器,結(jié)果表明在蝶形運(yùn)算前面幾級(jí)提升字長(zhǎng)和對(duì)數(shù)據(jù)字長(zhǎng)進(jìn)行截?cái)嗖僮鳎╯caling)可以很好地權(quán)衡運(yùn)算準(zhǔn)確性和硬件資源;文獻(xiàn)[9]使用了一種統(tǒng)計(jì)錯(cuò)誤分析和仿真實(shí)驗(yàn)混合的方式優(yōu)化了IFFT和FFT處理器,并且提供了一種可以有效減少搜索時(shí)間的方法;文獻(xiàn)[10]僅僅考慮了128點(diǎn)FFT以及IFFT最后一級(jí)對(duì)OFDM收發(fā)系統(tǒng)的影響;文獻(xiàn)[11]對(duì)實(shí)時(shí)OOFDMPON系統(tǒng)的發(fā)送端IFFT運(yùn)算進(jìn)行了輸出字長(zhǎng)和旋轉(zhuǎn)因子字長(zhǎng)的優(yōu)化,接收端的FFT處理采用浮點(diǎn)型操作;文獻(xiàn)[12]對(duì)基于DIT-2結(jié)構(gòu)的32點(diǎn)FFT/IFFT進(jìn)行了聯(lián)合優(yōu)化設(shè)計(jì),但沒(méi)有提及字長(zhǎng)優(yōu)化策略,且缺乏實(shí)際平臺(tái)的驗(yàn)證.

    本研究所采用的實(shí)時(shí)OOFDM-PON硬件平臺(tái)是在DIF-2的64點(diǎn)IFFT/FFT算法[5]的基礎(chǔ)上,結(jié)合IFFT與FFT的每級(jí)輸出以及旋轉(zhuǎn)因子字長(zhǎng)的聯(lián)合優(yōu)化,提出了一種減少仿真時(shí)間的字長(zhǎng)搜索算法,并在實(shí)際平臺(tái)上進(jìn)行了驗(yàn)證.

    1 仿真模型建立

    圖1是本研究采用的仿真模型框圖.在發(fā)射端,數(shù)據(jù)源采用偽隨機(jī)二進(jìn)制碼(pseudo random binary sequence,PRBS),通過(guò)正交振幅調(diào)制(quadrature amplitude modulation,QAM)映射,然后構(gòu)成64點(diǎn)IFFT所需要的并行輸入信號(hào),并行輸入采用施密特共軛對(duì)稱信號(hào)以生成僅包含實(shí)部的OFDM符號(hào),再通過(guò)添加循環(huán)前綴和長(zhǎng)短訓(xùn)練序列來(lái)組成OFDM幀信號(hào),最后通過(guò)DAC量化將數(shù)據(jù)轉(zhuǎn)換成模擬信號(hào)在信道上傳輸.在接收端,ADC將模擬信號(hào)轉(zhuǎn)換成數(shù)字信號(hào),根據(jù)長(zhǎng)短訓(xùn)練序列完成幀信號(hào)的同步以及信道估計(jì),再通過(guò)64點(diǎn)FFT將OFDM符號(hào)數(shù)據(jù)轉(zhuǎn)化為QAM信號(hào).本研究利用接收QAM信號(hào)的反向誤差向量幅度(inverse error vector magnitude,IEVM)(理想信號(hào)平均功率的均方根值與誤差矢量信號(hào)平均功率的均方根值之比)作為系統(tǒng)性能的衡量標(biāo)準(zhǔn).

    圖1 仿真模型框圖Fig.1 System setup blocks

    從圖1可以看出,影響系統(tǒng)最終輸出信號(hào)質(zhì)量的因素主要有IFFT/FFT模塊的運(yùn)算準(zhǔn)確度和ADC/DAC量化誤差.為獨(dú)立分析IFFT/FFT模塊內(nèi)部數(shù)據(jù)的字長(zhǎng)和IEVM的關(guān)系,本研究先使用浮點(diǎn)型的IFFT/FFT進(jìn)行仿真,分析ADC/DAC量化誤差帶來(lái)的影響,為后面的字長(zhǎng)優(yōu)化提供參考.考慮到實(shí)際的OOFDM-PON中DAC與ADC的位寬一般都保持一致[2,11],因此本研究分析的DAC采用與ADC同樣的位寬.

    圖2描述了在16~256 QAM映射方式下,不同的ADC/DAC位寬和系統(tǒng)接收端IEVM數(shù)值的關(guān)系.從圖中數(shù)據(jù)得到如下結(jié)論:①在同一種QAM調(diào)制格式下,系統(tǒng)IEVM和ADC/DAC量化位寬基本呈線性的關(guān)系,ADC/DAC位寬每增加1bit,相應(yīng)的IEVM數(shù)值就會(huì)增大約6dB;②在相同的ADC/DAC量化位寬情況下,不同的QAM映射的系統(tǒng)IEVM基本上沒(méi)有什么影響.值得注意的是,上述結(jié)果是在采用浮點(diǎn)型的IFFT/FFT情況下得到的,故上述仿真結(jié)果可以作為后續(xù)字長(zhǎng)優(yōu)化搜索的理論IEVM的上限(IEVMideal).

    圖2 系統(tǒng)IEVM和ADC/DAC位寬的關(guān)系Fig.2 Transceiver IEVM vs.ADC/DAC resolution

    2 字長(zhǎng)優(yōu)化

    為了減少實(shí)時(shí)OOFDM-PON系統(tǒng)邏輯資源的消耗,通常在實(shí)際平臺(tái)中采用定點(diǎn)計(jì)算實(shí)現(xiàn)FFT/IFFT運(yùn)算[2-5].在本研究中,64點(diǎn)FFT/IFFT運(yùn)算采用基于DIF-2的結(jié)構(gòu),該FFT/IFFT結(jié)構(gòu)一共包括6級(jí)蝶形運(yùn)算.對(duì)于每一級(jí)蝶形運(yùn)算而言,旋轉(zhuǎn)因子的字長(zhǎng)以及每級(jí)蝶形運(yùn)算的輸出字長(zhǎng)都會(huì)對(duì)FFT/IFFT的計(jì)算精度造成影響,使得系統(tǒng)的IEVM小于IEVMideal.考慮到OOFDM-PON接收系統(tǒng)的最優(yōu)IEVM小于40dB[4-5],結(jié)合圖2仿真所得到的IEVMideal,本研究將IEVMideal的90%(IEVMdown)作為字長(zhǎng)優(yōu)化的依據(jù).

    由于采用DIF-2的64點(diǎn)FFT/IFFT最后2級(jí)蝶形運(yùn)算僅僅進(jìn)行簡(jiǎn)單的加減運(yùn)算,每級(jí)運(yùn)算結(jié)果的輸出字長(zhǎng)增加一位即可,因而無(wú)需進(jìn)行優(yōu)化.為了使FFT/IFFT運(yùn)算的邏輯設(shè)計(jì)規(guī)整,在64點(diǎn)FFT/IFFT的其余4級(jí)蝶形運(yùn)算中,每級(jí)蝶形運(yùn)算的旋轉(zhuǎn)因子字長(zhǎng)都保持一致,且輸出字長(zhǎng)也保持一致.基于圖1的OFDM系統(tǒng)聯(lián)合優(yōu)化共計(jì)需要16個(gè)優(yōu)化參數(shù)(FFT/IFFT分別有4級(jí)旋轉(zhuǎn)因子以及4級(jí)輸出字長(zhǎng)),若本研究采用InterrCore(TM)i5-2320 CPU 3.00 GHz性能的處理器,則100次的仿真需要約4min,16個(gè)參數(shù)完成遍歷搜索所消耗的時(shí)間是不切實(shí)際的(大約幾個(gè)月的時(shí)間),因此采用遍歷搜索字長(zhǎng)在實(shí)際仿真中不現(xiàn)實(shí).為了減少字長(zhǎng)優(yōu)化搜索的時(shí)間,本研究提出了一種基于字長(zhǎng)集搜索的方法.

    2.1 字長(zhǎng)集上限搜索流程

    本研究提出了一種基于字長(zhǎng)集搜索的方法,該方法的實(shí)現(xiàn)流程如圖3所示.首先把64點(diǎn)FFT/IFFT的每級(jí)旋轉(zhuǎn)因子以及輸出字長(zhǎng)設(shè)置為6,并將其作為搜索的初始字長(zhǎng)集{binitial},如表1中的第一次搜索集合.根據(jù)該初始化字長(zhǎng)集計(jì)算系統(tǒng)的IEVM,然后判斷該結(jié)果是否小于IEVMdown,如果上述條件滿足,則把字長(zhǎng)集進(jìn)行加1操作(如表1的第二次搜索字長(zhǎng)集),直到設(shè)定的字長(zhǎng)集滿足系統(tǒng)的IEVM需求(即IEVM>IEVMdown),該字長(zhǎng)集稱為{bceiling}.

    圖3 搜索字長(zhǎng)上限流程Fig.3 Computing procedure adopted in numerically identifying the bit resolution upper boundary

    表1給出了一個(gè)尋找字長(zhǎng)上限的實(shí)例.系統(tǒng)ADC/DAC量化位寬采用6bit,系統(tǒng)要求的IEVMdown=24.037 dB;系統(tǒng)初始統(tǒng)一字長(zhǎng)為6,通過(guò)6次計(jì)算就找到了系統(tǒng)的字長(zhǎng)上限.

    表2是針對(duì)不同ADC/DAC量化位寬所對(duì)應(yīng)的字長(zhǎng)上限映射表.從表2可以看出,針對(duì)不同位寬的ADC/DAC,其字長(zhǎng)搜索次數(shù)僅與ADC/DAC量化位寬呈線性關(guān)系,根據(jù)該字長(zhǎng)搜索上限所計(jì)算的系統(tǒng)IEVM滿足本研究設(shè)計(jì)需求.

    2.2 最優(yōu)化字長(zhǎng)搜索

    顯然表2的結(jié)果僅給出了滿足所設(shè)約束(IEVM>IEVMdown)的一個(gè)上限,并不是字長(zhǎng)的最優(yōu)結(jié)果,為了在此基礎(chǔ)上進(jìn)一步對(duì)字長(zhǎng)進(jìn)行優(yōu)化,本研究給出了字長(zhǎng)優(yōu)化搜索的流程(見(jiàn)圖4).該字長(zhǎng)優(yōu)化方法實(shí)現(xiàn)分為如下幾個(gè)步驟.

    表1 一個(gè)搜索字長(zhǎng)上限的實(shí)例Table 1 An example of searching word-length upper-band

    表2 字長(zhǎng)上限搜索結(jié)果Table 2 Results of word-length upper-band

    步驟1 當(dāng)OOFDM-PON系統(tǒng)的ADC/DAC量化位寬確定了以后,根據(jù)表2獲取64點(diǎn)FFT/IFFT的各級(jí)字長(zhǎng)上限{bceiling}ADC,然后把該字長(zhǎng)上限傳遞給待優(yōu)化的字長(zhǎng)集{bceiling}cal,以供后續(xù)流程進(jìn)行字長(zhǎng)優(yōu)化.

    步驟2 首先把上述字長(zhǎng)傳遞給系統(tǒng)的優(yōu)化字長(zhǎng){bopt},然后對(duì)64點(diǎn)FFT/IFFT的各級(jí)旋轉(zhuǎn)因子以及輸出共16個(gè)參變量對(duì)收發(fā)系統(tǒng)的單獨(dú)影響進(jìn)行分析,方法針對(duì)每一個(gè)參變量,從{bceiling}cal中減去其對(duì)應(yīng)的字長(zhǎng),然后計(jì)算收發(fā)系統(tǒng)的IEVM,并循環(huán)16次獲取16個(gè)參變量所對(duì)應(yīng)的IEVM.

    步驟3 對(duì)上述16個(gè)參變量獲取的IEVM進(jìn)行排序,并根據(jù)上述排序結(jié)果獲取最小的IEVM所對(duì)應(yīng)的參變量,然后把該參變量的字長(zhǎng)減1,并把獲取到的新的字長(zhǎng)集賦予{bceiling}cal.

    步驟4 判斷IEVMmin是否滿足本研究所設(shè)定的判斷依據(jù),如果不滿足則從步驟2進(jìn)行循環(huán).

    步驟5 如果上述條件滿足,則在步驟2獲取的{bopt}就是最優(yōu)的字長(zhǎng)集合.

    針對(duì)不同的ADC/DAC量化位寬,本研究進(jìn)行了大量的仿真,得到了如圖5所示的字長(zhǎng)映射表.圖5(a)和(b)是發(fā)射端IFFT蝶形各級(jí)輸出字長(zhǎng)和旋轉(zhuǎn)因子的優(yōu)化結(jié)果,(c)和(d)是接收端FFT蝶形各級(jí)輸出字長(zhǎng)和旋轉(zhuǎn)因子的優(yōu)化結(jié)果.本研究采用的是DIF-2的64點(diǎn)IFFT/ FFT結(jié)構(gòu),理論上需要對(duì)6級(jí)蝶形的旋轉(zhuǎn)因子和輸出字長(zhǎng)進(jìn)行優(yōu)化.但是由于DIF結(jié)構(gòu)的最后兩級(jí)蝶形僅進(jìn)行簡(jiǎn)單的加減運(yùn)算,每級(jí)運(yùn)算結(jié)果的字長(zhǎng)增加一位即可,故圖5中沒(méi)有列出后面兩級(jí)字長(zhǎng)的優(yōu)化結(jié)果.

    圖4 優(yōu)化字長(zhǎng)搜索流程Fig.4 Computing procedure to optimize the word-length

    圖5 基于ADC/DAC量化位寬的字長(zhǎng)優(yōu)化結(jié)果Fig.5 Word-length optimization results based on ADC/DAC bits

    分析圖5(a)和(c)中的結(jié)果,可見(jiàn)優(yōu)化的IFFT和FFT蝶形各級(jí)輸出字長(zhǎng)和ADC/DAC量化位寬近似呈線性關(guān)系,這種線性關(guān)系產(chǎn)生的原因?yàn)镕FT/IFFT的每級(jí)輸出以及旋轉(zhuǎn)因子的字長(zhǎng)對(duì)系統(tǒng)IEVM的單獨(dú)影響呈線性關(guān)系[12].字長(zhǎng)每增加1位,系統(tǒng)IEVM性能提升約6dB,而ADC/DAC的字長(zhǎng)對(duì)系統(tǒng)IEVM也產(chǎn)生同樣的影響.因此若假設(shè)上述參數(shù)對(duì)系統(tǒng)的影響相互獨(dú)立,則在滿足設(shè)定的情況下,根據(jù)圖1所建立的模型不難得出系統(tǒng)的映射表字長(zhǎng)與ADC/DAC的量化字長(zhǎng)呈線性關(guān)系.圖5的優(yōu)化字長(zhǎng)映射表也驗(yàn)證了上述假設(shè).在ADC/DAC位寬相同的條件下,F(xiàn)FT的輸出字長(zhǎng)通常比IFFT的輸出字長(zhǎng)增加大約2位.從圖5(b)和(d)可以看出,基于ADC/DAC量化的IFFT與FFT的旋轉(zhuǎn)因子映射表存在一個(gè)臺(tái)階,這是由于基于DIF-2的FFT/IFFT的stage2,stage3和stage4旋轉(zhuǎn)因子存在與文獻(xiàn)[11]相似的特性.當(dāng)stage4旋轉(zhuǎn)因子的量化字長(zhǎng)在[8,12]區(qū)間時(shí),其量化數(shù)值保持不變;當(dāng)stage3的旋轉(zhuǎn)因子的量化字長(zhǎng)在[9,12]區(qū)間時(shí),其量化數(shù)值保持不變.

    盡管本研究?jī)H僅針對(duì)定點(diǎn)的64點(diǎn)FFT/IFFT進(jìn)行數(shù)值仿真并獲得優(yōu)化字長(zhǎng)映射表,但是利用圖5中的各個(gè)參數(shù)的發(fā)展趨勢(shì),該映射表可以進(jìn)一步擴(kuò)展到采用全并行結(jié)構(gòu)的任意點(diǎn)數(shù)的FFT/IFFT.對(duì)于系統(tǒng)給定的DAC/ADC,該字長(zhǎng)映射表為FFT/IFFT各級(jí)信號(hào)的最優(yōu)化字長(zhǎng)選擇提供了一種簡(jiǎn)單、有效的方法,這在很大程度上簡(jiǎn)化了高性能OOFDM收發(fā)機(jī)和其他基于FFT/IFFT系統(tǒng)的設(shè)計(jì).

    3 離線驗(yàn)證

    為了驗(yàn)證仿真實(shí)驗(yàn)結(jié)果的可靠性,本研究在實(shí)際平臺(tái)上對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行了離線驗(yàn)證.測(cè)試結(jié)構(gòu)如圖6所示,在PC機(jī)上使用Matlab軟件產(chǎn)生OFDM幀信號(hào),存為文本文件,再通過(guò)任意波形發(fā)生器(arbitrary waveform generator,AWG)將信號(hào)發(fā)送出去.OFDM信號(hào)經(jīng)過(guò)實(shí)際的物理光傳輸鏈路后,通過(guò)示波器采樣信號(hào),再將信號(hào)導(dǎo)入PC端的Matlab軟件,分析系統(tǒng)IEVM.

    圖6 系統(tǒng)離線測(cè)試結(jié)構(gòu)Fig.6 Verification architecture of offline system

    實(shí)驗(yàn)儀器的基本參數(shù)設(shè)置如下:AWG可支持?jǐn)?shù)字6~10bit的輸入;系統(tǒng)采用同步方式,即AWG和示波器共用同一個(gè)時(shí)鐘源;系統(tǒng)采用過(guò)采樣方式,AWG的采樣時(shí)鐘為1GHz,示波器的采樣時(shí)鐘為5GHz.本實(shí)驗(yàn)的光路采用分布式反饋(distributed feed back,DFB)激光器進(jìn)行光強(qiáng)調(diào)制,經(jīng)過(guò)25km的光纖鏈路,再通過(guò)光電二極管探測(cè)器進(jìn)行光電轉(zhuǎn)換.

    系統(tǒng)分別對(duì)浮點(diǎn)型IFFT/FFT運(yùn)算和基于字長(zhǎng)映射表的IFFT/FFT運(yùn)算進(jìn)行分析對(duì)比.通過(guò)離線測(cè)試平臺(tái),得到系統(tǒng)的性能指標(biāo)IEVM(重復(fù)測(cè)試5次,取平均值).通過(guò)比較二者之間的差異來(lái)驗(yàn)證優(yōu)化結(jié)果的準(zhǔn)確性.

    圖7是浮點(diǎn)型的IFFT/FFT和基于字長(zhǎng)映射表的IFFT/FFT所得結(jié)果的差值.從圖中數(shù)據(jù)可以看出,二者的誤差大約保持在0.5dB范圍內(nèi),基本滿足要求.

    圖7 浮點(diǎn)型IFFT/FFT和優(yōu)化后的IFFT/FFT的IEVM數(shù)值之間的誤差值Fig.7 IEVM differences of ideal IFFT/FFT and optimized IFFT/FFT

    4 邏輯資源統(tǒng)計(jì)

    本研究在Xilinx的Virtex6器件上實(shí)現(xiàn)了基于字長(zhǎng)映射表的全并行64點(diǎn)FFT模塊.為了進(jìn)行FFT模塊的性能分析,本研究采用8bitADC信號(hào)輸入,根據(jù)字長(zhǎng)映射表,蝶形每級(jí)字長(zhǎng)分別選擇{131413141516},得到基于字長(zhǎng)映射表的64點(diǎn)FFT處理器;同時(shí)本研究也使用Spiral工具生成了同樣的全并行64點(diǎn)FFT處理器.為了與研究設(shè)計(jì)性能相匹配,Spiral工具采用16bit定點(diǎn)計(jì)算.這兩種設(shè)計(jì)方案的綜合對(duì)比結(jié)果如表3和4所示.

    表3給出了基于優(yōu)化字長(zhǎng)映射表的FFT處理器和Spiral工具生成的FFT處理器中乘法器和加減法器的利用情況對(duì)比.從對(duì)比結(jié)果可以看出,本研究的FFT處理器在乘法器數(shù)量上和Spiral工具一致,但是由于對(duì)數(shù)據(jù)字長(zhǎng)進(jìn)行了優(yōu)化,故乘法器的數(shù)據(jù)位寬相對(duì)較小,加法器和減法器也存在同樣的現(xiàn)象.因此,本FFT處理器的設(shè)計(jì)相較于Spiral工具生成的FFT處理器更加節(jié)省硬件資源.

    表3 FFT處理器中乘法器和加減法器的利用情況Table 3 Usage of multipliers and subtractors for FFT processor

    在表4中列出了整個(gè)FFT處理器的資源利用結(jié)果.從對(duì)比結(jié)果可以看出,基于字長(zhǎng)映射表的FFT處理器相對(duì)于Spiral工具性能更優(yōu),在Slice LUTs方面可以節(jié)約37.2%左右的硬件資源.另外,表4還增加了和文獻(xiàn)[9,11-12]中FFT設(shè)計(jì)之間的對(duì)比.由于文獻(xiàn)[10]所采用的是Spiral設(shè)計(jì)[13],故沒(méi)有單獨(dú)列在表中.值得一提的是,文獻(xiàn)[11-12]是本研究組的前期工作,雖然在資源利用方面沒(méi)有很大的提升,但是本研究設(shè)計(jì)采用了更優(yōu)的搜索算法,縮短了字長(zhǎng)優(yōu)化的搜索時(shí)間.

    表4 FPGA實(shí)現(xiàn)的不同F(xiàn)FT處理器的資源利用結(jié)果和對(duì)比Table 4 Logic resource usage for different FFT FPGA structures

    5 結(jié)束語(yǔ)

    在OOFDM-PON系統(tǒng)中IFFT/FFT的高資源占用率的情況下,本研究主要通過(guò)優(yōu)化IFFT/FFT模塊的字長(zhǎng)來(lái)降低系統(tǒng)的硬件資源.系統(tǒng)采用IFFT和FFT聯(lián)合優(yōu)化的方式,優(yōu)化了包括蝶形運(yùn)算的輸出字長(zhǎng)和旋轉(zhuǎn)因子的字長(zhǎng)在內(nèi)的參數(shù).由于面臨系統(tǒng)的高復(fù)雜度,軟件尋找最優(yōu)化字長(zhǎng)的耗時(shí)長(zhǎng),故本研究通過(guò)縮小字長(zhǎng)搜索范圍來(lái)降低軟件耗時(shí),最終完成軟件上的OFDM系統(tǒng)字長(zhǎng)優(yōu)化,同時(shí)在離線的實(shí)際平臺(tái)上驗(yàn)證了實(shí)驗(yàn)所得數(shù)據(jù)的準(zhǔn)確性.另外,本研究使用Verilog硬件編程語(yǔ)言實(shí)現(xiàn)全并行流水線結(jié)構(gòu)的FFT功能模塊,與目前使用的Spiral設(shè)計(jì)相比,本設(shè)計(jì)的資源在Slice LUTs方面可以節(jié)約37.2%左右.

    [1]FISCHER J K,ALREESH S,ELSCHNER R,et al.Bandwidth-variable transceivers based on 4D modulation formats for future flexible networks[C]//ECOC.2013:279-281.

    [2]JIN X Q,TANG J M.Experimental investigations of wavelength spacing and colorlessness of RSOA-based ONUs in real-time optical OFDMA PONs[J].Journal of Lightwave Technology, 2012,30(16):2603-2609.

    [3]INAN B,ADHIKARI S,KARAKAYA O,et al.Real-time 93.8-Gb/s polarization-multiplexed OFDM transmitter with 1024-point IFFT[J].Opt Exp,2011,19(26):B64-B68.

    [4]CHEN M,HE J,CHEN L.Real-time optical OFDM long-reach PON system over 100 km SSMF using a sirectly modulated DFB laser[J].Journal of Optical Communications and Networking, 2014,6(1):18-25.

    [5]汪敏,虞禮輝,馮俊飛,等.基于異步時(shí)鐘的高速實(shí)時(shí)光OFDM收發(fā)系統(tǒng)[J].上海大學(xué)學(xué)報(bào)(自然科學(xué)版),2013,19(3):250-253.

    [6]WOLD E H,DESPAIN A M.Pipelined and parallel-pipeline FFT processors for VLSI implementation[J].IEEE Trans Computers,1984,33(5):414-426.

    [7]Spiral software/hardware generation for DSP algorithms[EB/OL].[2014-10-18]http://www. spiral.net/hardware/dftgen.html.

    [8]JOHANSSON S,HE S,NILSSON P.Wordlength optimization of a pipelined FFT processor[C]// Proc 42nd Midwest Symp Circuits and Systems.1999:501-503.

    [9]TSAI P Y,CHEN C W,HUANG M Y.Automatic IP generation of FFT/IFFT processors with word-length optimization for MIMO-OFDM systems[J].EURASIP Journal on Advances in Signal Processing,2011,DOI:10.1155/2011/136319.

    [10]BOUZIANE R,KOUTSOYANNIS R,MILDER P,et al.Optimizing FFT precision in optical OFDM transceivers[J].IEEE Photon Technol Lett,2011,23(20):1550-1552.

    [11]TANG J M,ZHANG J J,TUAN W Y,et al.Stage-dependent minimum bit resolution maps for real-time optical OFDM transceivers[C]//OFC.2014.

    [12]ZHANG J J,YUAN W Y,WANG K,et al.Stage-dependent minimum bit resolution maps of full-parallel pipelined FFT/IFFT for real-time optical OFDM transceivers[C]//ACP.2014.

    [13]MILDER P A,BOUZIANE R,KOUTSOYANNIS R,et al.Design and simulation of 25 Gb/s optical OFDM transceiver ASICs[J].Optics Express,2011(26):B337-B342.

    本文彩色版可登陸本刊網(wǎng)站查詢:http://www.journal.shu.edu.cn

    Design and implementation of FFT/IFFT processors with word-length optimization for OOFDM-PON system

    WANG Kai,WU Qi,LI Jiaqi,XUE Ziwei,ZHANG Junjie
    (School of Communication and Information Engineering,Shanghai University,Shanghai 200444,China)

    High-speed parallel fast Fourier transform/inverse fast Fourier transform(FFT/ IFFT)module has become one of the most significant obstacle to practically developing realtime high-speed optic orthogonal frequency division multiplexing(OOFDM)system based on field programmable gate array(FPGA)platform due to its high complexity.This paper builds a simulation platform for OOFDM transceivers and realizes joint optimization of the IFFT and FFT module to reduce logic resource usage.The algorithm shortens word-length boundaries to reduce the time for searching optimized word-length and builds a mapping table of the optimal word-lengths.Error between simulation results and verification results on an offline platform is within 0.5 dB indicating correctness of the proposed optimization algorithm.In addition,the FFT module based on the mapping table saves about 37.2%resource compared to the Spiral design.

    optical orthogonal frequency division multiplexing-passive optical network(OOFDM-PON);fast Fourier transform/inverse fast Fourier transform(FFT/IFFT);wordlength optimization;inverse error vector magnitude(IEVM)

    TN 913.7

    A

    1007-2861(2016)04-0398-10

    10.3969/j.issn.1007-2861.2014.05.018

    2014-11-26

    國(guó)家自然科學(xué)基金資助項(xiàng)目(61132004,61275073,61420106011);上海市科委重點(diǎn)資助項(xiàng)目(13JC1402600,14511100100,15511105400,15530500600)

    張俊杰(1978—),男,高級(jí)工程師,博士,研究方向?yàn)楣饨尤刖W(wǎng)等.E-mail:zjj@staff.shu.edu.cn

    猜你喜歡
    蝶形處理器運(yùn)算
    在FPGA上實(shí)現(xiàn)FFT的高效串行流水線結(jié)構(gòu)
    重視運(yùn)算與推理,解決數(shù)列求和題
    蝶形引入光纜技術(shù)新進(jìn)展
    光通信研究(2022年2期)2022-03-29 03:19:18
    有趣的運(yùn)算
    “整式的乘法與因式分解”知識(shí)歸納
    撥云去“誤”學(xué)乘除運(yùn)算
    Imagination的ClearCallTM VoIP應(yīng)用現(xiàn)可支持Cavium的OCTEON? Ⅲ多核處理器
    ADI推出新一代SigmaDSP處理器
    汽車零部件(2014年1期)2014-09-21 11:41:11
    呼嚕處理器
    蝶形彈簧的受力分析及彈性拉壓桿改造
    长岛县| 日照市| 唐山市| 交口县| 商洛市| 滨海县| 固始县| 紫云| 吉林省| 左云县| 景德镇市| 镇坪县| 宁国市| 榆林市| 阿克陶县| 樟树市| 吉安市| 镇康县| 娱乐| 英超| 陵水| 曲水县| 施甸县| 南江县| 平原县| 呼伦贝尔市| 五大连池市| 缙云县| 哈尔滨市| 黑山县| 聂拉木县| 余干县| 龙井市| 哈巴河县| 临沂市| 博爱县| 大埔区| 湘潭县| 固镇县| 皋兰县| 饶河县|