Paul Wheeler
1引言
說到要求超高性能的前沿應(yīng)用,就不得不提起ADI公司的SHARC處理器。隨著更高動態(tài)范圍、更高性能和更低成本等市場壓力的與日俱增,各種應(yīng)用對浮點處理器的需求也在不斷增加。本文將介紹第一款SHARC處理器背后的歷史,并討論其架構(gòu)的創(chuàng)新,這使得這款處理器在18年的數(shù)字信號處理歷史中一直處于領(lǐng)先的地位。
2SHARC處理器的歷史
“SHARC”是超級哈佛架構(gòu)(Super Harvard ARChitecture)的縮寫,是ADI公司為他們的浮點處理器起的名字。SHARC處理器在標(biāo)準(zhǔn)哈佛架構(gòu)基礎(chǔ)上作了改進,不僅方便了PM(程序存儲器)總線上的數(shù)據(jù)傳送,并通過增加一個指令緩存優(yōu)化了基于緊密循環(huán)的計算過程的吞吐性能。改進后的架構(gòu)能夠同時存取數(shù)據(jù)和系數(shù),并同時從指令緩存執(zhí)行所選的指令,從而高效地實現(xiàn)了處理器的三總線操作模式。
大家知道,SHARC處理器最早起源于ADSP-21020。這個浮點單指令單數(shù)據(jù)(SISD)DSP實際上是一個不帶嵌入式存儲器或外設(shè)的獨立計算內(nèi)核。PM和DM(數(shù)據(jù)存儲器)存儲空間是通過連接到SRAM芯片的外部總線進行訪問的,通過JTAG接口對處理器進行編程和調(diào)試。
ADSP-21020可以在33MHz時鐘頻率下工作,執(zhí)行單周期指令。ADSP-21020可以利用80位累加器完成32位或40位浮點和32位定點運算,是ADI公司在1991年推向市場的突破性產(chǎn)品。這種內(nèi)核技術(shù)是ADI公司對浮點性能和創(chuàng)新做出承諾的起始點。
3集成與創(chuàng)新:SHARC的誕生
第一款真正的SHARC處理器是ADSP-21060。ADI公司在ADSP-21020內(nèi)核產(chǎn)品的基礎(chǔ)上開發(fā)出了一個完全集成的處理器,其中包括了用于控制集成外設(shè)的DMA流量的片上SRAM和I/O處理器。
ADSP-21060浮點處理器是1994年進入市場的,當(dāng)時被認為是DSP性能和創(chuàng)新方面的頂尖水平。
SHARC內(nèi)核能夠在一個周期內(nèi)以高達40MHz的速度執(zhí)行計算,并且增加了I/O處理器,能夠在不增加任何內(nèi)核開銷的條件下,在外設(shè)和雙端口4Mb SRAM存儲器之間高速傳輸數(shù)據(jù)。
為了進一步提高最終用戶的系統(tǒng)性能和可擴展性,ADI設(shè)計團隊著手創(chuàng)建允許多處理器系統(tǒng)能共享數(shù)據(jù)并且開銷很小的機制。在外部端口邏輯中增加了一個簇總線控制器,可以無縫地進行處理器間的并行數(shù)據(jù)通信,每個簇最多可以有6個處理器。這種突破性技術(shù)允許系統(tǒng)架構(gòu)師以高達240MBps的帶寬從主處理器向指定從處理器的內(nèi)存直接傳送大量數(shù)據(jù),或使用廣播模式向簇中的所有從器件直接發(fā)送數(shù)據(jù)。
使用ADI的鏈路端口專利技術(shù)還能實現(xiàn)處理器間的高速通信。每個ADSP-21060集成了6個獨立的鏈路端口用于點到點通信,因此可以實現(xiàn)額外的240MBps的I/O帶寬。
由于具有這種真正平衡的架構(gòu)和擴展功能,SHARC處理器被廣泛用于運算強度大的應(yīng)用,如醫(yī)療成像、軍事雷達和電子游戲機。
也許讓人不敢相信,具有這種功能的處理器在15年前就推向市場了,但令人更加驚奇的是,這種處理器目前還在繼續(xù)為用戶所用!這是SHARC架構(gòu)性能的良好擴展性以及ADI公司對質(zhì)量和用戶滿意做出承諾的最好證明。
4第二代SHARC處理器
第二代SHARC處理器將處理性能提升到了新的層次,它將內(nèi)核架構(gòu)擴展為單指令多數(shù)據(jù)(SIMD)系統(tǒng),并將內(nèi)核時鐘頻率提高到100MHz。ADSP-2116x系列處理器保持了與ADSP-2106x SISD處理器的源代碼的完全兼容性,而且經(jīng)過少量代碼修改就能讓用戶發(fā)揮新增加的并行運算單元(寄存器文件+乘法器+ALU+桶式移位器)的作用,與上一代SHARC相比可以將周期性能指標(biāo)提高一倍。
為了在不降低周期性能的條件下方便到這個新增加的運算單元的數(shù)據(jù)傳送,內(nèi)部的PM和DM數(shù)據(jù)總線寬度都增加到了64位,同時在ADSP-21161上集成了48位寬100MHz SDRAM控制器來增加I/O數(shù)據(jù)傳送帶寬,從而能夠?qū)崿F(xiàn)高達600MBps帶寬的數(shù)據(jù)傳送能力。
就像上一代SISD SHARC一樣,第二代SHARC保留了支持簇總線系統(tǒng)架構(gòu)的多處理器無膠合連接,以及通過鏈路端口的點到點連接,使性能升級路線圖更加簡單清晰。
就像上一代SISD SHARC一樣,第二代SHARC系列器件被醫(yī)療、工業(yè)和軍事應(yīng)用所廣泛采用,而且由于額外集成了支持時分復(fù)用(TDM)和I2S格式的串行端口(SPORT),專業(yè)音響和高端消費/汽車音響設(shè)備很快地利用到了該處理器的浮點運算提供的大動態(tài)范圍優(yōu)勢。
5第三代SHARC處理器
第三代SHARC處理器開始跳出多處理器應(yīng)用空間,主動迎接新的挑戰(zhàn)。由于在音頻應(yīng)用中具有明顯的浮點處理優(yōu)勢,SHARC技術(shù)開發(fā)的重點開始轉(zhuǎn)向以最低系統(tǒng)成本努力增加片上處理功能。
以這個目標(biāo)開發(fā)并推向市場的第一批處理器是ADSP-2126x系列。就像ADSP-2116x一樣,ADSP-2126x采用SIMD架構(gòu)使運算性能最大化。除了將內(nèi)核性能翻倍達到200MHz外,ADSP-21266處理器還是SHARC系列中首個內(nèi)置片上掩膜ROM的產(chǎn)品。集成4Mb ROM降低了系統(tǒng)復(fù)雜性和成本,將曾經(jīng)給人們留下“高成本”印象的浮點型DSP推向了消費類音頻領(lǐng)域。
為了進一步降低硬件系統(tǒng)設(shè)計的復(fù)雜性,ADI公司開發(fā)出了名為“數(shù)字應(yīng)用接口”(DAI)的創(chuàng)新性外設(shè)。與以前的SHARC和同類競爭性產(chǎn)品將引腳功能固定下來不同,DAI允許用戶將任何外設(shè)功能分配到他們想要的任意一個外部引腳。對于音頻系統(tǒng)來說,這意味著當(dāng)系統(tǒng)輸入輸出要求發(fā)生改變時,音頻時鐘域可以隨時通過軟件分配到引腳并路由到串行端口。這種靈活性可以顯著減少為了支持特殊系統(tǒng)規(guī)范所需的外部引腳數(shù)量,有助于硬件設(shè)計的簡化,幫助用戶進一步降低成本。
ADSP-2136x繼承了ADSP-2126x節(jié)省成本的優(yōu)點,并增加了先進的音頻信號鏈集成方法。內(nèi)核性能提高了60%以上,達到333MHz,內(nèi)部SRAM可增加到3Mb。另外還集成了許多針對音頻的外設(shè),如高性能異步采樣率轉(zhuǎn)換器(ASRC)、SPDIF收發(fā)器和DTCP加密引擎,從而進一步優(yōu)化了可編程性能和音頻系統(tǒng)BOM成本,鞏固了ADI在音頻市場中的領(lǐng)導(dǎo)地位。在這一系列的高性能產(chǎn)品中還集成了工作頻率高達166MHz的32位SDRAM接口,以增加I/O帶寬,同時有利于數(shù)據(jù)密集應(yīng)用使用批量生產(chǎn)的存儲器。
基于這種突破性的音頻系統(tǒng)集成和性價比領(lǐng)先優(yōu)勢,第三代SHARC系列不僅在專業(yè)音頻領(lǐng)域,而且在消費音頻應(yīng)用(如家庭影院系統(tǒng)、AV放大器)中得到了廣泛應(yīng)用,為新一代高清音頻標(biāo)準(zhǔn)(DTS Master Audio和Dolby Tru-HD)推向市場發(fā)揮了重要作用。
6第四代SHARC系列——ADSP-2146x
第三代SHARC處理器在優(yōu)化性價比方面取得了成功,推動浮點處理器進入了對成本敏感的消費類應(yīng)用,而這類應(yīng)用曾被人們認為是不可能使用昂貴的浮點處理器的。
ADI公司現(xiàn)在面臨著一個有意思的挑戰(zhàn):如何進一步改進具備優(yōu)異性價比的浮點處理器?
在定義第四代處理器時,產(chǎn)品開發(fā)團隊注重的是核心價值正是它們使得SHARC一直處于浮點DSP技術(shù)的前沿: