• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于統(tǒng)計(jì)量的存儲(chǔ)系統(tǒng)磁盤(pán)功耗建模方法研究

      2016-08-01 06:13:52李戰(zhàn)懷王惠峰趙曉南
      關(guān)鍵詞:存儲(chǔ)系統(tǒng)磁盤(pán)能耗

      孫 鑒 李戰(zhàn)懷 張 曉 王惠峰 趙曉南

      (西北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院 西安 710129)

      ?

      基于統(tǒng)計(jì)量的存儲(chǔ)系統(tǒng)磁盤(pán)功耗建模方法研究

      孫鑒李戰(zhàn)懷張曉王惠峰趙曉南

      (西北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院西安710129)

      (qwert3277@163.com)

      摘要大數(shù)據(jù)的迅猛發(fā)展導(dǎo)致數(shù)據(jù)中心的存儲(chǔ)規(guī)模急劇擴(kuò)張,由此引發(fā)的高能耗已經(jīng)成為數(shù)據(jù)中心普遍面臨的一個(gè)突出問(wèn)題,磁盤(pán)類存儲(chǔ)介質(zhì)在數(shù)據(jù)中心耗能中所占的比例也在逐年增加,能耗建模在目前學(xué)者們的研究中越來(lái)越受到關(guān)注.精確的磁盤(pán)能耗模型不僅可以解決數(shù)據(jù)中心中的電力配套問(wèn)題,而且為當(dāng)前數(shù)據(jù)中心各種能耗管理技術(shù)體現(xiàn)更為精確的節(jié)能效果.提出了一種基于統(tǒng)計(jì)量的磁盤(pán)能耗預(yù)測(cè)模型,該模型彌補(bǔ)了傳統(tǒng)細(xì)粒度模型產(chǎn)生的額外負(fù)載影響,同時(shí)獲取了比傳統(tǒng)粗粒度模型更佳的預(yù)測(cè)準(zhǔn)確率.在實(shí)際應(yīng)用中,該模型不需要分析記錄復(fù)雜的磁盤(pán)內(nèi)部活動(dòng)細(xì)節(jié),也不需要繁雜的參數(shù)采集,僅需要存儲(chǔ)系統(tǒng)中宏觀的統(tǒng)計(jì)量作為參數(shù),且預(yù)測(cè)精度與細(xì)粒度模型近似.通過(guò)實(shí)驗(yàn)驗(yàn)證,該模型在能耗預(yù)測(cè)上的平均誤差為3%,并且針對(duì)同步IO及異步IO都有較好的預(yù)測(cè)效果.此外,該模型還可以應(yīng)用于各種在線系統(tǒng)的能耗預(yù)測(cè).

      關(guān)鍵詞存儲(chǔ)系統(tǒng);能耗;建模;磁盤(pán);電源管理

      隨著現(xiàn)階段數(shù)據(jù)中心信息處理規(guī)模的不斷擴(kuò)大,大量數(shù)據(jù)密集型應(yīng)用需要更可靠的在線數(shù)據(jù)資源訪問(wèn).但大容量的存儲(chǔ)空間帶來(lái)了電力能源的高消耗,同時(shí)也間接地增加了二氧化碳的排放量,加劇了溫室效應(yīng).IDC 2011年6月發(fā)布的數(shù)字研究報(bào)告顯示:2011年全球數(shù)據(jù)總量已高達(dá)1.8 ZB,并且預(yù)計(jì)到2020年,全球所有IT部門(mén)所管理的數(shù)據(jù)將比現(xiàn)在多出50倍[1].目前,在一個(gè)標(biāo)準(zhǔn)的數(shù)據(jù)中心中,存儲(chǔ)系統(tǒng)的能耗約占總能耗的37%,而數(shù)據(jù)中心的存儲(chǔ)系統(tǒng)在3~5年內(nèi)所消耗的電量費(fèi)用將超過(guò)其硬件購(gòu)置成本,并且存儲(chǔ)能耗還以每年60%以上的速度遞增[2-5].能耗成為存儲(chǔ)系統(tǒng)運(yùn)行的主要開(kāi)支,近來(lái)大家開(kāi)始將研究興趣轉(zhuǎn)向調(diào)度中的能耗管理.能耗感知調(diào)度是指將能耗作為調(diào)度評(píng)價(jià)指標(biāo)之一[6],無(wú)論是在線的密集型數(shù)據(jù)訪問(wèn)還是離線的海量數(shù)據(jù)存儲(chǔ),都會(huì)導(dǎo)致數(shù)據(jù)中心的能耗需求逐年增加.針對(duì)能耗需求爆炸的挑戰(zhàn),很多學(xué)者致力于磁盤(pán)節(jié)能技術(shù)的開(kāi)發(fā)及優(yōu)化,例如以MAID[7]為代表的磁盤(pán)分組技術(shù)、以PDC[8]為代表的數(shù)據(jù)分布技術(shù)等.這些技術(shù)在特定負(fù)載場(chǎng)景下達(dá)到了較理想的節(jié)能效果.但對(duì)于能耗管理技術(shù)來(lái)說(shuō),準(zhǔn)確的磁盤(pán)能耗預(yù)測(cè)模型可以更方便地設(shè)計(jì)IO調(diào)度節(jié)能算法以數(shù)據(jù)布局技術(shù),使得節(jié)能效果更加顯著,而不準(zhǔn)確的能耗預(yù)測(cè)會(huì)導(dǎo)致數(shù)據(jù)中心配套電力設(shè)施的浪費(fèi)或不足,因此,解決存儲(chǔ)系統(tǒng)的能耗預(yù)估是大多數(shù)數(shù)據(jù)中心面臨的一個(gè)巨大挑戰(zhàn),也是存儲(chǔ)系統(tǒng)節(jié)能技術(shù)研究的一個(gè)重要方面.

      目前現(xiàn)有磁盤(pán)能耗模型根據(jù)參數(shù)的采集方式及模型的構(gòu)建思路的不同可劃歸為細(xì)粒度模型及粗粒度模型兩大類,細(xì)粒度模型將設(shè)備劃分為多個(gè)功能組件,依據(jù)磁盤(pán)內(nèi)部的細(xì)節(jié)活動(dòng)來(lái)預(yù)估磁盤(pán)能耗,精確的計(jì)算設(shè)備的功能部件在每次IO訪問(wèn)過(guò)程中所引發(fā)的耗能,細(xì)粒度提出時(shí)間較早,預(yù)測(cè)結(jié)果較為精確,但大多數(shù)磁盤(pán)模型所需的參數(shù)采集方式較為復(fù)雜,并且采集內(nèi)容種類繁多,并不具有通用性.在目前數(shù)據(jù)中心高性能的需求下,這種細(xì)粒度模型的應(yīng)用會(huì)對(duì)日常數(shù)據(jù)處理帶來(lái)很大的采集開(kāi)銷.粗粒度模型以IO特征參數(shù)預(yù)估磁盤(pán)能耗,大多使用磁盤(pán)標(biāo)量參數(shù)或使用數(shù)據(jù)傳輸率等IO特征參數(shù),應(yīng)用于節(jié)能技術(shù)中粗略的能耗估計(jì),但這些粗粒度的模型專注于研究IO特征與能耗間的相關(guān)關(guān)系,并不關(guān)注磁盤(pán)的細(xì)節(jié)活動(dòng),因此在精確度上并不能令人滿意.針對(duì)于上述情況,本文提出了一種基于統(tǒng)計(jì)量的磁盤(pán)能耗預(yù)測(cè)模型,該模型不需要分析記錄復(fù)雜的磁盤(pán)內(nèi)部活動(dòng)細(xì)節(jié),也不需要繁雜的參數(shù)采集,僅需要存儲(chǔ)系統(tǒng)中宏觀的統(tǒng)計(jì)量作為參數(shù),且預(yù)測(cè)精度與細(xì)粒度模型近似.與傳統(tǒng)的細(xì)粒度和粗粒度不同的是,本文主要關(guān)注如何利用磁盤(pán)的統(tǒng)計(jì)量來(lái)獲得磁盤(pán)內(nèi)部活動(dòng)特征,再?gòu)膬?nèi)部細(xì)節(jié)活動(dòng)去預(yù)估磁盤(pán)能耗.從實(shí)驗(yàn)驗(yàn)證結(jié)果來(lái)看,本模型在尋道能耗預(yù)測(cè)模型上的平均誤差在3%,基本達(dá)到了細(xì)粒度模型的精確度.

      1磁盤(pán)能耗模型的研究現(xiàn)狀

      在目前的磁盤(pán)存儲(chǔ)系統(tǒng)能耗預(yù)測(cè)研究中,細(xì)粒度模型專注于獲取磁盤(pán)的內(nèi)部活動(dòng)細(xì)節(jié),而不過(guò)多地考慮設(shè)備的功率情況,例如在Zedlewski等人[9]使用早期的筆記本磁盤(pán)來(lái)進(jìn)行能耗測(cè)量,將IO讀寫(xiě)分為尋道能耗、傳輸能耗以及固定的電子部件能耗等,通過(guò)筆記本磁盤(pán)的尋址次數(shù)、傳輸數(shù)據(jù)塊大小等作為模型參數(shù),預(yù)估磁盤(pán)的IO訪問(wèn)能耗,其預(yù)估結(jié)果較為精確,是較為典型的細(xì)粒度模型,但其在論文中主要預(yù)估磁盤(pán)耗能,并沒(méi)有過(guò)多地關(guān)注功率狀態(tài).Peek等人[10]精確地調(diào)查了在特定配置下的磁盤(pán)能耗特征,并且研究了LBN與尋道所用能耗的相關(guān)關(guān)系,但作者沒(méi)有考慮到磁道與LBN并不是順序?qū)?yīng)的.

      上述學(xué)者們所設(shè)計(jì)的細(xì)粒度磁盤(pán)模型在測(cè)量設(shè)備能耗時(shí)具有非常優(yōu)秀的精確性,但在實(shí)際應(yīng)用情況下受到很大的約束.首先由于磁盤(pán)本身的運(yùn)動(dòng)特性,磁盤(pán)在旋轉(zhuǎn)延時(shí)期間所消耗的時(shí)間是不確定的,因此雖然細(xì)粒度模型對(duì)IO事件引發(fā)的能量消耗預(yù)估效果較好,但對(duì)于功率預(yù)測(cè)卻效果不佳.而功率預(yù)測(cè)由于其具有一定的統(tǒng)計(jì)意義,恰恰是在目前大規(guī)模數(shù)據(jù)中心能耗預(yù)測(cè)中更為關(guān)注的部分[11-13].此外,目前數(shù)據(jù)中心的在線及離線處理的數(shù)據(jù)量巨大,全程監(jiān)測(cè)磁盤(pán)內(nèi)部工作的細(xì)節(jié)并不現(xiàn)實(shí),這種模型所需的Trace分析文件至少跟當(dāng)前的IO處于相同的數(shù)量級(jí),這也是細(xì)粒度模型適應(yīng)性不強(qiáng)的另一個(gè)原因.

      粗粒度模型并不特別關(guān)心磁盤(pán)的細(xì)節(jié)活動(dòng)特征,在粗粒度模型中很多學(xué)者試著使用一些磁盤(pán)標(biāo)量或者特征量預(yù)估磁盤(pán)能耗而回避較為復(fù)雜的內(nèi)部細(xì)節(jié)活動(dòng).專注于存儲(chǔ)系統(tǒng)節(jié)能技術(shù)研究的學(xué)者,對(duì)節(jié)能效果的模擬建模都比較簡(jiǎn)單.例如Hybrid disks[14]使用非易失性存儲(chǔ)器增強(qiáng)IO子系統(tǒng)的性能,從而降低能耗,文獻(xiàn)[15]使用寫(xiě)重定向的方法降低磁盤(pán)能耗,但這2種技術(shù)均使用磁盤(pán)在每秒操作數(shù)(IOPS)狀態(tài)下的大概功率來(lái)估計(jì)節(jié)能效果.多速磁盤(pán)[16]由于目前實(shí)測(cè)建模比較困難,學(xué)者在探討其節(jié)能效果時(shí)使用的是模擬的標(biāo)量.MAID技術(shù)[7]應(yīng)用磁盤(pán)分組技術(shù)降低陣列能耗,但學(xué)者更關(guān)注于閑置能耗及待機(jī)能耗的節(jié)能效果,并不關(guān)注負(fù)載磁盤(pán)的能耗狀態(tài).文獻(xiàn)[17]提出一種應(yīng)用數(shù)據(jù)冗余降低磁盤(pán)能耗的方法,其使用磁盤(pán)負(fù)載狀態(tài)的平均能耗來(lái)預(yù)估節(jié)能效果.上述的節(jié)能技術(shù)研究可以看出該方向的學(xué)者大多更關(guān)心節(jié)能算法及數(shù)據(jù)布局等內(nèi)容,對(duì)能耗預(yù)測(cè)的定量分析不足,選取的特征參數(shù)大多無(wú)法體現(xiàn)能耗的細(xì)節(jié)變化.

      同時(shí),部分學(xué)者發(fā)現(xiàn)磁盤(pán)的功率狀態(tài)與磁盤(pán)的活動(dòng)特征有關(guān),并且在通過(guò)活動(dòng)特征預(yù)測(cè)磁盤(pán)能耗方面做了進(jìn)一步的研究.Stoess等人[18]使用磁盤(pán)利用率來(lái)衡量磁盤(pán)的能耗,磁盤(pán)利用率是通過(guò)數(shù)據(jù)傳輸率和響應(yīng)時(shí)間來(lái)定義的,該模型顯示在閑置和活動(dòng)狀況不同的磁盤(pán),根據(jù)其磁盤(pán)利用率能耗呈近線性趨勢(shì).但在文獻(xiàn)[19]中,學(xué)者通過(guò)實(shí)驗(yàn)證實(shí),在操作時(shí)間相同的磁盤(pán)活動(dòng),能耗結(jié)果可能不同.同時(shí)在文獻(xiàn)[19]中作者通過(guò)將IO負(fù)載分解為磁盤(pán)活動(dòng)細(xì)節(jié),并且采用“耗能對(duì)應(yīng)表”的方法來(lái)將磁盤(pán)活動(dòng)特征與能耗對(duì)應(yīng)起來(lái),但在IO分解中沒(méi)有考慮數(shù)據(jù)傳輸時(shí)間對(duì)12 V磁頭尋道的影響,這可能也是大數(shù)據(jù)塊隨機(jī)訪問(wèn)誤差較大的原因.Yan等人[20]給出了磁盤(pán)能耗與應(yīng)用程序的關(guān)系模型.通過(guò)DEEP作為測(cè)量手段,建模給出磁盤(pán)與應(yīng)用程序的能耗關(guān)系.文獻(xiàn)[21]中使用限制當(dāng)前設(shè)備的尋址、提速降速、待機(jī)等狀態(tài)來(lái)測(cè)定設(shè)備的數(shù)據(jù)并用于其他的模擬器.粗粒度模型本身不關(guān)注細(xì)節(jié)內(nèi)部活動(dòng)細(xì)節(jié),對(duì)磁盤(pán)的能耗預(yù)測(cè)精度無(wú)法達(dá)到細(xì)粒度模型的水平.無(wú)論是能耗優(yōu)化,還是通過(guò)磁盤(pán)活動(dòng)特征進(jìn)行預(yù)測(cè),都不能獲得較為理想的預(yù)估結(jié)果.

      本文在目前傳統(tǒng)的細(xì)粒度模型及粗粒度模型研究的基礎(chǔ)上,分析了兩大類模型在現(xiàn)階段高吞吐率需求的存儲(chǔ)系統(tǒng)中存在的缺陷,結(jié)合IO訪問(wèn)特征相關(guān)參數(shù)的研究成果,通過(guò)不影響在線訪問(wèn)的統(tǒng)計(jì)量參數(shù)預(yù)測(cè)磁盤(pán)細(xì)節(jié)活動(dòng),然后根據(jù)細(xì)節(jié)活動(dòng)對(duì)磁盤(pán)能耗進(jìn)行建模.這種思路有效地避免了繁多的采集量對(duì)系統(tǒng)性能的影響.

      2參數(shù)選擇

      在建立磁盤(pán)能耗模型的過(guò)程中,參數(shù)的選擇對(duì)預(yù)測(cè)準(zhǔn)確性影響很大,雖然對(duì)于單次IO來(lái)說(shuō),旋轉(zhuǎn)延遲時(shí)間,下次IO到達(dá)時(shí)間等磁盤(pán)的活動(dòng)特征是隨機(jī)的,但對(duì)于一段時(shí)間內(nèi)的IO訪問(wèn),在統(tǒng)計(jì)上還是有其相應(yīng)的特征,并且這些特征被學(xué)者們用來(lái)預(yù)測(cè)磁盤(pán)能耗,Allalouf等人[19]使用每秒鐘的平均尋道數(shù)、每秒鐘的數(shù)據(jù)傳輸量、磁盤(pán)隊(duì)列深度等參數(shù)構(gòu)建能耗表用于磁盤(pán)功率的預(yù)測(cè).但我們?cè)谔剿鞔疟P(pán)尋道功率模型時(shí)發(fā)現(xiàn),文獻(xiàn)[19]中的參數(shù)選取還有一定的片面性:從本節(jié)的構(gòu)造負(fù)載驗(yàn)證實(shí)驗(yàn)來(lái)看,在讀寫(xiě)數(shù)據(jù)塊相同的條件下,尋址距離而不是尋址數(shù)量會(huì)引發(fā)相同的能耗.本文在選取參數(shù)方面與文獻(xiàn)[19]相比主要有4點(diǎn)區(qū)別:1)我們使用輕量級(jí)采集工具而不是通過(guò)推測(cè)獲取特征參數(shù);2)我們將尋址距離而不是尋址次數(shù)作為12 V尋址功率模型的主要影響參數(shù);3)我們考慮了磁盤(pán)活動(dòng)利用率對(duì)功率預(yù)測(cè)的影響;4)通過(guò)實(shí)驗(yàn)驗(yàn)證了傳輸塊大小對(duì)尋址功率的影響.下面通過(guò)實(shí)驗(yàn)來(lái)分析本文選取的選址跨度、磁盤(pán)活動(dòng)利用率、數(shù)據(jù)傳輸塊大小等參數(shù)對(duì)磁盤(pán)細(xì)節(jié)活動(dòng)的影響.

      2.1LBA與尋址跨度

      邏輯塊地址(logical block address, LBA)是描述存儲(chǔ)設(shè)備上數(shù)據(jù)所在區(qū)域的通用機(jī)制.通常一個(gè)LBA為一個(gè)扇區(qū)大小.為了保證磁道上存儲(chǔ)空間的利用率,磁盤(pán)上的磁道是以環(huán)帶(zone)分組的形式進(jìn)行分布的,簡(jiǎn)單來(lái)講,多個(gè)磁道組成一個(gè)環(huán)帶,僅在同一環(huán)帶中磁道上的扇區(qū)數(shù)相同,這樣既保證了存儲(chǔ)空間的利用率又降低了磁頭讀寫(xiě)的復(fù)雜程度.目前關(guān)于磁盤(pán)特征抽取技術(shù)的研究已經(jīng)較為成熟,這種映射關(guān)系可以通過(guò)詢問(wèn)或經(jīng)驗(yàn)抽取的方法實(shí)現(xiàn).SCSI接口提供了通過(guò)SENDRECEIVE DIAGNOSTIC的Translate選項(xiàng)實(shí)現(xiàn)邏輯地址物理地址互轉(zhuǎn)換的詢問(wèn)方法[22],而文獻(xiàn)[22-23]提供了多種經(jīng)驗(yàn)抽取的磁盤(pán)特征提取方法,其中文獻(xiàn)[23]的方法效率最佳,可以在75 min內(nèi)獲取250 GB SATA磁盤(pán)的內(nèi)部特征.我們是在廣泛應(yīng)用的磁盤(pán)模擬器disksim工具中獲得Seagate ST3146855SS磁盤(pán)邏輯地址與物理地址的映射關(guān)系,并且每次運(yùn)行負(fù)載時(shí)都使用blktrace工具進(jìn)行跟蹤,以確保訪問(wèn)的LBA與真實(shí)的物理磁道相對(duì)應(yīng).這便保證了本節(jié)實(shí)驗(yàn)結(jié)果的可靠性.

      為了驗(yàn)證IO訪問(wèn)時(shí)磁頭位移對(duì)尋址能耗的影響,我們采用合成負(fù)載在SeaGate ST3146855SS服務(wù)器硬盤(pán)進(jìn)行了相應(yīng)的測(cè)試,本節(jié)所應(yīng)用的合成負(fù)載是一種基于磁道順序訪問(wèn)的負(fù)載,以每個(gè)磁道中某一扇區(qū)的LBN為尋址跨度,每個(gè)磁道訪問(wèn)塊大小為4 KB,保證整個(gè)測(cè)試過(guò)程中磁頭從第1個(gè)單盤(pán)片的物理0磁道依次移動(dòng)至物理最高的磁道.對(duì)磁盤(pán)單盤(pán)片上每一條磁道依次進(jìn)行讀操作和寫(xiě)操作,并保證每次尋址后磁頭都回到本次訪問(wèn)的起點(diǎn),每次讀寫(xiě)的數(shù)據(jù)量大小為4 KB.在圖1中,橫坐標(biāo)為磁頭的尋址位移,縱坐標(biāo)為單次尋址的平均耗能.我們可以看到,在尋道距離為10 000個(gè)磁道跨度之前,每次尋址的平均耗能與磁盤(pán)尋址跨度呈近似的線性關(guān)系,這也與dempsey[9]中的實(shí)驗(yàn)結(jié)果相對(duì)應(yīng).在10 000個(gè)磁道跨度至最大尋道跨度之間存在箭頭所示的5個(gè)階梯狀耗能曲線,這代表這塊磁盤(pán)為保證IO訪問(wèn)的性能,采用延長(zhǎng)磁頭推動(dòng)力持續(xù)時(shí)間的某些技術(shù),在應(yīng)對(duì)大跨度的尋址位移時(shí),根據(jù)尋址位移的范圍不同,在磁盤(pán)半徑方向采用不同的最高速度進(jìn)行尋址,例如本次實(shí)驗(yàn)中的SeaGate ST3146855SS磁盤(pán)就擁有5個(gè)不同的最高徑向速度,這樣雖然增加了耗能,但可以保證磁頭的尋址時(shí)間不會(huì)過(guò)長(zhǎng).這一結(jié)果與傳統(tǒng)的磁頭運(yùn)動(dòng)模型部分相符,我們?cè)诘?節(jié)中我們采用等效動(dòng)力模型對(duì)磁頭活動(dòng)功率建模時(shí),針對(duì)這種情況對(duì)磁頭運(yùn)動(dòng)模型進(jìn)行了改進(jìn).

      Fig. 1 Energy consumption of single seeking.圖1 單次尋址耗能

      本節(jié)也驗(yàn)證了磁頭的位移而不是磁頭的位置是尋址能耗的主要影響參數(shù).主要驗(yàn)證方法是采用2種不同的合成負(fù)載,2種負(fù)載與單次尋址耗能實(shí)驗(yàn)中所用負(fù)載類似,均對(duì)磁盤(pán)單盤(pán)片上每一條磁道依次進(jìn)行讀操作和寫(xiě)操作,并保證每次訪問(wèn)后磁頭都回到本次訪問(wèn)的起點(diǎn),每次讀寫(xiě)的數(shù)據(jù)量大小為4 KB.但差異之處在于,第1種合成負(fù)載從第1條磁道(磁道0)開(kāi)始訪問(wèn)到最后一條磁道(最高磁道)結(jié)束,我們稱之為順序訪問(wèn);第2種合成負(fù)載從最后一條磁道(最高磁道)開(kāi)始到第1條磁道(0磁道)結(jié)束,我們稱之為倒序訪問(wèn).圖2中顯示為順序訪問(wèn)和倒序訪問(wèn)的能耗,橫軸坐標(biāo)為尋址位移.從圖2可以看到,順序訪問(wèn)及倒序訪問(wèn)的能耗變化趨勢(shì)幾乎相同,在相同的尋址位移上的瞬時(shí)變化功率也非常相近.因此磁頭尋址功率與當(dāng)前磁頭所在位置關(guān)系不大,而磁頭位移是決定磁頭尋址功率的重要參數(shù)之一.

      Fig. 2 The power of sequence-reverse order seeking.圖2 磁頭順序-倒序訪問(wèn)的變化功率

      2.2磁盤(pán)活動(dòng)利用率

      磁盤(pán)活動(dòng)利用率指的是在單位時(shí)間內(nèi)磁盤(pán)讀寫(xiě)操作占總運(yùn)行時(shí)間的比率,這一參數(shù)反映了磁盤(pán)的繁忙程度.

      我們?cè)诮y(tǒng)計(jì)磁盤(pán)活動(dòng)利用率時(shí),使用IO操作的總時(shí)間占單位時(shí)間的比率來(lái)計(jì)算磁盤(pán)活動(dòng)利用率.這一計(jì)算方法也從側(cè)面反映了IO之間存在的達(dá)到時(shí)間占總運(yùn)行時(shí)間的比例大小.如圖3所示:

      Fig. 3 Disk utilization affects the seeking power.圖3 磁盤(pán)活動(dòng)利用率對(duì)尋址功率的影響

      在考慮該參數(shù)對(duì)功率影響時(shí),我們測(cè)試了3次不同的合成負(fù)載對(duì)磁盤(pán)瞬時(shí)功率的影響,如圖3所示,橫坐標(biāo)為當(dāng)前IO訪問(wèn)的磁道,縱坐標(biāo)為12 V電路在發(fā)生尋址操作時(shí)增加的功率.為保證負(fù)載訪問(wèn)模式的一致性,該3次合成負(fù)載的測(cè)試均保證磁頭在單盤(pán)片上從0磁道到最大磁道的訪問(wèn),每次IO為數(shù)據(jù)塊大小相同的同步的讀寫(xiě)請(qǐng)求,在讀寫(xiě)請(qǐng)求結(jié)束后加入不同的休眠時(shí)間以獲取不同的磁盤(pán)活動(dòng)利用率.f1為沒(méi)有休眠時(shí)間的合成負(fù)載,其活動(dòng)利用率在95%~100%之間;合成負(fù)載f2休眠時(shí)間為4 ms,其活動(dòng)利用率為80%~90%之間;合成負(fù)載f3休眠時(shí)間為6 ms,其活動(dòng)利用率為70%~80%之間.在圖3中,f(p)的數(shù)據(jù)是實(shí)測(cè)能耗數(shù)據(jù),f(u)的數(shù)據(jù)為當(dāng)前尋址距離下,根據(jù)所采集的利用率估算的能耗數(shù)據(jù).可以看出f(u)與f(p)的數(shù)據(jù)在訪問(wèn)相同磁道時(shí)相對(duì)吻合,因此我們從實(shí)驗(yàn)結(jié)果中推斷,對(duì)于12 V的尋址電路來(lái)說(shuō),磁盤(pán)活動(dòng)利用率與尋址能耗成正比.

      2.3數(shù)據(jù)傳輸率

      數(shù)據(jù)傳輸率是指在單位時(shí)間內(nèi)讀寫(xiě)操作分別傳輸?shù)臄?shù)據(jù)塊大小,在磁盤(pán)IO操作中影響數(shù)據(jù)傳輸時(shí)間.

      我們使用不同的合成負(fù)載,在保證活動(dòng)利用率不變、尋址跨度相同的前提下,分別測(cè)試每次傳輸塊大小為4 KB,64 KB,256 KB時(shí),3次合成負(fù)載的功率變化情況(對(duì)于SeaGate ST3146855SS磁盤(pán)而言,其內(nèi)側(cè)環(huán)帶中的磁道中單磁道最少扇區(qū)數(shù)為800,單次讀寫(xiě)400 KB大小通常會(huì)引發(fā)跨盤(pán)片的讀寫(xiě)操作,因此測(cè)試采用的最大塊數(shù)為256 KB).從圖4我們可以看出,隨著傳輸塊大小的增加,尋址功率呈下降趨勢(shì),其主要原因在于數(shù)據(jù)塊的增加引起了磁頭讀寫(xiě)操作時(shí)間的增加,對(duì)于磁頭的尋址操作來(lái)說(shuō),在耗能不變的前提下延長(zhǎng)了IO的訪問(wèn)時(shí)間.因此隨著傳輸數(shù)據(jù)塊的增加,其功率會(huì)逐漸降低.

      Fig. 4 Block size affects the seeking power.圖4 傳輸塊大小對(duì)尋址能耗影響

      本節(jié)主要討論了IO訪問(wèn)發(fā)生時(shí)磁盤(pán)的活動(dòng)特征,根據(jù)磁盤(pán)讀寫(xiě)的基本原理及驗(yàn)證性的實(shí)驗(yàn)數(shù)據(jù),分析磁盤(pán)特征參數(shù)與磁頭尋址功率之間的相關(guān)關(guān)系,并得出4點(diǎn)結(jié)論:

      1) 尋址耗能與尋址位移在一定范圍內(nèi)呈線性關(guān)系,一定范圍內(nèi)呈常數(shù)關(guān)系.磁頭尋道的一般機(jī)械過(guò)程為:加速前進(jìn)—?jiǎng)蛩偾斑M(jìn)—減速前進(jìn)—定位調(diào)整,并且經(jīng)典運(yùn)動(dòng)模型給出的磁頭尋址模型均把磁頭的尋址運(yùn)動(dòng)等效為加速度相反的勻加速直線運(yùn)動(dòng).因此,我們假設(shè)有一個(gè)徑向的推動(dòng)力及牽引力幫助磁頭完成了磁頭的尋址運(yùn)動(dòng).從經(jīng)典的磁頭尋址模型可知,推動(dòng)力及牽引力大小相同,方向相反.從而在磁頭徑向速度小于v0(見(jiàn)3.2節(jié))時(shí)尋址耗能與尋址位移呈線性關(guān)系,在大于v0后呈常數(shù)關(guān)系.

      2) 磁頭尋址能耗與LBA及磁頭所在位置無(wú)關(guān),與磁頭位移相關(guān).由結(jié)論1的分析可知,目前磁盤(pán)器件的徑向均加速均減速運(yùn)動(dòng)所消耗的電能與磁頭當(dāng)前位置(LBA)沒(méi)有相關(guān)性,而與磁頭的位移(牽引力制動(dòng)力的作用距離)相關(guān).

      3) 磁頭尋址能耗與磁盤(pán)活動(dòng)利用率呈正比.磁盤(pán)活動(dòng)利用率指的是在單位時(shí)間內(nèi)磁盤(pán)讀寫(xiě)操作占總運(yùn)行時(shí)間的比率.這個(gè)比率越低則說(shuō)明磁頭在IO操作完成后間隔的空閑時(shí)間越長(zhǎng).也就是說(shuō)磁頭在空閑時(shí)間內(nèi)并沒(méi)有工作,所以磁頭尋址能耗與磁盤(pán)活動(dòng)利用率呈正比.

      4) 塊大小越大,磁頭尋址功率越低.由于單次IO操作是由磁頭尋址—定位—傳輸數(shù)據(jù)塊這樣的流程進(jìn)行的.單次IO操作中數(shù)據(jù)塊大小越大,所占總的傳輸時(shí)間比率越大,而對(duì)于磁頭的尋址操作來(lái)說(shuō),相當(dāng)于在耗能不變的前提下,延長(zhǎng)了IO的訪問(wèn)時(shí)間,因此變相地降低了磁頭的尋址功率.

      本節(jié)對(duì)磁頭尋址功率的相關(guān)特征參數(shù)做了相應(yīng)的研究,提出了與尋址功率相關(guān)的4個(gè)結(jié)論,通過(guò)目前磁盤(pán)的工作原理分析以及實(shí)驗(yàn)驗(yàn)證相結(jié)合的方法,證實(shí)了這些結(jié)論的一般性.此外,在實(shí)驗(yàn)過(guò)程中采集的數(shù)據(jù)中可以看出,磁頭的尋址操作對(duì)IO讀寫(xiě)的平均訪問(wèn)時(shí)間影響最大,因此我們將IO讀寫(xiě)的平均訪問(wèn)時(shí)間作為尋道預(yù)估模型的主要參數(shù).而尋址位移、磁盤(pán)活動(dòng)利用率、數(shù)據(jù)傳輸率等參數(shù)對(duì)磁盤(pán)的能耗影響較大,我們將其作為細(xì)節(jié)模型的建模參數(shù).

      3模型的建立

      在第2節(jié)確定模型的主要參數(shù)之后,本節(jié)中我們將根據(jù)磁盤(pán)的內(nèi)部原理及讀寫(xiě)時(shí)的活動(dòng)細(xì)節(jié)構(gòu)建尋道預(yù)估模型(cylinder-seeking model for hard-disk activity, CSMDA),12 V電路的尋道功率模型(seeking model for hard-disk power, SMDP)及5 V電路的數(shù)據(jù)傳輸功率模型(data transport model for hard-disk power, TMDP).CSMDA模型用于預(yù)估磁盤(pán)尋址的細(xì)節(jié)活動(dòng),SMDP與TMDP模型用于預(yù)估磁盤(pán)不同線路的功率狀態(tài).目前大多數(shù)的SAS或是SATA磁盤(pán)由12 V及5 V兩路電路進(jìn)行供電,磁盤(pán)功率由2個(gè)線路共同計(jì)算獲得,如圖5所示.圖5為8 KB隨機(jī)讀訪問(wèn)下磁盤(pán)2個(gè)線路的電流狀態(tài),可以看到磁盤(pán)的整體能耗由2條線路共同承擔(dān).

      Fig. 5 Diagram of disk power.圖5 磁盤(pán)功率示意圖

      Fig. 6 Neural network fitting results.圖6 神經(jīng)網(wǎng)絡(luò)擬合結(jié)果

      3.1尋道預(yù)估模型(SMDA)

      為了保證能耗預(yù)測(cè)的準(zhǔn)確性,我們的尋道功率模型需要知道當(dāng)前IO訪問(wèn)的平均尋道跨度,從第2節(jié)的分析中我們可以得知,大多數(shù)的統(tǒng)計(jì)參數(shù)都與尋道跨度有關(guān),但為了減少預(yù)測(cè)過(guò)程中的計(jì)算量,我們使用IO的平均訪問(wèn)時(shí)間來(lái)預(yù)測(cè)單位時(shí)間中的磁頭平均位移.

      預(yù)測(cè)的主要方法是使用神經(jīng)網(wǎng)絡(luò)建模,將采集到的測(cè)試負(fù)載中的單次讀寫(xiě)操作的平均時(shí)間作為輸入?yún)?shù),而將磁頭位移量作為輸出.訓(xùn)練樣本及測(cè)試樣本均使用在實(shí)驗(yàn)中獲取的數(shù)據(jù),其中70%的數(shù)據(jù)為訓(xùn)練樣本,其他30%為驗(yàn)證及測(cè)試樣本,使用Levenberg-Marquardt擬合算法,訓(xùn)練擬合度為圖6(a),確認(rèn)及測(cè)試為圖6(b)(c),綜合擬合結(jié)果為圖6(d).由于在實(shí)驗(yàn)中訪問(wèn)了單盤(pán)片上的所有磁道,所以樣本空間足夠,在一定程度上保證了預(yù)測(cè)的準(zhǔn)確性.訓(xùn)練集測(cè)試集及誤差結(jié)果如圖6、圖7所示.

      Fig. 7 Neural network error results.圖7 神經(jīng)網(wǎng)絡(luò)誤差結(jié)果

      從擬合結(jié)果可以看出,使用神經(jīng)網(wǎng)絡(luò)建模的方法預(yù)測(cè)當(dāng)前磁頭的平均尋道跨度具有一定的誤差,其原因主要是在統(tǒng)計(jì)量中太多的數(shù)據(jù)與尋道跨度有關(guān),為了保證簡(jiǎn)潔性我們只選擇了影響最大的讀寫(xiě)特征來(lái)建模.但其誤差在一定程度上可以接受,同時(shí)也說(shuō)明尋道預(yù)估模型具有較大的改進(jìn)空間.

      3.2尋道功率模型(SMDP)

      盤(pán)臂制動(dòng)器由12 V電路供電[10],主要用于磁盤(pán)讀寫(xiě)中的磁頭定位,是磁盤(pán)部件中的高能耗部件,也是磁盤(pán)部件中電能消耗波動(dòng)較大的部分.為了避免文件系統(tǒng)層以及塊設(shè)備層中讀寫(xiě)優(yōu)化調(diào)度的影響,我們采用直接向磁盤(pán)裸設(shè)備發(fā)送讀寫(xiě)指令的方式控制其盤(pán)臂的活動(dòng),并且我們?cè)趯?shí)驗(yàn)過(guò)程中發(fā)現(xiàn),在磁盤(pán)盤(pán)片中不同物理磁道間位移相同磁道距離的能耗是相同的,這個(gè)結(jié)論也與Dempsey[10]提出的假設(shè)相符合.因此我們提出了SMDP模型,在模型中只要給定磁盤(pán)臂的磁道位移跨度及相關(guān)參數(shù)就可以模擬出磁盤(pán)臂本次定位的電能消耗.該磁盤(pán)臂跨度的能耗模型的優(yōu)點(diǎn)是單次測(cè)量、永久模擬.在以后的預(yù)測(cè)中,只需要給出磁盤(pán)臂的位移跨度,就可以獲取磁盤(pán)臂單次位移的電能消耗.

      在研究磁頭尋址功率模型過(guò)程中,我們應(yīng)用較為廣泛的等效磁頭運(yùn)動(dòng)模型,該模型將盤(pán)臂在盤(pán)片上的尋址運(yùn)動(dòng)(近似的徑向運(yùn)動(dòng))等效為2段加速度相反的勻變速直線運(yùn)動(dòng).該運(yùn)動(dòng)模型假定磁頭存在一個(gè)最大速度v0,磁頭在達(dá)到v0前勻加速運(yùn)動(dòng),達(dá)到v0后勻速運(yùn)動(dòng).并假定存在一個(gè)尋址距離seek0,當(dāng)尋址距離小于seek0時(shí),如圖8(a)所示,尋址過(guò)程中磁頭沒(méi)有達(dá)到極值v0便開(kāi)始減速,當(dāng)速度為0時(shí)恰好到達(dá)尋址位置.而當(dāng)尋址距離大于seek0時(shí),如圖8(b)所示磁頭達(dá)到極值之后不再加速而是保持一段勻速運(yùn)動(dòng)狀態(tài)后再減速到0,同時(shí)到達(dá)尋址位置.圖8是我們基于等效磁頭運(yùn)動(dòng)模型假定的磁頭特征給出的IO訪問(wèn)模型,從變極速補(bǔ)充模型圖8(c)上可以看出,由于磁盤(pán)采用多極速的技術(shù),可以使IO的磁頭尋址節(jié)省粗實(shí)線及虛線所在區(qū)域的時(shí)間.

      Fig. 8 Disk seeking model.圖8 磁頭運(yùn)動(dòng)模型

      在推導(dǎo)過(guò)程中所需參數(shù)如表1所示.

      Table 1 Interpretation of Symbols

      Fig. 9 Seeking-power fitting.圖9 尋道功率模型擬合

      n=f+0.01a×y×(x2+x)

      d×x+g×z+e).

      (1)

      在尋址距離大于seek0時(shí),由于此時(shí)磁頭運(yùn)動(dòng)狀態(tài)比較簡(jiǎn)單,我們直接給出簡(jiǎn)化公式:

      n=f+0.01a×y×x(b×x2+

      d×x+g×z+e).

      (2)

      為了獲取磁盤(pán)臂精確地尋址能耗特征,我們采用特定負(fù)載直接對(duì)磁盤(pán)設(shè)備進(jìn)行讀寫(xiě)操作,保證磁頭每次的讀寫(xiě)都從盤(pán)片外圈至內(nèi)圈,以升序依次訪問(wèn)該盤(pán)片的每一條磁道,并且每次讀寫(xiě)塊大小為1 KB,以減少磁頭傳輸數(shù)據(jù)塊時(shí)的時(shí)間影響.測(cè)試運(yùn)行了26 min,共采集數(shù)據(jù)點(diǎn)1 541個(gè),磁頭以升序依次訪問(wèn)了72 704個(gè)磁道中的每一個(gè)磁道.經(jīng)第2節(jié)的驗(yàn)證性實(shí)驗(yàn)結(jié)果可知,在磁道數(shù)10 000左右達(dá)到第1個(gè)極大速度,此時(shí)尋址位置應(yīng)處于seek0附近.采用前560個(gè)數(shù)據(jù)點(diǎn)圖9(a)作為尋址距離小于seek0的建模數(shù)據(jù),而將后1 000個(gè)數(shù)據(jù)點(diǎn)圖9(b)作為尋址距離大于seek0的建模數(shù)據(jù).使用數(shù)學(xué)工具1stopt,采用對(duì)公式的擬合效果如圖9所示.

      從上述的擬合結(jié)果及所獲得的擬合參數(shù)化簡(jiǎn)給出的式(1)與式(2).我們可以得出針對(duì)于Seagate cheetah15K5 146GSAS盤(pán)的尋道功率為

      (3)

      其中,s為尋址距離,u為磁盤(pán)活動(dòng)利用率,BLK為IO讀寫(xiě)的數(shù)據(jù)傳輸塊大小.在第5節(jié)中我們對(duì)尋道功率模型在小文件訪問(wèn)及完全隨機(jī)訪問(wèn)中進(jìn)行了實(shí)驗(yàn)驗(yàn)證.

      3.3數(shù)據(jù)傳輸功率模型(TMDP)

      磁盤(pán)中的5 V電路主要用于控制磁頭尋址結(jié)束后的讀寫(xiě)操作以及相應(yīng)的緩存等電路功率.通過(guò)第3節(jié)的實(shí)驗(yàn)分析我們可知,IO的數(shù)據(jù)傳輸率可以很好地描述磁頭在定位后的讀寫(xiě)頻率,我們將其作為建模的主要參數(shù).我們通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),相同的數(shù)據(jù)傳輸率下5 V的電路功率總是相同,并且無(wú)論隨機(jī)還是順序,功率變化幅度很小.從磁頭的數(shù)據(jù)傳輸原理可知,磁頭在進(jìn)行讀操作和寫(xiě)操作時(shí)其工作細(xì)節(jié)并不相同,所以我們假設(shè)5 V電路功率與讀寫(xiě)操作的數(shù)據(jù)傳輸率呈線性關(guān)系,并且將讀操作的傳輸率和寫(xiě)操作的傳輸率做為建模參數(shù).

      在TMD模型的建模過(guò)程中,我們?yōu)榱吮WC建模準(zhǔn)確,使用自定義的負(fù)載,讓磁盤(pán)每次執(zhí)行讀寫(xiě)操作時(shí)數(shù)據(jù)塊大小不斷增大,在更大的范圍內(nèi)描述磁頭在定位后的讀寫(xiě)頻率.使用這樣的方法,會(huì)使我們的建模數(shù)據(jù)更加可靠.

      我們假定5 V電路功率為

      P=a×RKB+b×WKB+c,

      (4)

      其中,RKB,WKB分別為磁盤(pán)在單位時(shí)間內(nèi)的讀寫(xiě)傳輸率.

      從圖10的擬合結(jié)果及獲得的擬合參數(shù)簡(jiǎn)化式(4),我們獲得了5 V電路的數(shù)據(jù)傳輸模型:

      P=(4.08E-6)×RKB+(1.48E-6)×

      WKB+2.54,

      (5)

      第5節(jié)中我們順序訪問(wèn)及完全隨機(jī)訪問(wèn)中對(duì)5V電路的數(shù)據(jù)傳輸模型進(jìn)行了實(shí)驗(yàn)驗(yàn)證.

      Fig. 10 Data transmission power fitting (R=0.880 8).圖10 數(shù)據(jù)傳輸功率模型擬合(R=0.880 8)

      3.4盤(pán)片馬達(dá)及電路能耗

      盤(pán)片馬達(dá)在磁盤(pán)通電后用于控制盤(pán)片的轉(zhuǎn)動(dòng),通過(guò)12V電路供電,馬達(dá)在磁盤(pán)待機(jī)過(guò)程中會(huì)停用.主軸電機(jī)主要控制磁盤(pán)在活動(dòng)及待機(jī)狀態(tài)下的磁盤(pán)轉(zhuǎn)動(dòng),在活動(dòng)及閑置狀態(tài)時(shí)能耗基本保持不變,文獻(xiàn)[3]給出了主軸電機(jī)的能耗公式:

      (6)

      其中,ωspm為主軸電機(jī)的角速度,γ為盤(pán)片的半徑.我們從式(6)中可以看出,在角速度保持不變的情況下,盤(pán)片馬達(dá)能耗可以看作是靜態(tài)的能耗,也就是說(shuō),在磁盤(pán)處于活動(dòng)狀態(tài)或是待機(jī)狀態(tài)時(shí),其主軸電機(jī)能耗基本不變.對(duì)5V供電電路來(lái)說(shuō),主要用于磁頭讀寫(xiě)及相關(guān)電路的供電[10],這部分能耗也可以認(rèn)為基本不變.

      本節(jié)中我們應(yīng)用改良后的通用磁盤(pán)等效運(yùn)動(dòng)模型推導(dǎo)出通用的尋址能耗式(1)、式(2)及傳輸能耗式(4),然后在對(duì)磁盤(pán)SeagateST3146855SS的IO訪問(wèn)能耗進(jìn)行了分析與實(shí)驗(yàn)測(cè)試,對(duì)該磁盤(pán)的2個(gè)供電線路分別建立了功率模型,SMDP模型與式(3)用于描述磁頭的尋址活動(dòng)主要用于模擬磁盤(pán)12V電路的功率.TMDP模型與式(5)用于描述讀寫(xiě)數(shù)據(jù)塊大小對(duì)磁盤(pán)功率的影響情況,主要用于描述5V電路功率.

      磁盤(pán)中的固定能耗部分如盤(pán)片馬達(dá)及控制電路等能耗已經(jīng)作為常量應(yīng)用于2個(gè)模型中.在第4節(jié)我們將對(duì)本節(jié)中所提出的功率模型進(jìn)行試驗(yàn)驗(yàn)證,以獲取其各自的誤差范圍,并對(duì)該公式的獲取方法進(jìn)行通用性的驗(yàn)證.

      4實(shí)驗(yàn)驗(yàn)證及數(shù)據(jù)分析

      在第3節(jié)中我們主要應(yīng)用了試驗(yàn)分析型的負(fù)載對(duì)磁盤(pán)功率進(jìn)行了建模和參數(shù)擬合,為了保證模型應(yīng)用的廣泛性,在本節(jié)中我們?cè)O(shè)定了多種負(fù)載對(duì)模型進(jìn)行驗(yàn)證,并對(duì)誤差進(jìn)行分析.整個(gè)實(shí)驗(yàn)環(huán)境如圖11所示:

      Fig. 11 Experimental environment of disk energy.圖11 磁盤(pán)能耗實(shí)驗(yàn)環(huán)境

      4.1實(shí)驗(yàn)平臺(tái)

      在本組實(shí)驗(yàn)中,使用曙光天闊A620r-G服務(wù)器單獨(dú)測(cè)試磁盤(pán)功率,我們使用SAS延長(zhǎng)線將SeagateST3146855SS磁盤(pán)外接于服務(wù)器的供電線路.使用電流鉗獲取磁盤(pán)的電流,為了防止電路間的電磁干擾,電流鉗獲取電流的電路通過(guò)電路板單獨(dú)外接.

      4.2功率模型模擬結(jié)果

      4.2.1異步IO模擬

      我們使用2種負(fù)載對(duì)12V電路尋道模型的隨機(jī)訪問(wèn)功率預(yù)估進(jìn)行驗(yàn)證.第1種負(fù)載使用IOmeter工具來(lái)模擬小數(shù)據(jù)文件和大數(shù)據(jù)文件的在異步IO條件下的磁盤(pán)訪問(wèn).設(shè)置塊大小分別為512B,1KB,4KB,8KB,16KB,如圖12(a)~(e)所示.讀寫(xiě)比例為50%讀操作、50%寫(xiě)操作,訪問(wèn)模式為隨機(jī)訪問(wèn).第2種負(fù)載使用自定義負(fù)載,自定義負(fù)載訪問(wèn)模式為隨機(jī)訪問(wèn)模式,尋址位置從單盤(pán)片中的所有磁道中隨機(jī)選取圖12(f),每次訪問(wèn)數(shù)據(jù)塊的大小也從512B,1KB,4KB,8KB,16KB中隨機(jī)選取,讀寫(xiě)比例為50%讀操作、50%寫(xiě)操作.在加載負(fù)載的同時(shí),我們使用采集工具采集模型所需要的參數(shù),如磁盤(pán)平均讀寫(xiě)時(shí)間,作為尋道預(yù)估模型的輸入,通過(guò)神經(jīng)網(wǎng)絡(luò)建模來(lái)估計(jì)當(dāng)前單位時(shí)間內(nèi)的平均尋址跨度,然后將平均尋址跨度作為磁頭尋道功率模型的輸入,結(jié)合磁盤(pán)活動(dòng)利用率、數(shù)據(jù)傳輸速率等參數(shù)用于估計(jì)尋址功率.

      Fig. 12 The model validation of seeking-power.圖12 尋道功率模型驗(yàn)證結(jié)果

      從圖12可以看出,12V電路的尋址功率模型在IOmeter模擬小數(shù)據(jù)塊的隨機(jī)讀寫(xiě)方面,尋道功率模型可以較好地預(yù)測(cè)磁盤(pán)當(dāng)前能耗.并且預(yù)測(cè)的精準(zhǔn)度比較平穩(wěn),并不隨著數(shù)據(jù)塊的增加而變大,主要原因在于在12V尋道功率模型中,我們同時(shí)也加入了與數(shù)據(jù)塊傳輸時(shí)間相關(guān)的參數(shù),用于適應(yīng)傳輸數(shù)據(jù)塊時(shí)功率的變化.

      Fig. 13 Estimation errors of different block size.圖13 不同數(shù)據(jù)塊的估計(jì)誤差

      同時(shí)我們也發(fā)現(xiàn)在使用IOmeter模擬異步IO負(fù)載時(shí),數(shù)據(jù)塊大小不同,能耗差異性并不大,這可能與IOmeter本身的隨機(jī)讀寫(xiě)策略有關(guān),IOmeter雖然使用的是隨機(jī)訪問(wèn)模式,但異步IO在塊調(diào)度層中對(duì)隊(duì)列中隨機(jī)的地址進(jìn)行排序后,磁頭尋址位移的變化會(huì)比較平穩(wěn).為了消除IOmeter本身隨機(jī)策略對(duì)模型驗(yàn)證的影響,我們同時(shí)也使用了自定義負(fù)載,該負(fù)載使用特定的訪問(wèn)模式,從磁盤(pán)所有磁道集內(nèi)隨機(jī)抽取磁道對(duì)其進(jìn)行直接讀寫(xiě)訪問(wèn),這種自定義負(fù)載可以保證最大限度的尋址隨機(jī)性.從圖13(a)(b)的誤差統(tǒng)計(jì)來(lái)看,對(duì)于IOmeter模擬的文件訪問(wèn)的平均誤差都在2%~3%之間,最大誤差不高于6%.從自定義隨機(jī)負(fù)載的模擬結(jié)果可以看出平均誤差在2%,最大誤差小于5%.順序訪問(wèn)過(guò)程中由于磁頭的位移幅度很小,對(duì)12V電路的影響有限,能耗基本不發(fā)生變化.圖14所示為5V電路的傳輸功率模型的驗(yàn)證結(jié)果,對(duì)于5V電路,我們使用IOmeter工具,分隨機(jī)負(fù)載(如圖14(c)、圖14(d))和順序負(fù)載(如圖14(a)、圖14(b))兩種驗(yàn)證集進(jìn)行測(cè)試,我們?cè)跍y(cè)試過(guò)程中設(shè)置塊大小為32KB,64KB,128KB,256KB,512KB,1MB,2MB,4MB等多種數(shù)據(jù)塊訪問(wèn)模式來(lái)體現(xiàn)傳輸數(shù)據(jù)塊時(shí)電路能耗的顯著變化.

      對(duì)于從小至大的數(shù)據(jù)塊傳輸情況,從誤差統(tǒng)計(jì)來(lái)看無(wú)論隨機(jī)還是順序都有較好的模擬結(jié)果,平均誤差在3%左右,最大誤差不超過(guò)5%.

      Fig. 14 The model validation of data transmission.圖14 數(shù)據(jù)傳輸功率模型驗(yàn)證結(jié)果

      4.2.2同步IO模擬

      我們使用合成負(fù)載對(duì)12V電路尋道模型的同步隨機(jī)訪問(wèn)進(jìn)行功率驗(yàn)證.同步IO的合成負(fù)載的訪問(wèn)模式為尋址位置從單盤(pán)片上所有磁道中隨機(jī)選取.每次IO訪問(wèn)之間的時(shí)間間隔也隨機(jī)產(chǎn)生,這樣保證了磁盤(pán)活動(dòng)利用率的隨機(jī)性.負(fù)載隨機(jī)選取不同的傳輸塊大小、尋址的磁道、每次IO訪問(wèn)后的休眠時(shí)間,這樣基本上可以模擬常見(jiàn)的同步IO訪問(wèn).設(shè)置塊大小為4KB,16KB,64KB,128KB.讀寫(xiě)比例為50%讀操作、50%寫(xiě)操作,訪問(wèn)模式為隨機(jī)訪問(wèn).在加載負(fù)載的同時(shí),我們使用采集工具采集模型所需要的參數(shù),如磁盤(pán)平均讀寫(xiě)時(shí)間,作為尋道預(yù)估模型的輸入,通過(guò)神經(jīng)網(wǎng)絡(luò)建模來(lái)估計(jì)當(dāng)前單位時(shí)間內(nèi)的平均尋址跨度,然后將平均尋址跨度作為磁頭尋道功率模型的輸入,結(jié)合磁盤(pán)活動(dòng)利用率、數(shù)據(jù)傳輸塊大小等參數(shù)用于估計(jì)尋址功率.

      圖15是我們對(duì)數(shù)據(jù)塊大小分別為4KB,16KB,64KB,128KB進(jìn)行的同步IO驗(yàn)證試驗(yàn)結(jié)果,如圖15(a)~(d)所示.可以看到在同步IO中數(shù)據(jù)塊大小發(fā)生較大變化時(shí),對(duì)尋址功率才會(huì)產(chǎn)生可見(jiàn)的影響.從預(yù)測(cè)結(jié)果來(lái)看,雖然數(shù)據(jù)塊大小增加會(huì)影響模型的預(yù)測(cè)精度,但4種同步IO負(fù)載的平均誤差都在3%左右.并且從預(yù)測(cè)結(jié)果來(lái)看,本文提出的功率模型無(wú)論從預(yù)測(cè)結(jié)果還是預(yù)測(cè)趨勢(shì)都可以較為準(zhǔn)確地預(yù)測(cè)磁盤(pán)尋址的當(dāng)前功率.

      Fig. 15 The model validation of synchronous IO.圖15 同步IO尋址功率預(yù)測(cè)結(jié)果

      4.3額外的負(fù)載

      Fig. 16 Performance impact on random access.圖16 隨機(jī)訪問(wèn)性能劣化

      本模型可以采用在線及離線的方式處理所采集到的數(shù)據(jù),由于采集數(shù)據(jù)的處理可以使用其他的服務(wù)器而對(duì)存儲(chǔ)系統(tǒng)不會(huì)產(chǎn)生額外的計(jì)算負(fù)載,因此我們主要考慮采集工具是否會(huì)對(duì)當(dāng)前的工作負(fù)載產(chǎn)生影響.根據(jù)采集時(shí)間窗口的不同,對(duì)當(dāng)前工作負(fù)載的影響也不相同.我們使用IOmeter工具模擬較為典型的訪問(wèn)負(fù)載:隨機(jī)訪問(wèn)負(fù)載,數(shù)據(jù)塊大小為4KB,50%讀、50%寫(xiě);順序訪問(wèn)負(fù)載,數(shù)據(jù)塊大小為4KB,50%讀、50%寫(xiě).由于隨機(jī)訪問(wèn)對(duì)IOPS的要求較高,因此我們以IOPS作為負(fù)載性能劣化的指標(biāo),而順序讀寫(xiě)我們以數(shù)據(jù)傳輸率為負(fù)載性能劣化的指標(biāo),分別對(duì)時(shí)間窗口1s,10s,30s進(jìn)行性能測(cè)試,每次測(cè)試時(shí)間為30min.測(cè)試結(jié)果如圖16、圖17所示:

      Fig. 17 Performance impact on sequence access.圖17 順序訪問(wèn)性能劣化

      從圖16可以看出對(duì)于隨機(jī)訪問(wèn)來(lái)說(shuō),使用iostate采集所需參數(shù)所帶來(lái)的額外負(fù)載隨著時(shí)間間隔的增加而不斷減少,并且以1s為時(shí)間窗口的細(xì)粒度采集模式也幾乎不會(huì)對(duì)隨機(jī)訪問(wèn)產(chǎn)生較大的影響.同樣,從圖17可以看到,采集工具對(duì)順序訪問(wèn)也沒(méi)有帶來(lái)太大的額外負(fù)載.從上述的實(shí)驗(yàn)測(cè)試來(lái)看,建模所需數(shù)據(jù)的采集對(duì)當(dāng)前的工作負(fù)載產(chǎn)生的影響極其微小,在極細(xì)小的采集窗口下(采集間隔1s)也沒(méi)有超過(guò)3%.

      4.4建模方法的通用性

      本文提出了一種使用磁盤(pán)活動(dòng)特征統(tǒng)計(jì)量作為參數(shù)對(duì)磁盤(pán)能耗進(jìn)行建模的方法,該方法以理論及實(shí)驗(yàn)驗(yàn)證的磁盤(pán)活動(dòng)與能耗的相關(guān)關(guān)系為基礎(chǔ),結(jié)合改良的傳統(tǒng)磁頭尋址模型,對(duì)磁盤(pán)的尋址能耗及數(shù)據(jù)傳輸能耗均進(jìn)行了建模.從理論上來(lái)說(shuō),這種建模方法只應(yīng)用了磁盤(pán)活動(dòng)的普適特征,而對(duì)于其他磁盤(pán)能耗的建模應(yīng)該具有通用性.第3節(jié)中的建模只針對(duì)了SeagateST3146855SS磁盤(pán),這里我們限于篇幅,不再描述其他型號(hào)磁盤(pán)繁瑣的建模過(guò)程.直接給出3個(gè)磁盤(pán)的特性能耗模型及其測(cè)試結(jié)果.如表2所示:

      Table 2 Fitting Formulae of Disk Drivers

      我們使用IOmeter對(duì)上述3種磁盤(pán)的模型進(jìn)行驗(yàn)證性測(cè)試,選取較為典型的隨機(jī)負(fù)載,即數(shù)據(jù)塊大小為4KB,50%讀、50%寫(xiě)、全隨機(jī),測(cè)試時(shí)間為10min,其中,D1磁盤(pán)為SeagateST3146855SS,D2磁盤(pán)為WD10EZEX,D3磁盤(pán)為SeagateConstellationES.測(cè)試結(jié)果如圖18所示:

      Fig. 18 Multiple disks experiment.圖18 多磁盤(pán)驗(yàn)證實(shí)驗(yàn)

      從圖18中可以看出,對(duì)于不同類型的3種磁盤(pán),本文出的建模都具有較好的效果,并且與經(jīng)典的細(xì)粒度磁盤(pán)模型dempsey所給出的5%平均誤差相比,精度很接近.因此,本文提出的建模方法具有通用性,并且精確度與細(xì)粒度模型接近,可以達(dá)到目前密集型數(shù)據(jù)訪問(wèn)的要求.

      5結(jié)束語(yǔ)

      本文提出了一種使用磁盤(pán)活動(dòng)特征統(tǒng)計(jì)量作為參數(shù)預(yù)估磁盤(pán)能耗的方法.這種方法通過(guò)統(tǒng)計(jì)量預(yù)測(cè)出磁盤(pán)的細(xì)節(jié)活動(dòng),然后使用等效的運(yùn)動(dòng)學(xué)模型結(jié)合相關(guān)的參數(shù)去預(yù)測(cè)磁盤(pán)在尋址及數(shù)據(jù)傳輸上的功率狀態(tài).這種方法不需要關(guān)注磁盤(pán)的細(xì)節(jié)活動(dòng),也不需要采集磁盤(pán)每一個(gè)IO操作,只需要一段時(shí)間內(nèi)的統(tǒng)計(jì)參數(shù)就可以估算磁盤(pán)的功率.這種無(wú)需密集型采集的方法即適用于在線性能要求較高的數(shù)據(jù)中心功率預(yù)測(cè),也適用于精確的評(píng)估各類節(jié)能算法在負(fù)載狀態(tài)下的真實(shí)節(jié)能效果.實(shí)驗(yàn)結(jié)果表明,該模型在同步及異步IO等多種數(shù)據(jù)訪問(wèn)模式下都具有較好的準(zhǔn)確性.

      參考文獻(xiàn)

      [1]IDC.The2011IDCdigitaluniversestudy[EBOL]. (2011-07-04) [2016-01-15].http:www.emc.comcollateralaboutnewsidc-emc-digital-universe-2011-infographic.pdf

      [2]AcharyaA,UysalM,SaltzJ.Activedisks:Programmingmodel,algorithmsandevaluation[C]Procofthe8thIntConfonArchitecturalSupportforProgrammingLanguagesandOperatingSystems.NewYork:ACM, 1998: 81-91

      [3]HopkinsM.Theonsiteenergygenerationoption[EBOL]. (2004-05-19)[2016-01-15] .http:datacenterjournal.comNewsAriticle.asp?article_id=66

      [4]BianchiniR,RajamonyR.Powerandenergymanagementforserversystems[J].Computer, 2004, 37(11): 68-74

      [5]DimitrijevicZ,RangaswamiR,ChangE,etal.Diskbench:User-leveldiskfeatureextractiontool[J].Computer, 2004, 35(12): 50-61

      [6]MaYan,GongBin,ZouLida.Duplication-basedenergy-efficientschedulingfordependenttasksingridenvironment[J].JournalofComputerResearchandDevelopment, 2013, 50(2): 420-429 (inChinese)(馬艷, 龔斌, 鄒立達(dá). 網(wǎng)格環(huán)境下基于復(fù)制的能耗有效依賴任務(wù)調(diào)度研究[J]. 計(jì)算機(jī)研究與發(fā)展, 2013, 50(2): 420-429)

      [7]ColarelliD,GrunwaldD.Massivearraysofidledisksforstoragearchives[C]Procofthe2002ACMIEEEConfonSupercomputing.Piscataway,NJ:IEEE, 2002

      [8]PinheiroE,BianchiniR.Energyconservationtechniquesfordiskarray-basedservers[C]Procofthe25thIntConfonSupercomputing.NewYork:ACM, 2014: 369-379

      [9]ZedlewskiJ,SobtiS,GargN,etal.Modelinghard-diskpowerconsumption[C]Procofthe2ndUSENIXConfonFileandStorageTechnologies.Berkeley,CA:USENIXAssociation, 2003: 217-230

      [10]PeekD,FlinnJ.Drive-Thru:Fast,accurateevaluationofstoragepowermanagement[C]Procofthe11thUSENIXAnnualTechnicalConf.Berkeley,CA:USENIXAssociation, 2005: 251-264

      [11]ZhuQ,ChenZ,TanL,etal.Hibernator:Helpingdiskarrayssleepthroughthewinter[J].ACMSIGOPSOperatingSystemsReview, 2005, 39(5): 177-190

      [12]ZhuQ,DavidF,DevarajC,etal.Reducingenergyconsumptionofdiskstorageusingpower-awarecachemanagement[C]Procofthe10thIntConfonHigh-PerformanceComputerArchitecture.Piscataway,NJ:IEEE, 2004: 118-129

      [13]ZhuQ,ZhouY.Power-awarestoragecachemanagement[J].IEEETransonComputers, 2005, 54(5): 587-602

      [14]BissonT,BrandtS,LongD.Ahybriddisk-awarespin-downalgorithmwithIOsubsystemsupport[C]Procofthe26thIEEEIntPerformanceComputingandCommunicationsConf.Piscataway,NJ:IEEE, 2007: 236-245

      [15]NarayananD,DonnellyA,RowstronA.Writeoff-loading:Practicalpowermanagementforenterprisestorage[J].ACMTransonStorage, 2008, 4(3): 10-21

      [16]CarreraEV,PinheiroE,BianchiniR.Conservingdiskenergyinnetworkservers[C]Procofthe17thAnnualIntConfonSupercomputing.NewYork:ACM, 2003: 86-97

      [17]PinheiroE,BianchiniR,DubnickiC.Exploitingredundancytoconserveenergyinstoragesystems[C]ProcofACMSIGMETRICSPerformanceEvaluationReview.NewYork:ACM, 2006, 34(1): 15-26

      [18]StoessJ,LangC,BellosaF.Energymanagementforhypervisor-basedvirtualmachines[C]Procofthe13thUSENIXAnnualTechnicalConf.Berkeley,CA:USENIXAssociation, 2007: 1-14

      [19]AllaloufM,ArbitmanY,FactorM,etal.Storagemodelingforpowerestimation[C]ProcoftheIsraeliExperimentalSystemsConf.NewYork:ACM, 2009: 3

      [20]YanJ,LonappanCK,VajidA,etal.Accurateandlow-overheadprocess-levelenergyestimationformodernharddiskdrives[C]ProcofIEEEGreenCom’13.Piscataway,NJ:IEEE, 2013: 171-178

      [21]WeddleC,OldhamM,QianJ,etal.PARAID:Agear-shiftingpower-awareRAID[J].ACMTransonStorage, 2007, 3(3): 13-24

      [22]ZhangJu,XiaoYuxin,JingNing,etal.OptimizedtheextractionofdiskcharacteristicsfortheIOschedulers[J].JournalofNationalUniversityofDefenseTechnology, 2003, 4(6): 15-26 (inChinese)(張巨, 肖予欽, 景寧, 等. 面向IO優(yōu)化調(diào)度器的磁盤(pán)特征提取[J]. 國(guó)防科技大學(xué)學(xué)報(bào), 2003, 4(6): 15-26)

      [23]ChuX,OuyangK,ChangX.FAXtrac:Fastextractionofdisklayout[C]Procofthe4thIEEEIntConfonNetworking,ArchitectureandStorage.Piscataway,NJ:IEEE, 2009: 309-314

      SunJian,bornin1982.PhDcandidate.Hismainresearchinterestsincludecloudstorageandgreenstorage.

      LiZhanhuai,bornin1961.ProfessorandPhDsupervisor.Hismainresearchinterestsincludedatabasetheoryandtechnologyandmassivedatastorage.

      ZhangXiao,bornin1978.PhDandassociateprofessor.Hismainresearchinterestsincludegreenstorageandmassivedatastorage.

      WangHuifeng,bornin1986.PhDcandidateinNorthwesternPolytechnicalUniversity.Hisresearchinterestsincludecloudcomputing,datasecurityandmassivedatastorage.

      ZhaoXiaonan,bornin1979.PhDandlecturer.Hermainresearchinterestsincludehierarchicalstorageandcloudstorage.

      收稿日期:2016-03-09;修回日期:2016-05-16

      基金項(xiàng)目:國(guó)家“八六三”高技術(shù)研究發(fā)展計(jì)劃基金項(xiàng)目(2013AA01A215);國(guó)家自然科學(xué)基金項(xiàng)目(61472323,61502392);中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金項(xiàng)目(3102015JSJ0009);華為創(chuàng)新基金項(xiàng)目(YB2014040023)

      通信作者:張曉(zhangxiao@nwpu.edu.cn)

      中圖法分類號(hào)TP333

      A Statistic-Based Method for Hard-Disk Power Consumption in Storage System

      Sun Jian, Li Zhanhuai, Zhang Xiao, Wang Huifeng, and Zhao Xiaonan

      (SchoolofComputerScienceandEngineering,NorthwesternPolytechnicalUniversity,Xi’an710129)

      AbstractDue to the rapid development of big data in the data center, power consumption of storage system is a major issue in today’s datacenters. How to reduce the power consumption of storage systems has become an urgent issue and a hot research topic in the field of computer science. As the hard disk drive is the primary storage medium in today’s storage systems, modeling hard-disk power consumption is attracting more attention in the current state of research. The accurate power consumption model of disk can not only solve the problem of power matching in data center devices, but also estimate the accuracy of energy-efficient solutions. We develop a statistic-based hard-disk power modeling method that estimates the power consumption of storage workloads. The model makes up the weakness of traditional fine-grained model and it is more accurate than the coarse-grained model. In practical applications, it does not need to record the disk internal activities, and does not need to trace complex parameter. Our power estimation results are highly accurate, which means error of 3% and the model is applicable to the synchronous IO and asynchronous IO. Moreover, our model can also be applied to various online storage systems and data center.

      Key wordsstorage system; energy conservation; modeling; hard-disk; power management

      This work was supported by the National High Technology Research and Development Program of China (863 Program) (2013AA01A215), the National Natural Science Foundation of China (61472323, 61502392), the Fundamental Research Funds for the Central Universities (3102015JSJ0009), the Huawei Innovation Research Program (YB2014040023).

      猜你喜歡
      存儲(chǔ)系統(tǒng)磁盤(pán)能耗
      120t轉(zhuǎn)爐降低工序能耗生產(chǎn)實(shí)踐
      昆鋼科技(2022年2期)2022-07-08 06:36:14
      能耗雙控下,漲價(jià)潮再度來(lái)襲!
      探討如何設(shè)計(jì)零能耗住宅
      分布式存儲(chǔ)系統(tǒng)在企業(yè)檔案管理中的應(yīng)用
      哈爾濱軸承(2020年2期)2020-11-06 09:22:36
      解決Windows磁盤(pán)簽名沖突
      天河超算存儲(chǔ)系統(tǒng)在美創(chuàng)佳績(jī)
      日本先進(jìn)的“零能耗住宅”
      修改磁盤(pán)屬性
      磁盤(pán)組群組及iSCSI Target設(shè)置
      創(chuàng)建VSAN群集
      武威市| 西丰县| 格尔木市| 龙山县| 通榆县| 昌邑市| 秭归县| 新津县| 和田市| 开封县| 八宿县| 满城县| 阳西县| 安图县| 扎鲁特旗| 德清县| 榆树市| 金昌市| 合山市| 齐河县| 三门峡市| 明水县| 凤山市| 稻城县| 隆安县| 昌宁县| 大同市| 乌鲁木齐市| 东平县| 罗山县| 石河子市| 应城市| 饶河县| 清流县| 衡阳县| 大石桥市| 新余市| 交口县| 克山县| 中阳县| 中西区|