• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于申威1621函數(shù)庫(kù)的斷流水指令替換方法①

    2021-08-02 11:08:46凡,王
    關(guān)鍵詞:函數(shù)庫(kù)浮點(diǎn)數(shù)浮點(diǎn)

    吳 凡,王 磊

    1(中原工學(xué)院 計(jì)算機(jī)學(xué)院,鄭州 450007)

    2(中原工學(xué)院 前沿信息技術(shù)研究院,鄭州 450007)

    高性能計(jì)算機(jī)是國(guó)家綜合國(guó)力的重要體現(xiàn),對(duì)現(xiàn)代社會(huì)的科學(xué)研究、社會(huì)服務(wù)、經(jīng)濟(jì)活動(dòng)而言,已成為不可或缺的戰(zhàn)略工具,全球眾多國(guó)家都極為重視高性能計(jì)算能力的建設(shè)與發(fā)展[1].基礎(chǔ)數(shù)學(xué)函數(shù)庫(kù)[2]作為處理器配套軟件的重要組成部分,是高性能計(jì)算機(jī)平臺(tái)上各領(lǐng)域應(yīng)用軟件開發(fā)必需的最基礎(chǔ)、最核心的軟件之一.而基礎(chǔ)數(shù)學(xué)庫(kù)的實(shí)現(xiàn)與硬件平臺(tái)密切相關(guān),Intel、AMD 等主流CPU 廠商都推出了與其平臺(tái)相對(duì)應(yīng)數(shù)學(xué)庫(kù)軟件.隨著高性能計(jì)算需求的日益增大,越來越多的應(yīng)用開始部署在以申威處理器為代表的國(guó)產(chǎn)高性能計(jì)算平臺(tái)上[3].申威1621 處理器是一款具有我國(guó)自主知識(shí)產(chǎn)權(quán)的高性能處理器,針對(duì)該處理器,目前已經(jīng)推出了與之對(duì)應(yīng)的國(guó)產(chǎn)數(shù)學(xué)庫(kù)軟件,并且做了相對(duì)應(yīng)的優(yōu)化,達(dá)到了工程的需求,其性能較之GNU的glibc 數(shù)學(xué)庫(kù)也有較大的優(yōu)勢(shì).

    從算法優(yōu)化角度,文獻(xiàn)[4]在分析現(xiàn)有算法的基礎(chǔ)上,提出初等函數(shù)算法設(shè)計(jì)原則和兩種算法設(shè)計(jì)模式,使得主核函數(shù)的性能平均提高52.4%,從核函數(shù)的性能平均提高75.3%,并且精度與GNU 總體保持一致.文獻(xiàn)[5]針對(duì)超越函數(shù)的實(shí)現(xiàn)繁瑣易錯(cuò)、應(yīng)用精度需求各異等問題,提出并實(shí)現(xiàn)兼顧通用性和函數(shù)數(shù)學(xué)特性的可變精度超越函數(shù)算法.該算法不僅能夠生成常見超越函數(shù)的不同精度版本的函數(shù)代碼,且相對(duì)標(biāo)準(zhǔn)數(shù)學(xué)庫(kù)超越函數(shù)具有性能優(yōu)勢(shì).

    從訪存優(yōu)化角度,文獻(xiàn)[6]為有效解決超越函數(shù)查表與多項(xiàng)式結(jié)合算法的“存儲(chǔ)墻”問題,提出基于數(shù)據(jù)表精簡(jiǎn)算法的超越函數(shù)訪存優(yōu)化方法,使得函數(shù)性能平均提升55.06%.文獻(xiàn)[7]提出了一種基于訪存指令的調(diào)度策略,即將訪存延遲有效地隱藏于計(jì)算延遲中,平均提高函數(shù)性能16.08%.文獻(xiàn)[8]提出一種基于多級(jí)分層策略的寄存器分配策略,合理地使用寄存器資源,減少寄存器分配過程中產(chǎn)生的溢出,將數(shù)學(xué)庫(kù)中的函數(shù)性能提高6%以上.文獻(xiàn)[9]針對(duì)基礎(chǔ)數(shù)學(xué)庫(kù)中的寄存器分配特點(diǎn),利用最常用情況執(zhí)行時(shí)間(Most-Case Execution Time,MCET)模型對(duì)經(jīng)典的線性掃描寄存器分配算法進(jìn)行了擴(kuò)展,將變量溢出過程分配到非常用路徑上,從而減少全局的寄存器溢出開銷,提高數(shù)學(xué)庫(kù)的性能.

    從SIMD 向量化角度,文獻(xiàn)[10]結(jié)合三角函數(shù)、反三角函數(shù)、指數(shù)函數(shù)和對(duì)數(shù)函數(shù)研究出一種高效向量化算法,并在申威26010 處理器上完成擴(kuò)展函數(shù)庫(kù)實(shí)現(xiàn),在性能上與Intel VML 數(shù)學(xué)庫(kù)相比,各函數(shù)的平均加速比均達(dá)到1.1 以上.文獻(xiàn)[11]針對(duì)SIMD 指令缺少和部分指令性能較低的問題,提出了一種基于SIMD擴(kuò)展指令的等價(jià)替換方法,使得函數(shù)庫(kù)性能提升13%左右.文獻(xiàn)[12]針對(duì)多數(shù)函數(shù)代碼分支多和SIMD 指令不完備的問題,提出了向量數(shù)學(xué)庫(kù)的向量化方法,通過確定核心代碼段、數(shù)據(jù)預(yù)處理過程向量化及指令向量化3個(gè)步驟,使exp,pow,log10 等典型函數(shù)的性能平均提高了24.2%.文獻(xiàn)[13]提出一種SIMD 對(duì)齊的優(yōu)化方法,并采用一套系統(tǒng)的方法來處理絕對(duì)地址和相對(duì)地址訪存方案,與數(shù)學(xué)函數(shù)的非對(duì)齊存儲(chǔ)器訪問方案相比,提升函數(shù)性能22.3%.文獻(xiàn)[14]提出一種向量寄存器部分?jǐn)?shù)據(jù)重用的方法,利用向量寄存器的部分元素來減少寄存器壓力、冗余計(jì)算和內(nèi)存訪問,與打包解包方法相比,該方法使得函數(shù)性能平均加速14.19%.

    文獻(xiàn)[15]從基本塊向量化、指令替換、訪存、指令流水線等多個(gè)方面展開優(yōu)化,在保證數(shù)學(xué)庫(kù)精度的同時(shí),有效提高了函數(shù)的性能.

    以上文獻(xiàn)提出的優(yōu)化方法都對(duì)基礎(chǔ)數(shù)學(xué)函數(shù)庫(kù)性能有一定的提升,但是還沒有文獻(xiàn)針對(duì)rfpcr和wfpcr指令作出優(yōu)化處理.在現(xiàn)版本基礎(chǔ)函數(shù)庫(kù)的實(shí)現(xiàn)中,tan、cot、remainder、fmodf、lround、modf、remquof、trunc 等函數(shù)都使用了rfpcr 指令和wfpcr 指令,該指令會(huì)導(dǎo)致流水線中斷,嚴(yán)重降低了函數(shù)庫(kù)的性能.因此本文在分析每個(gè)函數(shù)功能和指令特性后提出指令段功能等效替換方法,提升函數(shù)性能.

    本文第1 節(jié)詳細(xì)介紹指令替換方法;第2 節(jié)給出實(shí)驗(yàn)結(jié)果及分析;最后對(duì)全文進(jìn)行總結(jié).

    1 指令段替換方法

    在流水線技術(shù)中,指令之間的相關(guān)性會(huì)在流水線中引起沖突,沖突會(huì)導(dǎo)致流水線阻塞,而流水線阻塞會(huì)降低流水線的效率[16].除了指令之間的相關(guān)性會(huì)導(dǎo)致流水線的阻塞,還有一些特殊的指令由于指令的功能需求,會(huì)直接阻斷流水線,比如rfpcr和wfpcr 指令.浮點(diǎn)控制寄存器(Floating-Point Control Register,FPCR)是浮點(diǎn)運(yùn)算控制和狀態(tài)寄存器,其內(nèi)容用于控制浮點(diǎn)運(yùn)算的舍入方式、異常屏蔽等,并記錄浮點(diǎn)運(yùn)算的異常狀態(tài).rfpcr 指令的功能是讀浮點(diǎn)控制寄存器的值,wfpcr 指令向浮點(diǎn)控制寄存器寫入新值.

    當(dāng)譯碼器識(shí)別出rfpcr 指令時(shí),為保證rfpcr 指令獲得浮點(diǎn)控制寄存器的最新內(nèi)容,rfpcr 指令進(jìn)入浮點(diǎn)指令隊(duì)列發(fā)射的條件之一是前面的所有指令已執(zhí)行完畢并退出流水.

    當(dāng)譯碼器識(shí)別出wfpcr 指令時(shí),為保證wfpcr 指令修改FPCR 寄存器后能影響后繼的浮點(diǎn)指令,在指令流水線的發(fā)射站臺(tái)設(shè)置一位CSR 記分板,wfpcr 指令從指令隊(duì)列發(fā)射的條件之一是該記分板位已被清除,該指令發(fā)射時(shí),設(shè)置該記分板位為“1”,禁止發(fā)射隊(duì)列發(fā)射后繼的指令,直到wfpcr 指令完成并退出后,清除該記分板位.

    在申威基礎(chǔ)數(shù)學(xué)庫(kù)的實(shí)現(xiàn)中,rfpcr和wfpcr 會(huì)與移位、加減計(jì)算等指令組成一個(gè)指令段,指令段的主要功能是使得計(jì)算指令在向零舍入模式下執(zhí)行.圖1是指令段偽代碼.

    圖1 指令段偽代碼

    在申威1621 處理器中,默認(rèn)的舍入模式是就近舍入.為了實(shí)現(xiàn)在向零舍入模式下執(zhí)行計(jì)算指令,需要在計(jì)算前用wfpcr 指令將舍入模式修改為向零舍入,即向FPCR 寄存器中寫入新值,該值的舍入模式控制位為向零舍入,計(jì)算完成后再用wfpcr 指令將舍入模式還原.

    在有需要實(shí)現(xiàn)上述指令段功能的函數(shù)中,計(jì)算指令有3 種,分別是浮點(diǎn)轉(zhuǎn)整數(shù)指令(fcvtdl)、加法指令(faddd/fadds)和除法指令(fdivd/fdivs).如圖2所示,本文在不改變這些指令段正確性的前提下,使用等效的方法實(shí)現(xiàn)相同的功能.在執(zhí)行完上述3 種計(jì)算指令后,會(huì)得出一個(gè)值并被寫入到寄存器中.所謂功能等效替換方法是指在不使用rfpcr和wfpcr 指令的前提下,結(jié)合每個(gè)計(jì)算指令的功能和特性,使用另外一種方法得出計(jì)算結(jié)果,該結(jié)果與原版基礎(chǔ)數(shù)學(xué)函數(shù)庫(kù)實(shí)現(xiàn)的方法所計(jì)算出的值一致.

    圖2 功能等效替換方法示意圖

    1.1 浮點(diǎn)小數(shù)取整法

    對(duì)于浮點(diǎn)小數(shù)來說,浮點(diǎn)數(shù)的尾數(shù)包含浮點(diǎn)數(shù)的整數(shù)部分和小數(shù)部分,且整數(shù)部分所占的位數(shù)與指數(shù)大小有關(guān).對(duì)于雙精度浮點(diǎn)數(shù),若浮點(diǎn)數(shù)指數(shù)的十進(jìn)制數(shù)值是n,則小數(shù)部分占尾數(shù)的[0,51–n]位,整數(shù)部分占尾數(shù)的[(51–n)+1,51]位.在十進(jìn)制數(shù)中,若將小數(shù)點(diǎn)后面的數(shù)全部變?yōu)?,則小數(shù)就變成了一個(gè)整數(shù).同樣對(duì)于二進(jìn)制數(shù)而言,將小數(shù)點(diǎn)后面的位全部置為0,也就是將雙精度浮點(diǎn)數(shù)的[0,51–n]位置0,則該二進(jìn)制浮點(diǎn)數(shù)就變成了一個(gè)浮點(diǎn)整數(shù),也即實(shí)現(xiàn)浮點(diǎn)小數(shù)取整化.其具體的步驟如下:

    假設(shè)是對(duì)雙精度浮點(diǎn)數(shù)f1 進(jìn)行浮點(diǎn)小數(shù)取整化,

    Step 1.將f1 對(duì)應(yīng)的二進(jìn)制數(shù)傳給t1;生成一個(gè)二進(jìn)制數(shù)t2,其值為0x7FF0000000000000,即52 到63 位為1,其他位為0.

    Step 2.將t1 與t2 進(jìn)行邏輯與運(yùn)算,右移52 位后,減去1023,得到f1 指數(shù)的十進(jìn)制數(shù)值n.

    Step 3.將52 減去n,計(jì)算出浮點(diǎn)數(shù)尾數(shù)的小數(shù)部分占據(jù)的位數(shù).

    Step 4.生成一個(gè)二進(jìn)制數(shù)t3,其值的0 到(52–n)位為0,其他位為1.

    Step 5.將t3 與t1 進(jìn)行邏輯與運(yùn)算,使得浮點(diǎn)數(shù)尾數(shù)中的小數(shù)部分為0;再將t1的值傳給f1.

    圖3是按照上述思路,對(duì)浮點(diǎn)數(shù)f1(浮點(diǎn)數(shù)對(duì)應(yīng)的二進(jìn)制數(shù)每一位用x表示)進(jìn)行浮點(diǎn)小數(shù)取整化的實(shí)現(xiàn)過程.

    圖3 利用移位、邏輯與指令完成浮點(diǎn)小數(shù)取整化的流程圖

    對(duì)應(yīng)的匯編代碼如下:

    fimovd $f1,t1

    ldi t2,2047(zero)

    sll t2,52,t2//對(duì)應(yīng)Step 1

    and t1,t2,t2

    srl t2,52,t2

    ldi t12,1023(zero)

    subl t2,t12,t2//對(duì)應(yīng)Step 2

    ldi t4,52(zero)

    subl t4,t2,t2//對(duì)應(yīng)Step 3

    ldi t3,0(zero)

    ornot zero,t3,t3

    sll t3,t2,t3 //對(duì)應(yīng)Step 4

    and t3,t1,t1

    ifmovd t1,$f1//對(duì)應(yīng)Step 5

    指令說明:fimovd 將雙精度浮點(diǎn)數(shù)從浮點(diǎn)寄存器傳送到整數(shù)寄存器;ldi為立即數(shù)裝載指令;sll為邏輯左移指令;bic 實(shí)現(xiàn)邏輯與非運(yùn)算;and為邏輯與指令;srl為邏輯右移指令;ornot為邏輯或非指令;subl為長(zhǎng)字減指令;ifmovd 將整數(shù)寄存器中長(zhǎng)字整數(shù)按照雙精度浮點(diǎn)傳送到浮點(diǎn)寄存器.

    fcvtdl 指令將雙精度浮點(diǎn)數(shù)轉(zhuǎn)化成長(zhǎng)字,且依據(jù)浮點(diǎn)控制寄存器中的舍入方式控制位來選擇舍入方式.本文在查閱申威1621的指令集手冊(cè)后,發(fā)現(xiàn)在硬件的設(shè)計(jì)上,fcvtdl_z 指令實(shí)現(xiàn)了向“0”舍入模式下,將雙精度浮點(diǎn)數(shù)轉(zhuǎn)換成長(zhǎng)字的功能.所以直接用fcvtdl_z 指令即可實(shí)現(xiàn)rfpcr、wfpcr和fcvtdl 指令段的功能等效替換.

    但是該指令存在一個(gè)問題,若雙精度浮點(diǎn)數(shù)是一個(gè)浮點(diǎn)小數(shù),而不是浮點(diǎn)整數(shù),那么在轉(zhuǎn)換后,FPCR 寄存器的非精確異??刂莆粫?huì)被置1,從而產(chǎn)生一個(gè)非精確異常問題.因此使用浮點(diǎn)小數(shù)取整法,提前將浮點(diǎn)小數(shù)轉(zhuǎn)換為浮點(diǎn)整數(shù),即可解決fcvtdl_z 指令產(chǎn)生的非精確異常問題.

    1.2 終點(diǎn)判斷法

    申威1621 處理器按照IEEE-754 浮點(diǎn)標(biāo)準(zhǔn)[17]設(shè)置了4 種舍入模式,分別是就近舍入、向零舍入、向負(fù)無窮大舍入和向正無窮大舍入,其中就近舍入即0 舍1 入.在十進(jìn)制數(shù)運(yùn)算的四舍五入中,若有效位后面第一位的值小于5,則舍入的結(jié)果與向零舍入的結(jié)果相同;若有效位后面第一位的值大于5,則舍入的結(jié)果會(huì)比向零舍入的結(jié)果大1.0 舍1 入法與其類似.在二進(jìn)制數(shù)運(yùn)算中,有一個(gè)對(duì)階的過程,如果參與計(jì)算的兩個(gè)值階碼不同,就需要將階碼小的值的階碼左移,使其階碼與另一個(gè)階碼較大的數(shù)相同,同時(shí)尾數(shù)需要右移.在尾數(shù)右移時(shí),若被移去的最高數(shù)值位為0,則舍入,此時(shí)舍入的結(jié)果與向零舍入的結(jié)果相同;若被移去的最高數(shù)值位為1,則在尾數(shù)的末位加1,此時(shí)舍入結(jié)果的二進(jìn)制數(shù)值比向零舍入結(jié)果的二進(jìn)制數(shù)值大1.

    終點(diǎn)判斷法是在默認(rèn)舍入模式下,一條運(yùn)算指令執(zhí)行結(jié)束并且計(jì)算結(jié)果寫入寄存器后,根據(jù)不同的計(jì)算指令選擇不同的判斷方法決定計(jì)算結(jié)果.按照四則運(yùn)算指令分類,終點(diǎn)判斷法可以分為和判斷法、差判斷法、乘判斷法和除判斷法.

    下面分別以加法指令faddd/fadds和除法指令fdivd/fdivs 說明終點(diǎn)判斷法.

    1)faddd/fadds 指令

    Faddd/fadds 指令實(shí)現(xiàn)的是浮點(diǎn)數(shù)加的功能,并將相加的結(jié)果舍入到指定的精度,舍入方式根據(jù)浮點(diǎn)控制寄存器中的舍入方式控制位來選擇.其中faddd 指令實(shí)現(xiàn)雙精度浮點(diǎn)數(shù)加,fadds 指令實(shí)現(xiàn)的是單精度浮點(diǎn)數(shù)加.Faddd 指令和fadds 指令的結(jié)果對(duì)本文的替換方法沒有影響,因此本文基于faddd 指令分析替換方法.

    和判斷法依據(jù)被移去的最高數(shù)值位的值決定運(yùn)算的結(jié)果.當(dāng)最高數(shù)值位為0 時(shí),則和不變.當(dāng)最高數(shù)值位為1 時(shí),則將和的二進(jìn)制數(shù)減1.以加法運(yùn)算語句faddd$f1,$f2,$f3為例,其實(shí)現(xiàn)流程如圖4所示.

    圖4 和判斷法實(shí)現(xiàn)流程圖

    2)fdivd/fdivs 指令

    Fdivd/fdivs 指令實(shí)現(xiàn)的是浮點(diǎn)數(shù)除法的功能,商舍入到指定精度,舍入方式根據(jù)浮點(diǎn)控制寄存器中的舍入方式控制位來選擇.其中fdivd 指令實(shí)現(xiàn)雙精度浮點(diǎn)數(shù)除,fdivs 指令實(shí)現(xiàn)的是單精度浮點(diǎn)數(shù)除.Fdivd 指令和fdivs 指令的結(jié)果對(duì)本文的替換方法沒有影響,因此本文基于fdivd 指令分析.

    在十進(jìn)制運(yùn)算的四舍五入中,若是“四舍”,則舍入的結(jié)果比未舍入的結(jié)果小;若是“五入”,則舍入的結(jié)果比未舍入的結(jié)果大.同樣在二進(jìn)制運(yùn)算的0 舍1 入中,若是“0 舍”,則舍入的結(jié)果比未舍入的結(jié)果小;若是“1入”,則舍入的結(jié)果比未舍入的結(jié)果大.

    商判斷法依據(jù)回乘商的方法決定運(yùn)算的結(jié)果.回乘商是指在不進(jìn)行舍入情況下,將商與除數(shù)相乘,得到一個(gè)積.若商是“0 舍”后得出的結(jié)果,則積應(yīng)比除法語句中的被除數(shù)小,此時(shí)商的值不變.若商是“1 入”后得出的結(jié)果,則積應(yīng)比除法語句中的除數(shù)大,此時(shí)商對(duì)應(yīng)的二進(jìn)制值減去1.

    以除法運(yùn)算語句fdivd $f11,$f12,$f13為例,其替換的具體過程如下:

    Step 1.就近舍入下,執(zhí)行除法計(jì)算,得到商.

    Step 2.將商與被除數(shù)相乘得到積,這個(gè)積不做任何舍入操作.

    Step 3.將積與除數(shù)相減,得到一個(gè)差.

    Step 4.判斷差是否小于0.若差小于0,則商值不變.若差大于0,則將商對(duì)應(yīng)二進(jìn)制數(shù)減1.

    圖5中,左圖是采用rfpcr和wfpcr 指令設(shè)置舍入模式方法實(shí)現(xiàn)的指令段,右圖是采用商判斷法實(shí)現(xiàn)的指令段.

    圖5 商判斷法實(shí)現(xiàn)的指令段替換

    指令說明:fmsd為雙精度浮點(diǎn)乘減指令,f13 與f12 相乘再減去f11,最后結(jié)果寫入f0,且只對(duì)最終結(jié)果進(jìn)行舍入;fbgt為浮點(diǎn)數(shù)大于“0”轉(zhuǎn)移指令.

    終點(diǎn)判斷法實(shí)現(xiàn)的是在就近舍入模式下計(jì)算出向零舍入結(jié)果的功能,替換了原版使用rfpcr和wfpcr 指令修改舍入模式的方法,以此提高性能.其中商判斷法是在分析就近舍入和向零舍入的關(guān)系后提出的方法,和判斷法是在分析就近舍入和向零舍入的關(guān)系以及就近舍入的實(shí)現(xiàn)方式后提出的方法.由于申威1621 處理器的舍入模式是按照IEEE-754 浮點(diǎn)標(biāo)準(zhǔn)實(shí)現(xiàn)的,因此終點(diǎn)判斷法不僅可以應(yīng)用于申威1621 處理器,對(duì)于其他滿足IEEE-754 浮點(diǎn)標(biāo)準(zhǔn)的處理器都可適用.同時(shí)該方法主要針對(duì)四則運(yùn)算提出的,本文目前提出了和判斷法和商判斷法,同樣對(duì)于減法運(yùn)算和乘法運(yùn)算也可以應(yīng)用終點(diǎn)判斷法實(shí)現(xiàn)在就近舍入模式下計(jì)算出向零舍入結(jié)果的功能,相對(duì)應(yīng)的方法可以命名為差判斷法與積判斷法.

    2 實(shí)驗(yàn)及結(jié)果分析

    為了驗(yàn)證本文方法的有效性,以申威1621 處理器為實(shí)驗(yàn)平臺(tái).實(shí)驗(yàn)平臺(tái)相關(guān)配置信息如表1所示.

    表1 申威1621 實(shí)驗(yàn)平臺(tái)

    實(shí)驗(yàn)從正確性和性能兩方面進(jìn)行測(cè)試.正確性測(cè)試用Glibc 測(cè)試套件分別對(duì)替換前和替換后的計(jì)算結(jié)果進(jìn)行對(duì)比;由于部分函數(shù)需要替換多種指令,因此性能測(cè)試綜合3 種替換指令計(jì)算對(duì)函數(shù)的整體性能提升.性能提升的計(jì)算公式如下:

    性能提升=(替換前節(jié)拍?替換后節(jié)拍)/替換前節(jié)拍×100%

    2.1 正確性測(cè)試

    本文用glibc 測(cè)試套件作為測(cè)試用例,替換前與替換后的計(jì)算結(jié)果保持一致.測(cè)試結(jié)果表明,替換后與替換前的功能是等效的.

    2.2 性能測(cè)試

    本文性能測(cè)試通過rtc (讀計(jì)時(shí)器TC)指令計(jì)算被測(cè)函數(shù)的運(yùn)行節(jié)拍數(shù)來衡量性能的好壞.為保證性能測(cè)試能夠覆蓋函數(shù)的主要分支,主要采用0~1 區(qū)間內(nèi)均勻分布的隨機(jī)浮點(diǎn)數(shù)作為測(cè)試數(shù)據(jù)集,測(cè)試基礎(chǔ)函數(shù)庫(kù)運(yùn)行兩百次的節(jié)拍數(shù).為了減小偏差較大的測(cè)試數(shù)據(jù)對(duì)性能測(cè)試結(jié)果的影響,采用4D 檢測(cè)法[18]對(duì)函數(shù)運(yùn)行節(jié)拍數(shù)進(jìn)行處理并求算術(shù)平均值.測(cè)試結(jié)果如圖6所示.圖7是每個(gè)函數(shù)的性能提升百分比.

    圖6的測(cè)試結(jié)果表明,本文提出的指令段功能等效替換方法有效地解決了基礎(chǔ)數(shù)學(xué)函數(shù)庫(kù)中因rfpcr和wfpcr 指令導(dǎo)致的斷流水問題,與替換前的函數(shù)性能相比,替換后的每個(gè)函數(shù)性能都有不同程度的提升.

    圖6 替換前后性能對(duì)比

    從圖7的結(jié)果來看,可以將性能提升百分比分為兩種情況:

    圖7 性能提升百分比

    1)lround、remquo和remainder 等函數(shù)性能提升百分比較高.在這些函數(shù)中,同時(shí)應(yīng)用了浮點(diǎn)小數(shù)取整法和終點(diǎn)判斷法,并且remquo和remainde 函數(shù)多次應(yīng)用兩種替換方法,使得性能提升比較明顯.

    2)tan、cot和lgamma 等函數(shù)性能提升百分比較低.這是因?yàn)閠an和cot 函數(shù)只應(yīng)用了終點(diǎn)判斷法中的和判斷法,并且只替換了一次.lgamma 函數(shù)應(yīng)用了一次浮點(diǎn)小數(shù)取整法且多次應(yīng)用了終點(diǎn)判斷法,但是該函數(shù)分支較多,替換指令都處于不同的分支上,因此性能提升較低.

    綜合以上兩種情況的分析,可以得出性能提升效果不同的主要原因有以下幾種:1)部分函數(shù)需要應(yīng)用兩種替換方法,部分函數(shù)只需要應(yīng)用一種替換方法.2)有的函數(shù)需要替換多次,有的函數(shù)只需替換一次;3)有的替換指令分布在熱路徑[19]的分支上,有的替換指令是在函數(shù)較少使用的路徑上.

    3 結(jié)論與展望

    基礎(chǔ)數(shù)學(xué)庫(kù)在科學(xué)計(jì)算中發(fā)揮著舉足輕重的作用,其性能直接影響著科學(xué)計(jì)算程序的執(zhí)行效率.關(guān)于現(xiàn)版本國(guó)產(chǎn)申威基礎(chǔ)函數(shù)庫(kù)因rfpcr、wfpcr 指令和計(jì)算指令組成的指令段導(dǎo)致的流水線中斷問題,本文提出指令段功能等效替換方法.針對(duì)fcvtdl 指令提出了浮點(diǎn)小數(shù)取整化方法,針對(duì)faddd/fadds 指令和fdivd/fdivs指令提出了終點(diǎn)判斷法.實(shí)驗(yàn)結(jié)果表明,本文提出的方法有效的解決了rfprc和wfpcr 指令斷流水問題,使函數(shù)性能平均提升27.83%.下一步將充分利用流水線的硬件特性,深度挖掘流水線的性能優(yōu)勢(shì),對(duì)指令流水線進(jìn)行深入優(yōu)化,進(jìn)一步提高函數(shù)性能.

    猜你喜歡
    函數(shù)庫(kù)浮點(diǎn)數(shù)浮點(diǎn)
    LEO星座增強(qiáng)GNSS PPP模糊度浮點(diǎn)解與固定解性能評(píng)估
    四種Python均勻浮點(diǎn)數(shù)生成方法
    用于優(yōu)化雷達(dá)信號(hào)處理的VSIPL函數(shù)庫(kù)
    基于Python的開源GIS應(yīng)用開發(fā)
    Scratch求最值和平均值
    基于浮點(diǎn)DSP的鐵路FSK信號(hào)檢測(cè)
    基于BB60C的IQ數(shù)據(jù)采集與存儲(chǔ)系統(tǒng)設(shè)計(jì)
    在C語言中雙精度浮點(diǎn)數(shù)線性化相等比較的研究
    非精確浮點(diǎn)數(shù)乘法器設(shè)計(jì)
    基于FPGA的浮點(diǎn)FIR濾波器設(shè)計(jì)
    国产伦精品一区二区三区视频9| av黄色大香蕉| 日韩国内少妇激情av| 男人舔奶头视频| 日本精品一区二区三区蜜桃| 精品欧美国产一区二区三| 亚洲不卡免费看| 亚洲欧美日韩东京热| 国产av在哪里看| 少妇丰满av| 噜噜噜噜噜久久久久久91| 亚洲精品国产av成人精品 | av.在线天堂| 少妇人妻一区二区三区视频| 国产黄色小视频在线观看| 欧美色欧美亚洲另类二区| 国产色爽女视频免费观看| 国产精品一区二区三区四区免费观看 | 欧美zozozo另类| 夜夜夜夜夜久久久久| 少妇的逼水好多| 一区二区三区高清视频在线| 国产一区二区激情短视频| 久久午夜亚洲精品久久| 亚洲久久久久久中文字幕| 淫妇啪啪啪对白视频| 淫秽高清视频在线观看| 黄色欧美视频在线观看| 欧美成人一区二区免费高清观看| 精品午夜福利视频在线观看一区| 久久久色成人| 一个人免费在线观看电影| 偷拍熟女少妇极品色| 国产一区二区亚洲精品在线观看| 中文字幕熟女人妻在线| 欧美性猛交黑人性爽| 亚洲一级一片aⅴ在线观看| 久久久成人免费电影| 日本 av在线| 日韩中字成人| 成人午夜高清在线视频| 欧美高清性xxxxhd video| 久久鲁丝午夜福利片| 亚洲精品一卡2卡三卡4卡5卡| 日日摸夜夜添夜夜添av毛片| 国产一区二区亚洲精品在线观看| 国产亚洲91精品色在线| 十八禁网站免费在线| 欧美一区二区国产精品久久精品| 亚洲av熟女| 久久精品国产99精品国产亚洲性色| 人人妻人人看人人澡| ponron亚洲| 九色成人免费人妻av| 老司机影院成人| 国产成人a区在线观看| 插逼视频在线观看| 亚洲国产欧美人成| 成人鲁丝片一二三区免费| 中国美白少妇内射xxxbb| 欧美日本亚洲视频在线播放| 亚洲欧美日韩卡通动漫| av黄色大香蕉| 亚洲中文字幕一区二区三区有码在线看| 亚洲av.av天堂| 日韩高清综合在线| 国产精品一区二区免费欧美| 日韩av不卡免费在线播放| 亚洲精品粉嫩美女一区| 欧美xxxx性猛交bbbb| 麻豆一二三区av精品| 在线观看av片永久免费下载| 中文字幕熟女人妻在线| 欧美另类亚洲清纯唯美| 国产精品1区2区在线观看.| 久久久成人免费电影| 最后的刺客免费高清国语| 级片在线观看| 日韩欧美 国产精品| 长腿黑丝高跟| 日韩 亚洲 欧美在线| 成人精品一区二区免费| 午夜福利在线在线| 免费人成视频x8x8入口观看| 观看免费一级毛片| 国内少妇人妻偷人精品xxx网站| 久久精品综合一区二区三区| 蜜桃亚洲精品一区二区三区| 变态另类成人亚洲欧美熟女| 美女黄网站色视频| 午夜爱爱视频在线播放| 免费看光身美女| 3wmmmm亚洲av在线观看| 日本一二三区视频观看| 成人欧美大片| 亚洲国产精品sss在线观看| 两个人视频免费观看高清| 亚洲av电影不卡..在线观看| 中文亚洲av片在线观看爽| 国产精品国产三级国产av玫瑰| 久久久色成人| 国产精品99久久久久久久久| 搡老岳熟女国产| 国产成人a∨麻豆精品| 国内久久婷婷六月综合欲色啪| 欧美日韩综合久久久久久| 99久久精品热视频| 简卡轻食公司| 两性午夜刺激爽爽歪歪视频在线观看| 丰满的人妻完整版| 国产黄色视频一区二区在线观看 | 成年女人毛片免费观看观看9| 国产精品乱码一区二三区的特点| 婷婷六月久久综合丁香| 简卡轻食公司| 黄色一级大片看看| 久久人人爽人人爽人人片va| 亚洲一区高清亚洲精品| 婷婷精品国产亚洲av| 国产精品免费一区二区三区在线| 久久人人爽人人片av| 色5月婷婷丁香| 精华霜和精华液先用哪个| 嫩草影院入口| 观看免费一级毛片| 亚洲乱码一区二区免费版| 日本爱情动作片www.在线观看 | 十八禁网站免费在线| 在线免费观看不下载黄p国产| 国产免费男女视频| 国产精品免费一区二区三区在线| 99热这里只有是精品在线观看| 内射极品少妇av片p| 午夜a级毛片| 国产成人影院久久av| 联通29元200g的流量卡| 欧美日本亚洲视频在线播放| 亚洲五月天丁香| 国产久久久一区二区三区| 国产伦一二天堂av在线观看| 亚洲av中文av极速乱| 久久久久久久午夜电影| 精品一区二区三区视频在线| 丝袜喷水一区| 久久久午夜欧美精品| 亚洲av第一区精品v没综合| 欧洲精品卡2卡3卡4卡5卡区| 中文字幕av成人在线电影| 国产黄色小视频在线观看| 国产精品永久免费网站| 91午夜精品亚洲一区二区三区| 我要搜黄色片| 亚洲三级黄色毛片| avwww免费| 高清毛片免费观看视频网站| 中文资源天堂在线| 99热只有精品国产| 欧美丝袜亚洲另类| 国产亚洲精品久久久久久毛片| 九色成人免费人妻av| 搡老熟女国产l中国老女人| av中文乱码字幕在线| 欧美激情在线99| 观看免费一级毛片| 97人妻精品一区二区三区麻豆| 嫩草影院入口| 中文资源天堂在线| 深夜精品福利| 蜜桃亚洲精品一区二区三区| 麻豆久久精品国产亚洲av| 免费看美女性在线毛片视频| 久久久精品大字幕| 无遮挡黄片免费观看| 美女内射精品一级片tv| 亚洲精华国产精华液的使用体验 | 天天躁日日操中文字幕| 在线国产一区二区在线| 日日撸夜夜添| 99热全是精品| 成人特级黄色片久久久久久久| 国产精品爽爽va在线观看网站| 中文字幕免费在线视频6| 国产一级毛片七仙女欲春2| 亚洲精品国产成人久久av| 欧美成人免费av一区二区三区| 国产午夜福利久久久久久| 欧美性感艳星| 亚洲欧美日韩高清在线视频| 久久精品久久久久久噜噜老黄 | 国产成人a∨麻豆精品| 国产探花在线观看一区二区| 91av网一区二区| 一级毛片我不卡| 真人做人爱边吃奶动态| 久久精品国产自在天天线| 国内精品宾馆在线| 伦理电影大哥的女人| 天堂√8在线中文| 欧美丝袜亚洲另类| 国产高清视频在线播放一区| 久久久久国内视频| 日韩,欧美,国产一区二区三区 | 日韩欧美一区二区三区在线观看| 国产黄色视频一区二区在线观看 | 欧美激情国产日韩精品一区| 亚洲熟妇熟女久久| 成人亚洲精品av一区二区| 身体一侧抽搐| 久久6这里有精品| 人妻丰满熟妇av一区二区三区| 搡老岳熟女国产| 精品一区二区三区视频在线| 又黄又爽又免费观看的视频| 美女黄网站色视频| 亚洲美女搞黄在线观看 | 中文字幕免费在线视频6| 久久久久久九九精品二区国产| 欧美zozozo另类| 亚洲丝袜综合中文字幕| 久久中文看片网| 成年免费大片在线观看| 欧美一区二区精品小视频在线| av在线播放精品| 中文字幕久久专区| 日本 av在线| 中文字幕精品亚洲无线码一区| h日本视频在线播放| 精品久久国产蜜桃| 99热这里只有是精品50| 精品国产三级普通话版| 热99re8久久精品国产| 亚洲精品一卡2卡三卡4卡5卡| 狂野欧美激情性xxxx在线观看| 国产aⅴ精品一区二区三区波| 色在线成人网| 亚洲成人久久爱视频| 看十八女毛片水多多多| 男女之事视频高清在线观看| 天堂av国产一区二区熟女人妻| 最新中文字幕久久久久| 成人二区视频| 亚洲精品一区av在线观看| 性色avwww在线观看| 在线播放无遮挡| 精品乱码久久久久久99久播| 国产91av在线免费观看| 亚洲精品日韩av片在线观看| 国产美女午夜福利| 免费在线观看影片大全网站| 久久久久国内视频| 国语自产精品视频在线第100页| 欧美一区二区国产精品久久精品| 啦啦啦观看免费观看视频高清| 在线观看一区二区三区| 51国产日韩欧美| 亚洲中文字幕日韩| av卡一久久| 免费av观看视频| 香蕉av资源在线| 成人二区视频| 国产三级在线视频| 狂野欧美白嫩少妇大欣赏| 中文亚洲av片在线观看爽| 69人妻影院| 少妇的逼水好多| 日韩欧美三级三区| 色尼玛亚洲综合影院| 久久人人精品亚洲av| 精品一区二区三区视频在线| 精品一区二区三区视频在线观看免费| 性插视频无遮挡在线免费观看| 亚洲成av人片在线播放无| 国产一区亚洲一区在线观看| 久久久久久久久久久丰满| 人妻夜夜爽99麻豆av| 激情 狠狠 欧美| 一区福利在线观看| 国产一区二区在线av高清观看| aaaaa片日本免费| 亚洲性久久影院| 18禁黄网站禁片免费观看直播| 亚洲aⅴ乱码一区二区在线播放| 欧美极品一区二区三区四区| 欧美绝顶高潮抽搐喷水| 免费看a级黄色片| 成人午夜高清在线视频| 秋霞在线观看毛片| 一个人看视频在线观看www免费| 日韩一本色道免费dvd| 99热只有精品国产| 狂野欧美白嫩少妇大欣赏| 亚洲中文日韩欧美视频| 久久久久免费精品人妻一区二区| 国产伦精品一区二区三区视频9| 日本熟妇午夜| 亚洲美女黄片视频| 亚洲av免费高清在线观看| 国产成人freesex在线 | av女优亚洲男人天堂| 精品久久久噜噜| 国产真实伦视频高清在线观看| 亚洲va在线va天堂va国产| 久久人妻av系列| 亚洲自拍偷在线| 久久天躁狠狠躁夜夜2o2o| 亚洲精华国产精华液的使用体验 | 最近视频中文字幕2019在线8| 国产精品伦人一区二区| 99视频精品全部免费 在线| 精品久久国产蜜桃| 亚洲婷婷狠狠爱综合网| 91在线观看av| 亚洲欧美成人综合另类久久久 | avwww免费| 在线看三级毛片| 欧美三级亚洲精品| 两个人视频免费观看高清| 真人做人爱边吃奶动态| 3wmmmm亚洲av在线观看| 精品久久久久久久末码| 熟妇人妻久久中文字幕3abv| 成人国产麻豆网| 少妇人妻精品综合一区二区 | 日韩一区二区视频免费看| 天天躁夜夜躁狠狠久久av| 亚洲婷婷狠狠爱综合网| 91狼人影院| 97碰自拍视频| 亚洲七黄色美女视频| 中文字幕久久专区| 色综合亚洲欧美另类图片| 色视频www国产| 欧美最新免费一区二区三区| 搡女人真爽免费视频火全软件 | 秋霞在线观看毛片| 伦理电影大哥的女人| 国产不卡一卡二| 日本欧美国产在线视频| 大又大粗又爽又黄少妇毛片口| 此物有八面人人有两片| 国产精品日韩av在线免费观看| 在线免费十八禁| 免费一级毛片在线播放高清视频| 变态另类成人亚洲欧美熟女| 久久人人爽人人爽人人片va| 午夜爱爱视频在线播放| 尾随美女入室| 国产精品日韩av在线免费观看| 一级毛片aaaaaa免费看小| 97超视频在线观看视频| 国产aⅴ精品一区二区三区波| 精品一区二区免费观看| 最近最新中文字幕大全电影3| 男女做爰动态图高潮gif福利片| 中文字幕免费在线视频6| 日韩中字成人| 日本在线视频免费播放| 日日撸夜夜添| 久久久精品大字幕| 免费高清视频大片| 国产激情偷乱视频一区二区| 久久精品综合一区二区三区| 亚洲欧美成人精品一区二区| 超碰av人人做人人爽久久| 亚洲欧美成人精品一区二区| 免费观看人在逋| 亚洲,欧美,日韩| 99九九线精品视频在线观看视频| 欧美日本视频| 一夜夜www| 久久精品国产亚洲av涩爱 | 亚洲av电影不卡..在线观看| 草草在线视频免费看| 极品教师在线视频| 精品人妻偷拍中文字幕| 国产高清视频在线观看网站| 22中文网久久字幕| 日韩强制内射视频| 国产精品久久久久久久久免| 成人特级黄色片久久久久久久| 免费看美女性在线毛片视频| 人妻丰满熟妇av一区二区三区| 麻豆国产av国片精品| 精品一区二区三区av网在线观看| 午夜影院日韩av| 亚洲最大成人手机在线| 国产成人freesex在线 | 午夜激情欧美在线| 在线播放无遮挡| 少妇被粗大猛烈的视频| 亚洲欧美日韩卡通动漫| 真实男女啪啪啪动态图| 国产三级中文精品| 午夜亚洲福利在线播放| 一卡2卡三卡四卡精品乱码亚洲| 免费av不卡在线播放| 丰满的人妻完整版| 亚洲av免费高清在线观看| 国产精品野战在线观看| 菩萨蛮人人尽说江南好唐韦庄 | 亚洲色图av天堂| 亚洲精品国产成人久久av| 午夜激情福利司机影院| 欧美区成人在线视频| 欧美性猛交╳xxx乱大交人| 如何舔出高潮| av在线蜜桃| 狠狠狠狠99中文字幕| 日日摸夜夜添夜夜添av毛片| 精品午夜福利在线看| 日韩亚洲欧美综合| av视频在线观看入口| 久久午夜福利片| 可以在线观看毛片的网站| 日韩中字成人| 麻豆成人午夜福利视频| 免费一级毛片在线播放高清视频| 天堂网av新在线| 国产一区二区在线观看日韩| 国产片特级美女逼逼视频| 午夜日韩欧美国产| 少妇丰满av| 一进一出抽搐动态| 成年版毛片免费区| 91久久精品国产一区二区三区| 国产乱人偷精品视频| 男人舔奶头视频| 春色校园在线视频观看| 91在线观看av| 女生性感内裤真人,穿戴方法视频| 国产综合懂色| 深夜a级毛片| 日韩高清综合在线| 一区二区三区高清视频在线| 久久精品国产亚洲网站| 亚洲国产精品sss在线观看| 亚洲人成网站在线播| av免费在线看不卡| 真人做人爱边吃奶动态| 69人妻影院| 一级黄色大片毛片| 1024手机看黄色片| 亚洲精品日韩在线中文字幕 | 精品99又大又爽又粗少妇毛片| 99热网站在线观看| 精品久久久久久久久久免费视频| 日韩强制内射视频| 老熟妇乱子伦视频在线观看| 午夜精品在线福利| 国产精品久久久久久亚洲av鲁大| 欧美极品一区二区三区四区| 国产精品人妻久久久影院| 成人精品一区二区免费| 亚洲欧美日韩卡通动漫| 久久人人爽人人爽人人片va| 日日摸夜夜添夜夜添小说| 偷拍熟女少妇极品色| 免费无遮挡裸体视频| 国产精华一区二区三区| 婷婷精品国产亚洲av在线| 精品日产1卡2卡| 免费电影在线观看免费观看| 一级毛片aaaaaa免费看小| 欧美一区二区亚洲| 在线天堂最新版资源| 亚洲欧美一区二区三区国产| 少妇被粗大猛烈的视频| 日本91视频免费播放| 国国产精品蜜臀av免费| 人妻制服诱惑在线中文字幕| av不卡在线播放| 最新的欧美精品一区二区| 久久久久久久国产电影| 十分钟在线观看高清视频www | 亚洲一级一片aⅴ在线观看| 国产欧美日韩精品一区二区| 天堂8中文在线网| 国产白丝娇喘喷水9色精品| 亚洲欧美清纯卡通| 蜜臀久久99精品久久宅男| 特大巨黑吊av在线直播| 亚洲国产欧美在线一区| 欧美+日韩+精品| 丰满少妇做爰视频| 日韩av不卡免费在线播放| 女的被弄到高潮叫床怎么办| 国产精品人妻久久久影院| 中文资源天堂在线| 成人无遮挡网站| 久久免费观看电影| 精品99又大又爽又粗少妇毛片| 亚洲自偷自拍三级| 欧美+日韩+精品| 人妻人人澡人人爽人人| 久久久午夜欧美精品| 久久久久久人妻| 国产亚洲欧美精品永久| 欧美日本中文国产一区发布| 日本欧美国产在线视频| 日本av免费视频播放| 乱码一卡2卡4卡精品| 国产亚洲最大av| 大香蕉久久网| 国产淫片久久久久久久久| 久久国产乱子免费精品| 久久久a久久爽久久v久久| av天堂久久9| 夫妻性生交免费视频一级片| 乱系列少妇在线播放| 国产一区二区在线观看日韩| 大又大粗又爽又黄少妇毛片口| 午夜免费鲁丝| 日本黄大片高清| 男人狂女人下面高潮的视频| 国产一区亚洲一区在线观看| 99国产精品免费福利视频| 美女cb高潮喷水在线观看| 免费人妻精品一区二区三区视频| 乱码一卡2卡4卡精品| 我要看日韩黄色一级片| 美女脱内裤让男人舔精品视频| 秋霞在线观看毛片| 99久久精品热视频| 欧美高清成人免费视频www| 精品国产国语对白av| 日韩av不卡免费在线播放| 自线自在国产av| 国产精品欧美亚洲77777| 女性生殖器流出的白浆| 国产黄色视频一区二区在线观看| 国产精品秋霞免费鲁丝片| 少妇被粗大的猛进出69影院 | 99久久中文字幕三级久久日本| 少妇被粗大的猛进出69影院 | 精品国产一区二区久久| 少妇的逼水好多| 久久午夜福利片| 久久久午夜欧美精品| av黄色大香蕉| 亚洲情色 制服丝袜| 免费观看av网站的网址| 亚洲精品456在线播放app| 777米奇影视久久| 看免费成人av毛片| 国产 精品1| 一区二区av电影网| 蜜桃在线观看..| 亚洲va在线va天堂va国产| 国产黄频视频在线观看| 亚洲av成人精品一区久久| 日韩成人av中文字幕在线观看| 男女免费视频国产| 国产欧美日韩一区二区三区在线 | 亚洲精品第二区| 亚洲av男天堂| 99国产精品免费福利视频| 女性被躁到高潮视频| 哪个播放器可以免费观看大片| 美女中出高潮动态图| 91精品国产国语对白视频| 亚洲精品视频女| videos熟女内射| 综合色丁香网| 91久久精品电影网| 亚洲av在线观看美女高潮| 我要看日韩黄色一级片| 免费观看在线日韩| 美女视频免费永久观看网站| 免费久久久久久久精品成人欧美视频 | 午夜福利视频精品| 婷婷色麻豆天堂久久| 观看免费一级毛片| 啦啦啦中文免费视频观看日本| 国产永久视频网站| 免费看日本二区| 日本vs欧美在线观看视频 | 国产精品偷伦视频观看了| 国产精品免费大片| 日韩一区二区视频免费看| 在线观看美女被高潮喷水网站| av天堂中文字幕网| 在现免费观看毛片| 纵有疾风起免费观看全集完整版| 国产黄色视频一区二区在线观看| 美女主播在线视频| 一个人免费看片子| 一级片'在线观看视频| 在线播放无遮挡| 亚洲成人手机| 国产成人精品无人区| 99久国产av精品国产电影| 日本黄大片高清| 一级黄片播放器| 26uuu在线亚洲综合色| av黄色大香蕉| 日本猛色少妇xxxxx猛交久久| 在线播放无遮挡| 美女福利国产在线| 国产免费福利视频在线观看| 亚洲精品第二区| 久久精品国产自在天天线| 观看免费一级毛片| 97在线视频观看| 十八禁网站网址无遮挡 | 国产一区有黄有色的免费视频| 九色成人免费人妻av| 亚洲久久久国产精品| 王馨瑶露胸无遮挡在线观看| 三级国产精品欧美在线观看| 天堂俺去俺来也www色官网| 少妇人妻 视频| 精品视频人人做人人爽| 嫩草影院新地址| 肉色欧美久久久久久久蜜桃| 一级黄片播放器|