• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于分布式流處理的自適應數(shù)據(jù)分發(fā)策略

    2018-08-15 08:02:30閭程豪荊一楠何震瀛王曉陽1
    計算機應用與軟件 2018年8期
    關鍵詞:鍵值整體節(jié)點

    閭程豪 荊一楠 何震瀛 王曉陽1,

    1(復旦大學軟件學院 上海 201203)2(復旦大學計算機科學技術學院 上海 201203)3(上海市數(shù)據(jù)科學重點實驗室(復旦大學) 上海 200433)

    0 引 言

    在分布式數(shù)據(jù)流處理中,一個典型的場景就是采用一個固定的數(shù)據(jù)分發(fā)方法將數(shù)據(jù)(根據(jù)其鍵值)發(fā)送到多個工作節(jié)點中。例如,新浪、Twitter等媒體門戶對當下新聞中的熱點詞匯進行實時統(tǒng)計[1],實現(xiàn)基于頻數(shù)統(tǒng)計的在線數(shù)據(jù)挖掘技術[2],或是基于分布式數(shù)據(jù)流進行基于“group by”的實時查詢等。

    在上述場景中,數(shù)據(jù)分發(fā)方法都是以最小化整體處理的延遲時間或者最大化整體處理的吞吐量為目標的。為了實現(xiàn)這個目標,負載均衡和鍵值分離這兩個因素往往被考慮到。一方面,工作節(jié)點之間的負載越均衡,并行處理的效率就越高,整體處理的性能表現(xiàn)就越好。另一方面,為了使負載盡可能地均衡,一些分發(fā)方法將含有相同鍵值的數(shù)據(jù)分發(fā)到不同的節(jié)點上(例如round-robin數(shù)據(jù)分發(fā)方法)從而產(chǎn)生了鍵值分離。鍵值分離往往需要額外的歸并處理,因而產(chǎn)生額外開銷。

    現(xiàn)有工作基于類似上述兩方面的考慮,針對不同特征的數(shù)據(jù)集提出了各種靜態(tài)數(shù)據(jù)分發(fā)方法[6-9]以優(yōu)化處理的整體性能。當這些數(shù)據(jù)分發(fā)方法應用于某些特定數(shù)據(jù)集時,處理延遲時間或吞吐量得以最優(yōu)化。在處理分布特征不同的數(shù)據(jù)集或者數(shù)據(jù)特征不斷變化的數(shù)據(jù)集時,這些靜態(tài)分發(fā)方法顯得力不從心。例如,我們對一周內Wikimedia所有網(wǎng)站的訪問記錄進行分析,發(fā)現(xiàn)每小時被訪問網(wǎng)頁的數(shù)量(標記為K)與每小時內最受歡迎網(wǎng)頁被訪問的次數(shù)占總次數(shù)的比例(標記為p1)都會隨著時間發(fā)生較大變化,如圖1所示。這些值的大小對不同數(shù)據(jù)分發(fā)方法的性能表現(xiàn)有很大影響。此時,任何一種只對某種數(shù)據(jù)特征進行優(yōu)化的分發(fā)方法都無法使得查詢處理的延遲時間一直保持最小。

    圖1 Wikmedia數(shù)據(jù)集上數(shù)據(jù)特征隨著時間的變化

    面對上述挑戰(zhàn),本文策略為:(1) 在基于mini-batch的分布式流處理模型中,提出了一種自適應數(shù)據(jù)分發(fā)策略APS,以應對數(shù)據(jù)特征不斷變化的流數(shù)據(jù)處理任務。(2) 為數(shù)據(jù)分發(fā)方法提供了一種叫做整體分發(fā)評估HPM的估計,HPM綜合考慮了每個mini-batch中的負載均衡和鍵值分離情況,并為APS的調整提供依據(jù)。(3) 采用處理的延遲時間作為整體性能的評判標準,并通過在Spark Streaming[5]上的大量實驗證明了 APS的優(yōu)越性與HPM的準確性。

    1 相關工作

    現(xiàn)有工作中的數(shù)據(jù)分發(fā)方法主要基于最大負載和鍵值分離兩方面的考慮。文獻[6-7]提出MPC模型,通過綜合分析一個目標查詢所需數(shù)據(jù)交換的輪數(shù)和每輪數(shù)據(jù)交換中的最大負載這兩個因素找到最佳的數(shù)據(jù)分發(fā)方法。Nasir等[8-9]和Katsipoulakis等[10]通過權衡數(shù)據(jù)分發(fā)的不平衡程度與鍵值分離產(chǎn)生的額外處理和存儲開銷來確定最優(yōu)的數(shù)據(jù)分發(fā)方法。本節(jié)我們將著重介紹并比較當下最流行和最先進的5種分發(fā)方法。

    1.1 現(xiàn)有分發(fā)方法

    (1) Hash分發(fā)方法 Hash分發(fā)方法(HASH)使用一個哈希函數(shù)為每個鍵值映射一個特定的“編號”,并將數(shù)據(jù)發(fā)送到“編號”對應的工作節(jié)點?!熬幪枴迸c工作節(jié)點一一對應且相同鍵值總是對應相同的“編號”。因此HASH不會產(chǎn)生鍵值分離,但其負載均衡受數(shù)據(jù)集傾斜程度的影響較大。

    (2) Round-robin分發(fā)方法 Round-robin分發(fā)方法(RR)不考慮數(shù)據(jù)的鍵值,將數(shù)據(jù)逐條輪流發(fā)送至每一個工作節(jié)點。RR會產(chǎn)生大量的鍵值分離,但每個節(jié)點上的負載幾乎相同。

    (3) Power of Two Choices分發(fā)方法 Power of Two Choices分發(fā)方法(PoTC)[12]在數(shù)據(jù)分發(fā)過程中,令每個負責數(shù)據(jù)分發(fā)的載入節(jié)點各自記錄已發(fā)送過的鍵值與其對應送往的“編號”。各個載入節(jié)點互相獨立,并分別實時更新并記錄送往每個“編號”對應節(jié)點的負載條數(shù)。對含有新鍵值的數(shù)據(jù),PoTC使用兩個獨立的哈希函數(shù)產(chǎn)生兩個“編號”,將數(shù)據(jù)發(fā)送到當前負載較小的“編號”對應的節(jié)點中,并記錄該“編號”與鍵值的對應關系;對含有舊鍵值的數(shù)據(jù),PoTC通過該鍵值對應的“編號”對其進行分發(fā)。Katsipoulakis等[10]指出,當載入節(jié)點只有一個時,PoTC不僅能避免鍵值分離,還能改善負載均衡。然而,現(xiàn)實的分布式應用中,數(shù)據(jù)的分發(fā)往往由多個獨立的載入節(jié)點共同完成,因此同一個鍵值在不同載入節(jié)點中對應的“編號”不一定相同,鍵值分離隨之產(chǎn)生。

    (4) Partial Key Grouping分發(fā)方法 Partial Key Grouping分發(fā)方法[8](PK)在數(shù)據(jù)分發(fā)過程中,令每個載入節(jié)點實時更新記錄送往不同“編號”對應節(jié)點的負載條數(shù)。對每條剛到達的數(shù)據(jù),PK使用兩個獨立的哈希函數(shù)產(chǎn)生兩個“編號”,將數(shù)據(jù)發(fā)送到當前負載較小的“編號”對應的節(jié)點中。Nasir等[8]指出,當數(shù)據(jù)傾斜程度與工作節(jié)點數(shù)量滿足一定條件時,PK獲得較好的負載均衡且只產(chǎn)生少量鍵值分離。然而當數(shù)據(jù)傾斜過大,PK的負載均衡較差。此外,PK缺乏一定的拓展性。

    (5) D-Choices分發(fā)方法與W-Choices分發(fā)方法 D-Choices分發(fā)方法(DC)和W-Choices分發(fā)方法(WC)是PK的兩種更高級的拓展[9](APK)。分發(fā)過程中,每個載入節(jié)點與PK類似,各自記錄發(fā)往下游工作節(jié)點的負載情況。同時,APK根據(jù)鍵值出現(xiàn)的概率將所有鍵值分為heavy hitter與light key兩類。對含有l(wèi)ight key的數(shù)據(jù),APK使用兩個獨立的哈希函數(shù)產(chǎn)生兩個“編號”,將數(shù)據(jù)發(fā)送到當前負載較小的“編號”對應的節(jié)點中;對含有heavy hitter的數(shù)據(jù),APK為其提供更多“編號”的選擇(DC使用d個獨立哈希函數(shù)產(chǎn)生d個編號,WC則提供所有的編號),并將數(shù)據(jù)發(fā)送到當前負載最小的“編號”對應的節(jié)點中。根據(jù)Nasir等[9]的分析,DC和WC均能獲得最佳的負載均衡且表現(xiàn)接近,同時會產(chǎn)生一定的鍵值分離。當heavy hitter個數(shù)為0時,APK退化成了PK;當每個鍵值都是heavy hitter時(例如只有1個鍵值的情況),APK退化成了RR。為了討論方便,本文選用WC來代表APK。

    1.2 現(xiàn)有分發(fā)方法的比較

    1) HASH不會產(chǎn)生鍵值分離,且負載均衡程度由數(shù)據(jù)分別的特征決定。當數(shù)據(jù)分布較均勻時,一個理想的HASH方法可以獲得最佳的處理表現(xiàn)。

    2) 在常見的含有多個載入節(jié)點的應用中,PoTC與PK都為所有的鍵值提供了兩個選擇,鍵值分離程度類似。而PK在分發(fā)過程中為更多數(shù)據(jù)提供了兩個選擇,因此PK比PoTC有更好的負載均衡和整體表現(xiàn)。

    3) APK通過給heavy hitter更多的分發(fā)選擇,不僅提升了PK的可拓展性,更是以有限的鍵值分離增加為代價,解決了數(shù)據(jù)傾斜程度過大時的負載均衡問題。

    4) APK和RR都能獲得最佳的負載均衡,并分別對heavy hitter和所有鍵值進行全局的分發(fā)。因此APK的鍵值分離程度更少,整體表現(xiàn)性能更佳。

    5) APK歸納或更優(yōu)于RR、PoTC和PK。但由于APK會產(chǎn)生鍵值分離,因此只有當數(shù)據(jù)分布不均勻時,APK會更優(yōu)于HASH獲得最佳表現(xiàn)。

    綜上所述,HASH和APK有機會在不同的數(shù)據(jù)特征中獲得最佳性能表現(xiàn)。因此,本文選用HASH和APK作為參考和比較。

    2 問題歸納

    2.1 基于mini-batch的流數(shù)據(jù)分發(fā)模型

    基于mini-batch的分布式流處理系統(tǒng)是當下最流行的分布式流處理系統(tǒng)之一。以Spark Streaming[5]和Java Flume[11]為例,它們被廣泛應用于實時或準實時的分布式流處理應用中,具有良好的錯誤恢復能力。

    基于上述系統(tǒng)的數(shù)據(jù)分發(fā)模型如圖2所示。模型根據(jù)系統(tǒng)時間將數(shù)據(jù)流劃分為一系列微小批次(mini-batch),并對mini-batch進行串行處理。圖2將第t個批次中的一次數(shù)據(jù)分發(fā)抽象成了一個有向無環(huán)圖。圖中結點“L”代表接收和分發(fā)數(shù)據(jù)的載入節(jié)點,結點“M”代表接收并處理數(shù)據(jù)的map工作節(jié)點,每條有向線段代表數(shù)據(jù)的分發(fā)方向。一次分發(fā)完成后,系統(tǒng)對各個map工作節(jié)點的工作狀態(tài)進行同步,并根據(jù)處理任務的需要決定下一步的操作(繼續(xù)分發(fā)、數(shù)據(jù)歸并或結果輸出等)。當一個mini-batch處理結束后,系統(tǒng)對所有節(jié)點的工作狀態(tài)進行同步。在當前批次的數(shù)據(jù)處理完成且下一個批次的數(shù)據(jù)也收集完成之后,系統(tǒng)開始對下一個批次的數(shù)據(jù)進行處理。

    圖2 基于mini-batch的流數(shù)據(jù)分發(fā)模型

    2.2 整體分發(fā)評估(HPM)

    為了衡量數(shù)據(jù)分發(fā)方法的性能表現(xiàn),本文提供了一種叫作整體分發(fā)評估(HPM)的估計。

    首先給出單個mini-batch中最大負載和鍵值分散度的定義來量化分發(fā)方法在單個mini-batch中的負載均衡程度和鍵值分離程度。接著,結合最大負載與鍵值分散度,本文給出分發(fā)方法在單個mini-batch中的整體分發(fā)評估。

    定義1對于第t個mini-batch的數(shù)據(jù)分發(fā),收到最多數(shù)據(jù)的工作節(jié)點所接收的數(shù)據(jù)條數(shù)為mini-batcht上的最大負載,記作L(t)。

    定義2對于第t個mini-batch的數(shù)據(jù)分發(fā),分發(fā)后每個工作節(jié)點含有鍵值數(shù)量的和減去被分發(fā)數(shù)據(jù)的鍵值數(shù)量為mini-batcht上的鍵值分散度,記作D(t)。

    定義3對于第t個mini-batch的數(shù)據(jù)分發(fā),其最大負載和鍵值分散度的線性組合為mini-batcht上的整體分發(fā)評估,記作HPM(t):

    HPM(t)=L(t)+λ·D(t)

    (1)

    式中:λ為組合系數(shù),用于衡量鍵值分離程度占整體處理開銷的影響比例。例如,進行“union”操作時,鍵值分離并不會影響結果的輸出,因此λ=0;進行“group by”操作時,由于鍵值分離,工作節(jié)點含有的部分結果需要進一步聚合歸并,產(chǎn)生額外的開銷,因此λ>0,且λ與單條數(shù)據(jù)在聚合歸并時的處理時間以及單條數(shù)據(jù)在map工作節(jié)點中的處理時間密切相關。此外,對分離的鍵值進行聚合歸并處理的節(jié)點越少時,對部分結果聚合歸并的操作就慢,λ就越大。

    為了幫助理解,圖3以在mini-batcht中的數(shù)據(jù)分發(fā)為例,解釋了上述概念。圖3中不同顏色的方片代表含有不同鍵值的數(shù)據(jù),根據(jù)定義,mini-batcht的最大負載L(t)=8,鍵值分散度D(t)=2。當進行“union”操作時,λ=0,HPM(t)為8;當進行組合系數(shù)λ=1的“group by”操作時,HPM(t)=8+1×2=10。

    圖3 在mini-batch t上的數(shù)據(jù)分發(fā)

    根據(jù)基于mini-batch的流處理模型的特點,本文給出了數(shù)據(jù)分發(fā)方法整體分發(fā)評估的定義。

    定義4在基于mini-batch的流處理分發(fā)模型中,各個mini-batch上整體分發(fā)評估的累加即為一個數(shù)據(jù)分發(fā)方法的全局整體分發(fā)評估,記作HPM:

    (2)

    2.3 優(yōu)化目標

    綜合上述定義,單個mini-batch中的整體分發(fā)評估值越小,分發(fā)方法在該mini-batch中的表現(xiàn)越好。因此,全局整體分發(fā)評估的值越小,就意味著一個數(shù)據(jù)分發(fā)方法能提供給處理任務更好的整體性能表現(xiàn)。

    因此,本文的優(yōu)化目標為找到一種數(shù)據(jù)分發(fā)方法,使其在對數(shù)據(jù)分布特征不斷變化的數(shù)據(jù)流的分發(fā)中,獲得最小的全局整體分發(fā)評估HPM,從而使分布式流處理任務獲得最小的延遲時間。

    3 自適應數(shù)據(jù)分發(fā)策略(APS)

    3.1 APS介紹與實現(xiàn)

    基于上述優(yōu)化目標,本文提出了一種叫做自適應數(shù)據(jù)分發(fā)策略(APS)的數(shù)據(jù)分發(fā)方法。APS采用了一系列被廣泛使用的靜態(tài)數(shù)據(jù)分發(fā)方法作為候選,根據(jù)對每個mini-batch數(shù)據(jù)分布特征的預測及各個候選方法在該mini-batch上整體分發(fā)評估的估計,調整在每個mini-batch上的數(shù)據(jù)分發(fā)方法。對每個mini-batch的處理中,APS按以下4個步驟進行:

    1) 在開始某個mini-batcht的處理時,每個載入節(jié)點分別獲得對mini-batcht數(shù)據(jù)分布特征的預測。

    2) 每個載入節(jié)點分別遍歷所有的候選分發(fā)方法,根據(jù)mini-batcht的預測數(shù)據(jù)特征,選取HPM(t)估計值最小的數(shù)據(jù)分發(fā)方法。

    3) 每個載入節(jié)點根據(jù)所選的數(shù)據(jù)分發(fā)方法,將當前mini-batcht內的數(shù)據(jù)分發(fā)到map工作節(jié)點進行處理。

    4) 若出現(xiàn)鍵值分離,map工作節(jié)點根據(jù)處理任務的需要,決定對數(shù)據(jù)的下一步的操作(例如聚合歸并)。

    在步驟2)中,每個載入節(jié)點分別獲得相同的數(shù)據(jù)分布特征的預測并且采用相同的HPM估計方法,因此會調整至同一種數(shù)據(jù)分發(fā)方法。

    本文通過上一個mini-batch的數(shù)據(jù)特征分布情況來預測當前mini-batch的數(shù)據(jù)特征。由于文獻[13-14]中許多數(shù)據(jù)流特征估計方法的存在,本文并未對數(shù)據(jù)特征的預測方法展開深入討論。

    3.2 HPM的估計

    在APS的調整中,數(shù)據(jù)分發(fā)方法在一個mini-batch上對HPM的估計非常關鍵。根據(jù)第1節(jié)中對現(xiàn)有分發(fā)方法的介紹和比較,本文選用HASH和APK組成APS的候選分發(fā)方法集合。本節(jié)將分別介紹這兩種分發(fā)方法在mini-batch上對HPM的估計。

    假設系統(tǒng)共有m個接收并處理來自載入節(jié)點數(shù)據(jù)的map工作節(jié)點。mini-batcht含有M條待分發(fā)的數(shù)據(jù)和K個不同的鍵值,其中出現(xiàn)次數(shù)最多的鍵值出現(xiàn)的概率為p1, heavy hitter的個數(shù)為h。

    3.2.1 HASH在mini-batch上對HPM的估計

    HASH不會產(chǎn)生鍵值分離,因此D(t)=0。至于最大負載的估計,HASH滿足帶權重單選擇的“balls-into-bins”模型[7]。其中,每個出現(xiàn)頻率不同的鍵值對應模型中的不同重量的“ball”,m個map工作節(jié)點則分別對應模型中m個“bin”。根據(jù)模型,mini-batcht中HASH的最大負載L(t)滿足:

    (3)

    式中:g(δ)=(1+δ)·ln(1+δ)-δ。

    (4)

    (5)

    3.2.2 APK在mini-batch上對HPM的估計

    APK可以保證L(t)最優(yōu),即負載完全平均:

    APK給了每個heavy hitter最多m個選擇,每個light key最多2個選擇。因此,一次分發(fā)后,每個heavy hitter最多可以提供(m-1)個額外的鍵值,每個light key最多可以提供1個額外的鍵值。所以mini-batch t中APK的鍵值分散度D(t)滿足:

    D(t)≤(m-1)·h+1·(K-h)=K+(m-2)·h

    (6)

    APK在mini-batcht中對HPM的估計滿足:

    (7)

    4 實 驗

    4.1 實驗設置

    實驗在含有10臺機器的集群中進行。每臺機器分別有2個12核2.1 GHz Intel Xeon處理器,64 GB內存,運行64位Ubuntu Server 14.04操作系統(tǒng)。集群上運行Apache Spark 2.0.0與Apache Kafka 0.10.1.0。通過實驗,我們將驗證APS的優(yōu)越性與HPM的準確性。

    (1) 基于mini-batch的分布式流處理系統(tǒng) 實驗選用Spark系統(tǒng)[4]中的Spark Streaming模塊作為基于mini-batch的分布式流處理系統(tǒng)。Spark系統(tǒng)按照standalone的方式部署在10臺機器上,其中,1臺為master、9臺為worker。每個worker維護一個含有24個核的executor。因此,本實驗最多可以同時使用216個工作節(jié)點。當鍵值分離現(xiàn)象出現(xiàn)時,根據(jù)任務的需要,系統(tǒng)決定是否將含有分離鍵值的數(shù)據(jù)聚合歸并到reduce節(jié)點中進行下一步操作。實驗選用3個載入節(jié)點、15個map工作節(jié)點和1個reduce節(jié)點。

    (2) 模擬數(shù)據(jù)源 實驗中,我們搭建了一個含有3臺機器的Kafka集群[3],并使用1個topic中的3個partition來部署數(shù)據(jù)集以模擬3個數(shù)據(jù)流。每個partition獨立地存儲數(shù)據(jù),且被設置為從offset的最小值開始讀取,并與3個載入節(jié)點一一對應。因此,相同數(shù)據(jù)源在使用不同分發(fā)方法時,分發(fā)數(shù)據(jù)的內容和順序可以保持一致。

    (3) 真實數(shù)據(jù)集 真實數(shù)據(jù)集WIKI是來自Wikimedia的開源數(shù)據(jù)。內容是自 2016年1月1日至2016年1月7日的每個小時內對所有Wikimedia網(wǎng)站的訪問記錄。我們將原數(shù)據(jù)集做一定的解析之后,得到含有168個小時級時間戳的4 490 000 000條記錄。每條記錄包括時間戳與其訪問的網(wǎng)址信息,并將網(wǎng)址信息視作鍵值。其數(shù)據(jù)分布的特征變化如圖1所示。實驗中,我們對數(shù)據(jù)做了3%的均勻抽樣以模擬更快的數(shù)據(jù)特征的變化。

    (4) 模擬數(shù)據(jù)集 模擬數(shù)據(jù)集ZF1、ZF2均服從ZipF分布。分別通過改變ZipF分布函數(shù)中的鍵值數(shù)量K和特征指數(shù)函數(shù)z,我們生成了數(shù)據(jù)集ZF1和ZF2。圖4展示了各個模擬數(shù)據(jù)集上數(shù)據(jù)分布的特征變化。固定ZF1中K=3 000,ZF2中z=0.8,通過控制系統(tǒng)讀入數(shù)據(jù)流的速度,分別保證系統(tǒng)在處理ZF1和ZF2時,每個mini-batch上的特征分布能呈現(xiàn)圖中變化。

    圖4 模擬數(shù)據(jù)集的數(shù)據(jù)特征偏移

    4.2 在真實數(shù)據(jù)集上的性能表現(xiàn)

    實驗1將WIKI數(shù)據(jù)流基于mini-batch進行鍵值聚合(類似對鍵值做詞頻統(tǒng)計),并分別記錄前60個mini-batch中系統(tǒng)分別使用HASH、APK和APS進行數(shù)據(jù)分發(fā)時的性能表現(xiàn)。每個mini-batch長度為40 s,并含有732 000條輸入數(shù)據(jù)。為了更加清晰地展現(xiàn)數(shù)據(jù)分發(fā)方法對整體性能表現(xiàn)的影響,實驗設置map工作節(jié)點上每條數(shù)據(jù)處理時間為0.1 ms,reduce節(jié)點上每條數(shù)據(jù)處理時間為0.3 ms,以模擬較為復雜的聚合任務。根據(jù)處理任務的類型(任務處理在各個節(jié)點上的延遲時間),組合系數(shù)λ設為3。

    圖5展示了不同分發(fā)方法在每個mini-batch中的處理延遲時間變化。APS通過自適應地調整選擇每個mini-batch中的分發(fā)方法,將處理延遲時間盡可能地保持在最佳水平。與HASH和APK相比,APS分別最多能將處理延遲時間降低26.66%和26.67%。同時,注意到,由于本文對數(shù)據(jù)分布的預測存在誤差,APS在對第50個和第59個mini-batch上的調整存在一定的延遲。

    圖5 不同分發(fā)方法在每個mini-batch上的處理延遲時間

    圖6展示了不同分發(fā)方法在每個mini-batch中的整體分發(fā)評估變化。每個mini-batch中整體分發(fā)評估的變化與圖5非常相似,因此每個mini-batch上的延遲處理時間與整體分發(fā)評估具有很強的相關性。本文對HPM估計方法的準確性得以驗證。

    圖6 不同分發(fā)方法在每個mini-batch上的整體分發(fā)評估

    4.3 在模擬數(shù)據(jù)集上的性能分析

    4.3.1 不同數(shù)據(jù)特征偏移對APS性能提升影響

    實驗2分別將ZF1和ZF2數(shù)據(jù)流基于mini-batch進行鍵值聚合,并選用每個mini-batch上的整體分發(fā)評估值作為性能指標。通過計算使用APS獲得的HPM較使用HASH或APK獲得的HPM所降低的百分比,我們得到APS較HASH和APK的處理性能提升比率。實驗中,每個mini-batch長度為10 s,含有45 000條數(shù)據(jù)(被3個載入節(jié)點平均接收),數(shù)據(jù)特征變化如圖7所示。此外,實驗通過設置map工作節(jié)點和reduce節(jié)點上每條數(shù)據(jù)的處理時間,將組合系數(shù)λ設為1。

    圖7展示了APS在ZF1和ZF2中相比HASH和APK獲得的性能提升比率。其中,“vs HASH avg”、“vs HASH max”和“vs APK avg”、“vs APK max”分別代表實驗過程中APS較HASH性能提升比率的平均值、最大值以及較APK性能提升比率的平均值、最大值。

    圖7 在ZF1和ZF2上使用APS獲得的性能提升

    實驗表明,在對擁有不同數(shù)據(jù)特征偏移的流數(shù)據(jù)集進行分布式處理時,相比于候選集中的靜態(tài)數(shù)據(jù)分發(fā)方法,APS能讓整體處理性能獲得巨大的提升。

    4.3.2 不同任務類型對APS性能提升的影響

    實驗3使用不同的組合系數(shù)λ來表示不同的任務類型,并使用不同的λ值對ZF1數(shù)據(jù)集進行類似實驗2的多次模擬。同時,實驗仍然選用每個mini-batch上的整體分發(fā)評估值作為性能指標,計算APS較HASH和APK的處理性能提升比率。實驗假設,處理任務中鍵值分離產(chǎn)生的性能開銷與λ的值成正比。

    圖8展示了APS在不同組合系數(shù)λ中的表現(xiàn)結果。λ的值越大,APS較HASH的提升比率越低,較APK的提升比率越高;λ的值越小,APS較HASH的提升比率越高,較APK的提升比率越低。

    圖8 在不同任務類型中使用APS獲得的性能提升

    實驗表明,當處理任務中鍵值分離的開銷很高時,APS相比產(chǎn)生鍵值分離的APK有巨大的性能提升,故傾向于調整為HASH。當處理任務中鍵值分離的開銷很低時,APS相比負載偏移較多的HASH有巨大的性能提升,故傾向于調整為負載更加均衡的APK。

    5 結 語

    本文提出了一種叫做自適應數(shù)據(jù)分發(fā)策略(APS)的分發(fā)方法,為基于mini-batch的分布式流處理任務提供更好的性能表現(xiàn)。同時,本文還為數(shù)據(jù)分發(fā)方法的表現(xiàn)性能提供了一種叫作整體分發(fā)評估的估計方法。

    通過真實數(shù)據(jù)集上的實驗分析,本文驗證了APS相比現(xiàn)有被廣泛使用的靜態(tài)分發(fā)方法的優(yōu)越性和整體分發(fā)評估的準確性。通過模擬數(shù)據(jù)集上的實驗分析,本文進一步分析了APS在不同實驗設定下的表現(xiàn)能力。

    猜你喜歡
    鍵值整體節(jié)點
    CM節(jié)點控制在船舶上的應用
    Analysis of the characteristics of electronic equipment usage distance for common users
    基于AutoCAD的門窗節(jié)點圖快速構建
    非請勿進 為注冊表的重要鍵值上把“鎖”
    歌曲寫作的整體構思及創(chuàng)新路徑分析
    流行色(2019年7期)2019-09-27 09:33:10
    關注整體化繁為簡
    設而不求整體代換
    一鍵直達 Windows 10注冊表編輯高招
    電腦愛好者(2017年9期)2017-06-01 21:38:08
    抓住人才培養(yǎng)的關鍵節(jié)點
    改革需要整體推進
    18禁美女被吸乳视频| 国产亚洲精品综合一区在线观看| 一区二区三区免费毛片| 美女黄网站色视频| 精品国产三级普通话版| 一进一出抽搐gif免费好疼| 久久久久国产精品人妻aⅴ院| 日韩欧美国产在线观看| 欧美成人免费av一区二区三区| 久久久色成人| 最近视频中文字幕2019在线8| 精品国产三级普通话版| 亚洲一区高清亚洲精品| 毛片女人毛片| 在线免费观看不下载黄p国产 | 18禁在线播放成人免费| 黄色片一级片一级黄色片| 日本一本二区三区精品| 熟女电影av网| 久久99热这里只有精品18| 免费看美女性在线毛片视频| 在线免费观看不下载黄p国产 | www.熟女人妻精品国产| 欧美精品啪啪一区二区三区| 国产av在哪里看| 国产av不卡久久| 久久性视频一级片| 欧美国产日韩亚洲一区| 一级黄色大片毛片| 丰满的人妻完整版| 欧美xxxx黑人xx丫x性爽| 精品人妻一区二区三区麻豆 | 色精品久久人妻99蜜桃| 嫩草影院入口| 日本一二三区视频观看| 国产单亲对白刺激| 啦啦啦韩国在线观看视频| 欧美精品啪啪一区二区三区| 中文字幕av成人在线电影| 国产伦精品一区二区三区视频9 | 美女cb高潮喷水在线观看| 亚洲成av人片免费观看| 精品99又大又爽又粗少妇毛片 | 国产精品 国内视频| 欧美色视频一区免费| 美女cb高潮喷水在线观看| 最近在线观看免费完整版| 国产高清三级在线| 亚洲精品在线美女| 免费高清视频大片| 欧美日韩一级在线毛片| 99久久精品一区二区三区| av在线蜜桃| 99精品欧美一区二区三区四区| a在线观看视频网站| 精品99又大又爽又粗少妇毛片 | 97人妻精品一区二区三区麻豆| 国产亚洲欧美在线一区二区| 欧美日韩福利视频一区二区| 看黄色毛片网站| 伊人久久大香线蕉亚洲五| 91麻豆精品激情在线观看国产| 午夜福利免费观看在线| 1024手机看黄色片| 99热这里只有精品一区| 欧美乱色亚洲激情| 夜夜看夜夜爽夜夜摸| 久久99热这里只有精品18| 欧美激情在线99| 亚洲人成伊人成综合网2020| 两个人看的免费小视频| 在线观看66精品国产| 无遮挡黄片免费观看| 亚洲av免费在线观看| 噜噜噜噜噜久久久久久91| 免费观看的影片在线观看| 人妻久久中文字幕网| 一级毛片高清免费大全| 国产黄片美女视频| 婷婷精品国产亚洲av在线| 88av欧美| 在线观看午夜福利视频| 国产v大片淫在线免费观看| 99精品在免费线老司机午夜| 韩国av一区二区三区四区| 国产精品1区2区在线观看.| 精品国产超薄肉色丝袜足j| 午夜免费成人在线视频| avwww免费| 亚洲,欧美精品.| 俄罗斯特黄特色一大片| 国模一区二区三区四区视频| 可以在线观看的亚洲视频| 国产v大片淫在线免费观看| 国产色婷婷99| 欧美+日韩+精品| 夜夜看夜夜爽夜夜摸| 两个人的视频大全免费| 中文字幕熟女人妻在线| 美女高潮的动态| 一级毛片高清免费大全| 久久精品国产亚洲av涩爱 | 黄色丝袜av网址大全| 99久久成人亚洲精品观看| 日韩大尺度精品在线看网址| 亚洲午夜理论影院| 国产精品国产高清国产av| 欧美日韩综合久久久久久 | 中文字幕熟女人妻在线| 天天躁日日操中文字幕| 久久性视频一级片| 在线观看午夜福利视频| 久久久色成人| 欧美成人免费av一区二区三区| 国产毛片a区久久久久| 久久99热这里只有精品18| 黄片大片在线免费观看| 波多野结衣巨乳人妻| 国产午夜精品久久久久久一区二区三区 | 日韩欧美免费精品| 校园春色视频在线观看| 精品国产超薄肉色丝袜足j| 亚洲精品粉嫩美女一区| 蜜桃亚洲精品一区二区三区| 一级黄色大片毛片| 成人特级av手机在线观看| 欧美3d第一页| 麻豆成人av在线观看| 日本精品一区二区三区蜜桃| 99热6这里只有精品| 日本熟妇午夜| 亚洲av免费在线观看| 国产成人aa在线观看| 亚洲一区二区三区不卡视频| 国产伦精品一区二区三区视频9 | 小说图片视频综合网站| 欧美日韩中文字幕国产精品一区二区三区| 欧美一级毛片孕妇| 999久久久精品免费观看国产| 国产亚洲欧美在线一区二区| 色综合欧美亚洲国产小说| 网址你懂的国产日韩在线| 国产真实伦视频高清在线观看 | 网址你懂的国产日韩在线| 3wmmmm亚洲av在线观看| a级毛片a级免费在线| 亚洲av免费高清在线观看| www.熟女人妻精品国产| 欧美日韩国产亚洲二区| 亚洲真实伦在线观看| 90打野战视频偷拍视频| 好男人在线观看高清免费视频| 一区二区三区免费毛片| 老司机福利观看| 国内精品一区二区在线观看| 午夜福利欧美成人| 偷拍熟女少妇极品色| 国产中年淑女户外野战色| 在线播放无遮挡| 日韩中文字幕欧美一区二区| 免费看a级黄色片| 久久久久久久久大av| 日本免费a在线| 国产欧美日韩一区二区精品| 老司机福利观看| 搡老熟女国产l中国老女人| 精品一区二区三区人妻视频| 丁香欧美五月| 亚洲av日韩精品久久久久久密| 最后的刺客免费高清国语| 亚洲一区高清亚洲精品| 窝窝影院91人妻| 不卡一级毛片| 国产精品久久久久久精品电影| 亚洲av熟女| 久久国产精品人妻蜜桃| 亚洲欧美日韩无卡精品| 毛片女人毛片| 少妇熟女aⅴ在线视频| 国产精品一及| 国产日本99.免费观看| 欧美不卡视频在线免费观看| 欧美黑人欧美精品刺激| 成年女人毛片免费观看观看9| 在线a可以看的网站| 久久久国产精品麻豆| 蜜桃久久精品国产亚洲av| 人妻夜夜爽99麻豆av| 天美传媒精品一区二区| 怎么达到女性高潮| 国产精品香港三级国产av潘金莲| 国产成人aa在线观看| 国产精品一区二区三区四区免费观看 | 国产日本99.免费观看| 国产精品98久久久久久宅男小说| 九色成人免费人妻av| 老司机午夜福利在线观看视频| 精品一区二区三区视频在线观看免费| 中文字幕熟女人妻在线| 精品人妻一区二区三区麻豆 | 欧美xxxx黑人xx丫x性爽| 少妇的逼水好多| 亚洲美女视频黄频| 亚洲欧美激情综合另类| 亚洲电影在线观看av| 免费大片18禁| 看免费av毛片| 黄色女人牲交| 国产视频内射| 日韩欧美 国产精品| 亚洲七黄色美女视频| 一本精品99久久精品77| 亚洲成人精品中文字幕电影| 毛片女人毛片| 免费看光身美女| 天堂动漫精品| 亚洲国产中文字幕在线视频| 精品电影一区二区在线| 最近最新中文字幕大全免费视频| 国产伦精品一区二区三区四那| 18禁黄网站禁片免费观看直播| 久久久久九九精品影院| 亚洲成av人片在线播放无| 国产精品久久久久久亚洲av鲁大| 国产一区二区三区在线臀色熟女| 亚洲精品久久国产高清桃花| 女人被狂操c到高潮| 欧美一级a爱片免费观看看| 白带黄色成豆腐渣| 国产免费av片在线观看野外av| 欧美激情在线99| 欧美成人免费av一区二区三区| 一个人看视频在线观看www免费 | 97超级碰碰碰精品色视频在线观看| 啦啦啦韩国在线观看视频| 悠悠久久av| 成年女人永久免费观看视频| 毛片女人毛片| 久久人妻av系列| 色哟哟哟哟哟哟| 国产一区二区激情短视频| 国产美女午夜福利| 搞女人的毛片| 九九热线精品视视频播放| 丰满人妻熟妇乱又伦精品不卡| 老熟妇仑乱视频hdxx| 亚洲五月天丁香| 在线国产一区二区在线| 丰满的人妻完整版| 精品99又大又爽又粗少妇毛片 | 身体一侧抽搐| 中亚洲国语对白在线视频| 91九色精品人成在线观看| 18禁国产床啪视频网站| 精品99又大又爽又粗少妇毛片 | 两个人的视频大全免费| 黄片大片在线免费观看| 在线观看66精品国产| 黄片小视频在线播放| 欧美黄色片欧美黄色片| 精品人妻偷拍中文字幕| 亚洲欧美日韩无卡精品| 免费大片18禁| 欧美3d第一页| 岛国在线观看网站| 亚洲自拍偷在线| 国产高清有码在线观看视频| 国产精品久久电影中文字幕| 国产成+人综合+亚洲专区| 一个人看视频在线观看www免费 | 久久国产乱子伦精品免费另类| 噜噜噜噜噜久久久久久91| 黑人欧美特级aaaaaa片| 黄色女人牲交| 校园春色视频在线观看| 亚洲欧美日韩无卡精品| aaaaa片日本免费| 熟女电影av网| 欧美在线一区亚洲| 久久精品亚洲精品国产色婷小说| 国产主播在线观看一区二区| 天堂动漫精品| 国产一级毛片七仙女欲春2| eeuss影院久久| 国产亚洲欧美在线一区二区| 亚洲人与动物交配视频| 夜夜躁狠狠躁天天躁| 神马国产精品三级电影在线观看| 国产黄色小视频在线观看| www.熟女人妻精品国产| 亚洲国产高清在线一区二区三| 97人妻精品一区二区三区麻豆| 午夜福利免费观看在线| 欧美丝袜亚洲另类 | 亚洲精品成人久久久久久| av在线天堂中文字幕| 老司机午夜十八禁免费视频| 国产综合懂色| 欧美+亚洲+日韩+国产| 嫩草影院精品99| 国产精品久久久久久久久免 | 99久久成人亚洲精品观看| 久久久久久人人人人人| 99国产综合亚洲精品| 国产成人aa在线观看| 色老头精品视频在线观看| 国产免费av片在线观看野外av| 精品一区二区三区视频在线 | 黄片大片在线免费观看| 日韩欧美在线乱码| 九九久久精品国产亚洲av麻豆| 黄片大片在线免费观看| 欧美日本视频| 久久精品夜夜夜夜夜久久蜜豆| 久9热在线精品视频| 好看av亚洲va欧美ⅴa在| 久久中文看片网| 女警被强在线播放| 国产伦一二天堂av在线观看| 人人妻,人人澡人人爽秒播| 啪啪无遮挡十八禁网站| 真实男女啪啪啪动态图| 免费看a级黄色片| 亚洲精华国产精华精| 国产伦精品一区二区三区四那| 99国产极品粉嫩在线观看| 18禁国产床啪视频网站| 国产亚洲av嫩草精品影院| 黑人欧美特级aaaaaa片| 在线a可以看的网站| 天堂动漫精品| 成人性生交大片免费视频hd| 看片在线看免费视频| 亚洲一区二区三区色噜噜| 婷婷六月久久综合丁香| 一二三四社区在线视频社区8| 午夜精品久久久久久毛片777| 国产亚洲精品一区二区www| 久久欧美精品欧美久久欧美| 欧美激情在线99| 可以在线观看的亚洲视频| 亚洲国产欧美网| 91久久精品电影网| 最近视频中文字幕2019在线8| 精品人妻一区二区三区麻豆 | 无遮挡黄片免费观看| 18禁美女被吸乳视频| 国产精品嫩草影院av在线观看 | or卡值多少钱| 成年女人毛片免费观看观看9| 白带黄色成豆腐渣| 欧美午夜高清在线| 午夜亚洲福利在线播放| 蜜桃亚洲精品一区二区三区| 亚洲专区国产一区二区| 国产真人三级小视频在线观看| 国产精品 国内视频| 亚洲国产中文字幕在线视频| 国产精品98久久久久久宅男小说| 亚洲av电影在线进入| 午夜精品久久久久久毛片777| 在线国产一区二区在线| 免费看a级黄色片| 亚洲性夜色夜夜综合| 国产成人av教育| 一个人看视频在线观看www免费 | 女人被狂操c到高潮| 亚洲一区二区三区色噜噜| 午夜精品久久久久久毛片777| 天堂影院成人在线观看| 亚洲最大成人中文| 国产主播在线观看一区二区| 亚洲av熟女| 国产探花在线观看一区二区| 国产精品久久久久久亚洲av鲁大| 亚洲欧美一区二区三区黑人| 久久久久性生活片| 欧美乱色亚洲激情| 久久久久久久久大av| 99久久精品国产亚洲精品| 欧美精品啪啪一区二区三区| 国产主播在线观看一区二区| 日韩有码中文字幕| 国产精品电影一区二区三区| 午夜福利18| 亚洲精品久久国产高清桃花| 成人一区二区视频在线观看| 精品人妻偷拍中文字幕| 亚洲精品影视一区二区三区av| www.熟女人妻精品国产| 女人高潮潮喷娇喘18禁视频| 免费大片18禁| 尤物成人国产欧美一区二区三区| 麻豆成人av在线观看| 性色av乱码一区二区三区2| 日日夜夜操网爽| av中文乱码字幕在线| 亚洲精品影视一区二区三区av| 啦啦啦观看免费观看视频高清| 精品人妻1区二区| 男人的好看免费观看在线视频| 脱女人内裤的视频| 日本与韩国留学比较| 久久久久久大精品| 亚洲人成伊人成综合网2020| 日韩欧美在线乱码| 在线视频色国产色| 听说在线观看完整版免费高清| 99热精品在线国产| 久久婷婷人人爽人人干人人爱| 日韩亚洲欧美综合| 又紧又爽又黄一区二区| 一夜夜www| 免费人成在线观看视频色| av国产免费在线观看| 国产美女午夜福利| 国产视频一区二区在线看| 亚洲性夜色夜夜综合| 中文字幕久久专区| 一a级毛片在线观看| 国产中年淑女户外野战色| 亚洲精品一卡2卡三卡4卡5卡| 18禁在线播放成人免费| 美女被艹到高潮喷水动态| 精品国产美女av久久久久小说| 99久久综合精品五月天人人| 97碰自拍视频| www.www免费av| 亚洲最大成人中文| 噜噜噜噜噜久久久久久91| 久久久精品大字幕| 草草在线视频免费看| 夜夜夜夜夜久久久久| 91久久精品电影网| 毛片女人毛片| 国产视频一区二区在线看| 女人十人毛片免费观看3o分钟| 久久精品国产综合久久久| 久久精品影院6| 国产成人啪精品午夜网站| 高清日韩中文字幕在线| 国产精品电影一区二区三区| 超碰av人人做人人爽久久 | a级毛片a级免费在线| 免费在线观看日本一区| 欧美性猛交╳xxx乱大交人| 99国产精品一区二区三区| 天天躁日日操中文字幕| 日本黄色视频三级网站网址| 美女 人体艺术 gogo| 亚洲美女黄片视频| 黄色丝袜av网址大全| 天堂√8在线中文| netflix在线观看网站| 精品免费久久久久久久清纯| 国产亚洲精品久久久久久毛片| 精品欧美国产一区二区三| 色哟哟哟哟哟哟| 国产日本99.免费观看| 亚洲国产精品999在线| 亚洲第一电影网av| 国产精品三级大全| 亚洲va日本ⅴa欧美va伊人久久| 最近最新免费中文字幕在线| 国产高清视频在线播放一区| 久久精品国产99精品国产亚洲性色| 男女做爰动态图高潮gif福利片| 天堂网av新在线| 丰满乱子伦码专区| www日本在线高清视频| 十八禁人妻一区二区| 在线观看av片永久免费下载| 欧美黄色淫秽网站| 国产91精品成人一区二区三区| 高潮久久久久久久久久久不卡| 90打野战视频偷拍视频| 成年版毛片免费区| 国产淫片久久久久久久久 | 99久久精品热视频| 丁香六月欧美| 亚洲av熟女| 国产极品精品免费视频能看的| 很黄的视频免费| 日本 av在线| 99热精品在线国产| а√天堂www在线а√下载| 中文亚洲av片在线观看爽| 亚洲成人久久爱视频| 搡老岳熟女国产| 国产aⅴ精品一区二区三区波| 国产黄a三级三级三级人| 久久精品国产亚洲av涩爱 | 精品一区二区三区av网在线观看| 国产精品自产拍在线观看55亚洲| av福利片在线观看| 午夜激情欧美在线| 一a级毛片在线观看| 亚洲欧美日韩高清在线视频| 叶爱在线成人免费视频播放| 国产精品1区2区在线观看.| 国产欧美日韩一区二区精品| 国产午夜精品久久久久久一区二区三区 | 午夜精品一区二区三区免费看| 嫩草影院精品99| 亚洲专区国产一区二区| 午夜激情欧美在线| 久久婷婷人人爽人人干人人爱| 日日摸夜夜添夜夜添小说| 国产伦人伦偷精品视频| 中文亚洲av片在线观看爽| 老司机午夜十八禁免费视频| 婷婷六月久久综合丁香| 一级毛片高清免费大全| 亚洲五月天丁香| 大型黄色视频在线免费观看| 99热这里只有精品一区| 国产三级黄色录像| 激情在线观看视频在线高清| 在线观看免费午夜福利视频| 一a级毛片在线观看| 脱女人内裤的视频| 欧美zozozo另类| 12—13女人毛片做爰片一| 少妇的丰满在线观看| 亚洲av免费在线观看| 国产精品亚洲美女久久久| 最后的刺客免费高清国语| 欧美又色又爽又黄视频| 国内久久婷婷六月综合欲色啪| 香蕉av资源在线| 天堂av国产一区二区熟女人妻| 99久久无色码亚洲精品果冻| 久久精品人妻少妇| 成人18禁在线播放| 天天添夜夜摸| 亚洲国产高清在线一区二区三| 日本黄色片子视频| 日本精品一区二区三区蜜桃| 欧美精品啪啪一区二区三区| 午夜精品久久久久久毛片777| 3wmmmm亚洲av在线观看| 可以在线观看毛片的网站| 国产精品久久久久久人妻精品电影| 国内少妇人妻偷人精品xxx网站| 国产精品久久电影中文字幕| 久久久国产精品麻豆| 变态另类成人亚洲欧美熟女| 午夜激情福利司机影院| 国产精品一及| 国产免费男女视频| 精品一区二区三区视频在线 | 中文字幕久久专区| 亚洲国产精品成人综合色| 精品电影一区二区在线| 色av中文字幕| 欧美日韩中文字幕国产精品一区二区三区| 国产精品99久久久久久久久| 最近最新免费中文字幕在线| 精品人妻1区二区| 久久人妻av系列| 男女之事视频高清在线观看| av在线蜜桃| 精品久久久久久成人av| 一个人免费在线观看的高清视频| 99视频精品全部免费 在线| 欧美3d第一页| 国产av不卡久久| 老熟妇乱子伦视频在线观看| 女警被强在线播放| 久久久久久久久大av| 国产成+人综合+亚洲专区| 亚洲欧美日韩高清专用| 久久精品夜夜夜夜夜久久蜜豆| 人人妻人人看人人澡| 嫁个100分男人电影在线观看| 亚洲美女黄片视频| 脱女人内裤的视频| 最近最新免费中文字幕在线| 国产野战对白在线观看| 日韩大尺度精品在线看网址| 母亲3免费完整高清在线观看| 午夜免费成人在线视频| 天堂网av新在线| 99久久无色码亚洲精品果冻| 午夜免费成人在线视频| 亚洲在线观看片| 啪啪无遮挡十八禁网站| 亚洲真实伦在线观看| 久久久精品大字幕| 欧美成人a在线观看| 男女午夜视频在线观看| 亚洲在线观看片| 久久亚洲真实| 免费看a级黄色片| 一级毛片女人18水好多| 啪啪无遮挡十八禁网站| 最好的美女福利视频网| 亚洲在线观看片| 母亲3免费完整高清在线观看| 精品国产超薄肉色丝袜足j| 很黄的视频免费| 久久精品国产亚洲av香蕉五月| 成年人黄色毛片网站| 国产精品乱码一区二三区的特点| 中亚洲国语对白在线视频| av福利片在线观看| 一进一出抽搐动态| 在线观看一区二区三区| 窝窝影院91人妻| 日韩欧美免费精品| 又紧又爽又黄一区二区| 99精品久久久久人妻精品| 亚洲乱码一区二区免费版| 日本在线视频免费播放| 久久精品综合一区二区三区|