• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于內(nèi)存數(shù)據(jù)網(wǎng)格文件存儲分析

    2015-11-14 21:42:53俞祥鵬
    電腦知識與技術(shù) 2015年22期
    關(guān)鍵詞:性能分析

    俞祥鵬

    摘要:內(nèi)存數(shù)據(jù)網(wǎng)格存儲系統(tǒng)能夠大大提高數(shù)據(jù)的存儲速度,現(xiàn)有的內(nèi)存數(shù)據(jù)網(wǎng)格原型系統(tǒng)大多支持?jǐn)?shù)據(jù)鍵值對的存儲。該文通過利用現(xiàn)有的數(shù)據(jù)網(wǎng)格原型系統(tǒng),實(shí)現(xiàn)了分布式的內(nèi)存文件存儲工具。并對該工具的存儲性能進(jìn)行分析,并提出幾種影響分布式內(nèi)存數(shù)據(jù)網(wǎng)格文件存儲性能的因素。

    關(guān)鍵詞:內(nèi)存數(shù)據(jù)網(wǎng)格;文件存儲;性能分析

    中圖分類號:TP393 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2015)22-0171-03

    Abstract:In-memory-grid storage system can increase the speed of data storage. Most existing memory data grid prototype system only support key-value pair storage. In this paper,by using the existing data grid prototype system, we develop a tool that can storage file in In-memory-grid. And analyzed the performance of the tool, And put forward several kinds of influence factors of distributed memory data grid file storage.

    Key words:in-memory data grid; file storage; performance analysis

    隨著云計算技術(shù)的普及,產(chǎn)生的數(shù)據(jù)量越來越大,數(shù)據(jù)共享越來越普遍。為了處理海量數(shù)據(jù),解決傳統(tǒng)數(shù)據(jù)庫面臨的大規(guī)模數(shù)據(jù)訪問瓶頸問題,分布式緩存技術(shù)得以引入。分布式緩存將數(shù)據(jù)分布到多個緩存服務(wù)節(jié)點(diǎn),在內(nèi)存中管理數(shù)據(jù),對外提供統(tǒng)一的訪問接口,基于冗余備份機(jī)制實(shí)現(xiàn)高可用支持,又被稱為內(nèi)存數(shù)據(jù)網(wǎng)格(IMDG)。IMDG是基于內(nèi)存的新型分布式數(shù)據(jù)鍵值對存儲系統(tǒng),與分布式緩存相比,可以簡化應(yīng)用層數(shù)據(jù)訪問邏輯的開發(fā),減少維護(hù)緩存與數(shù)據(jù)庫的管理邏輯,屏蔽應(yīng)用與數(shù)據(jù)庫的交互細(xì)節(jié),并提供持久化機(jī)制將內(nèi)存中的數(shù)據(jù)自動存儲于數(shù)據(jù)庫中[2]。

    目前IMDG主要是對數(shù)據(jù)鍵值對存儲研究比較多,本文通過分析現(xiàn)存的IMDG原型系統(tǒng),利用Infinispan內(nèi)存數(shù)據(jù)網(wǎng)格原型實(shí)現(xiàn)的分布式文件存儲。通過在單機(jī)環(huán)境下和集群環(huán)境下的性能測試實(shí)驗,測試該內(nèi)存數(shù)據(jù)網(wǎng)格的文件讀寫性能,以及驗證影響內(nèi)存數(shù)據(jù)網(wǎng)格的讀寫性能的因素[2,6]。

    1 內(nèi)存數(shù)據(jù)網(wǎng)格的概述

    1.1分布式緩存

    在計算機(jī)中,分布式緩存是傳統(tǒng)概念上單一緩沖的擴(kuò)充。一個分布式緩存跨越多個服務(wù)器,因此其具有可擴(kuò)展性和事物處理性。通常主要是用于存儲應(yīng)用程序數(shù)據(jù)駐留在數(shù)據(jù)庫和web會話數(shù)據(jù)。因為內(nèi)存變得非常便宜和網(wǎng)卡已經(jīng)變得非常快分布式緩存的[1]現(xiàn)在已經(jīng)使用的越來越廣泛。對于分布式緩存主要的特性有高性能、動態(tài)可擴(kuò)展、高可用性、易用性、分布式代碼執(zhí)行[3,4]。現(xiàn)今,很多的系統(tǒng)都使用了數(shù)據(jù)緩存技術(shù),典型的數(shù)據(jù)檢索系統(tǒng),將數(shù)據(jù)檢索技術(shù)和數(shù)據(jù)緩存技術(shù)結(jié)合起來,極大地提高了檢索效率。

    1.2 內(nèi)存數(shù)據(jù)網(wǎng)格文件存儲

    Infinispan是JBoss Cache緩存框架的后續(xù)項目,它是一個開源的數(shù)據(jù)網(wǎng)格平臺,用于訪問分布式狀態(tài)的群集節(jié)點(diǎn)。它可以提供無固定類型的存儲key-value值,文件的存儲,基于網(wǎng)格的數(shù)據(jù)存儲。在存儲數(shù)據(jù)方面我們可以設(shè)置數(shù)據(jù)在集群中保存的副本數(shù)量;同時提供負(fù)載均衡,以及失效節(jié)點(diǎn)的數(shù)據(jù)自動遷移到其他節(jié)點(diǎn)的功能[5]。GridFileSystem(網(wǎng)格文件系統(tǒng))是一個全新實(shí)驗性的API,這些API使Infinispan后端的網(wǎng)格數(shù)據(jù)像文件系統(tǒng)一樣展示出來。對于實(shí)現(xiàn)的系統(tǒng),集群中某個節(jié)點(diǎn)失效時,該節(jié)點(diǎn)存儲的數(shù)據(jù)會自動遷移到其他的節(jié)點(diǎn)上,實(shí)現(xiàn)數(shù)據(jù)的可靠性存儲。同時如果某個節(jié)點(diǎn)上存儲的數(shù)據(jù)過多,也能夠進(jìn)行負(fù)載平衡。

    1.3 工具的實(shí)現(xiàn)

    內(nèi)存數(shù)據(jù)網(wǎng)格提供系統(tǒng)兩種類型的時間存儲。一種是文件流形式的數(shù)據(jù)存儲,主要存儲的內(nèi)容是文件。對于這種形式的數(shù)據(jù),內(nèi)存數(shù)據(jù)網(wǎng)格(Infinispan)首先要先去內(nèi)存文件系統(tǒng)中取數(shù)據(jù),在集群中選擇數(shù)據(jù)所要存放的節(jié)點(diǎn)(數(shù)據(jù)在集群中存兩份),然后通過Jgroup進(jìn)行數(shù)據(jù)的傳輸。另一種是Key-Value類型的數(shù)據(jù)。對于這種數(shù)據(jù)的存儲內(nèi)存數(shù)據(jù)網(wǎng)格(Infinispan)直接接收套接字客戶端發(fā)送過來的Key-Value的鍵值對,然后在集群中選擇兩個節(jié)點(diǎn)進(jìn)行存儲(數(shù)據(jù)存放兩份),通過Jgroup進(jìn)行數(shù)據(jù)的傳送。

    2 實(shí)驗方案介紹

    測試的系統(tǒng)采用的是Ubuntu14.1,內(nèi)核版本是3.11.10.11;java的環(huán)境是JDK8。虛擬機(jī)內(nèi)存大小是2GB。采用的方法是測試得到的數(shù)據(jù)取平均值,在試驗中每組數(shù)據(jù)測了50次,然后求其平均值。單機(jī)環(huán)境下的測試,主要測試因素是文件大小和文件存取時分塊大小。文件存取時分塊大小,主要指的是,文件在存儲到內(nèi)存數(shù)據(jù)網(wǎng)格時,內(nèi)存數(shù)據(jù)網(wǎng)格將文件分成塊,進(jìn)行分塊傳輸。文件在內(nèi)存數(shù)據(jù)網(wǎng)格中也是以塊的大小存放。這種分塊對上層用戶是透明的。下面分針對這兩種情況進(jìn)行了測試。在集群中的測試過程中因變量為讀文件時間和寫文件時間,自變量為文件大小、分塊的大小、集群環(huán)境。實(shí)驗的交換機(jī)的帶寬是1000M/S。主要目的是為了找出在集群環(huán)境下,文件大小,文件存入是分塊的大小,集群環(huán)境與文件的存取時間的關(guān)系。

    2.1實(shí)驗集群場景選擇

    集群環(huán)境的測試中,主要目的是為了測試,集群的分布與文件的讀寫時間的關(guān)系。主要考慮的因素有兩點(diǎn):一、同一臺物理機(jī)上的虛擬機(jī)之間會不會由于虛擬化的不穩(wěn)定,從而影響讀寫性能;二、文件存儲的過程中存儲在本節(jié)點(diǎn)與不存儲在本節(jié)點(diǎn)讀寫性能是否有影響。根據(jù)這兩個猜想我們設(shè)計了下面的集群中的幾個場景。在集群環(huán)境下我們采用下面圖中的幾種結(jié)構(gòu)。場景A寫AB存,一臺物理機(jī)上運(yùn)行兩臺虛擬機(jī),A虛擬機(jī)寫入數(shù)據(jù),A和B虛擬機(jī)存入數(shù)據(jù)(數(shù)據(jù)在集群中存儲兩份)。場景A寫B(tài)C存,一臺物理機(jī)上運(yùn)行三臺虛擬機(jī),A虛擬機(jī)寫入數(shù)據(jù),BC存入數(shù)據(jù)(數(shù)據(jù)在集群中存儲兩份);場景A寫AD存,物理機(jī)(HA-A)上運(yùn)行虛擬機(jī)A,物理機(jī)(HA-B)上運(yùn)行虛擬機(jī)D,物理機(jī)(HA-C)運(yùn)行虛擬機(jī)G,虛擬機(jī)A寫入數(shù)據(jù),存放在A和D兩個節(jié)點(diǎn)上;場景A寫B(tài)D存,物理機(jī)(HA-A)上運(yùn)行兩臺虛擬機(jī)A和B,物理機(jī)(HA-B)上運(yùn)行虛擬機(jī)D,虛擬機(jī)A寫入文件,虛擬機(jī)B和虛擬機(jī)D存儲文件。在這些場景中我們固定的文件大小為100M,文件塊大小為50M。

    2.2數(shù)據(jù)的監(jiān)控

    對于影響存取時間的猜想:數(shù)據(jù)段之間的時間隔,系統(tǒng)在接收和發(fā)送數(shù)據(jù)時都有一個發(fā)送緩沖區(qū)和接收緩沖區(qū),每接收完一個緩沖區(qū),集群需要確定當(dāng)前所有的集群是否是存活,發(fā)送數(shù)據(jù)。如果數(shù)據(jù)丟失,那么會重新發(fā)送一份發(fā)送之前緩沖區(qū)中的數(shù)據(jù)。對應(yīng)場景虛擬機(jī)環(huán)境和物理機(jī)環(huán)境的對比,存文件的時間效率不高的原因可能是虛擬機(jī)的不穩(wěn)定導(dǎo)致。

    3 實(shí)驗結(jié)果分析

    一個PUT(存)操作,只會產(chǎn)生網(wǎng)格中節(jié)點(diǎn)子集數(shù)(numOwners)個遠(yuǎn)程調(diào)用。一個GET操作只針對網(wǎng)格中某一個節(jié)點(diǎn)產(chǎn)生一次遠(yuǎn)程調(diào)用。另為,在分布式模式下,不管配置的是同步調(diào)用還是異步調(diào)用,如果緩存條目不存在于本地時,都是采用同步調(diào)用請求用來從其他節(jié)點(diǎn)獲取數(shù)據(jù)。對于數(shù)據(jù)的讀,時間上存在很大的變化,主要是它總是優(yōu)先讀取本地節(jié)點(diǎn)的數(shù)據(jù),才去讀取對應(yīng)節(jié)點(diǎn)的數(shù)據(jù)。

    4 結(jié)束語

    Infinispan分布式模式通過連續(xù)性哈希算法從網(wǎng)格中選擇出節(jié)點(diǎn)來保存緩存條目,節(jié)點(diǎn)總數(shù)就是數(shù)據(jù)網(wǎng)格中節(jié)點(diǎn)子集,哈希算法通過配置文件知道節(jié)點(diǎn)子集總數(shù),同時它維護(hù)緩存條目一直存在于這個數(shù)的節(jié)點(diǎn)上。節(jié)點(diǎn)子集數(shù)的大小與Infinispan數(shù)據(jù)網(wǎng)格的性能和容錯能力相關(guān),節(jié)點(diǎn)子集數(shù)太大,即緩存條目保存在很多節(jié)點(diǎn)上會影響性能,但節(jié)點(diǎn)子集數(shù)太小又影響容錯能力。

    數(shù)據(jù)網(wǎng)格通過哈希算法從網(wǎng)格中存取數(shù)據(jù),存取數(shù)據(jù)的過程中不是向所有節(jié)點(diǎn)發(fā)送多播請求,存取過程也不需要維護(hù)很繁多的元數(shù)據(jù)。一個PUT(存)操作,只會產(chǎn)生網(wǎng)格中節(jié)點(diǎn)子集數(shù)(numOwners)個遠(yuǎn)程調(diào)用。一個GET操作只針對網(wǎng)格中某一個節(jié)點(diǎn)產(chǎn)生一次遠(yuǎn)程調(diào)運(yùn),在后臺實(shí)質(zhì)也是產(chǎn)生網(wǎng)格中節(jié)點(diǎn)子集數(shù)(numOwners)個調(diào)用,且這些調(diào)用是并發(fā)進(jìn)行的,查詢到的結(jié)果會返回給調(diào)用者。另為,在分布式模式下,不管配置的是同步調(diào)用還是異步調(diào)用,如果緩存條目不存在于本地時,都是采用同步調(diào)用請求用來從其他節(jié)點(diǎn)獲取數(shù)據(jù)。因此寫數(shù)據(jù)時間比讀數(shù)據(jù)時間長。

    參考文獻(xiàn):

    [1] 秦秀磊, 張文博, 魏峻, 等. 云計算環(huán)境下分布式緩存技術(shù)的現(xiàn)狀與挑戰(zhàn)[J]. 軟件學(xué)報, 2013, 24(1): 50-66.

    [2] Marchioni F. Infinispan data grid platform[M]. Packt Publishing Ltd, 2012.

    [3] Chandra D G, DGE&T M L E. A Survey on Cloud Database[J]. IEEE IT Professional, 2013.

    [4] Chandra D G, Prakash R, Lamdharia S. A Study on Cloud Database[C]//Computational Intelligence and Communication Networks (CICN), 2012 Fourth International Conference on. IEEE, 2012: 513-519.

    [5] 劉朝輝,王偉,王彥士,等.面向內(nèi)存數(shù)據(jù)網(wǎng)格的分布式事務(wù)保障機(jī)制[J].計算機(jī)科學(xué)與探索, 2013,12(18):812-822.

    猜你喜歡
    性能分析
    各種熱水器方案的比較研究
    自動控制系統(tǒng)的優(yōu)劣評價分析
    考試周刊(2017年7期)2017-02-06 21:41:37
    網(wǎng)絡(luò)安全態(tài)勢量化評估模型
    網(wǎng)絡(luò)安全態(tài)勢感知國內(nèi)外研究現(xiàn)狀
    TD—LTE智能天線性能分析和應(yīng)用研究
    DCS控制系統(tǒng)在生產(chǎn)線物料運(yùn)輸工作的應(yīng)用
    科技視界(2016年4期)2016-02-22 13:05:13
    基于Petri網(wǎng)理論的AFDX性能分析
    科技視界(2015年29期)2015-10-19 11:47:43
    關(guān)于動車組動車轉(zhuǎn)向架的關(guān)鍵部件性能分析
    科技資訊(2015年7期)2015-07-02 19:04:05
    氣動調(diào)節(jié)閥的性能調(diào)試及主要性能分析
    PHS無線網(wǎng)絡(luò)優(yōu)化問題淺析
    瑞昌市| 随州市| 南丹县| 临江市| 博湖县| 阿图什市| 阿坝县| 东乡| 东山县| 松滋市| 六盘水市| 买车| 盘山县| 永康市| 乐昌市| 周宁县| 云霄县| 安多县| 兴文县| 桃园市| 靖州| 璧山县| 农安县| 巴彦县| 安西县| 保康县| 通河县| 周宁县| 营山县| 平阳县| 巴中市| 浦县| 永春县| 西贡区| 博白县| 左权县| 巧家县| 卢湾区| 五家渠市| 黑水县| 高阳县|