張連堂+嚴(yán)運(yùn)廣+周珂+黃祥志+陳前程+方鑫+李響
DOI:10.16644/j.cnki.cn33-1094/tp.2016.02.005
摘 ?要: 為輔助集群管理,根據(jù)Stuart K. Card等人提出的CARD信息可視化模型,對(duì)集群節(jié)點(diǎn)的連接信息進(jìn)行實(shí)時(shí)展示,提出一種單中心集群中節(jié)點(diǎn)連接信息的動(dòng)態(tài)可視化設(shè)計(jì)方案,簡(jiǎn)化了集群連接狀態(tài)管理的復(fù)雜程度。實(shí)驗(yàn)表明,該方案在實(shí)現(xiàn)時(shí)消耗的內(nèi)存資源較少。為大規(guī)模集群連接的信息可視化設(shè)計(jì)和實(shí)現(xiàn)奠定了方法基礎(chǔ)。
關(guān)鍵詞: 集群節(jié)點(diǎn); 集群管理; 連接信息; 可視化
中圖分類(lèi)號(hào):TP391 ? ? ? ? ?文獻(xiàn)標(biāo)志碼:A ? ? 文章編號(hào):1006-8228(2016)02-14-04
Design of connection information visualization for cluster nodes
Zhang Liantang1, Yan Yunguang1,2, Zhou Ke1,2, Huang Xiangzhi2, Chen Qiancheng1,2, Fang Xin1,2, Li Xiang3
(1. School of Computer and Information Engineering Henan University, Kaifeng, Henan 475004, China;
2. Institute of Remote Sensing and Digital Earth Chinese Academy of Sciences; 3. Beijing Institute of Spacecraft System Engineering)
Abstract: To assist the cluster management, this paper put forward a dynamic visualization proposal of the nodes in single center cluster to show the connection information of the cluster nodes dynamically and timely according to the CARD information visualization model. It simplified the complexity of the connection state management. The experiment result shows that this method is less resource consumption. It laid the foundation for the design and implementation of connection information visualization for large scale cluster.
Key words: cluster nodes; cluster management; connection information; visualization
0 引言
集群是一組連接在一起完成特定功能的計(jì)算機(jī)的集合[1]。集群可以在成本較低的情況下獲得較好的性能、較高的可靠性和靈活性。與集群交互時(shí),集群像是一個(gè)獨(dú)立的服務(wù)器提供服務(wù)。集群的一大特點(diǎn)是高可用性和靈活的伸縮擴(kuò)展性[2],可以根據(jù)需要增加或減少集群中計(jì)算機(jī)的數(shù)量。
集群的組成一般可分為中心節(jié)點(diǎn)計(jì)算機(jī)(以下簡(jiǎn)稱(chēng)中心節(jié)點(diǎn))和并行節(jié)點(diǎn)計(jì)算機(jī)(以下簡(jiǎn)稱(chēng)并行節(jié)點(diǎn))。
中國(guó)科學(xué)院遙感與數(shù)字地球研究所研制的衛(wèi)星遙感基礎(chǔ)共性產(chǎn)品一體化處理系統(tǒng)是專(zhuān)門(mén)用來(lái)處理遙感信息數(shù)據(jù)的集群系統(tǒng)(下文所說(shuō)的集群和集群系統(tǒng)都指該一體化處理系統(tǒng))。本系統(tǒng)中的中心節(jié)點(diǎn)由三個(gè)模塊組成,分別是通訊立方體、計(jì)算立方體、存儲(chǔ)立方體。如圖1所示,圖中的總控調(diào)度服務(wù)器即是文中提到的中心節(jié)點(diǎn),其他機(jī)器是并行節(jié)點(diǎn)。集群系統(tǒng)中的計(jì)算機(jī)都放在42U標(biāo)準(zhǔn)型機(jī)柜里,形成一種整機(jī)柜柔性服務(wù)器。集群系統(tǒng)是一種優(yōu)化型系統(tǒng),可以快速完成數(shù)據(jù)整編、共性產(chǎn)品生產(chǎn)、可視化檢索等功能。系統(tǒng)主要采用自動(dòng)化、標(biāo)準(zhǔn)化和業(yè)務(wù)化遙感數(shù)據(jù)處理模式,其中計(jì)算節(jié)點(diǎn)自動(dòng)執(zhí)行多項(xiàng)任務(wù),簡(jiǎn)化了對(duì)服務(wù)器、存儲(chǔ)器、網(wǎng)絡(luò)及其他資源的管理與配置流程,是標(biāo)準(zhǔn)產(chǎn)品的高自動(dòng)化生產(chǎn)系統(tǒng),其可用性、容量和性能可滿(mǎn)足行業(yè)不斷增長(zhǎng)的計(jì)算需求,為用戶(hù)提供從硬件環(huán)境設(shè)計(jì),到軟件功能按需重組的一體化遙感產(chǎn)品處理系統(tǒng)整體解決方案。為了輔助集群的管理,根據(jù)常見(jiàn)的星型網(wǎng)絡(luò)拓?fù)淠P蚚3]提出一種集群節(jié)點(diǎn)的連接信息可視化設(shè)計(jì)的方法,用于直觀的描述集群節(jié)點(diǎn)的連接信息。本文方法根據(jù)美國(guó)研究者Stuart K. Card等人提出的CARD信息可視化模型[4]對(duì)集群節(jié)點(diǎn)的連接信息進(jìn)行可視化設(shè)計(jì)。信息的可視化可以使數(shù)據(jù)的呈現(xiàn)效果得到增強(qiáng),讓用戶(hù)以非常直觀的方式實(shí)現(xiàn)對(duì)數(shù)據(jù)的觀察和瀏覽,亦可進(jìn)行交互操作,發(fā)現(xiàn)數(shù)據(jù)中隱藏的特征、關(guān)系和模式[5]。參考CARD可視化模型的過(guò)程,將集群節(jié)點(diǎn)連接信息的可視化設(shè)計(jì)分為以下過(guò)程:首先要進(jìn)行集群節(jié)點(diǎn)連接信息的獲取,接著對(duì)獲取到的集群節(jié)點(diǎn)信息進(jìn)行數(shù)據(jù)預(yù)處理,根據(jù)這些信息建立節(jié)點(diǎn)連接信息表[6],中心節(jié)點(diǎn)根據(jù)可視化區(qū)域的信息生成一張可視化結(jié)構(gòu)信息表,最后根據(jù)這兩個(gè)表進(jìn)行節(jié)點(diǎn)連接圖的繪制[7],當(dāng)用戶(hù)把鼠標(biāo)放置在圖中的節(jié)點(diǎn)區(qū)域的上方時(shí),顯示該節(jié)點(diǎn)計(jì)算機(jī)的詳細(xì)信息[8]。
1 集群節(jié)點(diǎn)連接信息的獲取
本集群主要有中心節(jié)點(diǎn)和并行節(jié)點(diǎn)兩種角色。首先運(yùn)行中心節(jié)點(diǎn)上的程序,當(dāng)中心節(jié)點(diǎn)的服務(wù)進(jìn)程開(kāi)啟后,建立一張連接表,中心節(jié)點(diǎn)利用TCP協(xié)議開(kāi)啟監(jiān)聽(tīng)進(jìn)程,被動(dòng)的等待連接;再依次打開(kāi)并行節(jié)點(diǎn),當(dāng)并行節(jié)點(diǎn)上的程序打開(kāi)后,就會(huì)主動(dòng)向中心節(jié)點(diǎn)的程序發(fā)出連接請(qǐng)求。中心節(jié)點(diǎn)程序接收到連接請(qǐng)求后,將收到的連接信息進(jìn)行預(yù)處理提取有用信息后放入連接表中,如有其他并行節(jié)點(diǎn)打開(kāi)時(shí),按照上述過(guò)程依次放入到該表中。建立連接表到繪圖的整個(gè)過(guò)程都在中心節(jié)點(diǎn)上進(jìn)行,當(dāng)有3個(gè)節(jié)點(diǎn)連接時(shí)建立的連接信息表如表1所示。
表1中的各個(gè)字段都有其具體的意義和作用:編號(hào)字段為當(dāng)繪圖的時(shí)候統(tǒng)計(jì)共有多少個(gè)并行計(jì)算節(jié)點(diǎn);IP為各個(gè)并行節(jié)點(diǎn)的IP地址,端口號(hào)為該并行節(jié)點(diǎn)和中心節(jié)點(diǎn)通信的端口;CPU利用率、內(nèi)存大小、內(nèi)存利用率和GPU信息可以作為集群決定為哪個(gè)并行節(jié)點(diǎn)分配任務(wù)的一個(gè)參考,輔助集群管理。
2 集群節(jié)點(diǎn)連接信息可視化的設(shè)計(jì)與實(shí)現(xiàn)
獲取到節(jié)點(diǎn)的連接信息后,生成連接信息表格。集群的中心節(jié)點(diǎn)獲取可視化區(qū)域的大小等信息后,生成一張可視化結(jié)構(gòu)表的格式如表2所示。然后根據(jù)連接信息表和可視化結(jié)構(gòu)表進(jìn)行繪制,如圖2所示。
設(shè)可視化區(qū)域的寬度為CW,高度為CH;中心加載圖片的寬度為PW,高度為PH;邊緣圖片的寬度為pw,高度為ph。
可以求出中心點(diǎn)O的X坐標(biāo)Ox=CW/2,點(diǎn)O的y坐標(biāo)Oy=CH/2。
因中心需要加載的圖片以O(shè)為中心點(diǎn),可以求出要加載圖片的左下角和右上角的坐標(biāo),從而把圖片固定在中心位置。左下角設(shè)為A,其X坐標(biāo)為:Ax=CW/2-PW/2,其Y坐標(biāo)為: ?⑴
同理可知右上角B的坐標(biāo)為:
⑵
假設(shè)有n個(gè)節(jié)點(diǎn)連接,連接線(xiàn)的長(zhǎng)度為r,如果想使節(jié)點(diǎn)均勻地分布在可視化區(qū)域內(nèi),連接線(xiàn)的一端是中心點(diǎn)O,根據(jù)三角函數(shù)算出連接線(xiàn)的另一個(gè)端點(diǎn),這里先設(shè)第I(0
⑶
⑷
最后得出邊緣各個(gè)圖像的左下角坐標(biāo)為:
⑸
右上角的坐標(biāo)為:
⑹
半徑r的取值范圍為:
⑺
在參數(shù)pw和ph固定的情況下支持的連接數(shù)(也就是避免視覺(jué)混淆現(xiàn)象)的范圍為:
⑻
本段描述實(shí)現(xiàn)快速計(jì)算圖片中各個(gè)重要的繪圖坐標(biāo)點(diǎn)。
3 運(yùn)行測(cè)試與結(jié)果分析
3.1 測(cè)試環(huán)境
本集群使用的是42U標(biāo)準(zhǔn)型機(jī)柜,機(jī)柜共放置10臺(tái)機(jī)器,用其中1臺(tái)作為中心節(jié)點(diǎn),其余為并行節(jié)點(diǎn)。它們之間連接的網(wǎng)絡(luò)拓?fù)錇?0臺(tái)計(jì)算機(jī)與1臺(tái)交換機(jī)直接相連的星型拓?fù)浣Y(jié)構(gòu)。
機(jī)器中的各個(gè)機(jī)器配置都相同,它們的IP配置如表2所示。交換機(jī)的配置如表3所示。
3.2 測(cè)試結(jié)果及其分析
由于集群系統(tǒng)中機(jī)器數(shù)目和交換機(jī)接口的限制,在測(cè)試時(shí),分別取0個(gè)、1個(gè)、3個(gè)、5個(gè)、7個(gè)和9個(gè)并行節(jié)點(diǎn)進(jìn)行連接測(cè)試:當(dāng)無(wú)并行節(jié)點(diǎn)連接到中心節(jié)點(diǎn)的時(shí)候,只顯示一個(gè)中心節(jié)點(diǎn);當(dāng)有一個(gè)節(jié)點(diǎn)計(jì)算機(jī)連接的時(shí)候,根據(jù)上述計(jì)算可以得到節(jié)點(diǎn)相對(duì)于中心節(jié)點(diǎn)的坐標(biāo),可得該節(jié)點(diǎn)處在連線(xiàn)的正右邊位置,即處在以中心為相對(duì)坐標(biāo)原點(diǎn)的正右方;當(dāng)有三個(gè)節(jié)點(diǎn)的時(shí)候,這三個(gè)節(jié)點(diǎn)之間的夾角是2π/3,當(dāng)有九個(gè)節(jié)點(diǎn)的時(shí)候,每?jī)蓚€(gè)相鄰節(jié)點(diǎn)的夾角是π/3,當(dāng)分別有1個(gè)、3個(gè)和9個(gè)節(jié)點(diǎn)的時(shí)(測(cè)試環(huán)境中可視化區(qū)域的長(zhǎng)和寬分別是456像素和385像素。連線(xiàn)半徑取值為192像素),當(dāng)并行節(jié)點(diǎn)個(gè)數(shù)分別為1、3和9這三種情況下,連接圖如圖3所示。第三張圖中一個(gè)IP為192.168.10.242的并行節(jié)點(diǎn)連接發(fā)生異常,節(jié)點(diǎn)失效,由此可見(jiàn),集群節(jié)點(diǎn)連接信息的可視化設(shè)計(jì)可以方便的觀察集群節(jié)點(diǎn)連接狀態(tài)信息并發(fā)現(xiàn)失效節(jié)點(diǎn),幫助更好的完成集群的管理。
當(dāng)集群的并行節(jié)點(diǎn)分別有0、1、3、5、7、9個(gè)連接到中心節(jié)點(diǎn)計(jì)算機(jī)的時(shí)候,資源占用情況如表5所示。
綜上,集群系統(tǒng)由于運(yùn)行操作系統(tǒng),開(kāi)始會(huì)占用CPU和內(nèi)存資源(CPU占用8%,內(nèi)存占用190M),每連接上一個(gè)并行節(jié)點(diǎn)就會(huì)消耗一定的CPU和內(nèi)存資源,通常情況下,當(dāng)機(jī)器的負(fù)載超過(guò)80%以后,機(jī)器性能會(huì)迅速下降,影響任務(wù)的執(zhí)行,接受測(cè)試的中心節(jié)點(diǎn)機(jī)器的內(nèi)存是5824MB,CPU是八核心的,當(dāng)連接個(gè)數(shù)不是很大時(shí),經(jīng)測(cè)定對(duì)CPU幾乎無(wú)影響,可以忽略不計(jì)。經(jīng)理論計(jì)算,目前理論上所支持的最大并行節(jié)點(diǎn)的連接數(shù)是(5824*1024-192500)/(10740)=537臺(tái)。
4 ?結(jié)束語(yǔ)
集群節(jié)點(diǎn)連接信息的可視化設(shè)計(jì)采用一種動(dòng)態(tài)繪制方法使集群中心節(jié)點(diǎn)和并行節(jié)點(diǎn)有規(guī)則的排列,這種方法可以用于集群節(jié)點(diǎn)的管理,方便用戶(hù)及時(shí)查看集群節(jié)點(diǎn)的連接狀態(tài)信息,幫助集群管理者及時(shí)了解集群節(jié)點(diǎn)的連接狀態(tài),更有效的對(duì)集群的節(jié)點(diǎn)進(jìn)行管理。但是目前僅支持單機(jī)柜中的集群節(jié)點(diǎn)連接信息的可視化設(shè)計(jì),下一步工作將通過(guò)使用分層和級(jí)聯(lián)方法支持更多機(jī)柜中的集群節(jié)點(diǎn)連接信息的可視化,實(shí)現(xiàn)大規(guī)模集群管理的可視化。
參考文獻(xiàn)(References):
[1] 向文.集群管理系統(tǒng)的研究與設(shè)計(jì)[D].遼寧師范大學(xué),2008.
[2] 李敬.集群系統(tǒng)集中管理平臺(tái)的研究與實(shí)現(xiàn)[D]. 西北工業(yè)大
學(xué),2004.
[3] 田建勇.析星型拓?fù)湓O(shè)計(jì)組建校園局域網(wǎng)[J].安順學(xué)院學(xué)報(bào),
2011.13(1):90-93
[4] 楊彥波,劉濱,祁明月.信息可視化研究綜述[J].河北科技大學(xué)
學(xué)報(bào),2014.35(1):91-102
[5] CARD SK, MACKINLAY J D, SHNEIDERMAN B.
Readings in Information Visualization: Using Vision to Think[M].San Francisco; Morgan Kaufmann,1999.
[6] 陳建軍,于志強(qiáng),朱昀.數(shù)據(jù)可視化技術(shù)及其應(yīng)用[J].紅外與激
光工程,2001.30(5):339-342.
[7] 任磊,王威信,周明駿等.一種模型驅(qū)動(dòng)的交互式信息可視化
開(kāi)發(fā)方法[J].軟件學(xué)報(bào),2008.19(8):1947-1967
[8] 劉大海.海量數(shù)據(jù)可視化方法的研究[D].天津大學(xué),2009.