何云飛 王 浩 黃 亮
(作者單位:遵義市廣播電視臺)
集群存儲實現(xiàn)海量備播數(shù)據(jù)管理
何云飛 王 浩 黃 亮
(作者單位:遵義市廣播電視臺)
摘 要:本文分析了備播系統(tǒng)的現(xiàn)狀,提出建設(shè)新一代集群存儲平臺作為備播內(nèi)容存儲,并介紹使用集群存儲實現(xiàn)對海量備播數(shù)據(jù)管理所帶來的好處。
關(guān)鍵詞:集群存儲;備播內(nèi)容存儲;數(shù)據(jù)管理
以往,電視臺節(jié)目生產(chǎn)與播出業(yè)務(wù)受傳統(tǒng)技術(shù)模式的限制,播出系統(tǒng)備播工作流程主要是基于效率底下的節(jié)目磁帶庫作為近線存儲,節(jié)目素材從本地上載到播出服務(wù)器,人工將播后素材再遷移到帶庫,無法直觀地統(tǒng)一管理備播素材。
近年來,隨著電視臺網(wǎng)絡(luò)化制播系統(tǒng)的建設(shè)發(fā)展,節(jié)目的播出業(yè)務(wù)模式發(fā)生了根本的改變,我國電視節(jié)目備播系統(tǒng)正在向網(wǎng)絡(luò)化、文件化以及流程化的業(yè)務(wù)系統(tǒng)發(fā)展。而隨著高標清同播業(yè)務(wù)需求,按照標清播出文件的碼率為12Mb/ s,高清播出文件的碼率為50Mb/s來計算,每小時高標清同播的素材大小為62×3600/8=27.9GB。傳統(tǒng)的在線存儲空間早已不能滿足日益增長的海量備播節(jié)目數(shù)據(jù)的存儲需求,因此,建設(shè)集中的后臺集群存儲作為備播業(yè)務(wù)支撐是非常有必要的,可以更有效率地完成播出素材的上載工作,安全穩(wěn)定地保障備播區(qū)域素材到播出服務(wù)器的遷移工作,方便直觀地開展播后素材管理以及重播、重審工作。
但是海量的備播數(shù)據(jù)爆炸式的增長向集中的集群存儲數(shù)據(jù)管理方式提出了挑戰(zhàn),一方面要應(yīng)對數(shù)據(jù)容量的不斷擴充,另一方面需要確保所有有效數(shù)據(jù)的高安全性和可管理性。
2.1集群基礎(chǔ)架構(gòu)
集群存儲平臺系統(tǒng)主要由元數(shù)據(jù)服務(wù)器集群、存儲服務(wù)器集群兩大部分組成。元數(shù)據(jù)服務(wù)器集群管理文件系統(tǒng)的元數(shù)據(jù),管理整個存儲系統(tǒng)的命名空間,對外提供單一的系統(tǒng)映像。存儲服務(wù)器集群存儲用戶的實際數(shù)據(jù),是整個集群存儲系統(tǒng)的存儲資源提供者。整個集群按大模塊分類可以分為以下三個部分。
元數(shù)據(jù)服務(wù)器(Metadata Server,簡稱MDS)。元數(shù)據(jù)是集群存儲的核心,文件的地址、基本屬性、列表、一致性維護、負載均衡和副本等信息都存儲在元數(shù)據(jù)服務(wù)器上,讀寫文件時能提供高效的信息隨機訪問。
存儲服務(wù)器節(jié)點(Data Server)。存儲節(jié)點僅提供單純的存儲服務(wù),功能較簡單,應(yīng)用客戶端根據(jù)元數(shù)據(jù)反饋給它的設(shè)備信息和偏移信息直接和存儲節(jié)點建立通信存取數(shù)據(jù)。
應(yīng)用客戶端(Client)。此模塊安裝在需要訪問集群存儲的服務(wù)器或PC上,負責提供統(tǒng)一視圖的存儲空間給服務(wù)器(Windows服務(wù)器看到如同新增一個本地硬盤,Linux新增一個掛載目錄),同時負責跟元數(shù)據(jù)服務(wù)器交互元數(shù)據(jù)屬性信息,跟存儲節(jié)點交互數(shù)據(jù)流。
2.2元數(shù)據(jù)工作原理
(1)為了提高元數(shù)據(jù)的安全性,元數(shù)據(jù)服務(wù)器總是成對出現(xiàn)的,每臺元數(shù)據(jù)服務(wù)器上存放的元數(shù)據(jù)信息metadata在設(shè)計時又被拆分為metadata1(M1)和metadata2(M2)兩部分。(2)元數(shù)據(jù)服務(wù)器MDS2提供M1的服務(wù)、M2的備份;元數(shù)據(jù)服務(wù)器MDS1提供M2的服務(wù)、M1的備份。(3)元數(shù)據(jù)服務(wù)器MDS1既提供M1的服務(wù),又提供M2的服務(wù);元數(shù)據(jù)服務(wù)器MDS2作為備份服務(wù)器。(4)元數(shù)據(jù)服務(wù)器MDS2既提供M1的服務(wù),又提供M2的服務(wù);元數(shù)據(jù)服務(wù)器MDS1作為備份服務(wù)器。
默認情況下,元數(shù)據(jù)服務(wù)器1提供metadata1的服務(wù),元數(shù)據(jù)服務(wù)器2提供metadata2的服務(wù),假如元數(shù)據(jù)服務(wù)器2異常離線或服務(wù)關(guān)閉,用戶在訪問客戶端(客戶端有讀/寫操作)時,metadata2的服務(wù)會自動切換到元數(shù)據(jù)服務(wù)器1上。元數(shù)據(jù)服務(wù)器2啟動恢復服務(wù)后,元數(shù)據(jù)服務(wù)器1上的數(shù)據(jù)會自動同步到元數(shù)據(jù)服務(wù)器2上,保證了主備元數(shù)據(jù)的一致性和冗余性。
3.1系統(tǒng)容量擴展
由于備播節(jié)目數(shù)據(jù)量在非結(jié)構(gòu)化大數(shù)據(jù)時代背景下指數(shù)增長,未來系統(tǒng)所需容量難以預(yù)估,初步部署時可預(yù)估兩年內(nèi)容量進行部署。集群系統(tǒng)支持Scale-Out的擴展方式,保證整個系統(tǒng)的擴展非常平滑,任何存儲節(jié)點可以在線地添加和刪除,相應(yīng)地可以在線擴容和縮小容量。添加或刪除節(jié)點后,存儲節(jié)點上的數(shù)據(jù)會均勻分布到每一個節(jié)點。
3.2數(shù)據(jù)讀寫性能
集群存儲可以使用全臺網(wǎng)備播系統(tǒng)現(xiàn)有的以太網(wǎng)環(huán)境,總帶寬達到2.2GB/ s以上,部署萬兆+千兆工作站及服務(wù)器的高速交換網(wǎng)絡(luò)。單存儲節(jié)點的64M分配機制可保證同時多硬盤的讀寫,加上分布式文件調(diào)度的多節(jié)點同時讀寫,使所有的存儲服務(wù)器上的磁盤性能和網(wǎng)絡(luò)帶寬都可以同時得到充分的利用,這樣集群存儲系統(tǒng)的聚合帶寬由多臺存儲服務(wù)器上的IO帶寬相加而成,從而克服了NAS的單一出口點所造成性能瓶頸,可以滿足高速度素材送播。
3.3數(shù)據(jù)安全性
硬件方面,所有元數(shù)據(jù)服務(wù)器和存儲節(jié)點都采用冗余部件,如電源、風扇、網(wǎng)絡(luò)接口等,具有較強的可靠性。集群系統(tǒng)至少有兩臺元數(shù)據(jù)服務(wù)器,這兩臺元數(shù)據(jù)服務(wù)器采用雙機熱備模式,實時雙向同步元數(shù)據(jù)信息,任何一臺元數(shù)據(jù)服務(wù)器節(jié)點故障/宕機都不會造成數(shù)據(jù)的丟失。存儲節(jié)點之間可選擇采用粗粒度副本、條帶化副本、網(wǎng)絡(luò)糾刪碼等多種數(shù)據(jù)安全策略,任何一個磁盤故障甚至存儲節(jié)點故障/宕機都不會導致數(shù)據(jù)的丟失。