郭濤
釋放大數(shù)據(jù)的價(jià)值,存儲必須有所改觀。除了大容量、高性能以外,存儲必須與大數(shù)據(jù)平臺對接,并且要通過搜索、分析等工具,打通存儲與業(yè)務(wù)之間的通路。且看業(yè)內(nèi)五大主流大
EMC Isilon:橫向擴(kuò)展 性能突出
大數(shù)據(jù)存儲不是一類單獨(dú)的產(chǎn)品,它有很多實(shí)現(xiàn)方式。EMC Isilon存儲事業(yè)部總經(jīng)理?xiàng)钐m江概括說,大數(shù)據(jù)存儲應(yīng)該具有以下一些特性:海量數(shù)據(jù)存儲能力,可輕松管理PB級乃至數(shù)十PB的存儲容量;具有全局命名空間,所有應(yīng)用可以看到統(tǒng)一的文件系統(tǒng)視圖;支持標(biāo)準(zhǔn)接口,應(yīng)用無需修改可直接運(yùn)行,并提供API接口進(jìn)行面向?qū)ο蟮墓芾?;讀寫性能優(yōu)異,聚合帶寬高達(dá)數(shù)GB乃至數(shù)十GB;易于管理維護(hù),無需中斷業(yè)務(wù)即可輕松實(shí)現(xiàn)動態(tài)擴(kuò)展;基于開放架構(gòu),可以運(yùn)行于任何開放架構(gòu)的硬件之上;具有多級數(shù)據(jù)冗余,支持硬件與軟件冗余保護(hù),數(shù)據(jù)具有高可靠性;采用多級存儲備份,可靈活支持SSD、SAS、SATA和磁帶庫的統(tǒng)一管理。
通過與中國用戶的接觸,楊蘭江認(rèn)為,當(dāng)前中國用戶最迫切需要了解的是大數(shù)據(jù)存儲有哪些分類,而在大數(shù)據(jù)應(yīng)用方面面臨的最大障礙就是如何在眾多平臺中找到適合自己的解決方案。
EMC針對不同的應(yīng)用需求可以提供不同的解決方案:對于能源、媒體、生命科學(xué)、醫(yī)療影像、GIS、視頻監(jiān)控、HPC應(yīng)用、某些歸檔應(yīng)用等,EMC會首推以Isilon存儲為核心的大數(shù)據(jù)存儲解決方案;對于虛擬化以及具有很多小文件的應(yīng)用,EMC將首推以VNX、XtremIO為核心的大數(shù)據(jù)存儲解決方案;對于大數(shù)據(jù)分析一類的應(yīng)用需求,EMC會綜合考慮客戶的具體需求,推薦Pivotal、Isilon等一體化的解決方案。在此,具體介紹一下EMC用于大數(shù)據(jù)的橫向擴(kuò)展NAS解決方案——EMC Isilon,其設(shè)計(jì)目標(biāo)是簡化對大數(shù)據(jù)存儲基礎(chǔ)架構(gòu)的管理,為大數(shù)據(jù)提供靈活的可擴(kuò)展平臺,進(jìn)一步提高大數(shù)據(jù)存儲的效率,降低成本。
EMC Isilon存儲解決方案主要包括三部分:EMC Isilon平臺節(jié)點(diǎn)和加速器,可從單個(gè)文件系統(tǒng)進(jìn)行大數(shù)據(jù)存儲,從而服務(wù)于 I/O 密集型應(yīng)用程序、存儲和近線歸檔;EMC Isilon基礎(chǔ)架構(gòu)軟件是一個(gè)強(qiáng)大的工具,可幫助用戶在大數(shù)據(jù)環(huán)境中保護(hù)數(shù)據(jù)、控制成本并優(yōu)化存儲資源和系統(tǒng)性能;EMC Isilon OneFS操作系統(tǒng)可在集群中跨節(jié)點(diǎn)智能地整合文件系統(tǒng)、卷管理器和數(shù)據(jù)保護(hù)功能。
楊蘭江表示,企業(yè)用戶選擇EMC Isilon的理由可以歸納為以下幾點(diǎn)。第一,簡化管理,增強(qiáng)易用性。與傳統(tǒng)NAS相比,無論未來存儲容量、性能增加到何種程度,EMC Isilon的安裝、管理和擴(kuò)展都會保持其簡單性。第二,強(qiáng)大的可擴(kuò)展性。EMC Isilon可以滿足非結(jié)構(gòu)化數(shù)據(jù)的存儲和分析需求,單個(gè)文件系統(tǒng)和卷中每個(gè)集群的容量為18TB~15PB。第三,更高的處理效率,更低的成本。EMC Isilon在單個(gè)共享存儲池中的利用率超過80%,而EMC Isilon SmartPools軟件可進(jìn)一步優(yōu)化資源,提供自動存儲分層,保證存儲的高性能、經(jīng)濟(jì)性。第四,靈活的互操作性。EMC Isilon支持眾多行業(yè)標(biāo)準(zhǔn),簡化工作流。它還提供了API可以向客戶和ISV提供OneFS控制接口,提供Isilon集群的自動化、協(xié)調(diào)和資源調(diào)配能力。
EMC Isilon大數(shù)據(jù)存儲解決方案已經(jīng)在醫(yī)療、制造、高校和科研機(jī)構(gòu)中有了許多成功應(yīng)用。
方案點(diǎn)評
EMC Isilon是一個(gè)強(qiáng)大但簡單的橫向擴(kuò)展NAS方案,適用于希望投資數(shù)據(jù)管理而不是單純存儲的企業(yè)。當(dāng)初,EMC將收購來的分布式數(shù)據(jù)倉庫軟件廠商Greenplum的軟件與Isilon存儲組合成了EMC最早的大數(shù)據(jù)解決方案。用戶既可以分開選擇Greenplum軟件或Isilon存儲,也可以選擇由Greenplum軟件和Isilon存儲組成的一體機(jī)解決方案。現(xiàn)在,Greenplum軟件雖然已歸Pivotal公司,但EMC是Pivotal的經(jīng)銷商與合作伙伴,Greenplum與Isilon存儲的組合方案并不會因此受到影響。
HDS UCP:統(tǒng)一平臺 應(yīng)用優(yōu)化
HDS中國區(qū)解決方案與專業(yè)服務(wù)事業(yè)部總監(jiān)陳戈認(rèn)為,大數(shù)據(jù)存儲應(yīng)該是一個(gè)解決方案:“大數(shù)據(jù)解決方案是由基礎(chǔ)架構(gòu)的各部件組成的,包含數(shù)據(jù)存儲、計(jì)算和分析,而存儲是此架構(gòu)中的一部分?!?/p>
大數(shù)據(jù)的存儲類型與傳統(tǒng)的存儲類型有一定區(qū)別:在大數(shù)據(jù)存儲中,更多的應(yīng)用是一次寫、多次讀,讀得更多是大數(shù)據(jù)存儲的一個(gè)特點(diǎn),而在傳統(tǒng)的數(shù)據(jù)存儲中,讀寫是隨機(jī)的,由于每個(gè)應(yīng)用不同,其讀寫的比例也是隨機(jī)的;大數(shù)據(jù)存儲需要具有橫向的可擴(kuò)展性,并可支持多種接口、多種數(shù)據(jù)訪問協(xié)議,便于不同數(shù)據(jù)進(jìn)入這個(gè)大數(shù)據(jù)平臺。
談到中國用戶在大數(shù)據(jù)存儲應(yīng)用中最迫切的需求是什么,陳戈認(rèn)為,中國用戶最迫切的需求是如何逐步實(shí)現(xiàn)大數(shù)據(jù)應(yīng)用,即用戶從現(xiàn)有的模式如何過渡到大數(shù)據(jù),如何更好地利用大數(shù)據(jù)進(jìn)行經(jīng)營分析。
大數(shù)據(jù)的經(jīng)典定義可以歸納為四個(gè)“V”,但企業(yè)不可能一步到位實(shí)現(xiàn)四個(gè)“V”,這需要一個(gè)循序漸進(jìn)的過程。海量的、多種類型的數(shù)據(jù)是一次性全部載入到大數(shù)據(jù)中,還是通過現(xiàn)有的平臺進(jìn)行數(shù)據(jù)初選,再導(dǎo)入到大數(shù)據(jù)平臺中,是兩種不同的實(shí)現(xiàn)途徑?!跋韧ㄟ^現(xiàn)有平臺進(jìn)行數(shù)據(jù)初選,再導(dǎo)入到大數(shù)據(jù)平臺,這種方式更適合于客戶逐漸實(shí)現(xiàn)大數(shù)據(jù),可以縮短用戶實(shí)現(xiàn)大數(shù)據(jù)應(yīng)用的時(shí)間?!标惛瓯硎?,“大數(shù)據(jù)主要是非結(jié)構(gòu)化數(shù)據(jù)。用戶可以使用基于對象數(shù)據(jù)存儲的HCP,利用其獨(dú)特的元數(shù)據(jù)采集和智能工具,對非結(jié)構(gòu)化文件數(shù)據(jù)進(jìn)行管理,實(shí)現(xiàn)智能的自動化,這有助于對數(shù)據(jù)進(jìn)行深度分析,幫助客戶從單一系統(tǒng)中存儲、共享、同步、保護(hù)、保存、分析和檢索文件數(shù)據(jù),減少垃圾數(shù)據(jù),進(jìn)而為大數(shù)據(jù)分析建立一個(gè)良好的基礎(chǔ)?!?/p>
談到用戶在大數(shù)據(jù)應(yīng)用中遇到的主要障礙,陳戈表示,一方面,應(yīng)用軟件本身的智能程度是否能滿足行業(yè)應(yīng)用需求,應(yīng)用軟件是否已經(jīng)成型,大數(shù)據(jù)人才是否具備等,是讓大數(shù)據(jù)應(yīng)用落地的關(guān)鍵;另一方面,如何抽取數(shù)據(jù),放在大數(shù)據(jù)平臺中進(jìn)行相應(yīng)的計(jì)算是另一個(gè)關(guān)鍵問題。endprint
HDS可為所有數(shù)據(jù)提供單一、可擴(kuò)展的虛擬化集成平臺。HDS推出了“三步”云戰(zhàn)略,從基礎(chǔ)架構(gòu)、內(nèi)容和信息三個(gè)層面幫助客戶解決目前所遇到的問題。具體來看,通過“基礎(chǔ)架構(gòu)云”,HDS可以幫助客戶進(jìn)行虛擬化和集成管理,實(shí)現(xiàn)數(shù)據(jù)中心的整合;在第二層的“內(nèi)容云”當(dāng)中,HDS可以按需提供內(nèi)容,更可以不受應(yīng)用限制地進(jìn)行數(shù)據(jù)搜索和集成;在第三層的“信息云”中,針對所有數(shù)據(jù)類型,HDS在其存儲平臺中融入了分析功能,使客戶可以從數(shù)據(jù)信息中獲取洞察力。
HDS提供的UCP for SAP HANA集成了基于大量數(shù)據(jù)集的創(chuàng)新和內(nèi)存分析技術(shù),并提供實(shí)時(shí)的洞察力,從而使當(dāng)前的信息驅(qū)動型企業(yè)可以加快其商業(yè)決策的速度。陳戈介紹說,UCP for SAP HANA解決方案結(jié)合了HDS刀片服務(wù)器技術(shù)、企業(yè)級存儲系統(tǒng)和業(yè)內(nèi)領(lǐng)先的網(wǎng)絡(luò)組件,在這樣一個(gè)集成的、高性能的硬件平臺上可以快速交付SAP下一代內(nèi)存計(jì)算技術(shù)。全球已有超過200家客戶在使用HDS和SAP的大數(shù)據(jù)解決方案。
方案點(diǎn)評
其實(shí),HDS的“三步”云戰(zhàn)略也可以看成是其大數(shù)據(jù)戰(zhàn)略。HDS借助以UCP為核心的大數(shù)據(jù)平臺,可以幫助企業(yè)用戶構(gòu)建從基礎(chǔ)架構(gòu)到內(nèi)容歸檔和搜索,直至信息提取和分析的全面、高效的大數(shù)據(jù)解決方案。HDS的“信息云”直接與大數(shù)據(jù)相關(guān)。UCP是一個(gè)集成了計(jì)算、存儲與網(wǎng)絡(luò)的一體化平臺,它既可以提供像一體機(jī)一樣的整合性、簡單性,又可以提供靈活的選擇,連接第三方的設(shè)備組件。HDS還通過與包括SAP在內(nèi)的眾多大數(shù)據(jù)分析類的合作伙伴合作,針對行業(yè)定制優(yōu)質(zhì)的大數(shù)據(jù)解決方案。
HP StoreAll :快速部署 極速搜索
中國惠普有限公司企業(yè)集團(tuán)存儲產(chǎn)品部存儲架構(gòu)師張楠向記者表示,大數(shù)據(jù)存儲是一套解決方案,應(yīng)該能夠?qū)Υ髷?shù)據(jù)的Volume、Velocity、Variety和Value四個(gè)方面提供全面的支持。
第一,大數(shù)據(jù)存儲要支持海量級的數(shù)據(jù)存儲,比如具有PB級的存儲能力。第二,大數(shù)據(jù)存儲要支持更高的存儲速度,支持10Gb甚至更高的網(wǎng)絡(luò)連接。第三,大數(shù)據(jù)存儲要支持?jǐn)?shù)據(jù)的多樣性,如圖片、文本、視頻、音頻等。第四,大數(shù)據(jù)最重要的是價(jià)值的體現(xiàn),而為了實(shí)現(xiàn)這一點(diǎn),存儲本身應(yīng)該具備快速、智能的數(shù)據(jù)檢索能力?!霸诖鎯Φ淖畹讓犹峁┳钪苯?、快捷的數(shù)據(jù)檢索。這一過程簡單說就是,將上層的數(shù)據(jù)挖掘工作下移,充分利用存儲強(qiáng)大的處理能力和數(shù)據(jù)識別能力。”張楠舉例說,“比如,在秒級的單位內(nèi)對數(shù)據(jù)進(jìn)行極速的搜索, 從幾千萬甚至上億個(gè)文件中找到目標(biāo)數(shù)據(jù)?!?/p>
另外,模糊查詢能力也是大數(shù)據(jù)存儲不可缺少的功能。智能的模糊查詢將為大數(shù)據(jù)平臺提供更加便捷的存儲服務(wù)能力,使得存儲更像一臺智能的高速計(jì)算設(shè)備。
目前,很多中國用戶在存儲廠商的引導(dǎo)下,片面追求存儲的大容量和高性能,而忽略了大數(shù)據(jù)存儲本身應(yīng)該提供的其他額外屬性。中國用戶在實(shí)施大數(shù)據(jù)的過程中經(jīng)常遇到的障礙有以下兩方面:第一,無法將存儲與大數(shù)據(jù)平臺進(jìn)行對接;第二,無法充分利用大數(shù)據(jù)存儲的價(jià)值,也很難將其運(yùn)用到實(shí)際的業(yè)務(wù)中。張楠表示,究其原因,主要在于有些大數(shù)據(jù)存儲產(chǎn)品沒有開放的接口協(xié)議,或沒有針對用戶的大數(shù)據(jù)場景進(jìn)行特別優(yōu)化,也沒有用戶容易接受的易用的管理方式等。
惠普在大數(shù)據(jù)方面可以提供軟硬結(jié)合的解決方案?;萜赵谑召廇utonomy公司之后,將其軟件與惠普的硬件平臺進(jìn)行了整合, 形成了一套完整的大數(shù)據(jù)解決方案。張楠介紹說,在存儲方面,惠普擁有像StoreAll這樣的大數(shù)據(jù)存儲平臺。借助HP StoreAll硬件平臺,用戶除了可以實(shí)現(xiàn)海量數(shù)據(jù)的存儲和高速數(shù)據(jù)訪問以外,還能實(shí)現(xiàn)高級的數(shù)據(jù)檢索功能,對特殊文件進(jìn)行快速定位。同時(shí),結(jié)合HP Autonomy軟件的特性,惠普還引入了模糊查詢、智能語義庫等概念,可以幫助企業(yè)用戶通過存儲底層為上層業(yè)務(wù)帶來所需的大數(shù)據(jù)業(yè)務(wù)價(jià)值。
如今,閃存不僅在大數(shù)據(jù)領(lǐng)域,而且在Tier 1存儲市場同樣占據(jù)著十分重要的地位。對于大數(shù)據(jù)平臺來說,閃存可用來提升存儲的存取速度,降低I/O的響應(yīng)時(shí)間等。針對那些I/O壓力十分明確的大數(shù)據(jù)平臺, SSD可以發(fā)揮其效果, 提升存儲的整體性能。但是,SSD并不是萬能的。因?yàn)榇蟛糠值臄?shù)據(jù)都是非結(jié)構(gòu)化的,而非結(jié)構(gòu)化數(shù)據(jù)對I/O的響應(yīng)要求遠(yuǎn)遠(yuǎn)沒有對帶寬的需求大,所以,讓用戶花數(shù)倍的價(jià)格購買SSD存儲在目前來看還是比較困難的。從目前情況看,引入閃存的大數(shù)據(jù)解決方案還不是很普遍。
方案點(diǎn)評
惠普在大數(shù)據(jù)方面收購了兩個(gè)軟件公司Vertica與Autonomy,然后將它們的軟件與原有的硬件平臺進(jìn)行整合,針對結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)都可以提供針對性的解決方案?;萜赵趯⒋髷?shù)據(jù)軟件與存儲硬件結(jié)合上也進(jìn)行了嘗試,其中一個(gè)成功的例子就是HP StoreAll大數(shù)據(jù)存儲平臺。HP StoreAll具有以下特點(diǎn):橫向擴(kuò)展,最大可以擴(kuò)展到16TB;集成HP Autonomy搜索引擎,可以快速搜索,實(shí)現(xiàn)實(shí)時(shí)大數(shù)據(jù)的價(jià)值;內(nèi)置對OpenStack的支持,可快速部署;支持文件和對象類型的數(shù)據(jù)存儲。
NetApp:統(tǒng)一架構(gòu) 無限擴(kuò)展
如今,企業(yè)若想獲得成功,就必須想方設(shè)法應(yīng)對具有前所未有的復(fù)雜性、高性能的海量數(shù)據(jù),并盡可能地管理這些數(shù)據(jù),從中發(fā)掘更大的商業(yè)價(jià)值。
對于國內(nèi)用戶來說,無論企業(yè)的規(guī)模和數(shù)據(jù)量大小如何,運(yùn)用大數(shù)據(jù)的關(guān)鍵在于,企業(yè)是否把大數(shù)據(jù)作為一個(gè)真正的工具,去體現(xiàn)企業(yè)的差異化,從而提升競爭力。隨著越來越智慧的企業(yè)信息化的發(fā)展,IT不再是束縛企業(yè)發(fā)展的瓶頸,而是真正地融入了企業(yè)自身的業(yè)務(wù)中。越來越多的公司將大數(shù)據(jù)成功地運(yùn)用于企業(yè)的商業(yè)模式。例如,在歐美,很多企業(yè)已經(jīng)著手將大量資源投放在大數(shù)據(jù)領(lǐng)域。反觀國內(nèi),在金融領(lǐng)域,有為數(shù)不少的企業(yè)通過大數(shù)據(jù)的分析工具來分析金融的走勢,實(shí)現(xiàn)風(fēng)險(xiǎn)管理,進(jìn)行信用卡的追蹤等。此外,像零售、制造、電信等行業(yè)也已在嘗試?yán)么髷?shù)據(jù)分析工具為企業(yè)營銷和決策提供支撐。endprint
無論企業(yè)現(xiàn)在是否正在使用大數(shù)據(jù)工具,企業(yè)都應(yīng)全面地考慮自身未來發(fā)展的需求,選擇一個(gè)廠家的平臺與之共同發(fā)展,這可以有效避免因數(shù)據(jù)和應(yīng)用遷移帶來的麻煩。
在大數(shù)據(jù)方面,NetApp能夠幫助企業(yè)實(shí)現(xiàn)數(shù)據(jù)管理,應(yīng)對業(yè)務(wù)挑戰(zhàn)的極限,將以數(shù)據(jù)為導(dǎo)向的洞察轉(zhuǎn)化為有效行動。若想將數(shù)據(jù)轉(zhuǎn)化為商機(jī),僅僅提升管理能力是不夠的,需要徹底轉(zhuǎn)變數(shù)據(jù)和業(yè)務(wù)之間的聯(lián)系模式。NetApp可以幫助企業(yè)用戶持續(xù)管理數(shù)據(jù),迅速把握意料之外的新商機(jī),永久保存所有數(shù)據(jù),并在靈活、開放的存儲平臺之上打造屬于企業(yè)自己的大數(shù)據(jù)解決方案。
NetApp提供了可高效處理、分析、管理和訪問大規(guī)模數(shù)據(jù)的大數(shù)據(jù)解決方案。NetApp的解決方案組合可劃分為分析、帶寬和內(nèi)容三個(gè)主要用例,這被稱之為大數(shù)據(jù)的“ABC”基本要素。
具體來看,分析(Analysis)是指針對極大數(shù)據(jù)集的高效分析。NetApp分析解決方案就是幫助用戶深入了解和利用數(shù)字世界,將數(shù)據(jù)轉(zhuǎn)化為高質(zhì)量的信息,以及提供關(guān)于業(yè)務(wù)的更深入見解,從而幫助企業(yè)做出更好的決策。
帶寬(Bandwidth)是指適用于數(shù)據(jù)密集型工作負(fù)載的性能。此類解決方案著重于為速度非??斓墓ぷ髫?fù)載提供更高的性能。高帶寬應(yīng)用包括高性能計(jì)算(能以極快的速度執(zhí)行復(fù)雜的分析)、用于監(jiān)控和任務(wù)規(guī)劃的高性能視頻流、媒體和娛樂領(lǐng)域中的視頻剪輯和播放。
內(nèi)容(Content)是指無限的安全數(shù)據(jù)存儲。此類解決方案著重于滿足可擴(kuò)展的安全數(shù)據(jù)存儲需求。內(nèi)容解決方案必須支持存儲的無限擴(kuò)展能力,以便企業(yè)可以根據(jù)需要存儲任意多的數(shù)據(jù),并能在需要時(shí)找到所需的數(shù)據(jù)。
NetApp致力于通過一系列解決方案來提供高性能的運(yùn)算和大數(shù)據(jù)的應(yīng)用。2013年11月,NetApp再次更新了E系列家族產(chǎn)品,推出E2700和E5500。該系列產(chǎn)品采用可輕松擴(kuò)展的設(shè)計(jì),適用于要求99.999%的可靠性且穩(wěn)定、高性能的工作負(fù)載。
用戶在采購大數(shù)據(jù)存儲產(chǎn)品時(shí),需要注意以下五個(gè)方面的問題:大數(shù)據(jù)存儲必須具有向上擴(kuò)展與向外擴(kuò)展的能力;架構(gòu)必須是針對工作負(fù)載進(jìn)行優(yōu)化的,具有實(shí)時(shí)處理能力;具有整合的數(shù)據(jù)保護(hù)功能;保證7×24小時(shí)運(yùn)行不中斷,可在線進(jìn)行容量擴(kuò)展,實(shí)施數(shù)據(jù)遷移等;可以實(shí)現(xiàn)服務(wù)的自動化。
方案點(diǎn)評
NetApp的技術(shù)優(yōu)勢集中體現(xiàn)在其統(tǒng)一存儲平臺上,從入門級產(chǎn)品到企業(yè)級產(chǎn)品,全部基于同一個(gè)體系架構(gòu)和操作系統(tǒng),不僅部署和使用方便,而且升級和擴(kuò)展非常簡單。當(dāng)初,NetApp收購LSI Engenio,其中一個(gè)重要的原因就是為了大數(shù)據(jù)。2013年,NetApp不斷更新E系列產(chǎn)品線,推出E2700和E5500等。E5500可以支持高IOPS混合工作負(fù)載和數(shù)據(jù)庫、高性能文件系統(tǒng)和帶寬密集型流等應(yīng)用,可確保數(shù)據(jù)的高可用性、完整性和安全性。
曙光XData:高度集成 貼近行業(yè)
關(guān)于大數(shù)據(jù)存儲,目前業(yè)界沒有一個(gè)通用的定義。曙光信息產(chǎn)業(yè)股份有限公司總裁助理兼存儲產(chǎn)品線產(chǎn)品總監(jiān)惠潤海從曙光大數(shù)據(jù)平臺和解決方案角度,概括出大數(shù)據(jù)存儲的主要特征。
首先,大數(shù)據(jù)存儲必須支持全類型數(shù)據(jù), 包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)數(shù)據(jù),實(shí)現(xiàn)統(tǒng)一數(shù)據(jù)支持。
其次,存儲性能上,一方面,大數(shù)據(jù)存儲要支持海量數(shù)據(jù),并且要在保證數(shù)據(jù)可靠性的基礎(chǔ)之上,實(shí)現(xiàn)容量與性能的線性擴(kuò)展;另一方面,為了實(shí)現(xiàn)大數(shù)據(jù)的價(jià)值,批處理和實(shí)時(shí)處理兩種措施都需要高性能的數(shù)據(jù)訪問獲取能力。
最后,在系統(tǒng)達(dá)到一定規(guī)模之后,系統(tǒng)的易用性和可管理性也是不可或缺的。
從應(yīng)用角度來說,目前中國用戶在大數(shù)據(jù)存儲應(yīng)用中最迫切的需求,是如何真正實(shí)現(xiàn)用戶數(shù)據(jù)的價(jià)值,如何驅(qū)動業(yè)務(wù)發(fā)展,實(shí)現(xiàn)決策和運(yùn)營。“從系統(tǒng)構(gòu)建層面說,要實(shí)現(xiàn)數(shù)據(jù)高性價(jià)比的存儲和管理,同時(shí)滿足數(shù)據(jù)服務(wù)的相關(guān)需求。”惠潤海表示。
針對用戶對大數(shù)據(jù)存儲的需求, 曙光推出了像大數(shù)據(jù)一體機(jī)這樣的全類型數(shù)據(jù)分析型產(chǎn)品,同時(shí)還基于該產(chǎn)品構(gòu)建了基于行業(yè)的解決方案,以幫助用戶實(shí)現(xiàn)大數(shù)據(jù)落地。
“除此之外, 我們還提供了大數(shù)據(jù)統(tǒng)一數(shù)據(jù)中心解決方案, 涵蓋了像主攻事物處理的DS900、DS800,以及針對文件存儲的Parastor等存儲產(chǎn)品。我們基于這些存儲產(chǎn)品構(gòu)建了大數(shù)據(jù)運(yùn)營管理平臺?!被轁櫤=榻B說,“曙光的優(yōu)勢不僅在于可以提供全面的產(chǎn)品支撐,更重要的是能夠提供數(shù)據(jù)生命周期過程服務(wù)支持。目前,我們提供的免費(fèi)維保期限為5年?!?/p>
曙光開發(fā)了針對不同行業(yè)和應(yīng)用場景的大數(shù)據(jù)存儲解決方案。以金融行業(yè)為例,目前國內(nèi)四大行的應(yīng)用系統(tǒng)每年產(chǎn)生的非結(jié)構(gòu)化數(shù)據(jù)量已達(dá)到PB級,結(jié)構(gòu)化數(shù)據(jù)也以百TB計(jì)。面對如此大量的數(shù)據(jù),如何存儲、管理、利用和盤活它們呢?惠潤海認(rèn)為,只有通過商業(yè)智能和高級分析應(yīng)用解決方案才能將數(shù)據(jù)的價(jià)值最大程度地發(fā)揮出來。
針對金融行業(yè)用戶的需求,曙光開發(fā)的XData大數(shù)據(jù)解決方案利用優(yōu)化的大數(shù)據(jù)處理技術(shù),對文件管理、歷史數(shù)據(jù)查詢和數(shù)據(jù)分析類應(yīng)用等進(jìn)行深入研究,為數(shù)據(jù)爆炸式增長帶來的海量數(shù)據(jù)存儲及分析應(yīng)用提供高可靠的解決方案。
曙光金融行業(yè)XData大數(shù)據(jù)解決方案采用曙光自主研發(fā)的SN-MPP并行數(shù)據(jù)庫,同時(shí)結(jié)合大數(shù)據(jù)處理事實(shí)標(biāo)準(zhǔn)Hadoop,并充分考慮了多方面的數(shù)據(jù)收集,加入ETL工具和連接驅(qū)動器,提供了類SQL的接口,還和現(xiàn)有金融業(yè)務(wù)系統(tǒng)進(jìn)行對接。
針對金融行業(yè)歷史數(shù)據(jù),XData大數(shù)據(jù)解決方案在方案設(shè)計(jì)上主要考慮了數(shù)據(jù)的安全性、歷史數(shù)據(jù)高效導(dǎo)入、快速訪問與分析報(bào)表。曙光金融行業(yè)大數(shù)據(jù)解決方案立足于基礎(chǔ)平臺建設(shè),同時(shí)切實(shí)貼合金融行業(yè)用戶需求,提供了優(yōu)質(zhì)的軟硬一體化解決方案,為用戶一攬子解決了部署、業(yè)務(wù)移植開發(fā)等技術(shù)難題,幫助用戶跨過應(yīng)用門檻。
方案點(diǎn)評
曙光不僅有像Parastor這樣的大型并行處理存儲系統(tǒng),而且推出了業(yè)內(nèi)流行的大數(shù)據(jù)一體機(jī)XData,給用戶提供了多種選擇。XData大數(shù)據(jù)一體機(jī)將軟硬件性能最大化,同時(shí)降低了整體擁有成本,縮短了項(xiàng)目周期, 減少了項(xiàng)目風(fēng)險(xiǎn)。曙光針對不同行業(yè)的特定需求,推出了定制化的大數(shù)據(jù)解決方案,覆蓋金融、電信、交通、醫(yī)療、教育、軍工、衛(wèi)星遙感等領(lǐng)域,通過自身大數(shù)據(jù)平臺上豐富的接口,與各行業(yè)的應(yīng)用相集成,提供高效和個(gè)性化的數(shù)據(jù)分析服務(wù),挖掘數(shù)據(jù)價(jià)值。endprint