劉沙
有調(diào)查顯示:如今人類每天都會產(chǎn)生2.5 quintillion bytes的數(shù)據(jù)(quintillion為10的18次方);手機每分鐘都會發(fā)出1600萬條短信;到2020年,全球移動設(shè)備數(shù)量預計將達到100億臺……
大數(shù)據(jù):大機遇+大挑戰(zhàn)
在美光科技亞太區(qū)解決方案架構(gòu)總監(jiān)See Ghee Tan(陳詩義)看來,這些大數(shù)據(jù)是全球的財富,可以在醫(yī)療、交通、制造等多個行業(yè)中幫助人們解決復雜問題。例如通過人工智能和機器學習分析病人的DNA數(shù)據(jù),醫(yī)生可以定制出可能尚未發(fā)現(xiàn)的癌癥治療方案;運用車聯(lián)網(wǎng)技術(shù)分析道路和車輛數(shù)據(jù),可以幫助汽車做出正確的判斷,減少交通事故。
而如此大量的數(shù)據(jù),在蘊藏著巨大機遇的同時,也帶來了巨大的挑戰(zhàn),首先要解決的問題就是該如何有效地存儲和分析這些數(shù)據(jù)?
據(jù)了解,美光科技制造半導體的過程就是一個借助數(shù)據(jù)分析和人工智能提高生產(chǎn)效率的成功實踐。陳詩義向記者介紹,半導體制造是地球上最復雜的工作之一,美光從全球500多個服務(wù)器、8000余個數(shù)據(jù)來源收集了PB量級的數(shù)據(jù),隨后讓數(shù)據(jù)科學家對這些數(shù)據(jù)進行分析,并建立AI和機器學習模型,改進了美光晶圓制造廠的生產(chǎn)過程,不僅能以極高的精確度在極短的時間完成任務(wù),還能探測到熟練工作人員也難以感知到的異常情況。美光科技也憑借這一IT創(chuàng)新獲得了2018年度CIO 100大獎。
“我們的愿景是通過改變世界使用信息的方式,讓生活更加豐富多彩!”陳詩義強調(diào),經(jīng)過40多年的發(fā)展,美光已經(jīng)從一家專門做DRAM的存儲器廠商,逐漸發(fā)展成為提供存儲器和存儲方案的廠商。全球各地的PC和OEM廠商、游戲、汽車和工業(yè)、移動設(shè)備和網(wǎng)絡(luò)設(shè)備、傳統(tǒng)企業(yè)和云計算領(lǐng)域都在應(yīng)用美光的存儲器和存儲方案。
美光9300 系列SSD應(yīng)需而生
如今,美光存儲主要分為兩大產(chǎn)品線,一類是為個人計算機和工作站提供支持的客戶端SSD,一類是滿足不同企業(yè)、不斷變化的IT應(yīng)用和基礎(chǔ)設(shè)施需求的企業(yè)級SSD。
陳詩義告訴記者,企業(yè)市場一直是美光關(guān)注的方向,根據(jù)美光的觀察,近年來,企業(yè)級存儲正呈現(xiàn)出以下趨勢:
一、由于數(shù)據(jù)的海量增長,企業(yè)系統(tǒng)架構(gòu)正在轉(zhuǎn)向使用分布式的基礎(chǔ)設(shè)施;
二、閃存的快速性能在超融合和邊緣計算之間引入了新的連接點,每天有數(shù)十億數(shù)據(jù)進入人工智能、機器學習、深度學習和實時分析領(lǐng)域;
三、企業(yè)需要全新的架構(gòu)支持快速增長的分析項目,服務(wù)器的固態(tài)硬盤容量正在快速增長,企業(yè)需要更高效、容量更大的產(chǎn)品來支撐。
“美光的新系列旗艦產(chǎn)品——美光9300系列SSD就是在這樣的背景下應(yīng)需而生?!泵拦饪萍计髽I(yè)級固態(tài)硬盤高級產(chǎn)品經(jīng)理Cliff Smith介紹,美光9300系列SSD采用PCIe第三代x4 NVMe界面,最高3500MB/s的讀寫速度,15.36TB容量,能以更大的容量為云計算和企業(yè)級市場提供更好的存儲性能,幫助數(shù)據(jù)應(yīng)用密集型公司更快速地訪問和處理數(shù)據(jù),從而縮短回應(yīng)時間。
而美光9300系列SSD之所以采用NVMe協(xié)議,是因為NVMe正在超越SATA和SAS成為企業(yè)級固態(tài)硬盤的首選界面。當今企業(yè)對于部署云基礎(chǔ)設(shè)施的需求正在不斷增加,大量數(shù)據(jù)檢索、處理和快速分析業(yè)務(wù)對存儲的需求也越來越高,在這種需求的驅(qū)動下,許多企業(yè)主存儲都在從SATA界面過渡到NVMe界面。
在談到產(chǎn)品優(yōu)勢時,Cliff Smith為記者列舉了一系列數(shù)據(jù):美光9300系列SSD的性能比一般企業(yè)級SATA SSD快9倍,效率高出35%;與其他NVMe SSD相比,美光9300系列SSD在讀取和寫入方面同等地實現(xiàn)了3.5GB/s的吞吐量(6.4TB以上容量),能為以數(shù)據(jù)為中心的應(yīng)用提供更快的回應(yīng)時間;美光9300系列的功耗比前一代NVMe SSD低28%,有助于降低運營成本,高容量的可用性可讓企業(yè)根據(jù)存儲需求進行擴展,滿足數(shù)據(jù)爆炸式增長的需求;大容量以及最高可達32個NVMe命名空間使企業(yè)能夠更加有效地定制部署,以實現(xiàn)存儲利用效率最大化。
Cliff Smith強調(diào),對于擁有大型數(shù)據(jù)中心的企業(yè)來說,可能需要同時支持成千上百萬客戶的數(shù)據(jù)需求,所以在數(shù)據(jù)輸入和數(shù)據(jù)轉(zhuǎn)換時,數(shù)據(jù)中心的工作負載是非常高的。比較典型的例子是金融領(lǐng)域的高頻交易,對于回應(yīng)時間的要求非常高,甚至每一微秒的價值都能達到成百上千萬美元。
為機器學習加速
除了上述特性,美光9300系列還對各種針對低延遲和性能關(guān)鍵型工作負載進行了優(yōu)化,適用的工作負載包括:人工智能和機器學習中的訓練/緩存、在線事務(wù)處理(OLTP)、高頻交易(HFT)、塊和對象存儲等等。
以機器學習為例。通常,數(shù)據(jù)科學家會將機器學習分為兩步:第一步是準備數(shù)據(jù)并分階段導入硬盤緩存,在這個過程中,需要對數(shù)據(jù)進行獲取、轉(zhuǎn)換、加載和提取;第二部是將數(shù)據(jù)遷移到GPU 中進行學習,即將數(shù)據(jù)導出和訓練。由于對存儲的讀取和寫入有著極高的要求,這兩個步驟通常是順序進行的,而且數(shù)據(jù)科學家們在機器學習時采用的數(shù)據(jù)量都是PB級別、可能來自多個不同的平臺,如果第一次獲得的數(shù)據(jù)不成功,整套步驟就需要不斷地重復進行。
而借助美光9300系列產(chǎn)品,數(shù)據(jù)的獲取、轉(zhuǎn)換、加載和提取這些步驟,與數(shù)據(jù)導出和訓練的步驟可以同時進行,大大提升了處理任務(wù)的速度——比SATA SSD快了7倍,加速了數(shù)據(jù)轉(zhuǎn)化為洞見的速度,讓數(shù)據(jù)實現(xiàn)價值的效率大大提高了。
最后,在談到下一代存儲時,陳詩義表示,對企業(yè)來說最重要的是性價比,因為企業(yè)不同應(yīng)用所需要的存儲性能和企業(yè)愿意為此付出的成本是不一樣的,美光會去研發(fā)貼近客戶需求的產(chǎn)品,了解市場的演變,爭取從中找到一個平衡點,打造出最佳方案。