齊旭
開源數(shù)據(jù)庫成為一種改變數(shù)據(jù)庫“游戲規(guī)則”的嘗試。近年來,谷歌、蘋果等企業(yè)也在開源數(shù)據(jù)庫領(lǐng)域積極布局。而由云廠商主導(dǎo)的云原生數(shù)據(jù)庫將這種“改變”推向了高潮。6月28日,Garmer發(fā)布的全球云數(shù)據(jù)庫市場份額榜單中,阿里云位居第三,成為游戲規(guī)則的改變者和全球云數(shù)據(jù)庫領(lǐng)跑者之一。7月4日,阿里云智能數(shù)據(jù)庫事業(yè)部負(fù)責(zé)人、達(dá)摩院數(shù)據(jù)庫首席科學(xué)家李飛飛在接受《中國電字報》記者專訪時表示,阿里云高度重視開源數(shù)據(jù)庫的發(fā)展,云原生數(shù)據(jù)庫polarDB等產(chǎn)品對開源社區(qū)具有重要貢獻(xiàn)。
多年實戰(zhàn)經(jīng)驗催生自研阿里云數(shù)據(jù)庫技術(shù)領(lǐng)跑全球市場
記者:阿里云數(shù)據(jù)庫近兩年已進(jìn)入世界各大研究機(jī)構(gòu)榜單的前列,請問你是如何看待阿里云數(shù)據(jù)庫在國際市場定位的?
李飛飛:從Garmer發(fā)布的全球云數(shù)據(jù)庫的市場份額榜單來看,阿里云已經(jīng)位列第三,超越了Oracle、IBM和谷歌。阿里云數(shù)據(jù)庫技術(shù)不僅運用到阿里自身的產(chǎn)品中,還在SIGMOD、ICDE、VLDB等國際頂尖數(shù)據(jù)庫技術(shù)交流會議E宣講,側(cè)面證明阿里云數(shù)據(jù)庫與國際知名云數(shù)據(jù)庫亞馬遜AWS、微軟SQL Server站到了同一高度。
記者:阿里為何自研云原生數(shù)據(jù)庫PolarDB,未來將有怎樣的技術(shù)布局?
李飛飛:隨著移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)的發(fā)展,數(shù)據(jù)量劇增,企業(yè)上云大勢所趨。傳統(tǒng)商業(yè)數(shù)據(jù)庫因昂貴、擴(kuò)展性差、技術(shù)復(fù)雜、迭代慢飽受詬病。云原生數(shù)據(jù)庫天然擁有云計算的彈性能力,兼具開源數(shù)據(jù)庫的易用、開放特點,及傳統(tǒng)數(shù)據(jù)庫的管理和處理性能優(yōu)勢,是云時代下企業(yè)數(shù)據(jù)庫的最佳選擇。
不同于傳統(tǒng)商業(yè)數(shù)據(jù)庫的單節(jié)點和計算、存儲綁定式架構(gòu),PolarDB具有的顯著運行優(yōu)勢為整個開源數(shù)據(jù)庫做出重要貢獻(xiàn)。PolarDB能實現(xiàn)計算與存儲分離、采用分布式共享存儲,大幅提升了數(shù)據(jù)庫的存儲容量和數(shù)據(jù)吞吐量,巧妙解決了分布式事務(wù)處理等技術(shù)難題。此外,PohrDB還具有分鐘級備份恢復(fù)、秒級彈性擴(kuò)容能力,充分兼容MySQL、Oracle、PostgreSQL等架構(gòu)。
客觀來講,目前PohrDB的架構(gòu)也還有改進(jìn)空間。由于分布式共享存儲需要利用RDMA遠(yuǎn)程快速訪問網(wǎng)絡(luò)來實現(xiàn),這就導(dǎo)致該網(wǎng)絡(luò)能夠連接的節(jié)點數(shù)存在上限,在承受巨大并發(fā)量時容易出現(xiàn)問題。
完善后的架構(gòu)將能更好地支持大體量、集中化的事務(wù)處理,實現(xiàn)多寫多讀、跨節(jié)點查詢,事務(wù)處理的復(fù)雜程度大幅降低。
賦能新興信息技術(shù)應(yīng)用看好中國開源社區(qū)生態(tài)
記者:開源技術(shù)對人工智能、大數(shù)據(jù)、云計算、自動駕駛的發(fā)展有何推動作用?
李飛飛:當(dāng)前,人工智能、大數(shù)據(jù)、自動駕駛等新興技術(shù)和系統(tǒng)已經(jīng)發(fā)展到了非常復(fù)雜的程度,如果沒有開源生態(tài)的加持,我很難想象這些新興技術(shù)能發(fā)展到今天的高度。
首先,從供給側(cè)角度來看,開源式數(shù)據(jù)庫的體系架構(gòu)較封閉式的數(shù)據(jù)庫系統(tǒng)能吸引更多有才華的開發(fā)者。參與的人越多,思維碰撞而引發(fā)的迭代演進(jìn)就會越快。對于人工智能、大數(shù)據(jù)、自動駕駛這些極其復(fù)雜的新興技術(shù)和系統(tǒng)來講,任何一家閉源數(shù)據(jù)庫公司的資源和開發(fā)力量都相對有限,技術(shù)需要越來越多的開源人才貢獻(xiàn)力量。
從需求側(cè)角度來看,各個企業(yè)在使用開源系統(tǒng)做人工智能、大數(shù)據(jù)的技術(shù)支撐時,不僅可以免除被閉源系統(tǒng)的技術(shù)綁定,還可以在開源社區(qū)實現(xiàn)數(shù)據(jù)庫技術(shù)遷移,企業(yè)也可進(jìn)行數(shù)據(jù)庫的個性化定制,實現(xiàn)大量的應(yīng)用和代碼改造且系統(tǒng)間互相兼容。
記者:當(dāng)前中國的開源社區(qū)生態(tài)如何?你是否看好PostgreSQL在中國的發(fā)展?
李飛飛:目前,MySQL在中國開源界占主導(dǎo)地位,其次是PostgreSQL,后者體量無法與前者相比,但市場潛力巨大。
這其中有一個有趣的插曲:MySQL是主流的開源軟件架構(gòu),但其被Oracle收購并控股。一方面,Orade將控制MySQL的競爭力,防止MySQL對其超越的可能性;另一方面,Oracle會隨對修改MySQL的開源協(xié)議,導(dǎo)致MySQL正在成為一個相對封閉的開源架構(gòu)。
PostgreSQL的開源協(xié)議相對友好,不受任何一家公司的決策局限,有利于中國基于PostgreSQL發(fā)展自己的生態(tài)、貢獻(xiàn)智慧。此外,較MySQL而言,Post-greSQL對Oracle的兼容性也更好,這對傳統(tǒng)的線下市場、大量Oracle的存量用戶是重大利好,為數(shù)據(jù)庫大量遷移帶來便利。