“一個人的基因總和是6×1023字節(jié),誰還有這么大的數(shù)據(jù)?沒有!我們每個人身體所攜帶的信息,比現(xiàn)在世界上已知信息的總和還要多?!比A大基因董事長汪建說。根據(jù)IDC的預測,到2020年,全球數(shù)據(jù)總量為40ZB(4×1023字節(jié)),人均5247GB。
“在此之前,國內(nèi)所有的大數(shù)據(jù)活動從未邀請我們參加,我們感到很不平衡。”汪建說,“人們常說低價值是大數(shù)據(jù)的特征之一,而我們研究的基因是高價值,人的生老病死都在這些數(shù)據(jù)里面?!钡拇_,小到生命個體的音容笑貌、生老病死,大到社會發(fā)展乃至人類繁衍生息,還有比這更有價值的事情嗎?汪建的演講不僅講述了信息技術(shù)與生物技術(shù)結(jié)合展現(xiàn)出的廣闊應用前景,更重要的是言語之間傳遞出的科技應該普惠民生的人文精神?;虻膬r值唯有通過信息技術(shù)才能挖掘出來。華大基因成立十多年后,汪建發(fā)現(xiàn)華大基因的數(shù)據(jù)產(chǎn)出量,每兩年都要在其后面增加一個0,增長速度遠遠超過摩爾定律的每兩年晶體管集成度增加1倍?!盎驕y定過去很長時間都是跑在我們自己的計算機上,到了后來扛不住了?!蓖艚ㄕf,“‘天河一號曾經(jīng)名列全球超級計算機500強第一名,華大基因在‘天河一號中的使用率達到50%,半個多月前啟動的‘天河二號有8000個CPU節(jié)點,我們預定了3000個?!?/p>
特立獨行的汪建認為,當前大數(shù)據(jù)的目標都太大,而“我們的目標很小也很簡單,就是健康長壽、不病不傻,我的健康我做主,生老病死我掌握”。汪建說:“12年前,我的血液分離出來都是白色的,高血脂、高血壓、冠心病集于一身,基本上屬于無可救藥了。經(jīng)過分析,又發(fā)現(xiàn)我的基因包含:出生缺陷、心腦血管及猝死相關(guān)基因、腫瘤易感基因、酗酒嗜煙基因、老年癡呆基因、藥物敏感基因?!比欢?,汪建卻身“殘”志堅,在56歲那一年,成功登頂珠峰,成為國內(nèi)登頂珠峰最年長的登山隊員。汪建的秘密在于“從不吃任何保健藥,而是定期檢測體內(nèi)激素、維生素和氨基酸的水平,缺什么就補什么。”
根據(jù)衛(wèi)生部2012年發(fā)布的《中國出生缺陷防治報告》,目前我國出生缺陷發(fā)生率在5.6%左右,每年新增出生缺陷數(shù)約為90萬例。出生缺陷首先是給家庭帶來不幸,其次也影響到社會的發(fā)展?!皬V東省貧困人口中一半是因病致貧或者返貧,”汪建說,“如果我們將癌癥早期發(fā)現(xiàn)率提前1年,那么病人5年的存活率至少可以提高2~3倍??刂瞥錾毕?、預防心腦血管疾病、腫瘤個體化治療、抵抗衰老乃至女性美容,哪一個不是價值成千上萬億元的產(chǎn)業(yè)?”
大部分精力放在慈善事業(yè)的蓋茨,曾經(jīng)多次拜訪華大基因。第一次拜訪時,汪建對西裝革履的蓋茨說,華大基因有個不許穿西裝更不許打領帶的規(guī)定。于是,從第二次開始,蓋茨入鄉(xiāng)隨俗?!拔覀冏疃桃淮握劻?個小時,最長交流了6個小時,雙方簽訂了16項重要合同?!蓖艚ㄕf,“我跟蓋茨說,我們不要你的錢,你提出一個項目,雙方各出一半的錢,共同為人類做點事情?!?/p>
貴州省黔西南是我國的基因?qū)殠?,具有民族多樣性和生物多樣性,是疾病研究的寶貴資源?!扒髂仙絽^(qū)的遺傳性疾病有其多樣性和特殊性,我們能夠控制黔西南的遺傳性疾病,我們就能控制中國其他山區(qū)的遺傳性疾病,我相信也可通過蓋茨推廣到全世界去控制這些遺傳性疾病?!蓖艚ㄕf,“貴州是生態(tài)寶地,好山好水好地方,養(yǎng)身養(yǎng)水養(yǎng)健康。我們依靠創(chuàng)新驅(qū)動,依靠服務民生,建立一個新的集聚區(qū),來共同減少出生缺陷、腫瘤和心腦血管病。這三類疾病加在一起對人類健康和生死的影響率達80%,如果我們在這80%上對人類有所貢獻,我們就不會愧對一生。華大做任何事情都是從個人開始的,我想這樣的結(jié)果一定是有利于一個地方的發(fā)展,有利于一個城市的發(fā)展,也會有利于一個國家的發(fā)展。用基因科技造福人類,是我們最大的愿望?!蓖艚ū硎?。
當今,經(jīng)歷了實驗科學、理論推演、計算機仿真后,科學研究正進入第四范式——數(shù)據(jù)密集型科學發(fā)現(xiàn)。華大基因在智惠民生、產(chǎn)業(yè)報國的同時,也在科學研究上碩果累累,多次在《自然》、《科學》等權(quán)威雜志上發(fā)布文章,從而成為科學研究第四范式的范例之一。endprint