尹海清姜 雪張瑞杰劉國權曲選輝, 3(1.北京科技大學鋼鐵共性技術協(xié)同創(chuàng)新中心,北京 100083;2.材料基因工程北京市重點實驗室,北京 100083;3.北京科技大學新材料技術研究院,北京 100083)
材料科學數據共享網及其在材料行業(yè)創(chuàng)新發(fā)展中的應用
尹海清1,2姜 雪1, 2張瑞杰1, 2劉國權1, 2曲選輝1, 2, 3
(1.北京科技大學鋼鐵共性技術協(xié)同創(chuàng)新中心,北京 100083;2.材料基因工程北京市重點實驗室,北京 100083;3.北京科技大學新材料技術研究院,北京 100083)
材料科學數據共享網是國家科技部科技基礎條件平臺建設項目,旨在整合我國材料領域的數據資源,建立滿足國家不同需求的材料科學數據體系和材料科學數據共享服務平臺。本文主要闡述材料科學數據共享網項目取得的成果以及材料數據作為加快新材料的研發(fā)、降低材料成本的三大關鍵技術之一,在材料數據科學這一新學科的提出以及支撐虛擬材料設計生產線的建設等方面的應用。
材料數據;材料基因組;數據共享;知識產權;材料數據科學
基于數據的科學發(fā)現已經被認為是繼科學實驗、理論推導、計算機模擬仿真三種科研方式以外的新生的第四種科學研究方式[1]。材料是人類文明和社會發(fā)展的支柱,人類發(fā)展經歷的舊石器時代、新石器時代、青銅器時代、鐵器時代直至現代,材料始終貫穿其中。社會各行業(yè)的飛速發(fā)展需要材料的基礎支撐。隨著材料科學與工程的發(fā)展,以手冊和數據庫等非數字化和數字化形式存儲的數據越來越多。我國非常重視數據庫的建設,對材料數據庫技術的研究開始于20世紀80年代初。當時建成了分布于高校、科研院所和企業(yè)用戶各種各樣、大大小小的材料數據庫。清華大學、北京科技大學、中國地質大學、福州大學等高校,北京航空材料研究院、鋼鐵研究總院、有色金屬研究總院以及中國科學院的金屬研究所、過程工程研究所等科研院所,先后建立了不同材料的數據庫??v觀時代發(fā)展,人們對數據信息的利用越來越迫切,在社會科學等方面取得了突出的效果,對生物醫(yī)學數據的研究及成功應用也成為自然科學研究中的成功案例。而材料基因組計劃的提出與實施,使材料數據為越來越多的材料工作者所認識并關注。本文針對材料數據的特點和需求,結合材料科學數據共享網科學數據共享平臺,從我國材料數據庫的歷史與發(fā)展狀況、材料科學數據共享網項目概況、在新形勢下材料數據的發(fā)展及其應用等方面進行論述。
21世紀初,根據《2004—2010年國家科技基礎條件平臺建設綱要》和《“十一五”國家科技基礎條件平臺建設實施意見》的部署,由國家科技部、財政部共同組織實施,開展國家科技基礎條件平臺建設專項,重點支持6個領域的共享平臺建設,形成包括研究實驗基地和大型科學儀器設備、自然科技資源、科學數據、科技文獻、網絡科技環(huán)境等國家科技基礎條件資源的整合共享,促進全社會科技資源高效配置和綜合利用。其中,科學數據共享平臺的建設,旨在打破條塊分割,對相關部門和行業(yè)長期持續(xù)積累的數據資源以及國家科技計劃項目的數據進行整理、匯交和建庫,構建集中與分布相結合的國家科學數據中心群,提高與國際科學數據組織的信息交換能力,推動面向各類創(chuàng)新主體的共享服務網建設,形成國家科學數據分級分類共享服務體系。
材料科學數據共享網是國家科技基礎條件平臺建設項目,以整合、重構現有的、較為成熟的材料科學數據資源為基礎,構建材料科學數據共享服務平臺,形成材料數據采集提交與存儲、質量控制、開放共享的管理體系。20世紀80年代開始建設的一批材料數據庫,大多數因學科性強、規(guī)模小、數據量少、服務范圍小、缺乏更新等問題而導致無法持續(xù)運行服務,或在網絡上無法找到相應的資源。還有少部分數據庫資源被整合進入了材料科學數據共享網中,如中國科學院金屬研究所的金屬腐蝕數據等,后來匯交入庫進入材料科學數據共享網的有色金屬及其合金數據共享資源結點。為了避免上述問題再次出現,材料科學數據共享網項目建立異構分布、有序共享的材料數據體系,制定符合材料數據特點的共享機制和數據共享相關的標準規(guī)范,并在統(tǒng)一技術標準下,逐步建成面向不同領域服務的共享資源結點和應用主體數據庫群。
2009年,Hey Tony基于Grey Jim的科學發(fā)現第四范式思想,提出數據驅動的數據密集型科學發(fā)現是繼科學實驗、理論推導、計算機模擬仿真三種科研方式以外的新生的第四種科學研究方式[1],這標志著對數據的研究從此進入一個嶄新的階段。
2011年6月,美國發(fā)布了“材料基因組計劃”[2-3]。該計劃是“先進制造伙伴計劃”中的核心內容之一,通過計算、實驗與表征以及材料數據三大工具深度融合,如圖1所示,使新材料從設計到新產品開發(fā)應用全鏈條的進程至少加快1倍,成本至少降低一半。材料基因組計劃(我國稱之為“材料基因工程”)作為一種新的材料學科方法論,被列為我國“十三五”重點研發(fā)專項。材料基因組計劃打破了材料計算的各尺度相對獨立、計算與實驗相對分離,尤其是數據價值不被重視的局面。其中高通量計算、高通量制備與表征的實施,將產生大量數據,使材料數據由海量向大數據的趨勢發(fā)展。
材料數據已經作為材料領域第四種研究方法、材料基因組計劃的工具之一,在2014年德國的“工業(yè)4.0”計劃[4]和2015年我國的“中國制造2025”計劃中成為實現材料智能設計制造的基礎和知識載體。在以材料創(chuàng)新為主體需求的引導下,材料數據進一步顯示出新的特點,主要表現為高通量、海量、跨尺度和復雜多維等,對于材料數據的收集、整合、存儲、查詢檢索、管理、共享以及數據價值的深度開發(fā)都出了新的挑戰(zhàn)。
圖1 材料基因組計劃的基礎架構
材料科學數據共享網項目經過三年的建設期以及后續(xù)的穩(wěn)定服務期,已經從立項時的僅有的一些金屬腐蝕數據,發(fā)展成為目前擁有70余萬條質量可靠的材料數據、擁有近20家高校和科研院所的100余位專兼職建設與服務人員并向全社會免賈開放數據庫和提供免賈服務的材料數據平臺。
材料科學數據共享網的數據,按照項目建設初期確立的材料科學數據資源體系,整合入庫涉及資源體系的所有材料學科數據,形成了材料基礎、黑色金屬、有色金屬及其合金、高分子材料、復合材料、無機非金屬材料、生物醫(yī)用材料、能源材料、信息材料、天然材料及其制品等10個材料數據資源結點以及建筑材料、道路交通材料等2個應用主體庫。其中,黑色金屬和有色金屬及其合金的數據量較大,這是由于金屬材料發(fā)展的歷程以及積累了大量數據的優(yōu)勢。材料科學數據共享網的數據資源呈現物理分布、邏輯統(tǒng)一的格局。
材料科學數據共享網的門戶網站提供涉及2.4萬余種材料的70多萬條數據、材料數據處理工具以及29項材料數據及材料數據庫建設相關的標準規(guī)范草案、5項管理規(guī)章制度和4項材料數據分析評價方法。提供了數據的查詢、檢索、下載,規(guī)范草案的下載,部分數據的處理以及專家咨詢、材料設計與制備的研發(fā)等各項服務,服務的專家涉及參與建設的所有單位的科研技術人員,包括北京科技大學、中國科學院金屬研究所、西北工業(yè)大學、中國科學院化學研究所、北京大學、北京師范大學、鋼鐵研究總院、北京工業(yè)大學、中南大學、中科院上海硅酸鹽研究所、四川大學、北京有色金屬研究總院、中國地質大學、建筑材料工業(yè)技術情報研究所、長安大學、上海電力學院共16家單位,服務覆蓋材料數據資源體系中的所有材料學科,并編制了標準規(guī)范(草案)。
材料科學數據共享網服務平臺在2010年建成上線,向全社會全天候免賈開放并提供數據共享服務,實現了物理分布、邏輯統(tǒng)一的數據庫模式,可以通過中心網站進入分布數據庫,也可以對分布數據庫進行單獨訪問。對中心網站的訪問量呈現逐年遞增的態(tài)勢,如表1所示。截至2015年年底,網站訪問量近24萬次,其中2015年訪問量達到10萬次,較上線后的前幾年有較明顯的增長,其中來自國內的訪問量占總量的93.5%。這一比例也是隨著訪問量的增加而呈現增長的趨勢,較2014年的國內訪問量增長6個百分點。分析其原因,可能一方面在于大數據在社會多方面的應用形成的大數據時代這一社會環(huán)境的影響,另一方面在于材料基因工程相關熱門話題及其討論在我國受到越來越多人的關注,材料數據也成為一個新的研究熱點。對國內不同區(qū)域的訪問情況分析,如表2可以看到:來自北京的用戶訪問量占國內總訪問量的82%,所占比例遠超過其他地區(qū),其原因可能在于北京在高校和科研院所的數量上具有明顯優(yōu)勢,對材料領域的研究覆蓋面較廣,因此,對于由中國工程院和中國科學院發(fā)起的材料基因組計劃的研討中參與人員較多,對不同學科的材料數據的關注、了解與需求量增大,導致瀏覽量的激增。從用戶使用的瀏覽器看,如表3所示,使用最多的三種瀏覽器分別為google、firefox和IE8,利用上述瀏覽器的訪問量占中心網站訪問總量的62%。
除中心網站外,材料科學數據共享網的分布數據源在中心網站的宣傳下,也受到了關注。表4、圖2顯示了部署在沈陽的有色金屬及其合金材料數據資源結點的訪問量與用戶來源情況。2015年上半年訪問量統(tǒng)計約為17.5萬次,較前一年同期略有降低,其中來自中國和美國的用戶占總用戶量的98%以上。
材料科學數據共享網在數據整合入庫與服務用戶的各類需求的同時,逐步建立和完善材料數據集材料數據庫的基礎設施,為材料數據的長期可持續(xù)發(fā)展提供堅實的專業(yè)理論基礎。
(1)材料數據資源體系的確立。由李依依院士等10余位院士和頂級專家討論確立的以師昌緒先生主編的《材料大辭典》[5]和材料領域中長期科技發(fā)展規(guī)劃為基礎的材料數據資源體系,包括材料基礎、金屬材料及特種合金、黑色金屬、復合材料、有機高分子材料、無機非金屬材料、生物醫(yī)用材料、信息材料、能源材料、天然材料及其制品等10大類材料數據。這一材料數據體系,在國際上尚屬首個。多年的建設實踐及與國際同行的交流證明了該材料數據體系的科學性、全面性和權威性,并為今后數據科學在材料領域中的建立奠定了知識體系基礎。
表1 材料科學數據共享網中心網站近兩年的訪問量統(tǒng)計情況
表2 材料科學數據共享網中心網站的國內用戶來源統(tǒng)計
表3 材料科學數據共享網中心網站的用戶瀏覽器統(tǒng)計
(2)依據數據來源的材料數據質量控制。材料科學數據共享網的數據來源包括專業(yè)書籍、工具書、手冊、標準、年鑒、專利數據、期刊論文、學位論文,參加單位的測試數據、熱力學計算數據以及行業(yè)、生產廠家的生產數據等。通過《材料科學數據質量評估標準》(草案)的制定,確定材料數據可靠性分為完全可靠、一般可靠和有待驗證3個等級。不同來源的數據其可靠性不同,通過每條數據標注包含數據的所有來源信息,同時保證數據的可追溯性。
表4 有色金屬及其合金材料數據資源結點的用戶量統(tǒng)計
圖2 有色金屬及其合金材料數據資源用戶來源統(tǒng)計
(3)材料性能數據的分類整理。通過對各類材料性能數據的系統(tǒng)分類研究,將材料性能分為物理、化學、力學、電學、光學、熱學、磁學、電化學等性能、生物學性能以及環(huán)境性能、工藝性能、晶體結構性能與其他性能等13類,共整理了不同類型數據580余個,其中包括163個力學性能、89個物理性能、61個化學性能、48個電學性能等。
(4)材料科學數據提交格式的標準化。通過《材料科學數據提交格式規(guī)范》(草稿)的制定,針對不同來源的數據進行了分類,明確規(guī)定了材料計算數據、實驗數據和生產數據三類數據應包含的全部信息,以滿足材料數據的完整性的根本要求,使材料數據為材料設計和研發(fā)創(chuàng)新服務。
(5)材料數據的知識產權保護。DOI(Digital Objects Identifier)[6],即材料數據數字對象唯一標識符,具有唯一性、永久性、互操作性以及動態(tài)更新等特點,成為數據的“身份證”。通過制定《材料數據對象唯一標識符命名與注冊規(guī)范》(草稿),研究材料數據DOI的注冊機制,制定材料科學數據DOI命名規(guī)范一項,按照材料數據分類體系、數據關鍵信息對材料數據DOI命名進行標準化,保證數據在共享過程中的知識產權保護以及個人利益不被侵害。數字對象唯一標識符成為目前解決數據共享和數據出版的最有效的途徑之一。
自材料科學數據共享網項目實施以來,一直本著“邊建設邊應用”的原則,不斷提高材料數據的整合利用,同時加強材料數據的應用與服務,在國家大型工程的材料選材與結構設計、監(jiān)控及無損檢測,城市基礎設施安全服役,行業(yè)創(chuàng)新發(fā)展的核心技術開發(fā)與工程建設、新材料的設計研發(fā)與應用,國際合作與交流以及科研、教學及人才培養(yǎng)等方面發(fā)揮了重要的支撐作用,平均每年接到來自用戶的直接反饋約8000余件,用戶人群覆蓋高校、科研院所、市政部門、公司企業(yè)等方面。在過去一年多的時間里,材料科學數據共享網為來自不同方面的需求提供了科學而系統(tǒng)的數據服務,典型應用主要有以下幾個方面。
(1)對重大工程選材設計與健康監(jiān)控的支撐
在航天飛行器熱結構設計方面,為北京臨近空間飛行器系統(tǒng)工程研究所承擔的某臨近空間超高速飛行器的機翼前緣等熱結構的材料篩選、結構設計與評價等提供了耐高溫陶瓷基復合材料的基本力學性能、物理性能、700℃~1300℃的高溫力學性能等關鍵性能參數,為實現防熱—結構一體化設計提供了有力的支撐,節(jié)省了項目研究的成本和設計周期。
在復合材料飛機結構損傷監(jiān)測方面,為中國飛機強度研究所開展了飛機結構健康監(jiān)控等研究,提供了聚合物基復合材料的基本力學性能、物理性能數據以及結構損傷監(jiān)測相關的國內外技術標準,為飛機結構健康監(jiān)控系統(tǒng)設計和結構無損檢測提供了有力的支撐。
在大型工程的環(huán)境服役條件下材料設計、壽命預測評估及服役性能檢測方面,基于金屬材料在大氣及不同水域的腐蝕性能數據及各類技術標準,完成了港—珠—澳跨海橋隧等工程在不同氣候條件下的金屬材料的選材及其防腐設計、材料壽命預測及評估、工程施工以及材料在使用過程中的性能監(jiān)測。
(2)對城市基礎設施安全服役的支撐
城市燃氣管網設施的發(fā)展是城市現代化的重要標志,確保城市燃氣管網安全運行更是發(fā)展城市基礎設施安全服役的關鍵性問題。在材料科學數據共享網數據支持下,由北京科技大學與北京市燃氣集團有限責任公司合作研制的城市燃氣管網服役安全信息支撐數據系統(tǒng),建立了管網地理信息數據庫、管道材料數據庫、焊縫材料數據庫、防腐層材料數據庫、土壤環(huán)境數據庫、腐蝕案例庫,為城市燃氣管網的安全檢測、診斷、信息管理、服役安全和預警提供信息化支撐,至今仍是進行首都燃氣管網服役安全評估、確保管網安全運行的重要基礎。
(3)對創(chuàng)新驅動需求牽引的新材料的設計開發(fā)的支撐
基于材料科學數據共享網的稀土金屬與合金基礎數據庫的數據資源,北京工業(yè)大學在硬質合金刀具的研發(fā)和生產中取得突破,成功設計并采用原位合成技術和納米粉末造粒技術,開發(fā)了熱噴涂用納米WC-Co硬質合金復合粉末,并成功制備了煤礦用支撐掩護式液壓支架活塞桿的表面涂層,替代了傳統(tǒng)使用的電鍍硬鉻層,完全滿足了液壓支架活塞桿的表面防護的實際需求,與Praxair公司的國際先進同類產品的涂層相比,磨損速率降低了30%~50%。
(4)對《材料基因工程》重大專項立項的支撐
在美國提出材料基因組計劃后,我國材料科學專家從2011年開始對該計劃進行深入研討,并逐步形成了我國的思想體系,并分別于2013—2014年由中國工程院和中國科學院組織撰寫了材料基因工程重大咨詢項目,其中的建設材料數據庫平臺及數據技術部分就是依托材料科學數據共享網的思想和成果完成的,為材料基因組計劃在我國成功落地起到支撐作用。
(5)對國際合作與交流的支撐
2010年,依托材料科學數據共享網,北京科技大學成功承辦和協(xié)辦了第四屆亞洲材料數據會議,并發(fā)起成立了亞洲材料數據委員會,確立了我國材料數據在亞洲的三強地位,并多次與國際科學技術數據委員會(CODATA)進行深入的交流與探討。
(6)虛擬材料設計生產線
基于材料海量數據的整合、材料的本體、數據的多尺度跨層次無障礙傳輸等形成的虛擬材料設計生產線,是今后“材料+互聯(lián)網”的直接體現,也是工業(yè)4.0思想在材料領域應用的基礎,對于材料基因組計劃提出的新材料研發(fā)進程加快一倍的目標的實現具有強大的助推作用,對于鋼鐵材料等關系國家命脈但目前行業(yè)形勢很不樂觀的領域,無疑是解決當前低端產品產能過剩、同質化嚴重、高端產品性能不穩(wěn)定等問題的方法。這些工作已經成為鋼鐵共性技術協(xié)同創(chuàng)新中心的主體工作之一,以期實現新技術的工程應用。
材料科學數據共享網作為科技基礎條件平臺,是材料科學數據存儲、開放、服務的平臺,不僅基本實現了項目的整合、重構現有材料科學數據資源,建立滿足國家不同需求的跨部門、跨地區(qū)、異構分布、有序共享的材料科學數據體系的建設目標,而且不斷推動材料數據庫成為材料創(chuàng)新的基礎設施和有效工具,并在大數據時代和數據驅動的創(chuàng)新活動中發(fā)揮重要作用。材料科學數據共享網的建設和發(fā)展,有效避免了重復實驗,縮短了材料設計周期,降低了設計與服役評價的成本,創(chuàng)造了巨大的經濟價值,減少了國家的重復投入,同時,有效避免了信息孤島問題,有助于政府決策的及時化和科學化,并且有利于對國際科學數據資源的貢獻和有效利用,分享全人類的科技成果,產生巨大的社會效益。
然而,材料科學數據共享網在發(fā)展過程中,在數據源及數據應用等方面出現的新問題,對于材料數據的發(fā)展來講是極大的挑戰(zhàn),也是材料數據庫今后發(fā)展所面臨的普遍問題,主要表現在以下幾個方面。
(1)材料數據的知識產權屬性及其保護
數據的知識產權屬性在一定程度上給數據共享帶來困難,因此,在一些領域出現了大數據時代沒有數據的狀況。大量的材料數據往往與技術秘密、生產效益和經濟利益密切相關,賦予材料數據很強的知識產權屬性,并隱含著巨大的經濟效益并關乎國家安全。同時,我國關于數據知識產權的界定與保護方面的法律法規(guī)尚不健全與完善,給數據共享帶來相當的難度。
(2)材料數據的整合與工作成果評價
材料領域劃分的學科較多,涉及的材料種類眾多,而材料數據的來源豐富、分布廣泛,難以像氣象和地球等領域的原始數據那樣通過大量儀器自動采集直接獲取。目前,大部分材料數據的獲得是依賴人工的內容理解和數據提取,而且要求采集人員具有較高的領域知識水平。然而,大量的人力投入一方面難以換來高影響因子的文章,另一方面往往無法寫成文章甚至寫成的文章無期刊接收。這對于以論文作為考核指標的高校和科研院所的科研人員來講基本上是無科研成果。這種投入與成果評價的嚴重失衡,難以維持數據整合者的工作熱情。
(3)數據應用服務需求多樣化
材料科學數據共享網立項時的建設目標是在不了解其他類型材料時可以通過跨庫全文檢索來實現材料的跨類型的選材優(yōu)化。然而,隨著經濟的飛速發(fā)展,對材料的創(chuàng)新需求越來越多。一方面,用戶來自材料的不同學科和不同行業(yè),而材料科學數據共享網覆蓋材料領域的各個方面;另一方面,對從材料數據分析中獲得更多信息量的新的需求也越來越高,尤其在材料基因組計劃提出后。但除了材料科學數據共享網的黑色金屬數據共享資源結點中對淬透性的預測中運用了人工神經網絡(ANN)[7]等數據分析技術外,無論國內還是國際上,材料數據庫建設者都未曾涉獵材料數據分析或材料信息學[8]。
針對上述存在問題,總結材料科學數據共享網以及國外有影響力的材料數據庫的建設經驗,今后在材料數據及材料數據庫的建設發(fā)展中,可以在以下幾個方面開展深入研究。
(1)推行材料數據知識產權保護的切實可行的措施
只有明確了成果的知識產權,才能使數據擁有者愿意將自己的成果拿出來共享。積極學習期刊、論文等電子出版物的知識產權保護的相關法律、政策、方法、技術等,明確科學數據知識產權的法律界定,不斷探索數據的知識產權保護,學習并推廣材料數據DOI體系在材料科學數據共享網建設單位中的普及,并對有數據資源的單位和個人加大宣傳,保護材料數據的知識產權。同時,加大數據共享的機理機制建設,為數據共享奠定基礎。
(2)推廣數據出版和數據引用的理念
只有當數據整合這項基礎工作得到全社會,尤其是高校和科研院所的評價體系認可時,才能有更多的人愿意參與到材料數據共享這項工作中來。由國際科學技術數據委員會(CODATA)中方委員會2015年創(chuàng)辦的《中國科學數據》雜志,深入探討了科學數據出版的問題。同時,中國科學技術信息研究所及CODATA中委會等單位,在科學數據引用上也進行了積極的探索與嘗試,希望通過建立數據引用影響因子(Data Citation Index, DCI),最終實現被科研機構評價體系接受的、與SCI同等地位的DCI評價體系。
(3)各類材料數據整合與國家急需材料或熱點話題相關數據整合兩手都要抓
材料科學數據共享網在前期的建設中,已經構建和完善了材料數據知識體系。一方面作為國家基礎設施和資源建設內容,材料數據知識體系覆蓋的內容都要建設;另一方面不斷拓展和深化材料數據,在國家安全和經濟建設中或在熱點專題上做好材料數據整合和推廣應用。在夯實材料數據庫基礎的前提下,不斷以需求為牽引帶動材料數據的快速應用型發(fā)展。
(4)材料數據價值的挖掘與跨學科協(xié)同
科學發(fā)現第四范式的提出,為當今的數據時代指出了新的研究方式,為材料數據的發(fā)展和應用提出了新的思路。材料數據挖掘與知識的深度提取是數據驅動的材料研究,是材料信息學的研究核心,通過不同的技術,研究數據在不同學科、不同研究命題中的深入應用,來發(fā)現新材料、發(fā)掘新規(guī)律等。材料數據的本體[9-10]以及統(tǒng)計分析方法、機器學習方法[11]、神經網絡方法等不同挖掘方法,均是今后需要深入研究并突破的關鍵問題,而這一工作具有典型的交叉學科的特點,對材料、計算機、數學、物理、化學的研究充分融合。依托材料科學數據共享網項目的成果,以及國家十三五專項支持的材料基因工程實施后可能產生的高通量計算和高通量表征數據[12]的分析與挖掘,可以獲得新材料的發(fā)現以及新工藝的突破[13-15],這就要求材料數據庫建設者在數據價值的深度挖掘上需要率先邁出第一步,材料信息學和材料數據科學可能將成為今后材料科學與工程人才培養(yǎng)的重要方向之一。
材料科學數據共享網是國家科技基礎條件平臺建設項目。通過整合大量材料數據,形成了國家級材料數據庫,并通過材料科學數據共享網門戶網站對外發(fā)布,支撐材料選材,加快材料設計與優(yōu)化,對國民經濟建設、國家安全、國家重大工程等方面具有重要意義,避免了材料信息孤島,其系統(tǒng)性和科學性在促進材料基因工程及其材料數據工具發(fā)展方面發(fā)揮指導作用。材料數據在大數據時代正扮演著越來越重要的角色,推動著材料科學創(chuàng)新的縱深發(fā)展,與信息等領域的交叉融合對材料數據工作者提出了更大的挑戰(zhàn)?;诓牧峡茖W數據共享網整合的材料數據的分析與挖掘,將滿足知識的數字化存儲、計算、實驗與表征的交互,同時形成數據驅動的科學發(fā)現研究模式。今后,材料科學數據共享網將繼續(xù)加大數據整合與數據共享的力度,在發(fā)展材料數據科學的同時,加大材料數據的應用潛力的開發(fā),以在材料基因工程等方面實現更深入的應用。
[1] HEY Tony, TANSLEY Stewart, TOLLE Kristin. The fourth paradigm∶ data-intensive scientific discovery[M]. Washington∶ Microsoft Corporation, 2009∶ 109-130.
[2] CHEN Liquan. The materials genome initiative and advanced materials[J]. Engineering, 2015, 413(2)∶ 169-169.
[3] JUAN Pablo J de, BARBARA Jones, CORA Kovacs Lind, et al. The materials genome initiative, the interplayof experiment, theory and computation[J]. Current Opinion in Solid State and Materials Science, 2014(18)∶ 99-117.
[4] NATIONAL ACADEMY OF SCIENCE AND TECHNOLOGY. Recommendations for implementing the strategic initiativeindustrie 4.0[R]. 2013, 4.
[5] 師昌緒. 材料大辭典[M]. 北京∶ 化學工業(yè)出版社,1994.
[6] GORRAIZ Juan, MELERO-FUENTES David,GUMPENBERGER Christian, et al. Availability of digital object identifiers (DOIs) in Web of science and scopus[J]. Journal of Informatrics, 2016, 10(1)∶ 98-109.
[7] 陳蘊博, 左秀榮, 王淼輝, 等. 人工神經網絡在鋼鐵材料研究中的應用[J]. 材料導報, 2009,23(4)∶ 1-3.
[8] RAJAN Krishna. Informatics for materials science and engineering[M]. Netherland∶ Elsevier, 2013.
[9] ASHINO Toshihiro. Materials ontology∶ an infrastructure for exchanging materials information and knowledge[J]. Data Sci. J.,2010,8∶ 54-61.
[10] ZHANG Xiaoming, ZHAO Chongchong, WANG Xiang. A survey on knowledge representation in materials science and engineering∶ An ontological perspective[J]. Computers in Industry, 2015,73∶ 8-22.
[11] CERIOTTI Michele. Machines learn to recognize glasses[J]. Nature, 2016,12∶ 377-378
[12] NOSENGO Nicola. The materials code[J]. Nature,2016,533∶ 22-25.
[13] OLSON B G. Genomic materials design∶ the ferrous frontier[J]. ActaMaterialia, 2013,61∶ 771-781
[14] ALAN A Luo. Material design and development∶ From classical thermodynamics to CALPHAD and ICME approaches[J]. CALPHAD∶ Computer Coupling Of Phase Diagram And Thermo Chemistry, 2015,50∶ 6-22.
[15] AGRAWAL1 Ankit, DESHPANDE D Parijat, CECEN Ahmet, et al. Exploration of data science techniques to predict fatigue strength of steel from composition and processing parameters[J]. Integrating Materials and Manufacturing Innovation, 2014 (3)∶ 3-19.
National Materials Scientific Data Sharing Network and Its Application to Innovative Development of Materials Industries
YIN Haiqing1,2, JIANG Xue1,2, ZHANG Ruijie1,2, LIU Guoquan1,2, Qü Xuanhui1,2,3
(1. Collaborative Innovation Center of Steel Technology, University of Science and Technology Beijing,Beijing 100083; 2. Beijing Key Lab of Materials Genome Initiative, Beijing 100083; 3. Institute of Advanced Materials and Technology, University of Science and Technology Beijing, Beijing 100083)
Materials scientific data sharing network,a scientific data sharing platform in materials science and engineering, is financially supported by the National Science and Technology Infrastructure construction project of Ministry of science and Technology of China, aiming to collect the nationwide materials data resources and construct the materials data system and data sharing and service platform. In this paper, the progresses of materials scientific data sharing network were described, and the application of materials data,one of the three tools of materials innovation, in establishing the materials data science and virtual materials design and production line.
materials data, materials genome, data sharing, intellectual property, materials data science.
TB39
A
10.3772/j.issn.1674-1544.2016.03.009
尹海清*(1971—),女,北京科技大學教授、博士生導師,研究方向:材料數據、粉末冶金;姜雪(1989—),女,北京科技大學講師,研究方向:數據庫;張瑞杰(1977—),男,北京科技大學副教授、碩士生導師,研究方向:材料微觀組織模擬;劉國權(1952—),男,北京科技大學教授、博士生導師,研究方向:材料設計、材料數據;曲選輝(1960—),男,北京科技大學新材料技術研究院院長、教授、博士生導師,研究方向:粉末冶金。
國家科技部科技基條件平臺建設項目“材料科學數據共享網”(2005DKA32800);國家高技術研究發(fā)展計劃“基于材料基因工程的高性能材料設計、制備與表征技術”(863計劃)(2015AA034201);國家自然科學基金項目“微米尺度氧化鋁微型齒輪的微注射成形研究”(51172018);得到美國肯納金屬有限公司的支持。
2015年12月27日。