黃小猛 鄭飛 楊犇 穆斌 周勇 羅京佳
1 清華大學(xué)地球系統(tǒng)科學(xué)系, 北京 100084
2 中國(guó)科學(xué)院大氣物理研究所, 北京 100029
3 南京大學(xué)大氣科學(xué)學(xué)院, 南京 210023
4 同濟(jì)大學(xué)軟件學(xué)院, 上海 200092
5 中國(guó)氣象局氣象發(fā)展與規(guī)劃院, 北京 100081
6 南京信息工程大學(xué)大氣科學(xué)學(xué)院, 南京 210044
2021 年以來(lái),作為國(guó)家自然科學(xué)基金委員會(huì)(簡(jiǎn)稱自然科學(xué)基金委)的改革試點(diǎn),根據(jù)“源于知識(shí)體系邏輯結(jié)構(gòu)、促進(jìn)知識(shí)與應(yīng)用融通、突出學(xué)科交叉融合”的原則,對(duì)接地球科學(xué)部倡議的“宜居地球”頂層戰(zhàn)略,堅(jiān)持“問(wèn)題導(dǎo)向”,大氣科學(xué)學(xué)科(簡(jiǎn)稱大氣學(xué)科)進(jìn)行了資助布局改革。大氣數(shù)據(jù)與信息技術(shù)研究是發(fā)展大氣科學(xué)的重要“支撐技術(shù)”,為了促進(jìn)科技創(chuàng)新、落實(shí)改革要求、優(yōu)化學(xué)科布局,自然科學(xué)基金委對(duì)“D0510 大氣數(shù)據(jù)與信息技術(shù)”(簡(jiǎn)稱D0510)的研究方向及關(guān)鍵詞進(jìn)行了優(yōu)化調(diào)整,重點(diǎn)提高了申請(qǐng)代碼的包容性和覆蓋面,強(qiáng)調(diào)“卡脖子”關(guān)鍵技術(shù)和潛在“顛覆性”引領(lǐng)技術(shù)的創(chuàng)新(劉哲等, 2020)。
本文對(duì)新編D0510 研究方向及關(guān)鍵詞進(jìn)行解讀,旨在幫助相關(guān)領(lǐng)域科研人員選報(bào)項(xiàng)目、開(kāi)展合作,共同致力于大氣數(shù)據(jù)與信息技術(shù)學(xué)科方向新技術(shù)新方法的研究,激勵(lì)原始創(chuàng)新,拓展科學(xué)前沿,促進(jìn)交叉融合,對(duì)接國(guó)家需求。
近些年來(lái),在衛(wèi)星/雷達(dá)觀測(cè)、超級(jí)計(jì)算、云計(jì)算和物聯(lián)網(wǎng)等信息技術(shù)的推動(dòng)下,大氣數(shù)據(jù)呈現(xiàn)爆炸式增長(zhǎng),數(shù)據(jù)資源的內(nèi)涵不斷豐富、外延不斷拓展,數(shù)據(jù)向精細(xì)化、體系化、集約化、智能化發(fā)展的趨勢(shì)日益明顯。2022 年4 月,國(guó)務(wù)院印發(fā)的《氣象高質(zhì)量發(fā)展綱要(2022~2035 年)》中提出“加強(qiáng)人工智能、大數(shù)據(jù)、量子計(jì)算與氣象深度融合應(yīng)用”,為大氣學(xué)科未來(lái)發(fā)展指明了方向(國(guó)務(wù)院, 2022)。
數(shù)據(jù)、算法和算力是大氣數(shù)據(jù)與信息技術(shù)研究的三條主線。當(dāng)前,數(shù)據(jù)研究的重點(diǎn)是如何提高數(shù)據(jù)資源的共享訪問(wèn)和服務(wù)能力,如歐洲中期天氣預(yù)報(bào)中心(ECMWF)正在推動(dòng)“數(shù)字孿生地球”建設(shè),開(kāi)發(fā)高精度地球數(shù)字模型,為用戶提供高質(zhì)量數(shù)據(jù)服務(wù);美國(guó)國(guó)家海洋和大氣管理局(NOAA)啟動(dòng)大數(shù)據(jù)項(xiàng)目(Big Data Project),與Amazon、Microsoft 和Google 等云服務(wù)提供商合作將關(guān)鍵數(shù)據(jù)存儲(chǔ)在云中,無(wú)需進(jìn)一步分發(fā)即可直接在數(shù)據(jù)上進(jìn)行計(jì)算。算法的研究重點(diǎn)是如何開(kāi)展人工智能技術(shù)在天氣預(yù)報(bào)、氣候預(yù)測(cè)、仿真研究和圖像識(shí)別與處理等領(lǐng)域的應(yīng)用,如NOAA 出臺(tái)人工智能戰(zhàn)略、ECMWF 加快開(kāi)展“全工作流”人工智能應(yīng)用等。算力的研究重點(diǎn)是如何提高各種類型計(jì)算設(shè)備和器件運(yùn)行氣象軟件的效能。當(dāng)前,國(guó)家大力推進(jìn)高速泛在、天地一體、集成互聯(lián)、安全高效的信息基礎(chǔ)設(shè)施建設(shè)(新華社, 2021),緩解我國(guó)科學(xué)研究面臨的數(shù)據(jù)和算力瓶頸,必將推動(dòng)大氣數(shù)據(jù)與信息技術(shù)邁向新高峰。
大氣數(shù)據(jù)與信息技術(shù)研究呈現(xiàn)五大趨勢(shì)。一是學(xué)科交叉融合更加緊密。大氣科學(xué)與信息技術(shù)、自然科學(xué)與社會(huì)科學(xué)為學(xué)科發(fā)展開(kāi)創(chuàng)了新空間, 在科技創(chuàng)新和產(chǎn)業(yè)升級(jí)中的提效增能作用廣受學(xué)術(shù)界和企業(yè)界認(rèn)同(Faghmous and Kumar, 2014; Guo et al.,2016; Baumann et al., 2016; Ford et al., 2016; Bracco et al., 2018; Reichstein M et al., 2019; Ham et al.,2019)。二是知識(shí)與應(yīng)用融通更加廣泛。大數(shù)據(jù)、云計(jì)算和人工智能等技術(shù),使大氣數(shù)據(jù)在“生命安全、生產(chǎn)發(fā)展、生活富裕、生態(tài)良好”各領(lǐng)域應(yīng)用不斷推陳出新。三是支撐學(xué)科發(fā)展的資源更加豐富。國(guó)家“基建”將促進(jìn)數(shù)據(jù)中心、超算中心等國(guó)家信息基礎(chǔ)設(shè)施的建設(shè),為大氣學(xué)科發(fā)展提供更加豐富的計(jì)算、存儲(chǔ)和數(shù)據(jù)資源。四是科技焦點(diǎn)更加清晰。人工智能已明顯成為跨學(xué)科、跨領(lǐng)域的研究焦點(diǎn),而且在今后若干年內(nèi)還會(huì)保持這一態(tài)勢(shì)(Hsu et al.,2014; Apte et al., 2017; Jiang et al., 2018)。五是潛在顛覆技術(shù)涌現(xiàn)。雖然還處于探索性研究階段,但量子計(jì)算技術(shù)無(wú)疑會(huì)對(duì)大氣科學(xué)帶來(lái)巨大影響,需要積極開(kāi)展前瞻性研究(Gourianov et al., 2022)。在當(dāng)前日益復(fù)雜的國(guó)際背景下,提升大氣數(shù)據(jù)與信息技術(shù)自主創(chuàng)新能力尤為重要,自然科學(xué)基金委對(duì)此給予了充分重視(國(guó)家自然科學(xué)基金委員會(huì),2019a, 2019b; 劉哲等, 2021)。
新型信息技術(shù)可對(duì)大氣科學(xué)大數(shù)據(jù)進(jìn)行更加集中和智能化地處理分析,通過(guò)這一過(guò)程發(fā)掘大氣數(shù)據(jù)中的潛在信息,使得大氣數(shù)據(jù)的處理更加科學(xué)化。一方面新型信息技術(shù)需要大量數(shù)據(jù)作為基礎(chǔ),另一方面大數(shù)據(jù)也需要新型信息技術(shù)和顛覆性技術(shù)進(jìn)行數(shù)據(jù)價(jià)值化操作,兩者相輔相成。而我國(guó)大氣數(shù)據(jù)存在質(zhì)量參差不齊、時(shí)空一致性較差、數(shù)據(jù)標(biāo)簽滯后、數(shù)據(jù)實(shí)時(shí)性不足等問(wèn)題,利用大氣數(shù)據(jù)和信息技術(shù)創(chuàng)新大氣科學(xué)研究在數(shù)據(jù)、算法和算力方面依然面臨嚴(yán)峻挑戰(zhàn)。
依據(jù)現(xiàn)階段大氣學(xué)科申請(qǐng)代碼設(shè)置的“支撐技術(shù)”板塊,D0510 作為其中的“數(shù)據(jù)技術(shù)”鼓勵(lì)先進(jìn)技術(shù)與方法的創(chuàng)新,服務(wù)于大氣學(xué)科基礎(chǔ)理論與技術(shù)的發(fā)展。該方向不僅包括傳統(tǒng)的大氣數(shù)據(jù)分析技術(shù),更強(qiáng)調(diào)在大氣數(shù)據(jù)處理分析中利用大數(shù)據(jù)和人工智能等新興技術(shù)(郭華東等, 2014)。因此,如表1 所示,D0510 目前下設(shè)四個(gè)研究方向:多源數(shù)據(jù)融合與再分析、大氣數(shù)據(jù)分析、人工智能與大氣科學(xué)大數(shù)據(jù)、新型信息技術(shù)發(fā)展與應(yīng)用。
表1 大氣數(shù)據(jù)與信息技術(shù)(申請(qǐng)代碼D0510)研究方向及關(guān)鍵詞Table 1 Research directions and keywords for D0510 atmospheric data and information technology
在D0510 的四個(gè)研究方向中,多源數(shù)據(jù)融合與再分析研究方向主要側(cè)重發(fā)展大氣再分析資料和數(shù)據(jù)產(chǎn)品的核心技術(shù)與方法,支撐國(guó)產(chǎn)數(shù)據(jù)研制。大氣數(shù)據(jù)分析研究方向包容傳統(tǒng)方向,側(cè)重基于現(xiàn)代統(tǒng)計(jì)學(xué)的手段和方法,用于對(duì)于不同時(shí)空尺度和多變量數(shù)據(jù)的分析。人工智能與大氣科學(xué)大數(shù)據(jù)研究方向覆蓋深度學(xué)習(xí)、因果推斷等新興技術(shù),實(shí)現(xiàn)對(duì)大氣科學(xué)大數(shù)據(jù)的深度挖掘。新型信息技術(shù)發(fā)展與應(yīng)用研究方向側(cè)重于突破關(guān)鍵技術(shù),特別是具有“超前”意義的未來(lái)技術(shù),在大氣科學(xué)數(shù)據(jù)分析和預(yù)報(bào)中實(shí)現(xiàn)落地應(yīng)用。D0510 主要引導(dǎo)廣大科研人員開(kāi)展學(xué)科交叉融合和原創(chuàng)性研究,形成具有中國(guó)自主知識(shí)產(chǎn)權(quán)的新型支撐技術(shù)和方法。
D0510 下設(shè)的第一個(gè)研究方向“多源數(shù)據(jù)融合與再分析”主要是針對(duì)大氣多源數(shù)據(jù)的有效整合和實(shí)際應(yīng)用開(kāi)展研究。依照來(lái)源和整合方法,該研究方向主要包括了大氣多源數(shù)據(jù)、多源數(shù)據(jù)融合與反演、數(shù)據(jù)同化、和數(shù)據(jù)誤差分析四方面的關(guān)鍵詞。大氣多源數(shù)據(jù)包含的關(guān)鍵詞有基準(zhǔn)氣象數(shù)據(jù)、遙感數(shù)據(jù)產(chǎn)品和再分析資料三類,囊括針對(duì)這三類大氣主要數(shù)據(jù)開(kāi)展的研究;多源數(shù)據(jù)融合與反演包含的關(guān)鍵詞有資料融合、數(shù)據(jù)反演、多維時(shí)空數(shù)據(jù)建模、降尺度和遙感反演,側(cè)重于多源大氣數(shù)據(jù)的融合方法和遙感等數(shù)據(jù)的反演方法;數(shù)據(jù)同化包含的關(guān)鍵詞有最優(yōu)插值、變分同化、卡爾曼濾波和集合同化,包含了目前大氣數(shù)據(jù)同化領(lǐng)域主流的一些同化方法及其應(yīng)用研究;數(shù)據(jù)誤差分析則是針對(duì)以上三方面的研究?jī)?nèi)容,從質(zhì)量控制、誤差溯源和偏差訂正角度來(lái)保證大氣多源數(shù)據(jù)質(zhì)量并開(kāi)展相應(yīng)的研究,同時(shí)針對(duì)大氣數(shù)據(jù)的長(zhǎng)期一致性和不確定性等開(kāi)展均一化、不確定性分析以及相關(guān)的評(píng)估分析。多源數(shù)據(jù)融合與再分析將大氣基礎(chǔ)數(shù)據(jù)、融合與同化方法和誤差分析等研究?jī)?nèi)容有機(jī)結(jié)合,各研究?jī)?nèi)容之間相輔相成,為D0510 其它三個(gè)研究方向提供基礎(chǔ)的國(guó)產(chǎn)數(shù)據(jù)支撐。
D0510 下設(shè)的第二個(gè)研究方向“大氣數(shù)據(jù)分析”主要是基于現(xiàn)代統(tǒng)計(jì)學(xué)的手段和方法,對(duì)多圈層、多時(shí)空尺度和多變量大氣科學(xué)數(shù)據(jù)進(jìn)行分析,提高對(duì)天氣—?dú)夂蜻^(guò)程與機(jī)理的認(rèn)知。依照分析對(duì)象和分析方法,該研究方向主要包括了大氣科學(xué)的研究對(duì)象、關(guān)鍵科學(xué)問(wèn)題、研究手段和方法三個(gè)方面。其中,研究對(duì)象包含氣象災(zāi)害、氣候變化、空氣污染、強(qiáng)對(duì)流等關(guān)鍵詞;關(guān)鍵科學(xué)問(wèn)題包含多圈層相互作用、機(jī)理認(rèn)知、可預(yù)報(bào)性、不確定性、時(shí)空異質(zhì)性、能量收支等關(guān)鍵詞;研究手段和方法包含統(tǒng)計(jì)建模、時(shí)間序列分析、相關(guān)性分析、貝葉斯網(wǎng)絡(luò)、歸因分析、參數(shù)優(yōu)化等關(guān)鍵詞。該方向鼓勵(lì)利用傳統(tǒng)統(tǒng)計(jì)學(xué)方法,譬如采用經(jīng)驗(yàn)正交、奇異值分解等分析空間特征的統(tǒng)計(jì)方法,采用傅里葉變換、小波分析、功率譜分析等分析時(shí)間序列特征的手段,以及多元線性回歸建模方法等,開(kāi)展動(dòng)力方法和統(tǒng)計(jì)方法的融合研究,促進(jìn)對(duì)大氣現(xiàn)象的機(jī)理、因果關(guān)系及其可預(yù)報(bào)性的分析研究。以上三個(gè)方面形成了大氣數(shù)據(jù)分析的有機(jī)整體,既為第一個(gè)研究方向中的國(guó)產(chǎn)大氣數(shù)據(jù)資料研制提供技術(shù)支撐,也為第三個(gè)研究方向中的人工智能方法創(chuàng)新提供基礎(chǔ)平臺(tái)和參考基線。
D0510 下設(shè)的第三個(gè)研究方向“人工智能與大氣科學(xué)大數(shù)據(jù)”主要依托先進(jìn)技術(shù)與方法提升氣象預(yù)報(bào)預(yù)測(cè)技巧。該研究方向主要包括了研究對(duì)象、手段和方法、關(guān)鍵科學(xué)問(wèn)題三個(gè)方面。研究對(duì)象包含災(zāi)害天氣、極端氣候、臺(tái)風(fēng)、降水、短臨預(yù)報(bào)、延伸期預(yù)報(bào)等關(guān)鍵詞,力圖完善集智能識(shí)別、智能同化、智能模式和智能預(yù)測(cè)于一體的智慧氣象體系。手段與方法包含深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等關(guān)鍵詞。智能模型依賴的深度神經(jīng)網(wǎng)絡(luò)目前的“黑箱”特性被廣泛詬病,提升智能模型的可解釋性與適用性成為亟需解決的關(guān)鍵科學(xué)問(wèn)題。該方向鼓勵(lì)從大數(shù)據(jù)之間的相關(guān)關(guān)系和因果推斷出發(fā),融合動(dòng)力方程、守恒性、對(duì)稱性、時(shí)空不變性等增強(qiáng)智能模型的可解釋性和適用性。該方向以大氣數(shù)據(jù)為支撐,服務(wù)于國(guó)產(chǎn)高分辨率數(shù)據(jù)資料的重建,拓展大氣數(shù)據(jù)分析方法,促進(jìn)新型信息技術(shù)的應(yīng)用與發(fā)展。
D0510 下設(shè)的第四個(gè)研究方向“新型信息技術(shù)發(fā)展與應(yīng)用”主要是引導(dǎo)新型支撐技術(shù)與大氣學(xué)科的交叉融合,從一定程度上擴(kuò)展大氣學(xué)科的內(nèi)涵。依照技術(shù)內(nèi)涵和應(yīng)用領(lǐng)域,該研究方向主要包括了計(jì)算方法、數(shù)據(jù)管理、顛覆性技術(shù)三個(gè)方面。計(jì)算方法包含云計(jì)算、邊緣計(jì)算、邊云協(xié)同等關(guān)鍵詞,鼓勵(lì)在模式發(fā)展中融通新型計(jì)算形態(tài),提升模式計(jì)算性能;數(shù)據(jù)管理包含無(wú)人機(jī)遙感、區(qū)塊鏈、物聯(lián)網(wǎng)、5G 傳輸?shù)汝P(guān)鍵詞,倡導(dǎo)在數(shù)據(jù)采集、管理、應(yīng)用、服務(wù)過(guò)程中運(yùn)用新設(shè)備和新方法,豐富和完善大氣實(shí)況數(shù)據(jù)及分析產(chǎn)品的展現(xiàn)形式,促進(jìn)對(duì)大氣科學(xué)數(shù)據(jù)的理解和價(jià)值發(fā)現(xiàn);顛覆性技術(shù)包含量子計(jì)算、量子模擬等新型量子信息技術(shù),這已經(jīng)成為全球發(fā)達(dá)國(guó)家在科技領(lǐng)域關(guān)注的戰(zhàn)略方向,規(guī)劃布局和投資力度正在迅速加大。新型信息技術(shù)發(fā)展與應(yīng)用研究方向涵蓋了大氣數(shù)據(jù)的采集、管理、計(jì)算、呈現(xiàn)的全過(guò)程,所取得的突破與創(chuàng)新將為其它三個(gè)研究方向提供新的研究方法與手段。該方向需要結(jié)合分支學(xué)科的基本理論和經(jīng)驗(yàn)規(guī)律,吸收大數(shù)據(jù)和人工智能的科技進(jìn)步紅利,探索未來(lái)大氣數(shù)據(jù)與信息技術(shù)在應(yīng)用領(lǐng)域創(chuàng)新的各種可能。
上文介紹了各研究方向并梳理了關(guān)鍵詞的邏輯關(guān)系,為增進(jìn)申請(qǐng)人對(duì)D0510 發(fā)展趨勢(shì)和研究方向的理解,以下進(jìn)一步地對(duì)近兩年D0510 各方向關(guān)鍵詞的基金申請(qǐng)和文獻(xiàn)使用情況進(jìn)行統(tǒng)計(jì)分析。
自2021 年D0510 申請(qǐng)代碼使用新的研究方向分類以來(lái),每年面上項(xiàng)目、青年科學(xué)基金項(xiàng)目(簡(jiǎn)稱青年基金)和地區(qū)科學(xué)基金項(xiàng)目(簡(jiǎn)稱地區(qū)基金)的申請(qǐng)項(xiàng)目總數(shù)為60 余項(xiàng)(圖略),其中面上項(xiàng)目與青年基金的申請(qǐng)項(xiàng)目數(shù)量相當(dāng),各為30 項(xiàng)左右,而每年地區(qū)基金申請(qǐng)數(shù)量?jī)H為兩項(xiàng)。四類科學(xué)問(wèn)題屬性申請(qǐng)項(xiàng)目中C 類(需求類)項(xiàng)目數(shù)量最多,所占比例接近所有項(xiàng)目總數(shù)的50%,高于D05 的平均占比40.3%(何建軍等, 2021),D 類(交叉類)申請(qǐng)項(xiàng)目的所占比例僅次于C 類,達(dá)到了25%,遠(yuǎn)高于D05 申請(qǐng)代碼7.4%的平均占比;B 類(前沿類)申請(qǐng)項(xiàng)目占比低于20%,與D05的平均占比47.9%有較大落差。A 類(原創(chuàng)類)申請(qǐng)項(xiàng)目占比最低,與D05 其它申請(qǐng)代碼的整體申請(qǐng)情況類似。以上數(shù)據(jù)說(shuō)明相比于D05 其它申請(qǐng)代碼,D0510 申請(qǐng)代碼申請(qǐng)項(xiàng)目更側(cè)重于不同學(xué)科間的交叉。
D0510 申請(qǐng)代碼不同研究方向的申請(qǐng)項(xiàng)目數(shù)量之間有較大差別,近兩年平均有59%的項(xiàng)目選擇了“人工智能與大氣科學(xué)大數(shù)據(jù)”研究方向,23%的項(xiàng)目選擇了“多源數(shù)據(jù)融合與再分析”研究方向,15%的項(xiàng)目選擇了“大氣數(shù)據(jù)分析”研究方向,而選擇“新型信息技術(shù)發(fā)展與應(yīng)用”研究方向的項(xiàng)目占比僅為3%。
圖1 列出了2021~2022 年D0510 出現(xiàn)頻次最高的十個(gè)關(guān)鍵詞,排名第一的是深度學(xué)習(xí),出現(xiàn)頻次達(dá)到了48 次,即所有申請(qǐng)項(xiàng)目中有約40%選擇了這一關(guān)鍵詞。其次是機(jī)器學(xué)習(xí)、人工智能與資料融合,分別達(dá)到了28 次、21 次和21 次。十個(gè)高頻關(guān)鍵詞中八個(gè)與研究方法或數(shù)據(jù)相關(guān),而降水和災(zāi)害天氣是近年來(lái)的兩個(gè)熱點(diǎn)研究對(duì)象。
圖1 2021~2022 年D0510 申請(qǐng)代碼十個(gè)熱門(mén)關(guān)鍵詞的出現(xiàn)頻次Fig.1 Occurrence frequency of ten popular keywords under D0510 application code from 2021 to 2022
進(jìn)一步利用Web of Science 等文獻(xiàn)計(jì)量學(xué)分析工具,對(duì)大氣科學(xué)領(lǐng)域(Meteorology & Atmospheric Sciences)涉及D0510 申請(qǐng)代碼關(guān)鍵詞論文的發(fā)表情況進(jìn)行了統(tǒng)計(jì)和分析(圖2)。從圖2a 可知,2021 年度“多源數(shù)據(jù)融合與再分析”研究方向中,數(shù)據(jù)誤差分析方面的關(guān)鍵詞質(zhì)量控制、不確定性和評(píng)估的出現(xiàn)頻次較高,均超過(guò)4000 次,其次是再分析資料和數(shù)據(jù)同化,均超過(guò)1000 次。降尺度、數(shù)據(jù)反演和偏差訂正的出現(xiàn)頻次也超過(guò)了500 次。
“大氣數(shù)據(jù)分析”研究方向中(圖2b),不同關(guān)鍵詞的出現(xiàn)頻次存在明顯差異。其中,屬于研究對(duì)象的氣候變化和空氣污染這兩個(gè)關(guān)鍵詞出現(xiàn)頻次均超過(guò)10000 次。方法類關(guān)鍵詞中,排名前三的統(tǒng)計(jì)建模、相關(guān)性分析和時(shí)間序列分析出現(xiàn)頻次均超過(guò)2000 次,而參數(shù)優(yōu)化、歸因分析和貝葉斯網(wǎng)絡(luò)的出現(xiàn)頻次為100 至300 多次不等。
“人工智能與大氣科學(xué)大數(shù)據(jù)”研究方向中(圖2c)屬于研究對(duì)象的降水、空氣質(zhì)量、極端氣候等關(guān)鍵詞的出現(xiàn)頻次較高,例如降水的出現(xiàn)頻次超過(guò)了15000 次。除此之外,多個(gè)方法類關(guān)鍵詞的出現(xiàn)頻次也超過(guò)300 次。其中,機(jī)器學(xué)習(xí)的出現(xiàn)頻次最高,為1832 次,排名第二和第三的分別是人工智能的808 次和數(shù)據(jù)重建的801 次,而適用性和深度學(xué)習(xí)的出現(xiàn)頻次也超過(guò)了600 次。相比較而言,智能預(yù)測(cè)、智能識(shí)別和智能同化這些研究目的較明確的關(guān)鍵詞出現(xiàn)頻次普遍不高。
圖2 2021 年度D0510 申請(qǐng)代碼不同研究方向關(guān)鍵詞大氣科學(xué)領(lǐng)域論文在Web of Science 中的收錄情況Fig.2 The collection situation of the papers of research directions and keywords under D0510 application codes of the atmospheric sciences in 2021
“新型信息技術(shù)發(fā)展與應(yīng)用”研究方向中(圖2d),數(shù)據(jù)管理的出現(xiàn)頻次遠(yuǎn)高于其它關(guān)鍵詞。雖然很多關(guān)鍵詞涉及到新型信息技術(shù),但云計(jì)算、可視化、可視化建模和無(wú)人機(jī)遙感這些關(guān)鍵詞的出現(xiàn)頻次也達(dá)到了100 次以上。
圖3 總結(jié)了2001 年以來(lái)D0510 申請(qǐng)代碼申請(qǐng)項(xiàng)目中十個(gè)高頻關(guān)鍵詞(圖1)相關(guān)論文的逐3 年變化情況??梢钥吹剑▓D3a),除了降水和質(zhì)量控制,其余關(guān)鍵詞在2010 年以前出現(xiàn)頻次均較低,近幾年才得到了快速增長(zhǎng),尤其是機(jī)器學(xué)習(xí)、人工智能和深度學(xué)習(xí)這三個(gè)關(guān)鍵詞。其中,深度學(xué)習(xí)在近3 年的增長(zhǎng)速度最快,展現(xiàn)了很好的發(fā)展趨勢(shì)。
在這20 年期間,中國(guó)學(xué)者論文的所占比例也發(fā)生了明顯變化(圖3b)。在2007 年以前,除了災(zāi)害天氣和大數(shù)據(jù),其余關(guān)鍵詞中國(guó)學(xué)者論文占比大多維持在20%以下,而在2015 年之后,中國(guó)學(xué)者論文占比已基本超過(guò)20%。與其它關(guān)鍵詞不同,中國(guó)學(xué)者災(zāi)害天氣和大數(shù)據(jù)相關(guān)論文的占比從2001 年開(kāi)始出現(xiàn)了先上升后下降的趨勢(shì),占比峰值出現(xiàn)在2011 年前后。此外,可以發(fā)現(xiàn),自深度學(xué)習(xí)2016 年在全球范圍內(nèi)流行以來(lái)(圖3a),中國(guó)學(xué)者在這一方面的論文占比就超過(guò)了20%(圖3b),說(shuō)明中國(guó)學(xué)者在一些新興技術(shù)領(lǐng)域不存在起步晚的劣勢(shì)。
圖3 2001~2021 年D0510 申請(qǐng)項(xiàng)目中十個(gè)高頻關(guān)鍵詞相關(guān)論文Web of Science 收錄情況的逐3 年變化:(a)收錄數(shù)量(單位:a-1;2010 年后與關(guān)鍵詞降水相關(guān)的論文數(shù)量超過(guò)6000 篇/年);(b)中國(guó)學(xué)者論文所占比例Fig.3 Three-year variations of the collection situation of papers related to ten popular keywords under D0510 application code in “Web of Science”database from 2001 to 2021: (a) Number of collections (units: a-1; number of papers related to the keyword “precipitation” exceeds 6000 a-1);(b) proportion of Chinese scholars’ papers
從2021~2022 年D0510 的研究方向和關(guān)鍵詞申請(qǐng)情況統(tǒng)計(jì)結(jié)果來(lái)看,目前針對(duì)D0510 學(xué)科的申請(qǐng)存在總量偏少、原創(chuàng)類申請(qǐng)項(xiàng)目占比較低、關(guān)鍵詞使用集中于熱門(mén)方向、少數(shù)關(guān)鍵詞使用率偏低、前沿類申請(qǐng)稀缺等問(wèn)題。在D0510 中選擇合適的研究方向和關(guān)鍵詞,需要先厘清所申請(qǐng)的研究方向是屬于“分支學(xué)科”“支撐技術(shù)”還是“發(fā)展領(lǐng)域”,并且深入理解大氣學(xué)科“支撐技術(shù)”板塊中設(shè)置D0510 申請(qǐng)代碼的初衷。特別需要明確的是,純技術(shù)應(yīng)用類研究并不適合填報(bào)D0510 申請(qǐng)代碼,而應(yīng)從“分支學(xué)科”或“發(fā)展領(lǐng)域”中選擇對(duì)應(yīng)的申請(qǐng)代碼(劉哲等, 2020)。
在研究方向的選擇上,根據(jù)近兩年項(xiàng)目申請(qǐng)情況來(lái)看,申請(qǐng)人容易混淆“支撐技術(shù)”中的D0510 大氣數(shù)據(jù)與信息技術(shù)和“發(fā)展領(lǐng)域”中的D0515 應(yīng)用氣象學(xué)這兩類申請(qǐng)代碼,同時(shí)在方法上與D0509 大氣觀測(cè)、遙感和探測(cè)技術(shù)與方法上有所重疊,造成難于選擇。D0510 鼓勵(lì)大氣科學(xué)家和具有數(shù)據(jù)與信息背景的技術(shù)人才深度合作,突破大氣科學(xué)基礎(chǔ)研究中的“卡脖子”問(wèn)題和“顛覆性”技術(shù),實(shí)現(xiàn)大氣學(xué)科基礎(chǔ)理論和研究手段的創(chuàng)新。D0510 側(cè)重于數(shù)據(jù)與信息與大氣科學(xué)的交叉,而D0509 側(cè)重觀測(cè)、遙感和探測(cè),D0515 側(cè)重應(yīng)用研究與基礎(chǔ)研究的融合,申請(qǐng)人應(yīng)結(jié)合研究主題進(jìn)行針對(duì)性的選擇。
在關(guān)鍵詞的選擇上,申請(qǐng)人應(yīng)當(dāng)特別注意粗粒度與細(xì)粒度關(guān)鍵詞結(jié)合使用,選擇過(guò)粗會(huì)造成評(píng)審專家匹配范圍太廣,而選擇過(guò)細(xì)會(huì)造成滿足條件的評(píng)審專家太少,需要保證關(guān)鍵詞粗細(xì)適度以提升智能輔助匹配系統(tǒng)的效率。當(dāng)前,D0510 中關(guān)鍵詞使用集中于深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、人工智能等熱門(mén)方向以及降水、災(zāi)害天氣等焦點(diǎn)領(lǐng)域,意味著這些領(lǐng)域競(jìng)爭(zhēng)激烈,建議申請(qǐng)人避開(kāi)紅海,積極探索新的交叉融合問(wèn)題。
綜上,合適的研究方向和關(guān)鍵詞選擇將有利于對(duì)項(xiàng)目進(jìn)行精準(zhǔn)評(píng)估,使得人工智能系統(tǒng)能夠精確匹配到相應(yīng)的評(píng)審專家,確保科學(xué)基金申請(qǐng)書(shū)函評(píng)和會(huì)評(píng)的公平公正性,輔助學(xué)科整體情況的分析決策,從而對(duì)項(xiàng)目進(jìn)行更加合理的定位與分類,提高項(xiàng)目的評(píng)審效率,強(qiáng)化資助的合理性與導(dǎo)向性(鄭鈞正, 2013)。
在大氣學(xué)科申請(qǐng)代碼調(diào)整的大背景下,“申請(qǐng)代碼和關(guān)鍵詞”戰(zhàn)略研究工作組對(duì)D0510 申請(qǐng)代碼不斷進(jìn)行梳理和調(diào)整。自2019 年11 月以來(lái),依托各類學(xué)術(shù)年會(huì)和戰(zhàn)略研討會(huì),通過(guò)“自上而下”與“自下而上”開(kāi)展論證,形成了D0510 從“二級(jí)學(xué)科申請(qǐng)代碼”到“研究方向”再到“關(guān)鍵詞”的完整鏈條,對(duì)于傳統(tǒng)方向的包容性和新興技術(shù)的覆蓋性均得以提高,對(duì)于“卡脖子”和“顛覆性”技術(shù)的重視程度也得到加強(qiáng)。
近3 年申報(bào)D0510 的項(xiàng)目質(zhì)量穩(wěn)步上升,D0510 在引導(dǎo)支撐技術(shù)服務(wù)大氣學(xué)科方面激勵(lì)了技術(shù)人才與大氣科學(xué)家開(kāi)展深度合作,培養(yǎng)了更多高質(zhì)量的復(fù)合型創(chuàng)新人才。但D0510 也仍然存在一些問(wèn)題亟待改進(jìn),如:少數(shù)關(guān)鍵詞重疊、使用頻率不高、各研究方向關(guān)鍵詞分布不均,以及對(duì)申請(qǐng)代碼調(diào)整改革的目的和趨勢(shì)宣傳介紹不夠,導(dǎo)致部分申請(qǐng)人對(duì)研究方向和關(guān)鍵詞認(rèn)識(shí)不足。今后,還需持續(xù)跟蹤國(guó)際前沿動(dòng)態(tài),廣泛聽(tīng)取大氣科學(xué)和相關(guān)交叉學(xué)科專家意見(jiàn),不斷修訂完善并加強(qiáng)宣教,擴(kuò)大D0510 影響力,以充分發(fā)揮科學(xué)基金對(duì)大氣科學(xué)技術(shù)創(chuàng)新的引領(lǐng)作用。
致謝衷心感謝國(guó)家自然科學(xué)基金委員會(huì)“申請(qǐng)代碼和關(guān)鍵詞”戰(zhàn)略研究工作組D0510 小組的朱江、龔?fù)?、楊廣文、鄧科峰、付遵濤、耿冠楠、李慶祥、劉青山、王亞強(qiáng)、武炳義、徐喆、張寧參加研討,特別感謝清華大學(xué)的向妍霏和李佳皓,本文的研究成果離不開(kāi)他們大量細(xì)致的調(diào)研和數(shù)據(jù)統(tǒng)計(jì)分析工作。本次申請(qǐng)代碼調(diào)整工作自始至終都得到了國(guó)家自然科學(xué)基金委員會(huì)分管委領(lǐng)導(dǎo)、地球科學(xué)部領(lǐng)導(dǎo)一如既往的關(guān)心和悉心指導(dǎo),作者在此一并表示誠(chéng)摯的感謝!