任建玲
摘 要隨著對氣候變化研究的重視以及極端天氣的增多,歷史氣象觀測記錄檔案的需求與作用凸顯。從20世紀(jì)70年代末至今,氣象部門投入大量人力、物力和財力,歷史氣象觀測記錄檔案的數(shù)字化取得了可喜成果。本文回顧了天津氣象觀測記錄檔案數(shù)字化的各個階段、產(chǎn)生的數(shù)字化產(chǎn)品、檔案數(shù)字化成果的應(yīng)用,并對下一步工作進(jìn)行了展望。
關(guān)鍵詞氣象 觀測記錄 檔案數(shù)字化 成果應(yīng)用
氣象觀測記錄檔案是在氣象觀測、探測中形成的,反映大氣中各種氣象要素、大氣現(xiàn)象及其變化過程的真實記錄,包括各種觀探測記錄表、簿、磁帶(盤)、縮微膠片、光盤等[1]。氣象觀測記錄檔案是氣象檔案館的館藏主體,天津市氣象檔案館收藏了大量紙質(zhì)載體的氣象記錄檔案,最早的記錄檔案始于1887年,是研究我國近代氣候及環(huán)境的不可替代的寶貴財富,也是區(qū)域氣候變化和全球變化研究的基礎(chǔ)資料。這些氣象記錄檔案主要以紙質(zhì)載體為主,其信息無法得到更為廣泛和深入的應(yīng)用,數(shù)字化是解決利用和保護(hù)最佳的方法。
歷史氣象資料數(shù)字化是指將紙質(zhì)歷史氣象資料掃描成數(shù)字圖像,通過鍵盤錄入方式將紙質(zhì)或數(shù)字圖像上的數(shù)據(jù)信息轉(zhuǎn)換為可編輯、處理的數(shù)據(jù)文件,通過光學(xué)字符識別或波形圖識別技術(shù)將數(shù)字圖像上的數(shù)據(jù)信息轉(zhuǎn)換為可編輯、處理的數(shù)據(jù)文件。對紙質(zhì)歷史氣象資料進(jìn)行數(shù)字化,既可以保護(hù)資料原件,維持其歷史憑證價值,又能突破原有載體提供利用時的局限性,提高歷史氣象資料的應(yīng)用效率[2]。
一、氣象觀測記錄檔案數(shù)字化歷程
1.數(shù)字化初始階段(1978—1990)。始于20世紀(jì)70年代末期,按照中央氣象局的統(tǒng)一部署,天津氣候資料室開始使用紙帶穿孔方法對紙質(zhì)地面氣象觀測記錄月報表進(jìn)行信息化,用手工打鍵的方法,把手工記載的氣象資料變成電子計算機(jī)能接收識別的信息,記入紙帶、卡片、磁帶或膠片等信息載體上。參考依據(jù)就是1978年12月中央氣象局業(yè)務(wù)處下發(fā)《全國地面氣象資料信息化基本模式暫行規(guī)定》(中氣業(yè)發(fā)字〔1978〕第212號文)[3]1,之后又對這部分記載地面氣象觀測信息的紙帶資料進(jìn)行了重新整理和錄入,轉(zhuǎn)換成了A0文件歸檔保存。A0文件作為重要的數(shù)字化氣象資料,為之后的各項氣象事業(yè)的發(fā)展提供了可靠的基礎(chǔ)數(shù)據(jù)資源。
2.數(shù)字化持續(xù)階段(1991—2008)。截至2008年之前,數(shù)字化工作持續(xù)進(jìn)行。期間完成的主要工作有:(1)存貯介質(zhì)轉(zhuǎn)存。中國氣象局預(yù)測減災(zāi)司氣預(yù)函〔2006〕54號《關(guān)于做好2006年預(yù)測減災(zāi)業(yè)務(wù)服務(wù)專項能力建設(shè)工作的通知》下達(dá)了“天津市歷史信息化氣象資料存貯介質(zhì)轉(zhuǎn)存項目”。完成的主要任務(wù)是把2005年之前存檔的各站地面、農(nóng)業(yè)氣象、輻射信息化資料,進(jìn)行質(zhì)量檢查并分別存放在可讀寫CD-ROM光盤、磁帶、在線服務(wù)器三種介質(zhì)上。(2)降水自記紙跡線提取。降水自記紙是客觀記錄降水情況的珍貴氣象觀測資料,它記錄著每次降雨的特征,包括每分鐘的降雨強(qiáng)度、起止時間和各個時段的最大降水量,對我市開展降水特征和天氣、氣候的研究具有非常重要的意義,同時在防災(zāi)、減災(zāi)和國民經(jīng)濟(jì)建設(shè)中發(fā)揮重要的作用。
按照中國氣象局氣預(yù)函〔2002〕83號文件《關(guān)于在全國開展國家基本(準(zhǔn))站降水自記紙數(shù)字化處理的通知》的要求,2003—2007年期間陸續(xù)完成了“天津市降水自記紙數(shù)字化處理”項目。利用中國氣象局氣象檔案館和廣東省氣候中心共同研究開發(fā)的“降水自記紙彩色圖形數(shù)字化處理系統(tǒng)”[4]737,依據(jù)中國氣象局統(tǒng)一下發(fā)的《降水曲線數(shù)據(jù)文件數(shù)據(jù)格式》《降水自記數(shù)據(jù)(降水強(qiáng)度)標(biāo)準(zhǔn)文件格式》,完成了天津市所轄范圍內(nèi)兩個國家基本站自建站2004年降水自記紙圖像掃描、跡線跟蹤處理、質(zhì)量檢查、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)集制作等工作。成果包含4713個圖像文件(*.jpg);4713個數(shù)據(jù)文件(*.zjr);2個分鐘強(qiáng)度數(shù)據(jù)文件(R1文件);2個分鐘標(biāo)準(zhǔn)數(shù)據(jù)文件(R01文件);2個小時標(biāo)準(zhǔn)數(shù)據(jù)文件(R60文件);2個圖像數(shù)據(jù)集;1個降水曲線數(shù)據(jù)集;1個降水強(qiáng)度數(shù)據(jù)集。降水自記紙數(shù)字化是紙質(zhì)檔案數(shù)字化的一個大膽探索和實踐,為其他紙質(zhì)檔案數(shù)字化提供了寶貴的經(jīng)驗和技術(shù)借鑒。(3)補錄A6/V0文件。從2005年開始,開展國家科技基礎(chǔ)性工作專項資金項目“氣象科學(xué)數(shù)據(jù)共享中心”子項目“省級數(shù)據(jù)資源建設(shè)與共享服務(wù)”天津?qū)n}建設(shè),通過對數(shù)字化歷史資料的格式檢查、質(zhì)量檢查、數(shù)據(jù)統(tǒng)計,完成了大量數(shù)據(jù)集制作,并大大提高了數(shù)字化歷史資料(A0/A6)文件的質(zhì)量。建立的數(shù)據(jù)集清單見表1。依托這個項目,天津按照《全國地面氣象資料A6、A7文件信息基本模式暫行規(guī)定》(中國氣象局預(yù)測減災(zāi)司文件,氣預(yù)發(fā)字〔1999〕第14號)[3]29、氣表-1封面、封底V文件格式(中氣測發(fā)〔2001〕18號)[3]34的相關(guān)規(guī)定,對國家基本站自建站到2004年的地面氣象記錄月報表中逐時觀測項目進(jìn)行人工錄入處理生成A6文件1500個、封底封面V0文件1500個,并通過合成軟件合并為A文件。(4)風(fēng)自記歷史資料數(shù)字化。依托2008年開展的“天津市風(fēng)能資源數(shù)據(jù)庫建設(shè)”項目,按照國家級項目統(tǒng)一要求和本市風(fēng)能資源評價的需要,通過手工錄入和人機(jī)交互質(zhì)量控制,完成全市四個參證站(塘沽、漢沽、大港、西青)建站至2008年12月的風(fēng)向風(fēng)速逐小時歷史資料數(shù)字化工作,建立格式統(tǒng)一、數(shù)據(jù)完整和質(zhì)量可靠的AF文件1968個,為我市風(fēng)能資源數(shù)據(jù)庫建設(shè)提供歷史背景資料。
3.數(shù)字化飛速發(fā)展階段(2009年至今)。2009年以來,天津市氣象檔案館在中國氣象局氣象監(jiān)測與災(zāi)害預(yù)警工程、氣候變化應(yīng)對決策支撐系統(tǒng)工程、山洪地質(zhì)災(zāi)害防治氣象保障工程項目專項經(jīng)費的持續(xù)支持下,委托數(shù)字化外包公司先后完成天津市國家級氣象臺站各類地面觀測記錄月報表、新中國成立前各類歷史氣象觀測資料、農(nóng)業(yè)氣象觀測報表、高空氣象觀測記錄表、氣壓、溫度、濕度、降水、風(fēng)向風(fēng)速自記紙的圖像掃描和數(shù)據(jù)集制作。完成情況與數(shù)據(jù)量見表2(見下頁);數(shù)字化錄入文件數(shù)據(jù)集見表3(見下頁)。
2009年至2018年期間,取得了豐碩的數(shù)字化建設(shè)成果,這些成果已經(jīng)在氣象業(yè)務(wù)和科研中得到應(yīng)用,取得了顯著的成效。2019年的山洪地質(zhì)災(zāi)害防治氣象保障工程已安排經(jīng)費,進(jìn)行風(fēng)自記紙跡線提取工作,目前正在進(jìn)行中。
二、數(shù)字化成果應(yīng)用
1.業(yè)務(wù)工作的支撐。歷史檔案數(shù)字化產(chǎn)品A系列文件,自20世紀(jì)70年代末誕生以來,一改數(shù)據(jù)人工抄錄和統(tǒng)計的歷史,在氣象事業(yè)發(fā)展過程中長期發(fā)揮著重要的支撐作用,服務(wù)氣象事業(yè)50年。數(shù)字化的檔案滿足了用戶對不同時空、分辨率數(shù)據(jù)的需求,也為預(yù)報預(yù)測、氣候監(jiān)測、氣候分析與評估、農(nóng)業(yè)氣象服務(wù)、人工影響天氣、應(yīng)急與減災(zāi)、氣象災(zāi)害與防御等提供了重要的數(shù)據(jù)保障,促進(jìn)氣象業(yè)務(wù)發(fā)展,獲得顯著的社會效益??梢载?fù)責(zé)任地說,每項氣象相關(guān)業(yè)務(wù)工作的開展都離不開歷史數(shù)據(jù)的支撐,離不開檔案的憑證和查考作用。
2.數(shù)據(jù)產(chǎn)品的基礎(chǔ)。為了更好地提供數(shù)據(jù)服務(wù),我們制作了大量數(shù)據(jù)產(chǎn)品,數(shù)字化的檔案為各類數(shù)據(jù)集產(chǎn)品提供基礎(chǔ)數(shù)據(jù)源,數(shù)據(jù)產(chǎn)品囊括地面、高空、輻射等各類觀測,種類包括氣候標(biāo)準(zhǔn)值產(chǎn)品、基礎(chǔ)數(shù)據(jù)產(chǎn)品、氣候整編產(chǎn)品、均一化產(chǎn)品、網(wǎng)格化產(chǎn)品等。
3.科研和服務(wù)的保證。數(shù)字化的檔案為科學(xué)研究和氣象服務(wù)提供必要的資料保證,支持氣象科學(xué)研究項目462個,各級各類氣象服務(wù)不計其數(shù)??蒲许椖康馁Y助來源包括國家科技部、中國氣象局、天津市科委、市發(fā)改委、市農(nóng)委、市財政局、市技術(shù)監(jiān)督局、市氣象局等,還有一些橫向合作的部門及高校。氣象服務(wù)遍及全社會各個角落,關(guān)系到國計民生,小到氣象災(zāi)害憑證、大到重大事項決策。舉個最近的應(yīng)用實例:2017年8月在天津召開的全國第十三屆全運會,從籌備到開幕閉幕日期的選擇,從綜合氣象條件分析到可能風(fēng)險分析,從制定人工影響天氣方案到應(yīng)急方案制定,很多決策都參考了氣象統(tǒng)計數(shù)據(jù)。我們提供的氣象數(shù)據(jù)有近30年氣候背景統(tǒng)計數(shù)據(jù)、4月到9月期間逐小時降水量數(shù)據(jù)、雷達(dá)基數(shù)據(jù)資料、歷史天氣圖等數(shù)字化資料??蒲蟹矫?,氣候中心申請的天津市科技局項目“氣候變化對天津市排水規(guī)劃設(shè)計標(biāo)準(zhǔn)的影響評估”利用從降水自記紙?zhí)崛〉闹鸱昼娊邓Y料,分析了氣候變化對天津市排水設(shè)計的影響,分別利用年最大值法和年多值法進(jìn)行了分區(qū)暴雨公式編制等。
4.服務(wù)基礎(chǔ)資料專項。2011—2013年各省開展的“基礎(chǔ)資料專項工作”,對地面、高空、輻射數(shù)字化資料存在的數(shù)據(jù)質(zhì)量問題集中進(jìn)行質(zhì)量檢查,使其完整性、可靠性和準(zhǔn)確性進(jìn)一步提升。在質(zhì)量檢查過程中,數(shù)字化檔案起到了關(guān)鍵作用。利用最多的各類報表,使用的是掃描形成的圖像文件數(shù)據(jù)集,完全不用人工從庫房中提取原始紙質(zhì)檔案,節(jié)省了大量借閱、歸還的工作,并保護(hù)了珍貴原始觀測記錄檔案,工作效率提高70%。
三、數(shù)字化工作展望
1.新技術(shù)的應(yīng)用提高效率。目前,氣象資料數(shù)字化工作主要采用圖像掃描技術(shù)、數(shù)據(jù)錄入技術(shù)、圖形提取技術(shù)等。其中,相對有難度、耗時較長的是自記紙類圖形跡線跟蹤技術(shù),其過程主要是人機(jī)結(jié)合地對自記跡線進(jìn)行跟蹤,得到跡線特征點的坐標(biāo)數(shù)據(jù),從而得到給定時間段內(nèi)逐分鐘降水量數(shù)據(jù),形成數(shù)據(jù)文件。相信未來會有更好的技術(shù)和手段來完成類似的工作,提高數(shù)字化效率。未來手寫文本也能很準(zhǔn)確地進(jìn)行OCR識別,也會大大提高手寫檔案的數(shù)字化效率。
2.建立更高時間分辨率要素序列。自動氣象觀測站自2003年開始在全國范圍內(nèi)建立,自動觀測儀器可以采集到各種觀測要素的分鐘數(shù)據(jù),而在此之前,我們僅能提供一天四次的定時觀測數(shù)據(jù)。隨著對暴雨洪澇災(zāi)害、城市瀝澇、多年一遇極端降水事件分析等的深入研究,對更高時間分辨率降水資料的需求越來越突出。在需求的引領(lǐng)下,我們開展了降水自記跡線提取工作,得到自動站建立前的分鐘降水量數(shù)據(jù),滿足了科研的需要。風(fēng)的數(shù)據(jù)對風(fēng)能資源開發(fā)、橋梁設(shè)計、高層建筑設(shè)計、大氣污染物擴(kuò)散研究等起著至關(guān)重要的作用,因此長序列高時間分辨率風(fēng)向風(fēng)速觀測資料是2019年氣象科技檔案數(shù)字化的重點工作。以需求為引領(lǐng),是數(shù)字化工作開展的依據(jù)。進(jìn)一步加強(qiáng)氣溫、氣壓、相對濕度等要素的數(shù)字化力度,取得高時間分辨率氣象觀測數(shù)據(jù),是今后繼續(xù)努力的目標(biāo)。
3.提升歷史氣象資料數(shù)字化產(chǎn)品在線管理和服務(wù)能力。有了大量數(shù)字化產(chǎn)品,它的開發(fā)利用迫在眉睫。從檔案安全角度著想,我們自主研發(fā)了“歷史氣象觀測檔案數(shù)字化檢索平臺”。該系統(tǒng)在服務(wù)器虛擬化平臺上部署桌面虛擬化系統(tǒng),在閱覽室部署瘦客戶機(jī),完成歷史氣象觀測檔案數(shù)字化檢索平臺應(yīng)用的桌面虛擬化實現(xiàn)。用戶可根據(jù)檔案分類和查詢習(xí)慣,實現(xiàn)在平臺上對歷史氣象觀測檔案的分類檢索和調(diào)閱,提高了歷史檔案的檢索效率。同時,系統(tǒng)的應(yīng)用減少了對紙質(zhì)檔案的翻閱,從而保護(hù)了檔案,降低了管理員工作強(qiáng)度,減少由于檔案移動引起的工作失誤;采用桌面虛擬化技術(shù),實現(xiàn)了氣象檔案的安全訪問,防止了檔案未經(jīng)授權(quán)的訪問事件發(fā)生。
“十三五”氣象信息系統(tǒng)發(fā)展規(guī)劃現(xiàn)代化目標(biāo)明確提出,要提高數(shù)字化氣象檔案在線管理服務(wù)率,更便捷、高效、全面地提供長年代氣候背景數(shù)據(jù)產(chǎn)品。這也是我們近年來的工作目標(biāo),在中國氣象信息中心的領(lǐng)導(dǎo)下,逐步實現(xiàn)氣候資料數(shù)字化圖像在線查詢、檢索服務(wù)。