王雨婷
(赤峰市氣象局 內(nèi)蒙古 赤峰 024000)
隨著社會經(jīng)濟(jì)及科技的日益發(fā)展,社會對電視節(jié)目的認(rèn)可度不斷增強(qiáng)。 人們的生活方式亦在不斷豐富,受到天氣限制的活動逐漸變多,因此氣象類影視節(jié)目的受歡迎程度隨之增加。 以天氣預(yù)報(bào)為代表的影視節(jié)目根據(jù)社會的變化在逐漸改版翻新,收視率一直居高不下。 在制作天氣預(yù)報(bào)影視節(jié)目中,撰寫播報(bào)稿件是節(jié)目中的重要環(huán)節(jié)。 稿件編輯需在較短的時(shí)間內(nèi)完成大量的氣象信息收集及稿件撰寫任務(wù)。 為實(shí)現(xiàn)原始數(shù)據(jù)從人工提取到全自動提取的轉(zhuǎn)化,人們開始研發(fā)并應(yīng)用業(yè)務(wù)輔助的讀取生成調(diào)用程序。 此程序的運(yùn)用不但可以提高預(yù)報(bào)信息的準(zhǔn)確性,還可以實(shí)現(xiàn)編輯的手動操作到自動處理的轉(zhuǎn)換,極大地提高了工作效率。 本文基于Python 語言,對氣象類稿件自動生成系統(tǒng)的開發(fā)及應(yīng)用進(jìn)行了一系列的研究,以期解決氣象類稿件撰寫工作繁雜低效及稿件質(zhì)量難以保證的問題,為氣象節(jié)目的正向發(fā)展提供動力。
隨著人們對氣象類節(jié)目質(zhì)量要求的不斷提高,氣象類稿件編輯工作對氣象信息的需求量越來越大,對節(jié)目輸出信息的時(shí)效性、準(zhǔn)確性及豐富性要求越來越高,氣象播報(bào)稿件中的內(nèi)容及播報(bào)形式亦需趨于多樣化。 準(zhǔn)確豐富的節(jié)目播報(bào)內(nèi)容能夠滿足人們豐富多彩的生產(chǎn)生活需要。天氣預(yù)報(bào)稿件編寫的數(shù)據(jù)主要來源于全國綜合氣象信息共享平臺 ( China Integrated Meteorological Information Service System,CIMISS)、城鎮(zhèn)預(yù)報(bào)、公眾預(yù)報(bào)、預(yù)警信息、雨雪情報(bào)等氣象服務(wù)信息平臺,氣象服務(wù)信息平臺的數(shù)據(jù)一般分為兩類:一類數(shù)據(jù)被稱為“實(shí)況數(shù)據(jù)”,另一類被稱為“模式數(shù)據(jù)”。
實(shí)況數(shù)據(jù)是氣象學(xué)科中相對原始的數(shù)據(jù),實(shí)況數(shù)據(jù)的采集工作主要借助氣象站來完成。 通過衛(wèi)星遙感技術(shù)、氣象站氣象數(shù)據(jù)自動采集與收集系統(tǒng)或簡單的人工觀測等多種方法來實(shí)現(xiàn)氣象站點(diǎn)觀測數(shù)據(jù)的收集。 收集來的數(shù)據(jù)需要通過設(shè)定好的機(jī)器程序編碼為二進(jìn)制,將編碼好的數(shù)據(jù)傳輸?shù)綌?shù)據(jù)庫中儲存,再通過特定的傳輸協(xié)議進(jìn)行傳輸,將本省觀測站點(diǎn)的全部實(shí)時(shí)相關(guān)數(shù)據(jù)打包上傳到國家氣象信息中心的通信臺[1]。 據(jù)中國氣象局2022 年9 月14日發(fā)布的統(tǒng)計(jì)數(shù)據(jù)顯示,截至2021 年底,我國擁有國家級地面氣象觀測站10 930 個(gè),省級常規(guī)氣象觀測站55 719個(gè),加上其他類型的地面觀測站點(diǎn),已建成7 萬余個(gè)地面氣象觀測站,全國近4 萬個(gè)鄉(xiāng)鎮(zhèn)實(shí)現(xiàn)自動氣象觀測站全覆蓋[2]。
模式數(shù)據(jù)是由高性能計(jì)算機(jī)以當(dāng)天的天氣實(shí)況數(shù)據(jù)為源頭通過物理方程計(jì)算得出的。 通過已知的天氣現(xiàn)象,推測計(jì)算出之后的天氣情況。 將推測出的結(jié)果用經(jīng)緯度網(wǎng)格來呈現(xiàn),經(jīng)緯度網(wǎng)格中的每個(gè)點(diǎn)就表明了該經(jīng)緯度地區(qū)未來某個(gè)時(shí)刻的氣象狀況,包括了降水、氣溫、日照等氣象因素,進(jìn)行推測計(jì)算的計(jì)算機(jī)程序被稱為模式系統(tǒng)。
要想將收集到的數(shù)據(jù)在氣象類節(jié)目中進(jìn)行實(shí)際運(yùn)用,需要通過一套特定流程將處理好的數(shù)據(jù)最終傳輸?shù)筋A(yù)報(bào)員的手中。 收集來的不同數(shù)據(jù)在到達(dá)通信臺后會被分為兩種路徑處理:一是實(shí)況數(shù)據(jù)的路徑,實(shí)況數(shù)據(jù)先通過計(jì)算機(jī)對數(shù)據(jù)中包含的BUFR 解碼,在提取到需要的物理量信息后,將其寫入到一個(gè)關(guān)系型數(shù)據(jù)庫中進(jìn)行緩存,后續(xù)定時(shí)進(jìn)行重復(fù)工作,直到將全部站點(diǎn)同一個(gè)時(shí)刻的物理量信息提取出來,傳輸?shù)筋A(yù)報(bào)員客戶端軟件訪問的高速存儲服務(wù)器中;二是處理模式數(shù)據(jù)的路徑,此類數(shù)據(jù)相比實(shí)況數(shù)據(jù)在處理上要簡單便捷許多。 模式數(shù)據(jù)前期無須進(jìn)行一系列的解碼工作,通信臺可以直接將數(shù)據(jù)傳送到一個(gè)高速解析服務(wù)器中,然后通過解碼、衛(wèi)星通道拆分等操作,直接寫入到高速存儲服務(wù)器中,供預(yù)報(bào)員客戶端軟件訪問,便完成了氣象類影視節(jié)目所需數(shù)據(jù)的監(jiān)測、獲取、傳輸、運(yùn)用、播報(bào)等全部流程。 如圖1 所示。
圖1 數(shù)據(jù)傳輸流程圖
實(shí)況數(shù)據(jù)及模式數(shù)據(jù)被稱為天氣預(yù)報(bào)之源,是氣象類稿件撰寫的直接依據(jù)。 在撰寫氣象類稿件時(shí),需要在收集到的數(shù)據(jù)中查找可用的信息,篩選的數(shù)據(jù)量極為龐大,此項(xiàng)工作如果僅僅通過人工來完成,難度很高。 因此,智能化及自動化是一個(gè)明顯的發(fā)展趨勢,亦是一個(gè)重要的發(fā)展需求。
近年來,赤峰市各旗縣區(qū)天氣預(yù)報(bào)節(jié)目數(shù)量不斷增加,不少節(jié)目前后都經(jīng)歷了多次的改版更新,導(dǎo)致氣象類稿件撰寫工作中所需的氣象預(yù)報(bào)數(shù)據(jù)及產(chǎn)品需求都隨之增加,氣象數(shù)據(jù)的采集及整理難度逐漸升高,使稿件的撰寫工作變得更加復(fù)雜煩瑣。 目前我市氣象類影視節(jié)目稿件編寫主要由采編人工編寫來完成,需要人工手動在CIMISS 查找各旗縣區(qū)每日最高溫度及天氣現(xiàn)象等其他各種氣象要素,再與24 h、48 h 城鎮(zhèn)預(yù)報(bào)中提取到的溫度、風(fēng)向、風(fēng)速、天氣現(xiàn)象等氣象數(shù)據(jù)進(jìn)行對比分析,以上工作僅僅只是完成稿件編寫所需數(shù)據(jù)查詢的準(zhǔn)備工作,為了保證氣象播報(bào)節(jié)目的綜合質(zhì)量,氣象稿件的內(nèi)容還需要更加豐富、及時(shí)、準(zhǔn)確。 因此,工作人員需要圍繞氣象類稿件的撰寫開展大量的工作,其中包括對氣象原始數(shù)據(jù)進(jìn)行校對、對比及結(jié)論分析,還有提取氣象服務(wù)產(chǎn)品有效信息等項(xiàng)目,將最終分析研究的結(jié)果與通俗簡潔、邏輯清晰的語言文字相結(jié)合,最終進(jìn)行統(tǒng)一的文本編輯,一套完整的流程下來將是一個(gè)非常龐大工程。 據(jù)統(tǒng)計(jì),每天各旗縣區(qū)撰寫氣象類的稿件7 篇,進(jìn)行數(shù)據(jù)查詢與對比工作120 多次,耗時(shí)30~50 min,龐大的工作量給工作人員增加了巨大負(fù)擔(dān)。 每天都是如此的工作強(qiáng)度,除了挑戰(zhàn)工作人員的技術(shù)能力,也是對心理素質(zhì)的考驗(yàn)。 數(shù)據(jù)信息的準(zhǔn)確率、數(shù)值區(qū)間范圍、文本語言規(guī)范亦難以保障[3]。 由于電視天氣預(yù)報(bào)節(jié)目制作及具體的氣象數(shù)據(jù)具有很強(qiáng)的時(shí)效性,氣象類稿件的撰寫及播報(bào)工作都必須在規(guī)定時(shí)間節(jié)點(diǎn)之內(nèi)完成,需要對各種氣象數(shù)據(jù)進(jìn)行準(zhǔn)確快速的篩選[4]。 因而工作人員要在短時(shí)間內(nèi)進(jìn)行大量的氣象數(shù)據(jù)比對及數(shù)據(jù)分析,不僅要消耗大量的時(shí)間,同時(shí)數(shù)據(jù)的準(zhǔn)確性亦很難得到保證。
氣象類節(jié)目是氣象部門為公眾防災(zāi)減災(zāi)及生產(chǎn)生活服務(wù)的重要窗口,亦是公眾獲取氣象信息的重要渠道,氣象稿件的撰寫作為氣象類影視節(jié)目中尤為重要的環(huán)節(jié),保證其質(zhì)量是提高天氣預(yù)報(bào)節(jié)目質(zhì)量、豐富節(jié)目內(nèi)容的重要前提,只有通俗簡潔、層次清晰的稿件,才能讓播報(bào)在達(dá)到準(zhǔn)確標(biāo)準(zhǔn)的前提下更加具有條理。 在撰寫稿件的過程中需要提前搜集大量的氣象資料,挑選并提取出相關(guān)的數(shù)據(jù)進(jìn)行加工。 氣象類稿件自動生成系統(tǒng)能夠進(jìn)行數(shù)據(jù)讀取處理及預(yù)報(bào)產(chǎn)品信息分析工作,且都是通過系統(tǒng)自動完成的,相對人工進(jìn)行數(shù)據(jù)處理所花費(fèi)的時(shí)間減少許多,工作效率得到了極大的提升,很大程度上減少了工作人員每天重復(fù)煩瑣工作的壓力。
撰寫氣象類稿件需要及時(shí)、快捷地提取有效資料信息,亦是提高撰寫效率的第一步[5]。 除了要確保稿件撰寫的效率之外,相比于其他影視節(jié)目,準(zhǔn)確性是氣象類稿件撰寫的首要基本準(zhǔn)則,氣象部門將提高預(yù)報(bào)準(zhǔn)確率作為重中之重。 要想保證氣象類影視播報(bào)的質(zhì)量,氣象類影視節(jié)目的個(gè)性化、多樣性、時(shí)效性、準(zhǔn)確性以及完整性都極為重要。 氣象影視節(jié)目制作的時(shí)間有限,要求在短時(shí)間內(nèi)完成節(jié)目稿件撰寫、數(shù)據(jù)生成、錄制、后期制作、傳送等多個(gè)復(fù)雜煩瑣的工作環(huán)節(jié)[6]。 因此,本文所研究的氣象類稿件自動生成系統(tǒng)的開發(fā)及后續(xù)的應(yīng)用具有重要意義及重大價(jià)值。 氣象類稿件自動生成系統(tǒng)能夠自動整合信息資料,完成氣象類稿件的撰寫,通過設(shè)定好的固定流程更好地保證稿件的綜合質(zhì)量。
氣象類稿件自動生成系統(tǒng)設(shè)計(jì)主要是通過對系統(tǒng)配置文件的編輯定義來實(shí)現(xiàn)一鍵生成氣象類稿件的自動化處理。 處理操作主要包括獲取本地時(shí)間、自動讀取數(shù)據(jù)、自動提取產(chǎn)品有效信息、自動調(diào)整稿件長度及自動添加素材等項(xiàng)目。
目前,氣象類稿件主要數(shù)據(jù)是來源于地面實(shí)時(shí)觀測數(shù)據(jù)及各類氣象預(yù)報(bào)產(chǎn)品,在數(shù)據(jù)讀取及處理、預(yù)報(bào)產(chǎn)品信息分析、稿件編寫方面,采編人員很難在規(guī)定時(shí)間內(nèi)同時(shí)進(jìn)行。 因此,想要更加高效地完成氣象類稿件的撰寫,就需要將數(shù)量較多的氣象數(shù)據(jù)及產(chǎn)品,按照實(shí)際業(yè)務(wù)流程需求進(jìn)行有條理、有目的的自動處理[7]。
例如:通過固定路徑報(bào)文來獲取對應(yīng)每個(gè)旗縣的天氣、風(fēng)向、風(fēng)速,通過輸入當(dāng)日天氣,可以自動對比之前24 h 與48 h 的溫度上升下降的趨勢與范圍來輸出對應(yīng)詞條,再通過獲取的數(shù)據(jù)信息鍵入模板,來生成每日氣象播報(bào)時(shí)所需要的稿件。 處理后,所有數(shù)據(jù)將自動轉(zhuǎn)變,不需要再通過人工進(jìn)行復(fù)雜煩瑣的處理,系統(tǒng)運(yùn)行后,“自動化”特點(diǎn)給實(shí)際業(yè)務(wù)工作帶來最大的效益就是提高了工作效率。
氣象類稿件自動生成系統(tǒng)設(shè)計(jì)中包含數(shù)據(jù)采集的步驟,當(dāng)涉及數(shù)據(jù)采集部分時(shí),使用Python 的文件處理功能及數(shù)據(jù)結(jié)構(gòu)(如字典及列表)來讀取文件內(nèi)容、分析數(shù)據(jù)并提取所需的信息[8-9]。
以下是系統(tǒng)采集部分所用的技術(shù)實(shí)現(xiàn)方法:
(1)數(shù)據(jù)路徑設(shè)置。 使用open()函數(shù)打開指定路徑下的文件,以只讀模式讀取文件內(nèi)容,并使用file 變量引用該文件對象。
(2)文件讀取。 是通過readlines()方法,逐行讀取文件的內(nèi)容,并將每一行的數(shù)據(jù)存儲在列表lines 中。
(3)數(shù)據(jù)采集處理。 是對于每一行數(shù)據(jù),使用空格進(jìn)行分割,去除空格后的元素存儲在列表例如:data_10 中。其次,將第一個(gè)元素作為鍵(城市名稱),將整個(gè)列表例如:target_10 作為值,構(gòu)建一個(gè)鍵值對,并存儲在字典tempDict_10 中。
(4) 數(shù)據(jù)分組。 是通過特定字符串, 例如(′24~48″48~72′)來標(biāo)識數(shù)據(jù)的不同時(shí)間段。 當(dāng)遇'24 ~48'時(shí),將當(dāng)前的tempDict_10 存儲在res_10 字典中,并重新創(chuàng)建一個(gè)空tempDict_10 字典。 當(dāng)遇到'48 ~72'時(shí),表示數(shù)據(jù)采集已完成,跳出循環(huán)。
(5)數(shù)據(jù)提取。 例如:從res_10 字典中提取特定城市的數(shù)據(jù),并存儲在不同的變量中,以供后續(xù)處理及使用。
該方法展示了數(shù)據(jù)采集的一般流程,包括文件操作、數(shù)據(jù)解析及組織,以及數(shù)據(jù)提取及存儲。 通過此方法,可以有效地從給定的文件中采集及處理數(shù)據(jù),為后續(xù)的數(shù)據(jù)分析及應(yīng)用提供準(zhǔn)備。 設(shè)置預(yù)報(bào)數(shù)據(jù)讀取節(jié)點(diǎn),達(dá)到簡單而快速的效果,同時(shí)也可以有效地避免數(shù)據(jù)混讀錯誤。
獲取各數(shù)據(jù)的處理,需要針對每個(gè)城鎮(zhèn)的所獲取的各要素?cái)?shù)據(jù),通過判斷類型的不同,將其進(jìn)行分類并存儲在相應(yīng)的變量中。
以風(fēng)要素為例:使用條件語句(if 語句)對每個(gè)城鎮(zhèn)的風(fēng)力數(shù)據(jù)進(jìn)行判斷。
風(fēng)力級別分類:根據(jù)風(fēng)力級別的不同,將風(fēng)力數(shù)據(jù)進(jìn)行分類,并將分類結(jié)果存儲在相應(yīng)的變量中,寫入到指定路徑生成的文件中。
不同風(fēng)力級別的判斷:根據(jù)不同的風(fēng)力級別,將變量賦予相應(yīng)的描述,如“風(fēng)力不大”“風(fēng)力適中”“風(fēng)力稍大”“風(fēng)力偏大”及“有大風(fēng)陣風(fēng)7 級以上”。 通過代碼,可以對風(fēng)力數(shù)據(jù)進(jìn)行分類及處理,根據(jù)不同的要素獲取相應(yīng)的描述結(jié)果。 可以根據(jù)分類結(jié)果進(jìn)一步使用及分析各類要素?cái)?shù)據(jù),數(shù)據(jù)處理方法可以幫助更好地理解及利用各要素?cái)?shù)據(jù)。 在自動生成氣象類稿件時(shí)再使用一系列的if?elif?else 條件語句,根據(jù)各要素的范圍判斷應(yīng)該選擇哪個(gè)描述文字,將對應(yīng)的描述文字賦值給對應(yīng)的變量。 然后通過write()方法向文件中寫入文本內(nèi)容:各個(gè)地區(qū)的天氣預(yù)報(bào)信息。 最后通過字符串拼接將變量中的值與固定文本連接起來形成完整的描述。
氣象類稿件自動生成系統(tǒng)主要采用了一種基于Python 語言代碼的實(shí)現(xiàn)方法,進(jìn)行構(gòu)建程序結(jié)構(gòu)、設(shè)計(jì)數(shù)組、調(diào)用數(shù)據(jù)文件、編輯對話框等一系列操作,并結(jié)合CIMISS 氣象服務(wù)系統(tǒng)原始數(shù)據(jù)開發(fā)自動、錄入處理程序。
綜上所述,我國經(jīng)濟(jì)一直在不斷發(fā)展,社會和諧進(jìn)步及生態(tài)環(huán)境的可持續(xù)發(fā)展越來越與氣象條件變化息息相關(guān)。 隨著氣象科技的快速發(fā)展,在計(jì)算機(jī)系統(tǒng)的支持下,氣象類稿件編寫資料越來越多,信息量亦越來越大,稿件編寫所需的數(shù)據(jù)讀取及結(jié)論分析方式發(fā)生了重大改變,整體過程減少了人工操作,實(shí)現(xiàn)信息數(shù)據(jù)自動化轉(zhuǎn)變,提高了制作的工作效率。 本系統(tǒng)不僅可以簡化制作業(yè)務(wù)流程,還可以避免由于人工編寫氣象類稿件時(shí)出現(xiàn)效率低下、數(shù)據(jù)錯誤、數(shù)值區(qū)間不統(tǒng)一、文本編寫差異等問題,使節(jié)目在數(shù)據(jù)量快速增加的同時(shí),保證了業(yè)務(wù)效率及節(jié)目質(zhì)量的同步提高及發(fā)展。