郭運(yùn)滔 韓兵
(1.戰(zhàn)略支援部隊(duì)信息工程大學(xué) 河南鄭州 450001;2. 32727部隊(duì))
開源情報(bào)工作是通過公開、合法的方式從公開來源獲取信息,并進(jìn)行加工、提煉獲取情報(bào)的過程[1]。新聞媒體是開源情報(bào)的重要來源,人工智能技術(shù)在新聞?lì)I(lǐng)域得到廣泛應(yīng)用,這對(duì)開源情報(bào)工作構(gòu)成了重大影響。
當(dāng)前人工智能已廣泛應(yīng)用于國內(nèi)外新聞工作的各業(yè)務(wù)環(huán)節(jié)[2],基本涵蓋了從選題策劃、內(nèi)容生產(chǎn)到產(chǎn)品分發(fā)等全過程[3]。
在選題策劃階段,人工智能可以幫助發(fā)現(xiàn)具有潛在新聞價(jià)值的話題和事件,進(jìn)而提供新聞創(chuàng)作思路。傳統(tǒng)的選題策劃主要依賴經(jīng)驗(yàn)和靈感,現(xiàn)在則更多地借助人工智能和大數(shù)據(jù)技術(shù)收集信息、挖掘線索。人工智能可以快速地提取核心觀點(diǎn)、事件發(fā)展趨勢(shì)、輿論情感導(dǎo)向、分析事件傳播路徑,讓新聞生產(chǎn)者迅速了解整個(gè)事件的來龍去脈,提供創(chuàng)作思路,從而縮減創(chuàng)作的時(shí)間,提高新聞價(jià)值[4]。
開發(fā)利用智能化的大數(shù)據(jù)平臺(tái)系統(tǒng),采集挖掘社交媒體數(shù)據(jù),監(jiān)測(cè)網(wǎng)絡(luò)輿情,捕捉網(wǎng)絡(luò)話題,是目前國內(nèi)外主流媒體的普遍做法。這些平臺(tái)的功能模塊一般包括突發(fā)事件預(yù)警、新聞線索發(fā)現(xiàn)、新聞熱點(diǎn)發(fā)現(xiàn)、新聞事件核查、熱度走勢(shì)預(yù)測(cè)、新聞價(jià)值研判和輔助報(bào)道決策等。有的平臺(tái)能自動(dòng)識(shí)別突發(fā)事件線索并高亮突出火災(zāi)、爆炸、交通事故等事件信息,有的平臺(tái)能實(shí)時(shí)監(jiān)測(cè)分析互聯(lián)網(wǎng)信息來源、熱度走勢(shì)、地域分布等,有的平臺(tái)能捕捉熱點(diǎn)事件、分析發(fā)展趨勢(shì)并提出可操作的選題策劃建議[3]。以《紐時(shí)時(shí)報(bào)》為例,其機(jī)器人Blossom能通過社交媒體數(shù)據(jù)分析預(yù)測(cè)用戶關(guān)注度和事件的新聞價(jià)值,而另一款機(jī)器人Editor可以自動(dòng)識(shí)別語義標(biāo)簽并追蹤實(shí)時(shí)新聞要素?cái)?shù)據(jù)[5]。
1.多模態(tài)信息處理
隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,智能化的文本、圖片、音頻、視頻等多模態(tài)信息處理技術(shù)目前已廣泛應(yīng)用于新聞?lì)I(lǐng)域。各種人工智能技術(shù)組合搭配后形成了針對(duì)不同應(yīng)用場(chǎng)景的信息處理工具,大幅度提升了新聞工作效率。語音識(shí)別、語音轉(zhuǎn)換和機(jī)器翻譯技術(shù)相結(jié)合可以實(shí)現(xiàn)語音轉(zhuǎn)文字和多語種實(shí)時(shí)轉(zhuǎn)寫,方便了訪談等錄音的整理。在智能標(biāo)引、語音合成、語義檢索等技術(shù)支撐下,可以將文字稿直接轉(zhuǎn)換為視頻,并實(shí)現(xiàn)音視頻智能生成。計(jì)算機(jī)視覺和自動(dòng)摘要等技術(shù)融合實(shí)現(xiàn)了視頻資料的識(shí)別與高效處理。數(shù)據(jù)可視化技術(shù)則可以更直觀地展示數(shù)據(jù)內(nèi)涵,方便受眾理解新聞。
2.機(jī)器人寫作
寫稿機(jī)器人是一種基于算法的自動(dòng)編寫新聞的計(jì)算機(jī)軟件程序[6],可以運(yùn)用大數(shù)據(jù)分析和云計(jì)算技術(shù)從海量信息中篩選出有價(jià)值的內(nèi)容,并結(jié)合自然語言處理技術(shù)以符合人類閱讀習(xí)慣的方式呈現(xiàn)。寫稿機(jī)器人主要有模板式、抽取式、生成式等三種內(nèi)容生成方式,基于數(shù)據(jù)挖掘和算法優(yōu)化的模板式是目前應(yīng)用最廣泛的一種[7]。寫稿機(jī)器人的一般工作流程包括建設(shè)內(nèi)容數(shù)據(jù)庫、抓取或輸入相關(guān)報(bào)道素材、利用算法進(jìn)行處理和分析、發(fā)現(xiàn)信息關(guān)聯(lián)和趨勢(shì)、確定新聞寫作角度和方向、自動(dòng)選用寫作模板并生成新聞、內(nèi)容審核和分發(fā)等。機(jī)器人寫作能大幅提升新聞生產(chǎn)速度,強(qiáng)化新聞生產(chǎn)的客觀性和數(shù)據(jù)的準(zhǔn)確性,有利于讓記者和編輯從事更具理性沉思的深度報(bào)道和探討社會(huì)意義的人文寫作。
3.新聞內(nèi)容校審
人工智能還應(yīng)用于新聞事實(shí)核查和新聞內(nèi)容校審。網(wǎng)絡(luò)虛假信息甄別技術(shù)是開展新聞事實(shí)核查的重要手段,目前主要有語言特征分析、社交網(wǎng)絡(luò)分析和圖像特征分析等三種智能核查方法,能從文字內(nèi)容、傳播行為和圖像特征入手檢測(cè)信息的真實(shí)性[8]。新聞內(nèi)容的校對(duì)質(zhì)檢是自然語言處理技術(shù)在新聞?lì)I(lǐng)域的另一個(gè)應(yīng)用場(chǎng)景,能有效提升校審效率。例如,新華社智能檢校機(jī)器人“較真”在傳統(tǒng)檢校軟件功能的基礎(chǔ)上應(yīng)用了機(jī)器學(xué)習(xí)技術(shù),可以實(shí)現(xiàn)人名自動(dòng)識(shí)別、語言語法使用、語義搭配理解、知識(shí)辨別、邏輯搭配、日期規(guī)范及稿件電頭格式等方面的校驗(yàn)功能[3]。
算法推薦技術(shù)應(yīng)用于新聞分發(fā)環(huán)節(jié),有效提高了新聞分發(fā)速度和精準(zhǔn)度。算法推薦有“用戶畫像”和“聊新聞”兩種實(shí)現(xiàn)模式?!坝脩舢嬒瘛币哉倩厮惴ê团判蛩惴榛舅惴ㄔ韀9],實(shí)踐中通過采集互聯(lián)網(wǎng)上用戶個(gè)人信息和使用“痕跡”數(shù)據(jù),分析公眾的個(gè)性化需求,進(jìn)而繪制出因人而異的公眾日常生活圖譜和社交網(wǎng)絡(luò)圖譜,并在圖譜的“指導(dǎo)”下,自動(dòng)在數(shù)據(jù)庫中進(jìn)行信息檢索匹配后完成推送工作[10]。目前百度新聞和今日頭條都采用了類似的個(gè)性化推薦技術(shù)。“聊新聞”模式是用人工智能技術(shù)搭建一個(gè)聊天“機(jī)器人”,在聊天過程中通過關(guān)鍵詞提取和話語分析來獲知用戶的情感偏好和個(gè)人興趣,并向其推送相應(yīng)的新聞信息。
新聞媒體智能化對(duì)開源情報(bào)工作的影響是全面的、深遠(yuǎn)的和系統(tǒng)性的。
機(jī)器生成內(nèi)容克服了人的部分生理限制,制造了豐富的開源情報(bào)素材。一是人工智能使新聞產(chǎn)出數(shù)量急劇增加。當(dāng)前絕大部分新聞媒體都已經(jīng)實(shí)現(xiàn)了電子化,很容易在線獲取[11]。人工智能應(yīng)用于內(nèi)容生產(chǎn),催生了即時(shí)數(shù)據(jù)新聞、視覺新聞、互動(dòng)新聞、自動(dòng)化新聞、傳感器新聞等報(bào)道樣式[12]。這些新報(bào)道樣式在本質(zhì)上都是以數(shù)據(jù)驅(qū)動(dòng)新聞生產(chǎn),通過對(duì)網(wǎng)絡(luò)海量數(shù)據(jù)信息的挖掘、統(tǒng)計(jì)和分析,找出數(shù)據(jù)間的相關(guān)性,發(fā)現(xiàn)新聞線索,確定報(bào)道選題并通過可視化的數(shù)據(jù)形式呈現(xiàn)新聞故事的新聞報(bào)道方式[10]。二是人工智能幫助豐富了新聞報(bào)道的角度。通過專題聚類可以對(duì)事件進(jìn)行全方位描述,匯聚采集各方觀點(diǎn),為更加全面地開展情報(bào)分析奠定了基礎(chǔ)。三是機(jī)器翻譯技術(shù)使新聞利用突破了語言限制。新聞媒體通常使用標(biāo)準(zhǔn)詞匯,遵循公式化的結(jié)構(gòu),因此機(jī)器翻譯新聞內(nèi)容非常高效。
人工智能的應(yīng)用提升了新聞的情報(bào)價(jià)值和效用,從中提煉出有價(jià)值情報(bào)的可能性越來越大。第一,人工智能提升了新聞的時(shí)效性。從新聞事件的發(fā)生到新聞報(bào)道發(fā)出的時(shí)間間隔被縮短至秒級(jí),并且可以7×24小時(shí)不間斷工作,任何突發(fā)事件都會(huì)被迅速報(bào)道,極大地滿足了動(dòng)向和態(tài)勢(shì)情報(bào)的監(jiān)控需求。第二,人工智能部分地減少了新聞生產(chǎn)過程中的主觀性影響?;跀?shù)據(jù)和算法的新聞生產(chǎn)方式,解放了人力,并在一定程度上消除了采編人員個(gè)人因素的影響。第三,人工智能可以更有效地對(duì)抗假新聞。在網(wǎng)絡(luò)環(huán)境中,假新聞形式多樣、識(shí)別困難,深度偽造等新技術(shù)的應(yīng)用使局面更加復(fù)雜嚴(yán)峻,這種情況下只能寄希望于先進(jìn)技術(shù)[13]。
新聞的智能化導(dǎo)致海量新聞當(dāng)中無關(guān)信息、虛假信息充斥,同質(zhì)化問題嚴(yán)重,增加了開源情報(bào)開發(fā)難度和成本。首先,新聞機(jī)構(gòu)應(yīng)用人工智能技術(shù)的水平參差不齊,甚至形成代差,導(dǎo)致新聞產(chǎn)出質(zhì)量標(biāo)準(zhǔn)不一。其次,算法技術(shù)中隱藏著技術(shù)開發(fā)人員的算法偏見和利益相關(guān)者的經(jīng)濟(jì)目標(biāo),影響新聞的客觀性。再次,智能推送導(dǎo)致產(chǎn)生“信息繭房”、回音室效應(yīng)和群體極化效應(yīng),造成偏頗的信息內(nèi)容和片面的信息來源充斥,少數(shù)派觀點(diǎn)被壓制。最后,新聞的海量增長要求增加人財(cái)物投入,使從業(yè)人員素質(zhì)和軟硬件技術(shù)水平與開源情報(bào)發(fā)展要求相匹配。
人工智能技術(shù)的應(yīng)用促進(jìn)了新聞與開源情報(bào)的競(jìng)爭(zhēng)與融合,并在客觀上提高了開源情報(bào)工作的標(biāo)準(zhǔn)與要求。一方面,人工智能應(yīng)用于新聞,能更直接更便捷地滿足用戶的即時(shí)信息需求,從而導(dǎo)致開源情報(bào)用戶流失,體現(xiàn)出新聞對(duì)開源情報(bào)的競(jìng)爭(zhēng)優(yōu)勢(shì)。另一方面,新聞與開源情報(bào)呈現(xiàn)明顯的交叉融合。盡管新聞與開源情報(bào)分屬傳播學(xué)和情報(bào)學(xué)兩個(gè)學(xué)科,但是在本質(zhì)上都是信息,并且當(dāng)前二者在研究對(duì)象、研究方法和應(yīng)用領(lǐng)域的交叉越來越明顯。
要有效應(yīng)對(duì)新聞智能化,開源情報(bào)工作應(yīng)積極引進(jìn)和改造相關(guān)新聞智能化技術(shù),并創(chuàng)造性開發(fā)一些特色技術(shù)。
新聞是開源情報(bào)的基礎(chǔ)性來源。開源信息可以劃分為由機(jī)構(gòu)產(chǎn)生的新聞媒體內(nèi)容、灰色文獻(xiàn)和由個(gè)人產(chǎn)生的社交短文、社交長文,新聞媒體內(nèi)容在采集、處理、利用和生產(chǎn)等開源情報(bào)業(yè)務(wù)流程當(dāng)中的利用難度最小[11],可以視為開源情報(bào)的基礎(chǔ)。
新聞技術(shù)一般領(lǐng)先并引領(lǐng)開源情報(bào)技術(shù)發(fā)展。開源情報(bào)以特定情報(bào)用戶為服務(wù)對(duì)象,以服務(wù)決策為主要目標(biāo),因此多以行政化方式運(yùn)作。新聞面向特定受眾群體,強(qiáng)調(diào)新聞的內(nèi)容價(jià)值同時(shí)更強(qiáng)調(diào)新聞的傳播價(jià)值,市場(chǎng)化競(jìng)爭(zhēng)更有利于新聞?lì)I(lǐng)域的技術(shù)創(chuàng)新。情報(bào)來源公開是開源情報(bào)的基本內(nèi)涵,情報(bào)來源的變化與人類社會(huì)信息傳播媒介技術(shù)的發(fā)展緊密相關(guān)。例如,針對(duì)印刷媒體,開源情報(bào)的工作重點(diǎn)是編制索引、儲(chǔ)存和方便獲取書面信息,為此發(fā)展出了剪報(bào)技術(shù),“一把剪刀、一瓶漿糊和一個(gè)資料柜”成為許多情報(bào)專家的標(biāo)配。開源情報(bào)工作要應(yīng)對(duì)新聞的智能化必須首先學(xué)習(xí)新聞的智能化。具體從實(shí)踐角度看,前文提到的新聞智能化應(yīng)用幾乎都可以對(duì)應(yīng)到開源情報(bào)具體流程當(dāng)中,并能拓展應(yīng)用于新聞之外的信息。例如,虛假新聞?wù)鐒e技術(shù)可以應(yīng)用于開源情報(bào)溯源查證等。
開源情報(bào)工作有其特殊性,在引進(jìn)新聞智能化技術(shù)的同時(shí)需要結(jié)合實(shí)踐加以改造。比如新聞產(chǎn)品不能代替開源情報(bào)。新聞強(qiáng)調(diào)傳播價(jià)值,以有趣或有用的內(nèi)容吸引人。開源情報(bào)更突出效用性和競(jìng)爭(zhēng)性,而且在此基礎(chǔ)上會(huì)產(chǎn)生某些保密要求,因此可能需要增加保密功能模塊等內(nèi)容。又如,內(nèi)容上開源情報(bào)一般與國家安全相關(guān),新聞涵蓋領(lǐng)域則更寬泛,具體的分析方法可能存在差異。再如,與采集新聞受眾的數(shù)據(jù)信息相比,情報(bào)用戶數(shù)據(jù)信息的采集存在較多限制,采用用戶畫像方式進(jìn)行開源情報(bào)推送的可行性存疑。在具體的開源情報(bào)部門,智能化技術(shù)的引進(jìn)和改造也應(yīng)特別注意以現(xiàn)實(shí)需求為依據(jù)。
引進(jìn)和改造智能化技術(shù)的同時(shí),必須重視創(chuàng)造性開發(fā)。開源情報(bào)是大情報(bào)體系當(dāng)中的一個(gè)門類,發(fā)揮著引導(dǎo)情報(bào)搜集和為秘密情報(bào)提供補(bǔ)充等作用。除了直接以產(chǎn)品服務(wù)用戶外,還有情報(bào)協(xié)同、多元情報(bào)融合等應(yīng)用場(chǎng)景,這些場(chǎng)景是新聞工作中一般涉及不到的。人工智能技術(shù)還處于弱人工智能發(fā)展階段,與之關(guān)聯(lián)的數(shù)據(jù)、算法和算力等要素正在快速發(fā)展過程中。開源情報(bào)智能化技術(shù)創(chuàng)新應(yīng)當(dāng)緊跟新技術(shù)發(fā)展,結(jié)合服務(wù)特定應(yīng)用場(chǎng)景進(jìn)行開發(fā)。另外在開發(fā)過程中還必須警惕“技術(shù)崇拜”,注意及時(shí)預(yù)判和解決智能化技術(shù)可能帶來的負(fù)面影響。