徐常亮
相比于擁有數(shù)百年歷史的媒體行業(yè),人工智能是一個嶄新的概念。這項復(fù)雜的技術(shù)基于一個簡單的理念:讓機器來認知世界,通過人類難以企及的計算能力來解決問題和完成復(fù)雜的工作。2011年,Google首先提出了谷歌大腦的概念,一年后他們就做出了一個標志性的成果:讓計算機識別貓臉。這個項目利用互聯(lián)網(wǎng)數(shù)據(jù)來訓練,更多地是在打造一種底層平臺。這意味著人工智能第一個階段的開端:讓機器來認知世界。
2016年以來,發(fā)源于互聯(lián)網(wǎng)行業(yè)的人工智能,開始向互聯(lián)網(wǎng)以外的行業(yè)延伸,觸達傳統(tǒng)行業(yè),甚至在一些特定領(lǐng)域引起了顛覆性的革新和質(zhì)變。谷歌旗下的Deepmind研發(fā)的AlphaGo在圍棋這一細分領(lǐng)域擊敗了人類棋手,讓大眾開始認識和了解人工智能這一概念。幾乎同一時間段,阿里云推出城市大腦,讓人工智能開始應(yīng)對交通和城市管理的問題。人工智能第二個階段的探索開始了:讓人工智能來解決問題和完成工作。
媒體大腦是媒體與人工智能融合的產(chǎn)物。從報紙到廣播、電視,再到互聯(lián)網(wǎng)和智能手機,技術(shù)一直是驅(qū)動媒體變革和發(fā)展的力量之源,現(xiàn)在無疑又到了一個媒體需要變革的時代,有一系列的問題亟待解決:新聞的核心生產(chǎn)力靠什么技術(shù)?影響力靠什么提升?未來的新聞資源在哪里?下一代媒體到底長什么樣?
2017年12月26日在成都舉行的第五屆中國新興媒體產(chǎn)業(yè)融合發(fā)展大會上,新華社發(fā)布中國第一個媒體人工智能平臺——“媒體大腦”(mp.shuwen.com)和第一條MGC(Machine Generated Content,機器生產(chǎn)內(nèi)容)視頻新聞,向海內(nèi)外媒體提供2410(智能媒體生產(chǎn)平臺)、采蜜、新聞分發(fā)、版權(quán)監(jiān)測、人臉核查、用戶畫像、智能會話、語音合成等8個模塊的服務(wù),探索人工智能時代媒介形態(tài)和傳播方式的未來。
2018年1月,新華社社長蔡名照指出:“今年,新華社將整合全社人工智能資源,升級“現(xiàn)場云”資源聚合平臺,利用“媒體大腦”平臺的智能采集、用戶分析、圖像識別、語音合成等功能,推進在策劃、采集、編輯、加工、分發(fā)、反饋等全流程應(yīng)用,探索智能化編輯部的標準和范式,搶占融合發(fā)展制高點?!?/p>
今年兩會期間,“媒體大腦”在新華社微信上推出了MGC報道,呈現(xiàn)如兩會工作報告中關(guān)鍵詞、高頻詞的趨勢變化等,背后已經(jīng)是一條智能化新聞生產(chǎn)流水線:由記者和編輯來定義產(chǎn)品設(shè)計模型,然后讓機器批量生產(chǎn)內(nèi)容。
負責“媒體大腦”研發(fā)和落地的是新華智云,其slogan是:“憑計算之力,求數(shù)據(jù)洞察,賦萬物為媒,迎智能時代。”“媒體大腦”實際上是新華智云對這條slogan的實踐,它的核心要素包含在四個詞匯中:計算、數(shù)據(jù)、萬物、智能。計算聯(lián)結(jié)數(shù)據(jù),智能賦予萬物。
孤立的數(shù)據(jù)無法產(chǎn)生價值,大數(shù)據(jù)對“量”這一指標的需求是空前的,數(shù)據(jù)的聯(lián)結(jié)靠的是計算。媒體行業(yè)百十年來累積下了巨量的數(shù)據(jù)資源,是有待挖掘的寶地和礦藏。
互聯(lián)網(wǎng)公司內(nèi)有這樣一種思維:“一切業(yè)務(wù)數(shù)據(jù)化,一切數(shù)據(jù)業(yè)務(wù)化?!边@很像毛澤東提出的“從群眾中來,到群眾中去”的工作方法,只不過需要提煉和系統(tǒng)化的對象變成了一項項具體的業(yè)務(wù)。媒體同樣是業(yè)務(wù)的一種,而人工智能的快速發(fā)展,則讓媒體看到了這一工作方法的現(xiàn)實可行途徑。
業(yè)務(wù)數(shù)據(jù)化,首先要做到的是讓線下數(shù)據(jù)走向線上,讓過去的數(shù)據(jù)產(chǎn)生價值。在機器識別貓這一過程中,人工智能首先得到了幾百萬幀的靜態(tài)視頻資料;AlphaGo在剛剛起步時,同樣搜羅了巨量的人類棋譜來學習。這是讓既有的信息記錄,變成人工智能管理下的數(shù)據(jù)資源。通過強大的計算力,人工智能可以在圖片間、棋譜間找到關(guān)聯(lián),進而得到“識別貓”“下圍棋”等具體的能力。
數(shù)據(jù)業(yè)務(wù)化,為人工智能的工作找到一個出口,并進一步接收反饋。AlphaGo通過自我對弈和與人類高手的較量,不斷調(diào)整自己的棋路以及對勝負的預(yù)期,最終獲得了人類難以企及的棋力;城市大腦根據(jù)城市攝像頭數(shù)據(jù)對紅綠燈的放行策略進行優(yōu)化調(diào)整,具體的調(diào)整結(jié)果又會反饋到城市大腦中,成為進一步完善調(diào)整策略的重要參考。過往成功的人工智能案例在這一步上所做的,是讓數(shù)據(jù)的使用和反饋成為一個閉環(huán),而這也是媒體和人工智能融合過程中的一條必經(jīng)之路。
新聞記錄的是歷史,沉淀的是數(shù)據(jù)。路透社流傳著一句話,“在新聞成為新聞之前,都在路透社存著”,而在新華智云看來,“Before it’s news,it’s data;After it’s news,it’s data”。也就是說新聞即數(shù)據(jù),數(shù)據(jù)即新聞。媒體大腦的第一項工作,就是去建立一個全球最大的新聞資訊庫,這包括了文字、圖片、音頻和視頻等各種媒介形式,也包括了主流媒體和自媒體乃至UGC(用戶生產(chǎn)內(nèi)容)等各類信息來源。搜羅信息僅僅是一個開端,讓信息結(jié)構(gòu)化、標簽化才是“一切業(yè)務(wù)數(shù)據(jù)化”的關(guān)鍵,而這個過程中必不可少的就是算力。隨著云計算業(yè)務(wù)的發(fā)展,媒體大腦可以調(diào)用的計算資源在近幾年間得到了巨幅提升,這對媒體而言是前所未有的一次機遇,也是“媒體大腦”得以成立和發(fā)展的重要基礎(chǔ)。
在收集反饋、形成閉環(huán)方面上,人工智能的發(fā)展早已走在了前面。隨著互聯(lián)網(wǎng)和智能手機的快速普及,新聞受眾對于信息的反饋早已不再是慢悠悠的“讀編往來”,人工智能的一個小分支——推薦算法,近幾年來已經(jīng)形成了一種行之有效的商業(yè)模式。對于媒體來說,收集受眾的反饋本該比過去任何一個時代更簡單。但在實際工作中,很多媒體卻受限于工作思路或媒介形式,缺乏相應(yīng)的信息溝通渠道。匯總了全媒體信息和數(shù)據(jù)的“媒體大腦”,提供的正是這樣一種一站式的解決方案。它收集的反饋一方面使媒體受惠,另一方面還能為人工智能的自我進化提供數(shù)據(jù)支持,讓媒體和人工智能間達到互利共贏的效果,這也是媒體和人工智能融合的價值和意義所在。
▲2410(智能生產(chǎn)平臺)
人工智能并不獨立存在,它需要依托于作為“物”的計算機和智能設(shè)備才可以工作。而反過來說,人工智能也可以賦能給各種各樣的設(shè)備,讓它們具有感知世界、向世界發(fā)聲的能力——這是人類能力的延伸。隨著人工智能的發(fā)展,我們也將目睹一個萬物為媒的進化過程。
媒體大腦2410(智能媒體生產(chǎn)平臺)目前運用人工智能技術(shù)、大數(shù)據(jù)技術(shù)、物聯(lián)網(wǎng)技術(shù)、云計算技術(shù),由MGC覆蓋突發(fā)事件、程序性報道、輿情報道。其生產(chǎn)過程是:首先通過攝像頭、傳感器、無人機等方式獲取視頻和數(shù)據(jù),然后經(jīng)由圖像識別、視頻識別等技術(shù)讓機器進行內(nèi)容理解和新聞價值判斷,選取報道角度,將新理解的內(nèi)容與已有知識圖譜進行關(guān)聯(lián),對語義進行檢索,并配合接入天氣、交通、地理等數(shù)據(jù),經(jīng)過視頻編輯、語音合成、數(shù)據(jù)可視化等一系列過程,最終生成一條富媒體內(nèi)容(文字、視頻、圖譜、音頻、可視化)。這條素材和線索,可以在不同的平臺上展示,如移動端、智能音箱。由于人工智能的牽線搭橋,萬物成為了廣義上媒體的一部分。
新華社提出的MGC新聞這一概念,與廣為人知的UGC形成了對應(yīng)。在新聞領(lǐng)域,MGC和UGC的共性是在第一時間、從第一現(xiàn)場搜集第一手的新聞素材,但MGC的潛力顯然更勝一籌:它的感知設(shè)備是可復(fù)制的,將來覆蓋的時間、空間和信息收集的類別都將遠超于人類。機器收集的素材也不存在主觀判斷問題,它是一個更加真實、全面,也更加結(jié)構(gòu)化、數(shù)據(jù)化的新聞資源。MGC今后的產(chǎn)量將是UGC的3倍或者三次方以上,借助機器,人們可以更高效地生產(chǎn)專業(yè)內(nèi)容。
在可預(yù)見的未來,MGC的發(fā)展將與智能設(shè)備的發(fā)展緊密聯(lián)系在一起,信息渠道的多寡決定了MGC的覆蓋面和進步速度。這包括了行車記錄儀、無人機、智能家居等各類攝像和傳感設(shè)備,以智能音箱、智能電視為代表的各類信息輸出設(shè)備,還包括潛在的VR(虛擬現(xiàn)實)/AR(增強現(xiàn)實)設(shè)備,甚至是未來可能無所不包的機器人。人工智能將全面賦能給這些設(shè)備,并從中獲取自己成長所需的養(yǎng)分。
在人工智能領(lǐng)域,有一個長久以來被爭論的問題:人工智能是否會取代人類?具體到媒體領(lǐng)域,人工智能有沒有可能取代記者、編輯?MGC新聞是否會替代人類的報道?2013年,牛津大學的Carl Benedikt Frey和Michael A. Osborne發(fā)表了一篇論文,對702種職業(yè)被人工智能取代的可能性做出了分析。具體到記者這個職業(yè),論文中認為人工智能可以取而代之的概率只有11%。兩位學者提到了難以被人工智能取代職業(yè)的三個特征:幫助和關(guān)切他人、思考和創(chuàng)意內(nèi)容、社交和談判能力。截至2017年末,這篇論文已經(jīng)被引用超過1500次。
可以看到,媒體人在日常工作中,恰恰對這三個特征都有一定程度的需求,而這其實就對應(yīng)著我們評價新聞報道時常說的有溫度、有態(tài)度、有深度。如果新聞欠缺這些要素,那它確實可能被機器所取代,但這顯然不應(yīng)成為媒體人對自己的要求。人工智能的發(fā)展和MGC新聞的出現(xiàn),其實為媒體人展示的是另一條路徑:讓機器做機器擅長的事情,去成為人類的千里眼、順風耳,去承擔低價值的重復(fù)、枯燥的勞動,而內(nèi)容工作者將由此得到生產(chǎn)力上的解放。
過去和現(xiàn)在的記者都需要花費巨量的時間在搜集、整理新聞相關(guān)的資料和素材上,這件事未來就可以讓機器來做,而且很可能比人類做得更加有條理、有效率;以往記者收集自己作品的反饋費時費力,未來這同樣可以由機器代勞。媒體與人工智能的融合會在新聞生產(chǎn)流程中提高效率,而節(jié)約出來的時間就可以讓記者去做更有價值、更有觀點、更有溫度的深度報道?!懊襟w大腦”所推動的,正是這樣一次新聞生產(chǎn)流程的重塑,進而改變媒體由內(nèi)到外的整體生態(tài)環(huán)境。(見圖1)
圖1 “媒體大腦”賦能的記者工作場景模擬
未來優(yōu)秀的媒體人不必是人工智能專家,但他/她一定知道怎樣利用人工智能來更好地為自己的工作服務(wù)?!懊襟w大腦”和MGC視頻新聞的出現(xiàn),不是要取代記者和編輯,而是在更高層面上,把人與物的延伸連接起來,更快、更準、更智能地獲得新聞線索和新聞素材,賦能記者和編輯,幫助媒體提高生產(chǎn)力。在媒體和人工智能的融合之路上,“媒體大腦”將與媒體攜手前行。