媒體大腦
——媒體與人工智能的融合重生之路

2018-06-29 07:16:00徐常亮

視聽界 2018年3期

徐常亮

相比于擁有數(shù)百年歷史的媒體行業(yè)，人工智能是一個嶄新的概念。這項復(fù)雜的技術(shù)基于一個簡單的理念：讓機器來認知世界,通過人類難以企及的計算能力來解決問題和完成復(fù)雜的工作。2011年，Google首先提出了谷歌大腦的概念，一年后他們就做出了一個標志性的成果：讓計算機識別貓臉。這個項目利用互聯(lián)網(wǎng)數(shù)據(jù)來訓練，更多地是在打造一種底層平臺。這意味著人工智能第一個階段的開端：讓機器來認知世界。

2016年以來，發(fā)源于互聯(lián)網(wǎng)行業(yè)的人工智能，開始向互聯(lián)網(wǎng)以外的行業(yè)延伸，觸達傳統(tǒng)行業(yè)，甚至在一些特定領(lǐng)域引起了顛覆性的革新和質(zhì)變。谷歌旗下的Deepmind研發(fā)的AlphaGo在圍棋這一細分領(lǐng)域擊敗了人類棋手，讓大眾開始認識和了解人工智能這一概念。幾乎同一時間段，阿里云推出城市大腦，讓人工智能開始應(yīng)對交通和城市管理的問題。人工智能第二個階段的探索開始了：讓人工智能來解決問題和完成工作。

媒體大腦是媒體與人工智能融合的產(chǎn)物。從報紙到廣播、電視，再到互聯(lián)網(wǎng)和智能手機，技術(shù)一直是驅(qū)動媒體變革和發(fā)展的力量之源，現(xiàn)在無疑又到了一個媒體需要變革的時代，有一系列的問題亟待解決：新聞的核心生產(chǎn)力靠什么技術(shù)？影響力靠什么提升？未來的新聞資源在哪里？下一代媒體到底長什么樣？

2017年12月26日在成都舉行的第五屆中國新興媒體產(chǎn)業(yè)融合發(fā)展大會上，新華社發(fā)布中國第一個媒體人工智能平臺——“媒體大腦”（mp.shuwen.com）和第一條MGC（Machine Generated Content，機器生產(chǎn)內(nèi)容）視頻新聞，向海內(nèi)外媒體提供2410（智能媒體生產(chǎn)平臺）、采蜜、新聞分發(fā)、版權(quán)監(jiān)測、人臉核查、用戶畫像、智能會話、語音合成等8個模塊的服務(wù)，探索人工智能時代媒介形態(tài)和傳播方式的未來。

2018年1月，新華社社長蔡名照指出：“今年，新華社將整合全社人工智能資源，升級“現(xiàn)場云”資源聚合平臺，利用“媒體大腦”平臺的智能采集、用戶分析、圖像識別、語音合成等功能，推進在策劃、采集、編輯、加工、分發(fā)、反饋等全流程應(yīng)用，探索智能化編輯部的標準和范式，搶占融合發(fā)展制高點?！?/p>

今年兩會期間，“媒體大腦”在新華社微信上推出了MGC報道，呈現(xiàn)如兩會工作報告中關(guān)鍵詞、高頻詞的趨勢變化等，背后已經(jīng)是一條智能化新聞生產(chǎn)流水線：由記者和編輯來定義產(chǎn)品設(shè)計模型，然后讓機器批量生產(chǎn)內(nèi)容。

負責“媒體大腦”研發(fā)和落地的是新華智云，其slogan是：“憑計算之力，求數(shù)據(jù)洞察，賦萬物為媒，迎智能時代。”“媒體大腦”實際上是新華智云對這條slogan的實踐，它的核心要素包含在四個詞匯中：計算、數(shù)據(jù)、萬物、智能。計算聯(lián)結(jié)數(shù)據(jù)，智能賦予萬物。

一、數(shù)據(jù)計算合

孤立的數(shù)據(jù)無法產(chǎn)生價值，大數(shù)據(jù)對“量”這一指標的需求是空前的，數(shù)據(jù)的聯(lián)結(jié)靠的是計算。媒體行業(yè)百十年來累積下了巨量的數(shù)據(jù)資源，是有待挖掘的寶地和礦藏。

互聯(lián)網(wǎng)公司內(nèi)有這樣一種思維：“一切業(yè)務(wù)數(shù)據(jù)化，一切數(shù)據(jù)業(yè)務(wù)化?！边@很像毛澤東提出的“從群眾中來，到群眾中去”的工作方法，只不過需要提煉和系統(tǒng)化的對象變成了一項項具體的業(yè)務(wù)。媒體同樣是業(yè)務(wù)的一種，而人工智能的快速發(fā)展，則讓媒體看到了這一工作方法的現(xiàn)實可行途徑。

業(yè)務(wù)數(shù)據(jù)化，首先要做到的是讓線下數(shù)據(jù)走向線上，讓過去的數(shù)據(jù)產(chǎn)生價值。在機器識別貓這一過程中，人工智能首先得到了幾百萬幀的靜態(tài)視頻資料；AlphaGo在剛剛起步時，同樣搜羅了巨量的人類棋譜來學習。這是讓既有的信息記錄，變成人工智能管理下的數(shù)據(jù)資源。通過強大的計算力，人工智能可以在圖片間、棋譜間找到關(guān)聯(lián)，進而得到“識別貓”“下圍棋”等具體的能力。

數(shù)據(jù)業(yè)務(wù)化，為人工智能的工作找到一個出口，并進一步接收反饋。AlphaGo通過自我對弈和與人類高手的較量，不斷調(diào)整自己的棋路以及對勝負的預(yù)期，最終獲得了人類難以企及的棋力；城市大腦根據(jù)城市攝像頭數(shù)據(jù)對紅綠燈的放行策略進行優(yōu)化調(diào)整，具體的調(diào)整結(jié)果又會反饋到城市大腦中，成為進一步完善調(diào)整策略的重要參考。過往成功的人工智能案例在這一步上所做的，是讓數(shù)據(jù)的使用和反饋成為一個閉環(huán)，而這也是媒體和人工智能融合過程中的一條必經(jīng)之路。

新聞記錄的是歷史，沉淀的是數(shù)據(jù)。路透社流傳著一句話，“在新聞成為新聞之前，都在路透社存著”，而在新華智云看來，“Before it’s news,it’s data;After it’s news,it’s data”。也就是說新聞即數(shù)據(jù)，數(shù)據(jù)即新聞。媒體大腦的第一項工作，就是去建立一個全球最大的新聞資訊庫，這包括了文字、圖片、音頻和視頻等各種媒介形式，也包括了主流媒體和自媒體乃至UGC（用戶生產(chǎn)內(nèi)容）等各類信息來源。搜羅信息僅僅是一個開端，讓信息結(jié)構(gòu)化、標簽化才是“一切業(yè)務(wù)數(shù)據(jù)化”的關(guān)鍵，而這個過程中必不可少的就是算力。隨著云計算業(yè)務(wù)的發(fā)展，媒體大腦可以調(diào)用的計算資源在近幾年間得到了巨幅提升，這對媒體而言是前所未有的一次機遇，也是“媒體大腦”得以成立和發(fā)展的重要基礎(chǔ)。

在收集反饋、形成閉環(huán)方面上，人工智能的發(fā)展早已走在了前面。隨著互聯(lián)網(wǎng)和智能手機的快速普及，新聞受眾對于信息的反饋早已不再是慢悠悠的“讀編往來”，人工智能的一個小分支——推薦算法，近幾年來已經(jīng)形成了一種行之有效的商業(yè)模式。對于媒體來說，收集受眾的反饋本該比過去任何一個時代更簡單。但在實際工作中，很多媒體卻受限于工作思路或媒介形式，缺乏相應(yīng)的信息溝通渠道。匯總了全媒體信息和數(shù)據(jù)的“媒體大腦”，提供的正是這樣一種一站式的解決方案。它收集的反饋一方面使媒體受惠，另一方面還能為人工智能的自我進化提供數(shù)據(jù)支持，讓媒體和人工智能間達到互利共贏的效果，這也是媒體和人工智能融合的價值和意義所在。

▲2410(智能生產(chǎn)平臺)

二、智能萬物蘇

人工智能并不獨立存在，它需要依托于作為“物”的計算機和智能設(shè)備才可以工作。而反過來說，人工智能也可以賦能給各種各樣的設(shè)備，讓它們具有感知世界、向世界發(fā)聲的能力——這是人類能力的延伸。隨著人工智能的發(fā)展，我們也將目睹一個萬物為媒的進化過程。

媒體大腦2410（智能媒體生產(chǎn)平臺）目前運用人工智能技術(shù)、大數(shù)據(jù)技術(shù)、物聯(lián)網(wǎng)技術(shù)、云計算技術(shù)，由MGC覆蓋突發(fā)事件、程序性報道、輿情報道。其生產(chǎn)過程是：首先通過攝像頭、傳感器、無人機等方式獲取視頻和數(shù)據(jù)，然后經(jīng)由圖像識別、視頻識別等技術(shù)讓機器進行內(nèi)容理解和新聞價值判斷，選取報道角度，將新理解的內(nèi)容與已有知識圖譜進行關(guān)聯(lián)，對語義進行檢索，并配合接入天氣、交通、地理等數(shù)據(jù)，經(jīng)過視頻編輯、語音合成、數(shù)據(jù)可視化等一系列過程，最終生成一條富媒體內(nèi)容（文字、視頻、圖譜、音頻、可視化）。這條素材和線索，可以在不同的平臺上展示，如移動端、智能音箱。由于人工智能的牽線搭橋，萬物成為了廣義上媒體的一部分。

新華社提出的MGC新聞這一概念，與廣為人知的UGC形成了對應(yīng)。在新聞領(lǐng)域，MGC和UGC的共性是在第一時間、從第一現(xiàn)場搜集第一手的新聞素材，但MGC的潛力顯然更勝一籌：它的感知設(shè)備是可復(fù)制的，將來覆蓋的時間、空間和信息收集的類別都將遠超于人類。機器收集的素材也不存在主觀判斷問題，它是一個更加真實、全面，也更加結(jié)構(gòu)化、數(shù)據(jù)化的新聞資源。MGC今后的產(chǎn)量將是UGC的3倍或者三次方以上，借助機器，人們可以更高效地生產(chǎn)專業(yè)內(nèi)容。

在可預(yù)見的未來，MGC的發(fā)展將與智能設(shè)備的發(fā)展緊密聯(lián)系在一起，信息渠道的多寡決定了MGC的覆蓋面和進步速度。這包括了行車記錄儀、無人機、智能家居等各類攝像和傳感設(shè)備，以智能音箱、智能電視為代表的各類信息輸出設(shè)備，還包括潛在的VR（虛擬現(xiàn)實）/AR（增強現(xiàn)實）設(shè)備，甚至是未來可能無所不包的機器人。人工智能將全面賦能給這些設(shè)備，并從中獲取自己成長所需的養(yǎng)分。

三、人機協(xié)同，未來可期

在人工智能領(lǐng)域，有一個長久以來被爭論的問題：人工智能是否會取代人類？具體到媒體領(lǐng)域，人工智能有沒有可能取代記者、編輯？MGC新聞是否會替代人類的報道？2013年，牛津大學的Carl Benedikt Frey和Michael A. Osborne發(fā)表了一篇論文，對702種職業(yè)被人工智能取代的可能性做出了分析。具體到記者這個職業(yè)，論文中認為人工智能可以取而代之的概率只有11%。兩位學者提到了難以被人工智能取代職業(yè)的三個特征：幫助和關(guān)切他人、思考和創(chuàng)意內(nèi)容、社交和談判能力。截至2017年末，這篇論文已經(jīng)被引用超過1500次。

可以看到，媒體人在日常工作中，恰恰對這三個特征都有一定程度的需求，而這其實就對應(yīng)著我們評價新聞報道時常說的有溫度、有態(tài)度、有深度。如果新聞欠缺這些要素，那它確實可能被機器所取代，但這顯然不應(yīng)成為媒體人對自己的要求。人工智能的發(fā)展和MGC新聞的出現(xiàn)，其實為媒體人展示的是另一條路徑：讓機器做機器擅長的事情，去成為人類的千里眼、順風耳，去承擔低價值的重復(fù)、枯燥的勞動，而內(nèi)容工作者將由此得到生產(chǎn)力上的解放。

過去和現(xiàn)在的記者都需要花費巨量的時間在搜集、整理新聞相關(guān)的資料和素材上，這件事未來就可以讓機器來做，而且很可能比人類做得更加有條理、有效率；以往記者收集自己作品的反饋費時費力，未來這同樣可以由機器代勞。媒體與人工智能的融合會在新聞生產(chǎn)流程中提高效率，而節(jié)約出來的時間就可以讓記者去做更有價值、更有觀點、更有溫度的深度報道?！懊襟w大腦”所推動的，正是這樣一次新聞生產(chǎn)流程的重塑，進而改變媒體由內(nèi)到外的整體生態(tài)環(huán)境。（見圖1）

圖1 “媒體大腦”賦能的記者工作場景模擬

未來優(yōu)秀的媒體人不必是人工智能專家，但他/她一定知道怎樣利用人工智能來更好地為自己的工作服務(wù)?！懊襟w大腦”和MGC視頻新聞的出現(xiàn)，不是要取代記者和編輯，而是在更高層面上，把人與物的延伸連接起來，更快、更準、更智能地獲得新聞線索和新聞素材，賦能記者和編輯，幫助媒體提高生產(chǎn)力。在媒體和人工智能的融合之路上，“媒體大腦”將與媒體攜手前行。

媒體大腦——媒體與人工智能的融合重生之路

一、數(shù)據(jù)計算合

二、智能萬物蘇

三、人機協(xié)同，未來可期

媒體大腦
——媒體與人工智能的融合重生之路

一、數(shù)據(jù)計算合

二、智能萬物蘇

三、人機協(xié)同，未來可期