本刊記者丨魯燁
人工智能時(shí)代,新聞生產(chǎn)的第一線上,我們又多了一位新的伙伴,它就是“機(jī)器人記者”。
自2014年大數(shù)據(jù)在媒體行業(yè)的深度應(yīng)用以來(lái),新聞生產(chǎn)的流程、報(bào)道的廣度深度、新聞的展示方式和傳播能力都在發(fā)生著微妙的變化,媒體行業(yè)總體呈現(xiàn)出從數(shù)字信息化向智能化轉(zhuǎn)變的明顯趨勢(shì),可視化的數(shù)據(jù)新聞、高冷酷炫的智能輕應(yīng)用、“瑞士軍刀”之稱的智能手表、不現(xiàn)顏值的“機(jī)器人記者”等智能化產(chǎn)物紛至沓來(lái)。今天,讓我們來(lái)聊聊初露鋒芒的“機(jī)器人記者”,看她是如何驚艷的。
先讓我們猜猜,下面這兩篇體育報(bào)道的開篇哪篇是“機(jī)器人記者”寫的,哪篇是真實(shí)存在的人寫的?
如果你無(wú)法分辨哪一篇是由人類寫的,那你不是唯一一個(gè)。而答案是:左邊是機(jī)器寫的,右邊是人寫的。你猜對(duì)了嗎?
機(jī)器人寫作新聞開始備受關(guān)注,是由于2014年7月美國(guó)加州發(fā)生一次里氏4.4級(jí)的地震,《洛杉磯時(shí)報(bào)》在地震發(fā)生后三分鐘內(nèi)發(fā)出消息,是所有新聞媒體中最快在網(wǎng)站報(bào)道該消息的,而作者卻是一個(gè)名為Quakebot的“機(jī)器人”。這個(gè)“機(jī)器人記者”實(shí)則是一套新聞自動(dòng)生成系統(tǒng),開發(fā)設(shè)計(jì)者是《洛杉磯時(shí)報(bào)》的一名記者兼程序員,按照他的設(shè)計(jì),Quakebot能夠在地震發(fā)生后,根據(jù)美國(guó)地質(zhì)勘探局發(fā)出的數(shù)據(jù),自動(dòng)將信息輸入模板并提交至采編系統(tǒng)。
所謂“機(jī)器人”寫作新聞,實(shí)則是直接利用算法程序撰寫新聞報(bào)道,通過(guò)采集大量的各種題材以及高質(zhì)量的數(shù)據(jù),建立各種分類的龐大數(shù)據(jù)庫(kù),從中尋找模型、趨勢(shì)以及相互的關(guān)系,最后由機(jī)器自動(dòng)化生產(chǎn)新聞。美國(guó)Automated Insights(自動(dòng)透視)和Narrative Science(敘事科學(xué))都是這樣的公司。
從2014年7月份開始,美聯(lián)社與Automated Insights簽署了550萬(wàn)美元的協(xié)議,開始啟用該公司開發(fā)的程序撰寫有關(guān)公司財(cái)報(bào)的新聞報(bào)道。具體而言,先收集公司公開盈利報(bào)告的數(shù)據(jù),最終提供分析每家公司的發(fā)展情況、解析它們金融策略的報(bào)道。只要輸入一些數(shù)據(jù),如公司收益報(bào)表之類,這個(gè)聰明的程序就能在幾秒鐘之內(nèi)生成一篇新聞報(bào)道。
可以看到,美聯(lián)社與Automated Insights合作,共同促進(jìn)了自動(dòng)化新聞寫作的發(fā)展。算法的驚人之處在于,其充分利用了模式和規(guī)則。尤其是新聞寫作,從故事的構(gòu)思、素材的采集、組織與整理、文章結(jié)構(gòu)的處理,到最終的遣詞用句,大都有模式和規(guī)則可循。只要有模式和規(guī)則,就有算法的用武之地。
除了Automated Insights以外,Narrative Science也開發(fā)了撰寫新聞的機(jī)器人。他們用的方法很簡(jiǎn)單,就是創(chuàng)造模板,機(jī)器人能夠采取數(shù)據(jù)并填入相關(guān)空格里。很多新聞是有一定格式的,如財(cái)報(bào)、球賽、突發(fā)事件等。只要有格式,機(jī)器人就能夠完成工作。福布斯利用Narrative Science的Quill平臺(tái)撰寫類似報(bào)道,并稱該公司是他們的合作伙伴。
隨著技術(shù)成熟的“變本加厲”,再加上用戶使用各種數(shù)字渠道對(duì)內(nèi)容的多元需求,不久后,越來(lái)越多的內(nèi)容不再是由人類編寫,而是由計(jì)算機(jī)算法完成,由此滋生了一個(gè)“文本自動(dòng)生成”產(chǎn)業(yè),或者說(shuō)催生了一種新新人類——“機(jī)器人記者”。當(dāng)然,這些“機(jī)器人記者”并不只是重復(fù)數(shù)據(jù),它會(huì)以適合目標(biāo)受眾的風(fēng)格,比如,從古板到活潑,寫出看起來(lái)像是人類編寫的報(bào)道。
毫無(wú)疑問,“機(jī)器人記者”可以彌補(bǔ)傳統(tǒng)記者應(yīng)對(duì)突發(fā)事件的不及時(shí),做到數(shù)據(jù)收集和分析的快速、準(zhǔn)確。這在一定程度上,減輕了人類寫作過(guò)程中的負(fù)擔(dān)。
這樣看來(lái),機(jī)器人的工作效率、數(shù)據(jù)儲(chǔ)備、整理能力、寫稿速度和超級(jí)編輯能力等,都會(huì)令傳統(tǒng)記者自愧不如、望塵莫及了。
那么問題來(lái)了,會(huì)不會(huì)像業(yè)內(nèi)人士所擔(dān)憂的那樣,“機(jī)器人記者”將成為記者的終結(jié)者呢?
傳統(tǒng)記者是否會(huì)因此而擔(dān)憂和焦慮?有人樂道,在新聞行業(yè)進(jìn)入爭(zhēng)分奪秒的網(wǎng)絡(luò)媒體時(shí)代,機(jī)器人寫稿的快速高效,給苦于競(jìng)爭(zhēng)的媒體優(yōu)先突圍的機(jī)遇;也有人擔(dān)憂,機(jī)器人給人類記者帶來(lái)了“競(jìng)爭(zhēng)壓力”,機(jī)器人是否會(huì)搶了記者的飯碗?
隨著人工智能技術(shù)的發(fā)展,未來(lái)機(jī)器人甚至可能擁有人類的某種智能。在“機(jī)器人記者”可能會(huì)搶了傳統(tǒng)記者飯碗的隱憂面前,人們開始在擁抱還是拒絕“機(jī)器人記者”的選擇上搖擺不定。
讓我們來(lái)看看大家對(duì)這個(gè)問題的看法:
業(yè)內(nèi)人士表示,機(jī)器人寫手只是一種輔助形式,它可以節(jié)省時(shí)間,把記者從一堆基礎(chǔ)數(shù)據(jù)和信息中解放出來(lái)。然而,說(shuō)機(jī)器人會(huì)搶記者的飯碗,未免有點(diǎn)杞人憂天。機(jī)器人撰寫新聞的過(guò)程就像一個(gè)復(fù)雜的填詞游戲,一些具有固定模式的行業(yè)性文章更符合它的能力。機(jī)器人無(wú)法進(jìn)行深度分析,更不會(huì)煉字鍛句。如果有一天記者真的被冷冰冰的機(jī)器人取代,新聞恐將淪為諸多報(bào)道模式的生硬“拼盤”。
名為Quakebot的“機(jī)器人”的設(shè)計(jì)者舒文克表示,機(jī)器人寫手雖有其技術(shù)優(yōu)勢(shì),但卻無(wú)法完全具備人的靈活性和創(chuàng)造力。讓機(jī)器人成為記者的幫手,我相信,它會(huì)使工作更有趣。
美聯(lián)社表示,機(jī)器寫作并不意味著記者會(huì)喪失工作,而是將美聯(lián)社記者解放出來(lái),專注于做更多注重人性化色彩、體現(xiàn)人類智慧的內(nèi)容,依靠機(jī)器做其擅長(zhǎng)的大量數(shù)據(jù)收集整理、模式化有規(guī)律所尋的文字工作。以往美聯(lián)社每季度生產(chǎn)大約200個(gè)報(bào)道,現(xiàn)在每個(gè)季度能生產(chǎn)3000-5000個(gè)報(bào)道,效率是人類記者的15倍。
浙大智能系統(tǒng)與控制研究所的朱秋國(guó)老師認(rèn)為,要它去做深度報(bào)道,可能夠嗆!有血有肉的記者對(duì)業(yè)務(wù)精鉆細(xì)磨,應(yīng)該還是保得住飯碗的——這個(gè)機(jī)器人的出現(xiàn)是為了刺激我們來(lái)的。
敘述科學(xué)聯(lián)合創(chuàng)始人克里斯蒂安·哈蒙德認(rèn)為,這股機(jī)器自動(dòng)撰寫新聞的海嘯將不會(huì)淹沒付費(fèi)新聞撰稿者的工作,他們研發(fā)的軟件系統(tǒng)并不是想要奪取任何人的飯碗。相反,電腦能開采出更多信息寶礦,并生產(chǎn)出非常廉價(jià)卻完全可讀的針對(duì)時(shí)事、潮流等領(lǐng)域的報(bào)道,而這些可能是人類記者從未涉及過(guò)的。
由此可見,大部分業(yè)內(nèi)人士還是普遍樂觀的,“機(jī)器人”寫手作為傳統(tǒng)記者的輔助形式,可以把記者從繁重的工作者解放出來(lái),使傳統(tǒng)記者有更充足的時(shí)間備戰(zhàn)深度報(bào)道和人性化分析中來(lái)。相信,人類和電腦運(yùn)算可以天衣無(wú)縫地充分合作,機(jī)器人利用其完美的記憶系統(tǒng)成為人類新聞工作者的完美采編助手。
有關(guān)“機(jī)器人記者”的猜想和未來(lái)之說(shuō),業(yè)內(nèi)眾說(shuō)紛紜。
《紐約時(shí)報(bào)》報(bào)道,某軟件公司開發(fā)的機(jī)器人記者很可能在2016年獲得普利策新聞獎(jiǎng)。該機(jī)器人使用的軟件能夠通過(guò)推斷得出結(jié)論,并從某個(gè)特定的視角出發(fā)來(lái)寫文章。在體育報(bào)道方面,它能夠充分理解“反敗為勝”“團(tuán)隊(duì)努力”之類的專業(yè)術(shù)語(yǔ),同時(shí)根據(jù)自己的判斷對(duì)體育比賽最重要的方面進(jìn)行報(bào)道。因此,它不會(huì)像其他軟件那樣單純地復(fù)述事實(shí),而是會(huì)給文章加入一些不同的元素。更有專家預(yù)測(cè),不遠(yuǎn)的未來(lái)機(jī)器人還能夠與人進(jìn)行自由聊天和郵件通信,甚至可以演講并回答人類的提問。
敘述科學(xué)公司聯(lián)合創(chuàng)始人克里斯蒂安·哈蒙德認(rèn)為,未來(lái)15年完全由機(jī)器人撰寫的文章達(dá)到90%。
關(guān)于“機(jī)器人記者”的預(yù)測(cè)或者猜想,或許都能讓我們感到人工智能的強(qiáng)大力量,但是,這些能不能實(shí)現(xiàn)、什么時(shí)候能實(shí)現(xiàn),可能還很難有一個(gè)明確的答案。因?yàn)榧词故侵悄軝C(jī)器人,它的智能依然有限,無(wú)法真的像人類一樣思考。
不過(guò),機(jī)器人記者對(duì)新聞的作用還是不可小視的。在中國(guó),目前還沒有機(jī)器人記者這一概念,但已出現(xiàn)有網(wǎng)絡(luò)媒體利用計(jì)算機(jī)采集信息輔助新聞報(bào)道。雖然這些程序沒有完成記者“寫稿”這最后一步,但是實(shí)踐中由計(jì)算機(jī)程序“采買”、人類記者“加工”,這一模式取得了理想的效果。
互聯(lián)網(wǎng)時(shí)代,我們產(chǎn)生數(shù)據(jù)規(guī)模越來(lái)越龐大,而且很復(fù)雜,凡人難以處理,需要人工智能,而不是人類智能,來(lái)從中獲取有益的信息。特別是在金融、體育和銷售規(guī)劃等數(shù)據(jù)繁多的領(lǐng)域,將人工智能應(yīng)用于大量資源,這種新的軟件平臺(tái)就會(huì)應(yīng)用先進(jìn)的度量標(biāo)準(zhǔn),去確認(rèn)模式、趨勢(shì)和反常數(shù)據(jù),然后,迅速產(chǎn)生解釋性文本。
“機(jī)器人記者”寫作的重中之重就是積累高質(zhì)高量的數(shù)據(jù)。這也是為什么金融和體育會(huì)成為軟件寫手的前沿陣地:這兩類話題都包含了數(shù)據(jù)的起伏,比如每只股票的收益,股票震蕩等等。
目前,機(jī)器人記者碰到了一個(gè)小問題:所有的新聞和評(píng)論都只會(huì)針對(duì)勝利者。比如當(dāng)一支球隊(duì)被意料之外的對(duì)手打敗后,所有以結(jié)果數(shù)據(jù)為出發(fā)點(diǎn)的評(píng)論都會(huì)瞬間變得非??瘫〔⒊錆M羞辱。美國(guó)體育聯(lián)會(huì)要求敘述科學(xué)想辦法讓軟件在隊(duì)伍失利的情況下也能寫出贊揚(yáng)隊(duì)員們表現(xiàn)的文章,但是顯然機(jī)器人們寫不出“雖敗猶榮”這樣的話。
最高的呼聲中彰顯著最常見的解放主題,“機(jī)器人記者”將會(huì)解放人類,使人類能夠更多地進(jìn)行報(bào)道,減少數(shù)據(jù)處理工作。
但是,據(jù)敘述科學(xué)聯(lián)合創(chuàng)始人克里斯蒂安·哈蒙德估計(jì),到本世紀(jì)20年代中期,將有90%的新聞?dòng)捎?jì)算機(jī)算法生成,其中大多都無(wú)需人工干預(yù)。倘若這個(gè)預(yù)測(cè)接近事實(shí),那么我們就會(huì)處在一個(gè)滑坡之上。
自動(dòng)透視公司指出,其軟件去年一共創(chuàng)作了10億個(gè)報(bào)道,許多都沒有人工干預(yù),它和敘述科學(xué)公司的主頁(yè)上,展示著我們耳熟能詳?shù)目蛻魳?biāo)志:三星、康卡斯特(Comcast)、美聯(lián)社、Edmunds.com和雅虎,所以,用戶極有可能在沒有意識(shí)的情況下消費(fèi)了這種內(nèi)容。
法國(guó)的歐洲工商管理學(xué)院管理科學(xué)教授菲利普·M·帕克的專利算法系統(tǒng)已經(jīng)生成了超過(guò)100萬(wàn)本圖書,其中有10萬(wàn)多本在亞馬遜上銷售。他說(shuō),給他一個(gè)技術(shù)性或晦澀難懂的話題,他的系統(tǒng)就能模仿可能就此題目進(jìn)行寫作的人的思維過(guò)程,挖掘數(shù)據(jù),撰寫一本書或一篇報(bào)告,比如《紅斑痤瘡患者官方資料》。敘述科學(xué)公司聲稱它可以創(chuàng)作“與出自人類的作品分毫不差的文本”,自動(dòng)透視公司則稱它的專長(zhǎng)是“像一個(gè)人一樣”寫作。
但這正是讓我們擔(dān)憂的地方。在國(guó)外,機(jī)器新聞?wù)诠コ锹诱诳萍嫉膸椭?,“機(jī)器人記者”或許終有一天會(huì)悄悄取代人類傳播者的優(yōu)勢(shì)能量。算法生成的內(nèi)容也在迅速向我們文化中的各個(gè)角落和縫隙滲透,未來(lái),我們會(huì)不會(huì)因此逐漸丟失、放棄自己?