歐陽菁
(廣州醫(yī)科大學(xué)雜志社,廣東 廣州 511436)
人工智能(artificial intelligence,AI)是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué),它是計算機(jī)科學(xué)的一個分支。該領(lǐng)域的研究包括機(jī)器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。李克強(qiáng)總理在2017年政府工作報告中指出,要加快培育、壯大包括人工智能在內(nèi)的新興產(chǎn)業(yè)。人工智能首次被寫入全國政府工作報告,預(yù)示著該項技術(shù)將迎來新的發(fā)展,包括出版業(yè)在內(nèi)的各行各業(yè)與人工智能技術(shù)的融合發(fā)展步伐也將進(jìn)一步加快。醫(yī)學(xué)期刊作為出版業(yè)中學(xué)術(shù)交流的重要窗口和平臺,面臨著學(xué)術(shù)和出版兩方面的重要轉(zhuǎn)型和變革,人工智能技術(shù)的逐步引入,會在一定程度上抹平文化、體制以及技術(shù)等各方面的差距,在互聯(lián)網(wǎng)資源的整合和大數(shù)據(jù)的分析下,出版流程將會被重塑并跨界融合,醫(yī)學(xué)期刊將會被賦予新的活力。
醫(yī)學(xué)期刊主要發(fā)表醫(yī)學(xué)原始文獻(xiàn),是有效傳播醫(yī)學(xué)學(xué)術(shù)信息、反映學(xué)術(shù)成果的媒介,是專家、學(xué)者表達(dá)和交流學(xué)術(shù)思想的平臺。傳統(tǒng)出版流程要經(jīng)過選題策劃、內(nèi)容創(chuàng)作、編輯加工、出版發(fā)行等不同階段,其中選題策劃起著提綱挈領(lǐng)的作用。選題策劃是編輯運(yùn)用其學(xué)識和智慧,在調(diào)查研究的基礎(chǔ)上,對期刊形勢進(jìn)行分析、觀察并把握未來走向,充分考慮社會需求,進(jìn)行醞釀、提煉、篩選、分析、論證,制訂選題規(guī)劃的創(chuàng)造性活動[1]。它是醫(yī)學(xué)期刊品質(zhì)保證的前提,也是醫(yī)學(xué)期刊發(fā)展的基礎(chǔ),更是編輯活動中最具創(chuàng)新性的環(huán)節(jié)。好的選題策劃決定了醫(yī)學(xué)期刊的質(zhì)量,并帶來一定的社會效益和經(jīng)濟(jì)效益。
既往的同行專家對醫(yī)學(xué)期刊的選題策劃主要有以下幾方面要求:①選題策劃要特色化:醫(yī)學(xué)期刊要立足本刊定位,選題要突出刊物特色,包括地方特色、區(qū)域特色、學(xué)科特色、學(xué)術(shù)特色、欄目特色,形成人無我有、人有我新的專欄選題[2-3]。②選題策劃要有創(chuàng)新性和先導(dǎo)性:醫(yī)學(xué)期刊的宗旨就是要立足科學(xué)前沿、學(xué)術(shù)高度,傳播新的科技進(jìn)展,策劃引領(lǐng)科學(xué)創(chuàng)新的選題。也就是要求觀點(diǎn)要新、理論要深、價值要高,站在學(xué)科前沿和學(xué)術(shù)制高點(diǎn),搶先反映某一領(lǐng)域的新理論、新成果和新動態(tài)。醫(yī)學(xué)專業(yè)出身的醫(yī)學(xué)編輯根據(jù)自己的學(xué)術(shù)修養(yǎng)和知識儲備,借助文獻(xiàn)檢索、召開專家會議以及研讀學(xué)術(shù)論文等多種渠道,積極分析研判學(xué)術(shù)研究領(lǐng)域的熱點(diǎn)難點(diǎn),對收集到的資料進(jìn)行分類整理和關(guān)聯(lián)整合,獲得更多參考信息。這些科研信息經(jīng)過篩選,是最新、最急需研究的課題,有一定的超前并引領(lǐng)新的理論研究的作用[4-5]。③選題策劃要注重?zé)狳c(diǎn):學(xué)科發(fā)展中的熱點(diǎn)問題也是整個領(lǐng)域共同關(guān)注的問題,具有被引用和探討的價值,及時介紹、報道這些熱點(diǎn)有助于學(xué)術(shù)交流,還可提高期刊的影響力[6]。④選題策劃要兼顧服務(wù)性:醫(yī)學(xué)期刊發(fā)展到今天早已不是賣方市場,要想獲得更多的受眾,必須立足讀者需求,保證學(xué)術(shù)刊物忠實(shí)的讀者群和穩(wěn)定的作者群。所以醫(yī)學(xué)編輯除了搜集學(xué)術(shù)進(jìn)展外,還需要及時收集稿件刊發(fā)后讀者的反饋信息,并以多種形式調(diào)查讀者需求,提升刊物在讀者中的辨識度和忠誠度[2,7]。
人工智能的強(qiáng)項在于大量快速的閱讀和學(xué)習(xí)、收集海量數(shù)據(jù)并分析,然后協(xié)助人們形成決策。如基于人工智能技術(shù)的數(shù)據(jù)驅(qū)動決策系統(tǒng),包括數(shù)據(jù)提取、轉(zhuǎn)換、加載工具,這些程序?qū)母鞣矫媸占牟煌瑪?shù)據(jù)源數(shù)據(jù)合并到數(shù)據(jù)倉庫,然后用數(shù)據(jù)分析工具分析,讓人工智能得到學(xué)習(xí)訓(xùn)練,最后由決策工具給出邏輯性的決策[8],如圖1所示。具體到醫(yī)學(xué)期刊的選題策劃,人工智能首先將期刊生產(chǎn)和出版經(jīng)營中產(chǎn)生的很多信息數(shù)據(jù),如作者信息、讀者信息、期刊信息、評價信息、用戶行為等,通過人工智能儲存于數(shù)據(jù)庫;然后醫(yī)學(xué)編輯根據(jù)自己的出版定位,研究和劃定相關(guān)領(lǐng)域的閱讀需求,將熱點(diǎn)詞匯、熱門事件、傳播熱度和頻度以及學(xué)術(shù)進(jìn)展等信息輸入人工智能平臺,對學(xué)術(shù)出版數(shù)據(jù)進(jìn)行智能分析和挖掘;最后通過對大數(shù)據(jù)的抓取,形成正確的選題決策。人工智能在做選題策劃時,還可以同時了解到全國乃至全世界共有多少同類期刊在做同樣的選題,便于對選題意義的進(jìn)一步把握。
學(xué)術(shù)最新進(jìn)展學(xué)術(shù)熱點(diǎn)(熱門事件、熱點(diǎn)詞匯)學(xué)術(shù)難點(diǎn)提取、轉(zhuǎn)換、加載工具數(shù)據(jù)倉庫數(shù)據(jù)分析決策支持工具
圖1 人工智能的選題決策運(yùn)算流程
2.2.1決策過程客觀精準(zhǔn),直達(dá)熱點(diǎn)。在醫(yī)學(xué)出版行業(yè),高質(zhì)量的選題策劃需要醫(yī)學(xué)編輯結(jié)合專業(yè)素養(yǎng)、知識面和眼界并依賴創(chuàng)意去選擇。創(chuàng)意的產(chǎn)生有隨機(jī)性,更多依賴于經(jīng)驗和靈感,帶有很強(qiáng)的主觀性。編輯在選題前通過經(jīng)驗、邏輯、直覺以及個人的偏好刪除大量無用的信息,篩選出少數(shù)信息作為選題依據(jù),從而做出選題方案。人工篩選不僅效率低下,信息的篩選往往也會顧此失彼,忽視大量有用信息,缺乏全面性和客觀性。2001年,諾貝爾生理或醫(yī)學(xué)獎得主R.Timothy Hunt的成名論文也曾經(jīng)被頂級期刊拒絕,雖然另外一個期刊表示可以接受,但要求其在沒有任何新數(shù)據(jù)的情況下全部重寫。2003年,另一位諾貝爾生理或醫(yī)學(xué)獎得主Paul Clauterbur獲得諾獎的論文也被《自然》拒絕,直到其抗議后論文才得以發(fā)表。西班牙的一位物理學(xué)家曾統(tǒng)計,至少20多位諾獎得主的獲獎?wù)撐谋黄诳芙^過。人工智能的出現(xiàn)使得既往由直覺和經(jīng)驗主導(dǎo)的決策過程轉(zhuǎn)變成以數(shù)據(jù)和邏輯為主導(dǎo),加上人工智能對信息數(shù)據(jù)的快速學(xué)習(xí)和處理能力,選題策劃在很大程度上變得高效、公正和確定。2014年后,國內(nèi)外出版商開始大規(guī)模增加基于人工智能技術(shù)的投資閱讀分析,以確保各類文獻(xiàn)、暢銷書、經(jīng)典作品等不因編輯的直覺、偏好、知識局限而被放棄。Web of Science學(xué)術(shù)平臺利用人工智能技術(shù),采用Gibbs Sampling算法篩選有提升空間、處于研究前沿、國際上關(guān)注度較高的專題領(lǐng)域進(jìn)行選題,如該算法的LDA模型。該模型對主題和主題對應(yīng)的特征詞加上了先驗分布,對特定領(lǐng)域的 Web of Science 數(shù)據(jù)進(jìn)行分析處理,結(jié)合編委會專家的建議,為期刊跟蹤全球?qū)W科熱點(diǎn)、選題組稿及定向約稿提供支持。《紐約時報》的數(shù)字團(tuán)隊研發(fā)了機(jī)器人Blossomblot,可以根據(jù)社交平臺的文章進(jìn)行大數(shù)據(jù)分析,推測哪些類型的內(nèi)容更具熱度,輔助編輯挑選合適的素材。據(jù)該報內(nèi)部統(tǒng)計,經(jīng)Blossomblot篩選后的文章點(diǎn)擊量是普通文章的38倍[9-11]。中國青年出版社副社長王瑞2016年底表示,該社已經(jīng)通過大數(shù)據(jù)抓取開發(fā)了一些符合大眾需要的選題,得到了讀者的認(rèn)可。北京北大方正電子有限公司已經(jīng)構(gòu)建了自己的大數(shù)據(jù)中心,根據(jù)互聯(lián)網(wǎng)的熱門事件、熱點(diǎn)詞匯、傳播的頻度和熱度,對選題進(jìn)行智能化分析,幫助編輯進(jìn)行更有效的選題策劃;其副總裁劉長明將人工智能技術(shù)的發(fā)展提升到數(shù)據(jù)革命的高度,他認(rèn)為圍繞大數(shù)據(jù)解決方案進(jìn)行選題策劃,通過數(shù)據(jù)的分析和挖掘,可以滿足選題的優(yōu)化,幫助出版社做決策。
2.2.2運(yùn)算高效省時,節(jié)省編輯人力。編輯策劃的選題要具有科學(xué)性、創(chuàng)新性和獨(dú)特性,也是要基于其大量的數(shù)據(jù)檢索、事實(shí)的調(diào)研以及廣泛的閱讀。醫(yī)學(xué)編輯除了運(yùn)用文獻(xiàn)計量學(xué)在國內(nèi)外各文獻(xiàn)數(shù)據(jù)庫大量檢索、信息分析外,還要積極與相應(yīng)學(xué)科的專家學(xué)者保持經(jīng)常性的溝通,參加學(xué)術(shù)論壇,了解某領(lǐng)域的研究熱點(diǎn)和今后的學(xué)術(shù)生長點(diǎn)等。在傳統(tǒng)的模式下,編輯需要耗費(fèi)大量的時間和精力去篩選出有效、可靠的信息,因此效率低下;而擁有強(qiáng)大運(yùn)算能力的人工智能能以意想不到的速度完成信息的抓取,提供決策參考。2016年,戰(zhàn)勝韓國頂尖棋手李世石的AlphaGoLee,僅訓(xùn)練數(shù)月,自我對弈約3000萬盤就以4:1擊敗李世石;其第二代AlphaGo Zero,自我訓(xùn)練的時間僅為3天,自我對弈490萬盤,以100:0的戰(zhàn)績擊敗其前輩Lee。微軟開發(fā)出的“小冰”機(jī)器人每6分鐘可以學(xué)習(xí)一遍1920~1980年中國519位現(xiàn)代詩人的作品,每6分鐘做一次迭代,100小時后就基本具有寫詩能力[12]。未來人工智能會帶著海量的動態(tài)信息,時刻等待編輯的指令。一旦編輯確定選題偏好,把這些偏好指令傳輸給智能機(jī)器人,人工智能就會迅速運(yùn)算、篩選,給編輯提供需要的策劃方案,編輯只需要確認(rèn),一個精準(zhǔn)、完整匹配的選題策劃方案便會形成了?!都~約時報》啟用一個聊天機(jī)器人作為主編,每天可以不間斷工作24小時,它挑選的文章平均點(diǎn)擊率遠(yuǎn)超過普通編輯,甚至可以直接向編輯推薦撰稿人,不僅大大降低前期的人力投入,還能夠提高選題策劃的含金量。
人工智能是建立在數(shù)據(jù)、算法基礎(chǔ)上的計算機(jī)科學(xué),雖然對程序化的數(shù)據(jù)識別、信息處理具有強(qiáng)大的運(yùn)算能力,但在本質(zhì)上缺乏人類的社會和文化屬性,沒有人類的價值觀、審美觀、情感和創(chuàng)意能力等,其實(shí)質(zhì)還屬于一種機(jī)械性和自然性,所以在實(shí)際運(yùn)用中還有著較多的不足。
選題策劃的亮點(diǎn)就在于創(chuàng)意和創(chuàng)新,基于線性化計算的人工智能無法用算法合成一個具有正常立體思維的人類思考。機(jī)器更多的是取代了基礎(chǔ)性、重復(fù)性的工作,將人類智能從低級、重復(fù)的操作中解放出來, 使得人類有時間和精力發(fā)揮自己的創(chuàng)造力,生產(chǎn)具有思考深度、縝密邏輯、情感張力的內(nèi)容。在傳統(tǒng)選題過程中,編輯的工作不僅僅是信息抓取和篩選,更重要的是基于編輯自身廣博的知識面、嚴(yán)謹(jǐn)?shù)膶I(yè)素養(yǎng)以及極大的閱讀量對信息甄別后的深度思考,在錯綜復(fù)雜的線索中抽絲剝繭, 探求信息鏈條背后的深層邏輯, 甚至要在對立的觀點(diǎn)之間尋求平衡, 由此尋找到有創(chuàng)新點(diǎn)而又富有創(chuàng)意的選題,這些都不是擅長處理規(guī)范性文本和結(jié)構(gòu)化數(shù)據(jù)的人工智能所能勝任的。
目前的人工智能技術(shù)還處在弱人工智能階段,其算法的基礎(chǔ)是結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù),而且前者優(yōu)先?,F(xiàn)階段的這種技術(shù)缺乏真實(shí)場景的體驗,不像人類具有社會屬性,對各種社會場景具備獨(dú)特的價值觀,如倫理、道德、法律、制度等。因此,盡管數(shù)據(jù)搜集和分析是人工智能的強(qiáng)項,在即時性、準(zhǔn)確性、海量互動等方面可以代替人類甚至超越人類,卻無法代替編輯進(jìn)行復(fù)雜的價值判斷和深刻的邏輯分析。信息價值中包含的對重要性的認(rèn)知、對美丑的分辨、對善良的堅守、對信仰的追求等價值取向還是需要人來進(jìn)行判斷。當(dāng)編輯將這些重復(fù)、煩瑣、程序化的職能交給人工智能之后,就需要運(yùn)用自己的價值判斷深度挖掘和正確選擇,以更好地引導(dǎo)優(yōu)秀內(nèi)容的傳播。美聯(lián)社是最早啟用機(jī)器人寫作的傳統(tǒng)新聞機(jī)構(gòu)之一,從2014年起安排編輯對每一篇由機(jī)器人生成的新聞報道進(jìn)行人工審查。審查的重點(diǎn)不是字、詞、句的校對,而是新聞事件背后相對復(fù)雜的事實(shí)和邏輯鏈條,從而進(jìn)行價值判斷。隨著技術(shù)的升級發(fā)展,人工智能也可能被嵌入人類價值觀。正如加利福尼亞大學(xué)伯克利分校計算機(jī)學(xué)教授斯圖爾特·拉塞爾所說,盡可能把人類價值變成可編程的代碼,轉(zhuǎn)化為人工智能的語言。目前已有幾個美國科學(xué)家開始嘗試把人類價值觀嵌入機(jī)器人程序,但人工智能在短時間內(nèi)畢竟代替不了人類的價值判斷。
編輯與作者、讀者除了線性的專業(yè)交流,還有很多非線性的情感維系。弱人工智能時代,計算機(jī)的算法還不能將情感轉(zhuǎn)換為代碼進(jìn)行輸入,所以人工智能還不具備人類處理情感和思維的能力。醫(yī)學(xué)期刊本來就是一個交流的平臺,選題策劃的精準(zhǔn)與否也需要得到作者、讀者的反饋和互動。冰冷的代碼輸出缺乏交流的溫度和人格魅力的展現(xiàn),難以長久維系與忠實(shí)的讀者、作者的友好關(guān)系。所以編輯有必要通過專業(yè)交流和人文關(guān)懷保持和學(xué)術(shù)界作者、讀者的情感聯(lián)系,這對選題策劃及期刊的發(fā)展都極有益處。
我們正處在技術(shù)革新推動的行業(yè)轉(zhuǎn)型期,媒體智能化時代已悄然臨近。在可預(yù)見的未來,人工智能必定對出版生產(chǎn)、媒體傳播的方方面面產(chǎn)生深遠(yuǎn)影響。作為醫(yī)學(xué)編輯,我們不可沉溺于既往的“體制繭房”,對新技術(shù)置身事外,但也不能盲目跟風(fēng),任意上馬不可靠、不適用的人工智能項目。醫(yī)學(xué)編輯作為科研人員,首先要全面了解人工智能的進(jìn)展和應(yīng)用范疇,選擇最適合自身雜志的相關(guān)技術(shù),量體裁衣。其次,人工智能運(yùn)算的基礎(chǔ)是數(shù)據(jù)(尤其是大數(shù)據(jù)),醫(yī)學(xué)編輯在策劃選題輸入信息數(shù)據(jù)時,要注意數(shù)據(jù)的版權(quán)以及重要信息的保密,減少數(shù)據(jù)隱私的外泄。再次,醫(yī)學(xué)編輯自身的專業(yè)分布于各行各業(yè),除了提高自己的專業(yè)修養(yǎng),還應(yīng)該提高人工智能的應(yīng)用水平,避免高智能技術(shù)和應(yīng)用能力的不匹配。
總之,選題策劃是具有創(chuàng)意的創(chuàng)新過程,醫(yī)學(xué)編輯和人工智能技術(shù)是相得益彰的人機(jī)協(xié)同過程。編輯必須發(fā)揮自身優(yōu)勢,主導(dǎo)人工智能在其更擅長的數(shù)據(jù)處理和分析領(lǐng)域協(xié)助期刊傳播最優(yōu)秀、最創(chuàng)新的內(nèi)容,避免由人工智能的純算法導(dǎo)致的低俗或不當(dāng)內(nèi)容的傳播。同時,醫(yī)學(xué)編輯必須從煩瑣、機(jī)械化的勞作中解放出來,把更多時間和精力投入到更適合人類智能擅長的領(lǐng)域,傳播一些引領(lǐng)世界科技發(fā)展、促進(jìn)社會生產(chǎn)力提高及激發(fā)情感共鳴的作品。