• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      機器學習在新聞生產(chǎn)環(huán)節(jié)的應(yīng)用分析

      2018-07-19 14:53:42李烈鵬姜霄晗
      科技傳播 2018年13期
      關(guān)鍵詞:新聞生產(chǎn)機器學習人工智能

      李烈鵬 姜霄晗

      摘 要 智能化的一個基礎(chǔ)性技術(shù)手段就是讓機器按照人設(shè)定的規(guī)矩和格局來運行。與新聞相關(guān)的人工智能技術(shù)如機器人、視覺信息處理、機器學習等,已經(jīng)被大量運用。文章通過梳理國外新聞業(yè)界對這些人工智能技術(shù)在新聞生產(chǎn)中的實際運用,分析機器學習技術(shù)如何改變已有的新聞生產(chǎn)格局,同時剖析在新聞實踐中使用機器學習技術(shù)產(chǎn)生的問題。

      關(guān)鍵詞 新聞生產(chǎn);人工智能;機器學習

      中圖分類號 G2 文獻標識碼 A 文章編號 1674-6708(2018)214-0075-03

      中國巨大規(guī)模的移動互聯(lián)網(wǎng)用戶,以及阿里巴巴、騰訊、百度等大型互聯(lián)網(wǎng)公司所擁有的海量數(shù)據(jù),是中國成為在人工智能發(fā)展上最具潛力的國家。在新聞生產(chǎn)和研究中,人工智能技術(shù)與大數(shù)據(jù)、AR/VR、云存儲等新興科技,已經(jīng)給新聞內(nèi)容生產(chǎn)和分發(fā)帶來了變革。從人工智能技術(shù)中的機器學習出發(fā),具體到新聞實踐和研究當中,機器學習是如何對新聞生產(chǎn)環(huán)節(jié)產(chǎn)生作用并使之做出改變?機器學習在新聞生產(chǎn)中的運用是否產(chǎn)生負面 效果?

      1 與新聞生產(chǎn)相關(guān)的機器學習技術(shù)

      機器學習是人工智能的一個子集,并且這個領(lǐng)域具有巨大的新聞潛力。機器學習既是一種工具,也是新聞審查的話題。

      即使是研究機器學習的專業(yè)人士,對于“機器學習是什么”這個問題也會有不同的見解,到目前為止,還不存在一個廣泛認可的關(guān)于機器學習的定義。1996,Langley提出,機器學習是一門人工智能的科學,該領(lǐng)域的主要研究對象是人工智能,特別是如何在經(jīng)驗學習中改善具體算法的性能??▋?nèi)基梅隆大學Tom Mitchell教授在1997年提出,機器學習是對能通過經(jīng)驗自動改進的計算機算法的研究。2004年,土耳其伊斯坦布爾博阿齊奇大學教授阿培丁提出,機器學習是用數(shù)據(jù)或以往的經(jīng)驗,以此優(yōu)化計算機程序的性能標準[1]。

      他們關(guān)于機器學習的定義中,“經(jīng)驗”一詞都被提及,可以想象,機器學習與人類思考的經(jīng)驗過程是類似的,不過它能考慮更多的情況,執(zhí)行更加復雜的計算。筆者嘗試給機器學習下一個定義:從廣義上來講,機器學習是一種能夠賦予機器學習的能力,以此讓機器完成直接變成無法完成的功能的方法。但從實踐意義上來說,機器學習是一種通過利用數(shù)據(jù)以及以往經(jīng)驗,訓練出模型,然后使用模型預測或者得出算法結(jié)果的一種方法。

      事實上,機器學習的一個主要目的就是把人類思考歸納經(jīng)驗的過程,轉(zhuǎn)化為計算機通過對數(shù)據(jù)和經(jīng)驗的處理計算,并得出模型的過程。經(jīng)過計算機得出的模型能夠以近似于人的方式解決很多靈活復雜的問題。監(jiān)督式學習和無監(jiān)督式學習是機器學習最大的分支。

      監(jiān)督式學習是從已有的實例中學到或建立一個模式,并以此模式分析新的實例。我們只需把數(shù)據(jù)交給算法系統(tǒng),計算機會自動按照給定的規(guī)則填充公式化的表達,生成稿件。目前我國媒體主要運用這一種算法方式進行自動化新聞寫作,運用于數(shù)據(jù)容易模板化的體育報道和財經(jīng)新聞數(shù)據(jù)報道。另一方面,目前機器學習還可以在人臉上布置若干“標志點”,從而估算出各類情緒的概率值,這類技術(shù)可以運用到采訪對象、正職演說等報道中去。

      相比于監(jiān)督式學習,無監(jiān)督式學習是通過觀察來進行自我學習。無監(jiān)督式學習在學習過程中并不知道其輸入與輸出的內(nèi)容,也就是并不知道何種學習是正確的,其主要目的是尋找相關(guān)關(guān)系和趨勢、表面奇異值等,并不深入追究因果關(guān)系。通過無監(jiān)督式學習,可以在沒有任何人為干預的條件下簡化數(shù)據(jù),嘗試尋找人力無法完成的新聞線索,人們無需知曉規(guī)則,新聞產(chǎn)品即是“無需推敲”的成品,然而編輯審稿環(huán)節(jié)對事實的核查、對真相邏輯鏈的追尋將困難重重。

      在當下智媒化傳播技術(shù)條件下,“簽發(fā)”不是媒體工作的終點,寫作完成也只是新聞工作中的一個節(jié)點。同時,新聞稿件將沒有最終定稿的狀態(tài),將處于不斷的人為干預的半自動化迭代過程中。機器學習在新聞生產(chǎn)和分發(fā)的過程中,占據(jù)著越來越重要的地位,而專業(yè)媒體機構(gòu)從此不是唯一,各方技術(shù)的介入,使得新聞生產(chǎn)的過程更加多變,新聞生產(chǎn)的內(nèi)容生態(tài)更為復雜,其操作流程更加難以辨識。

      2 機器學習為新聞生產(chǎn)提供更多可能性

      在人與機器的關(guān)系上,“增強新聞”是各國的新聞從業(yè)者基本可就此達成的共識,人將與機器合作完成新聞報道,機器學習廣泛應(yīng)用到新聞生產(chǎn)環(huán)節(jié),諸如“自動化寫作”“數(shù)據(jù)調(diào)查”等。

      《亞特蘭大憲法報》的調(diào)查團隊在一則名為《醫(yī)生和性虐待》的系列報道中關(guān)注了一個特殊的群體——那些曾對患者進行性侵犯的醫(yī)生。這篇報道揭露了美國醫(yī)療界的一個嚴重問題:醫(yī)生利用自己的身份對患者進行性侵犯,但是卻沒有受到應(yīng)有的懲罰,他們中的多數(shù)人仍然可以留在自己的工作崗位上,繼續(xù)行醫(yī),而他們的病人對此卻一無所知。亞特蘭大憲法報記者Danny Robbins在查閱佐治亞州醫(yī)學委員會記錄的2015年醫(yī)療犯罪案例時發(fā)現(xiàn),在這些處罰令中,有70條和不當性行為有關(guān)的記錄,同時,在佐治亞州,犯有不當性行為的醫(yī)生,三分之二可以繼續(xù)持有行醫(yī)執(zhí)照,其中包括了有重復性犯罪記錄的醫(yī)生。

      調(diào)查團隊想知道:這僅僅是佐治亞州的個例,還是全美存在的普遍現(xiàn)象。亞特蘭大憲法報的數(shù)據(jù)新聞團隊通過網(wǎng)絡(luò)爬蟲從各州醫(yī)療委員會的網(wǎng)站上爬取了共計十萬份左右的處罰令文檔。調(diào)查團隊使用了監(jiān)督式機器學習的方法,從已經(jīng)確定的性侵處罰令中訓練出一套模型,應(yīng)用在新的處罰令上。在監(jiān)督式的機器學習中,那些已經(jīng)被確認和性侵犯有關(guān)的處罰令被當成是訓練數(shù)據(jù),計算機會根據(jù)相應(yīng)算法自動提取訓練集數(shù)據(jù)的特征。訓練完成后,再把新的處罰令扔給計算機,計算機就會根據(jù)訓練模型對其進行自動分類,判斷新的處罰令是否符合這些特征。

      通過這樣的方法,他們最終確認了6 000份處罰令可能和不當性行為有關(guān)。之后,調(diào)查團隊再通過人工比對的方法進行核實,排除掉那些重復的記錄,并且確認在這些案例中醫(yī)生到底受到了怎樣的懲罰。在掌握了可靠的數(shù)據(jù)之后,調(diào)查團隊又進行了一系列的采訪和追蹤調(diào)查。

      這種通過海量數(shù)據(jù)來建立新模型的形式,可以應(yīng)用在采訪過程中對采訪對象的情緒判斷。在這方面,機器學習與嬰兒逐漸學習并識別面部表情的原理很相似,可以通過不間斷地向機器輸入大量表情、微表情、語言以及語氣,最終形成能夠判斷各類表情甚至體悟微表情的功能。這也將給記者在采訪過程中提供更多的便利和線索。

      Buzzfeed的記者用機器學習的方法發(fā)現(xiàn)了美國領(lǐng)空上存在許多執(zhí)行政府監(jiān)控任務(wù)的飛行器。首先,Buzzfeed的記者找到了100架已經(jīng)被確認是來自美國國土安全部或FBI的飛行器,另外有從 Flightradar24網(wǎng)站上隨機選擇了500架其它的飛行器,并且獲得了600架飛行器詳細的飛行記錄。Flightradar24是一個提供航班實時信息的服務(wù)商,能夠提供諸多飛機的具體記錄,包括飛機的起落時間、飛行時長和飛行軌跡等。記者將這些飛行記錄當做訓練數(shù)據(jù),訓練出一個模型,再從Flightradar24網(wǎng)站上獲取更多飛機的飛行記錄進行試驗,找出那些飛行特征和訓練模型十分接近的飛行器。通常,那些執(zhí)行政府特殊任務(wù)的飛行器會被掛名在一個虛假公司下,以此來掩蓋其真實的身份。Buzzfeed的記者循著這些飛機又找到它們背后所屬的公司,并且確認這些公司屬于美國軍方或政府機構(gòu)。

      從上面兩個案例中,我們可以發(fā)現(xiàn),機器學習確實能夠為新聞生產(chǎn)提供更多的選擇和可能性,無論是幫助記者尋找選題,還是簡化新聞生產(chǎn)過程中需要處理的龐雜的資料。機器學習最擅長的是在龐大的數(shù)據(jù)中尋找模式和規(guī)律,而這其實是很多新聞生產(chǎn)及其報道的核心所在。

      當然,機器學習并不是一個萬能的工具。在使用它進行輔助報道之前首先要理解它,知道什么樣的選題或者問題適合用機器學習的方法來解決,以及在使用這種方法的時候,需要怎樣的統(tǒng)計學和社會科學方法論的基礎(chǔ)。

      3 機器學習易滋生虛假新聞

      虛假新聞是業(yè)界一直存在的現(xiàn)象,在網(wǎng)絡(luò)時代,各種虛假新聞更是防不勝防,而機器學習在虛假新聞的產(chǎn)生方面也產(chǎn)生了一定的影響。機器學習不僅能夠在新聞生產(chǎn)環(huán)節(jié)發(fā)生作用,幫助記者完成復雜的新聞生產(chǎn)過程。但是,機器學習也能寫出大量以假亂真的假新聞。2017年10月,《科學美國麗人》的副主編Larry Greenemeier發(fā)表文章《AI是否可能成為假新聞和產(chǎn)品評價的未來》,文章認為:在虛假信息方面,“人工智能的發(fā)展可能會引起更大的問題?!敝T如Yelp(美國版“大眾點評”)以及亞馬遜等網(wǎng)站的用戶評論也正面臨著真假難辨的 困境。

      2017年9月,希拉里的新書《What Happened》首次在亞麻徐的主頁上發(fā)布,幾小時內(nèi),亞馬遜上關(guān)于此書的評論數(shù)酒甌超過了1 600條,然而亞馬遜卻迅速刪除了900條可疑的虛假評論。這些評論者聲稱自己多么喜愛或者討厭這本書,但卻沒有任何購買或者閱讀此書的記錄。這些虛假的產(chǎn)品評論很有可能隨著自動化技術(shù)的日漸成熟而產(chǎn)生更大的影響,甚至左右大眾的觀點。

      芝加哥大學的一個研究團隊針對“AI大批量生成的虛假評論是否足夠可信并影響受眾”展開了調(diào)查。他們的一項最新研究使用機器深度學習的技術(shù),分析并學習了上百萬條現(xiàn)有的Yelp餐廳評價,進而自動生成假的Yelp餐廳評價。為了顯得逼真,其中一些評論使用了復雜的語句;而另一些評論則故意使用了重復的語句,能被用戶一眼辨別出來是假評論。

      當研究者對這些由AI自動生成的假評論進行測試時,他們發(fā)現(xiàn)Yelp的過濾軟件(同樣基于機器學習算法)并不能準確識別真假評論。甚至說,剽竊檢測軟件也不能識別二者的區(qū)別。也就是說,機器自動寫的假評論成功騙過了Yelp網(wǎng)站和剽竊檢測軟件。另一方面,人類受訪者也難以區(qū)分出真實的評價和機器自動生成的假評價,當受訪者被要求為Yelp評論的“有用程度”進行打分時,“AI撰寫的假評論”和“人類撰寫的真實評論”的得分幾乎是一樣的。

      而這僅僅是在產(chǎn)品評論方面所出現(xiàn)的虛假問題,在這個機器能通過學習自動生產(chǎn)新聞產(chǎn)品的時代,網(wǎng)絡(luò)上出現(xiàn)的新聞作品的真實性讓受眾難以分辨,這是機器學習在應(yīng)用過程中不可避免的負面效應(yīng)。當然也有更多的研究者投入到研制反虛假新聞技術(shù)當中。

      隨著AI技術(shù)的飛速進步和數(shù)據(jù)的指數(shù)倍增長,真假新聞在語言和語法上的區(qū)別將日益縮小。這也意味著檢測文字和語法的算法將形同虛設(shè),關(guān)鍵在于“攻擊者”和“防御者”誰能先開發(fā)出更加復雜的算法和更為優(yōu)化的人工神經(jīng)網(wǎng)絡(luò)。當然,除了技術(shù)方面,新聞記者也應(yīng)該承擔一定責任,幫助公眾辨別和調(diào)查虛假信息,記者應(yīng)該借助媒體鑒別工具等手段追蹤信息流,這也意味著各大網(wǎng)絡(luò)平臺應(yīng)該賦予記者更多接觸平臺數(shù)據(jù)的渠道。

      4 結(jié)論

      互聯(lián)網(wǎng)帶來的信息消費模式從“人找信息”向“信息找人”轉(zhuǎn)變,而且由于算法公司不斷地將用戶出讓的隱私用于構(gòu)建“數(shù)字身份檔案”,進而實現(xiàn)精準化推送,媒體受脅迫難以避免“流量工廠”的經(jīng)營模式[2]。流量壓力之下,為開發(fā)非公共性的“利基市場”、分眾化的“長尾市場”,內(nèi)容公司需要全部的用戶行為數(shù)據(jù),特別是用戶“關(guān)系數(shù)據(jù)”,進而無條件“迎合”新條件下的受眾需求。在機器學習等技術(shù)的助推下,向精細化導流的方向發(fā)展,新聞分發(fā)體系中將提供更加個性化的新聞,最大化地挖掘新聞作品的利 用率。

      當下,機器學習等人工智能算法的不透明、新聞生產(chǎn)各環(huán)節(jié)對技術(shù)公司的強依賴、虛假新聞層出不窮并難以分辨等趨勢,亟待研究者不僅僅停留在對技術(shù)層面能實現(xiàn)什么,而應(yīng)該將實現(xiàn)轉(zhuǎn)移到更多內(nèi)在的層面。

      傳媒機構(gòu)在使用人工智能進行寫作、傳送和資訊配置時必須承擔相應(yīng)的責任,必須清楚人工智能可以做什么,不能做什么。我們可以看出,未來的專業(yè)工作者的能力表現(xiàn)并不在于他能些什么、他能表達什么,而是對社會信息的表達和配置有更強的平衡能力、更多元的制衡機制。對于人工智能發(fā)展的焦慮,作為研究者事先要做好預判,當這個時代真正到來時我們就能通過預防使負面影響降到 最低。

      參考文獻

      [1]阿培丁.機器學習導論[M].3版.北京:機械工業(yè)出版社,2016.

      [2]仇筠茜,陳昌鳳.黑箱:人工智能技術(shù)與新聞生產(chǎn)格局嬗變[J].新聞界,2018(1):28-34.

      猜你喜歡
      新聞生產(chǎn)機器學習人工智能
      2019:人工智能
      商界(2019年12期)2019-01-03 06:59:05
      人工智能與就業(yè)
      數(shù)讀人工智能
      小康(2017年16期)2017-06-07 09:00:59
      基于機器學習的圖像特征提取技術(shù)在圖像版權(quán)保護中的應(yīng)用
      基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預測分析
      時代金融(2016年27期)2016-11-25 17:51:36
      前綴字母為特征在維吾爾語文本情感分類中的研究
      科教導刊(2016年26期)2016-11-15 20:19:33
      新媒體時代的新聞生產(chǎn)
      新聞愛好者(2016年9期)2016-11-15 19:26:27
      基于支持向量機的金融數(shù)據(jù)分析研究
      下一幕,人工智能!
      南風窗(2016年19期)2016-09-21 16:51:29
      網(wǎng)絡(luò)新聞生產(chǎn)中的道德綁架現(xiàn)象與規(guī)避
      新聞世界(2016年4期)2016-06-20 08:55:22
      揭阳市| 隆子县| 博客| 布尔津县| 阿鲁科尔沁旗| 五常市| 潞城市| 东兴市| 九江市| 濉溪县| 错那县| 和平县| 德安县| 崇明县| 玉田县| 竹山县| 资源县| 三江| 莱芜市| 鹿邑县| 上虞市| 贡嘎县| 菏泽市| 莎车县| 中方县| 武胜县| 琼结县| 新乐市| 汕头市| 密云县| 额济纳旗| 鄂温| 泗水县| 大渡口区| 德庆县| 阜阳市| 贺兰县| 庄浪县| 隆子县| 高州市| 高密市|