劉宇陽
百分點(diǎn)集團(tuán)副總裁兼EBG事業(yè)部總裁 高體偉
華南理工大學(xué),軟件工程碩士。擁有近20年豐富的政府、金融、電信、制造、零售等行業(yè)解決方案銷售經(jīng)驗(yàn)和團(tuán)隊(duì)管理經(jīng)驗(yàn)。曾任惠普軟件集團(tuán)大客戶部總經(jīng)理,任職期間使惠普軟件業(yè)務(wù)連續(xù)三年保持兩位數(shù)的增長;曾任Golferdataco Founder、方正控股區(qū)域售前經(jīng)理?,F(xiàn)負(fù)責(zé)百分點(diǎn)企業(yè)業(yè)務(wù)事業(yè)部管理工作。
2016年10月,國家新聞出版廣電總局正式發(fā)布了《關(guān)于發(fā)布首批新聞出版業(yè)科技與標(biāo)準(zhǔn)重點(diǎn)實(shí)驗(yàn)室的通知》,這是首批新聞出版業(yè)科技與標(biāo)準(zhǔn)重點(diǎn)實(shí)驗(yàn)室申報(bào)評(píng)審工作。百分點(diǎn)集團(tuán)與南方報(bào)業(yè)傳媒集團(tuán)聯(lián)合建設(shè)的“媒體大數(shù)據(jù)應(yīng)用實(shí)驗(yàn)室”,成功入選專業(yè)領(lǐng)域?qū)嶒?yàn)室,是數(shù)據(jù)管理與運(yùn)營方向三個(gè)實(shí)驗(yàn)室之一。實(shí)驗(yàn)室主要研究新聞行業(yè)的數(shù)據(jù)匯聚與治理、交換與共享、分析與應(yīng)用、存儲(chǔ)與安全等相關(guān)大數(shù)據(jù)收集、清洗治理、交換標(biāo)準(zhǔn)以及共享機(jī)制、數(shù)據(jù)分析挖掘與應(yīng)用的個(gè)性化開發(fā)等新技術(shù)。
近日,出版參考雜志社就“媒體大數(shù)據(jù)應(yīng)用實(shí)驗(yàn)室”的研究方向與人工智能在出版領(lǐng)域的若干應(yīng)用,采訪了百分點(diǎn)集團(tuán)副總裁兼EBG事業(yè)部總裁高體偉。
應(yīng)用實(shí)驗(yàn)室:聚焦大數(shù)據(jù)管理
出版參考:百分點(diǎn)與南方報(bào)業(yè)聯(lián)合建設(shè)媒體大數(shù)據(jù)應(yīng)用實(shí)驗(yàn)室成功入選了首批新聞出版業(yè)科技與標(biāo)準(zhǔn)重點(diǎn)實(shí)驗(yàn)室,請(qǐng)介紹一下該實(shí)驗(yàn)室的具體研究內(nèi)容?
高體偉:媒體大數(shù)據(jù)應(yīng)用實(shí)驗(yàn)室是本次入選的數(shù)據(jù)管理與運(yùn)營方向三個(gè)實(shí)驗(yàn)室之一。實(shí)驗(yàn)室主要研究新聞行業(yè)的數(shù)據(jù)匯聚與治理、交換與共享、分析與應(yīng)用、存儲(chǔ)與安全等相關(guān)大數(shù)據(jù)收集、清洗治理、交換標(biāo)準(zhǔn)以及共享機(jī)制、數(shù)據(jù)分析挖掘與應(yīng)用的個(gè)性化開發(fā)等新技術(shù)。具體有以下四個(gè)方面:
1.數(shù)據(jù)新聞可視化表達(dá)。將新聞背后的數(shù)據(jù)進(jìn)行分析與過濾,從小數(shù)據(jù)中總結(jié)規(guī)律、建設(shè)各種類型的分析模型,最終把數(shù)據(jù)和新聞內(nèi)容本身作為相輔的整體進(jìn)行傳播,從量化的角度準(zhǔn)確地報(bào)道新聞事實(shí),反映新聞事物的發(fā)展?fàn)顩r,并通過可視化的手段進(jìn)行展現(xiàn)。
2.媒體智能決策分析。通過對(duì)新聞熱點(diǎn)、熱點(diǎn)事件以及傳播路徑等的分析,利用文本智能分析技術(shù)中的相似判定技術(shù)實(shí)現(xiàn)新聞報(bào)道的轉(zhuǎn)載判定和自動(dòng)分類等技術(shù),建立新聞、論壇、博客、微博、視頻、全局等多維輿論場發(fā)現(xiàn)模型,幫助企業(yè)做智能決策分析,可以分析熱點(diǎn)新聞的來源、傳播路徑、熱度時(shí)間以及發(fā)展趨勢(shì)。同時(shí),基于全媒體資源管理平臺(tái),可以利用新聞稿件問的關(guān)聯(lián)關(guān)系,完成數(shù)據(jù)新聞的智能決策分析。
3.媒體傳播效果評(píng)估分析。從關(guān)注報(bào)紙發(fā)行量轉(zhuǎn)變?yōu)殛P(guān)注真實(shí)受眾,客觀評(píng)價(jià)媒體的全網(wǎng)傳播效果,掌握媒體內(nèi)容的全網(wǎng)轉(zhuǎn)載情況和傳播路徑,掌握媒體原創(chuàng)內(nèi)容疑似侵權(quán)盜用情況。構(gòu)建基于報(bào)刊、網(wǎng)站、客戶端App、官微等渠道的“融媒體”智能傳播效果評(píng)價(jià)體系,定期形成綜合的量化影響力報(bào)告。
4.用戶畫像數(shù)據(jù)建模。實(shí)時(shí)收集網(wǎng)站以及移動(dòng)App的用戶閱讀行為數(shù)據(jù),并通過分布式計(jì)算、機(jī)器學(xué)習(xí)等多種手段,建設(shè)用戶閱讀行為分析系統(tǒng),進(jìn)行多種維度的統(tǒng)計(jì)和分析,從中發(fā)現(xiàn)用戶使用的特點(diǎn)和規(guī)律,進(jìn)而實(shí)現(xiàn)用戶畫像數(shù)據(jù)建模。
百分點(diǎn):轉(zhuǎn)型面向服務(wù)市場
出版參考:作為業(yè)內(nèi)大數(shù)據(jù)和人工智能的先行者,百分點(diǎn)為實(shí)驗(yàn)室的建設(shè)提供了有力的技術(shù)支持,請(qǐng)介紹一下百分點(diǎn)在轉(zhuǎn)型升級(jí)、服務(wù)市場方面的探索成果。
高體偉:百分點(diǎn)從2015年開始進(jìn)行轉(zhuǎn)型面向企業(yè)級(jí)服務(wù)市場,先后推出了一批企業(yè)級(jí)大數(shù)據(jù)產(chǎn)品,到今天經(jīng)過兩年多的市場檢驗(yàn)和經(jīng)驗(yàn)積累,百分點(diǎn)的產(chǎn)品也迎來了重大更新。
系統(tǒng)更新,持續(xù)幫助企業(yè)實(shí)現(xiàn)數(shù)據(jù)價(jià)值。首先,百分點(diǎn)大數(shù)據(jù)產(chǎn)品系列,我們重磅推出了大數(shù)據(jù)操作系統(tǒng)BDOS2.0。過去兩年中,大數(shù)據(jù)操作系統(tǒng)BD-OS加入了分布式分析型數(shù)據(jù)庫、人力資源管理平臺(tái)等核心技術(shù)組件,真正將人工智能和商業(yè)智能融合在了一個(gè)基礎(chǔ)平臺(tái)之上,能夠?yàn)殚_發(fā)者提供完整的數(shù)據(jù)集,提升企業(yè)使用數(shù)據(jù)價(jià)值的效率。
其次,是大數(shù)據(jù)建模工廠BD MW經(jīng)過兩年多的業(yè)務(wù)實(shí)戰(zhàn),我們的數(shù)據(jù)科學(xué)家在公共大治理、智能制造、融媒、金融等領(lǐng)域形成了富有洞見的模型庫,這個(gè)模型庫里面包含數(shù)百個(gè)經(jīng)過深度定制和優(yōu)化的商業(yè)模型,能夠顯著地提升企業(yè)運(yùn)營效率和水平。
最后,是基于大數(shù)據(jù)操作系統(tǒng)和建模工廠上的大數(shù)據(jù)智能應(yīng)用BD-IA,人工智能產(chǎn)品系列,包括智能標(biāo)簽工廠、智能交互分析引擎、智能語音應(yīng)用系統(tǒng),以及基于這些產(chǎn)品形成的富有行業(yè)特色、技術(shù)領(lǐng)先的涵蓋公共治理、智能制造、媒體出版和金融科技等行業(yè)的人工智能場景解決方案,持續(xù)幫助企業(yè)實(shí)現(xiàn)數(shù)據(jù)價(jià)值。這些產(chǎn)品也得到了不同程度的完善和整合,能夠靈活地組合成用戶行為分析、智能運(yùn)營和營銷、市場洞察等各種行業(yè)的解決方案。
新增產(chǎn)品線,助力人工智能發(fā)展。百分點(diǎn)新增的一條人工智能產(chǎn)品系列產(chǎn)品線。這個(gè)系列強(qiáng)調(diào)運(yùn)用自認(rèn)語言處理、語音識(shí)別的人工智能技術(shù),幫助用戶完成各類數(shù)據(jù)分析和運(yùn)用。這個(gè)系列包括三款產(chǎn)品,首先是智能標(biāo)簽工廠,是百分點(diǎn)的拳頭產(chǎn)品,一直針對(duì)的是用戶、產(chǎn)品等十幾個(gè)建模分析,現(xiàn)在我們把智能標(biāo)簽工廠擴(kuò)展成知識(shí)圖譜,不僅包括實(shí)體還包括實(shí)體關(guān)系。新的智能標(biāo)簽工廠能在企業(yè)內(nèi)部建立起一整套企業(yè)知識(shí)體系,形成標(biāo)準(zhǔn)化的知識(shí)數(shù)據(jù)和數(shù)據(jù)接口,更好地支持各類智能應(yīng)用。
第二款產(chǎn)品是智能交互分析引擎,BI分析(商業(yè)智能BusinessIndigence)是最常見也是最基本的數(shù)據(jù)應(yīng)用,但BI分析要求用戶理解維度、指標(biāo)等概念都提高了分析工具的使用門檻。我們的智能交互分析引擎,通過自然語言和語音與用戶進(jìn)行交互,用戶只需要對(duì)系統(tǒng)描述自己想要什么,而不是告訴系統(tǒng)怎么做,系統(tǒng)就能夠通過自然語言理解,將用戶的需求自動(dòng)轉(zhuǎn)化為對(duì)底層數(shù)據(jù)的抽取、分析、組合這一系列的過程,并且選取合適的展現(xiàn)方式將分析結(jié)果呈現(xiàn)給用戶。另外,智能交互分析引擎還能主動(dòng)發(fā)現(xiàn)數(shù)據(jù)中的異常和亮點(diǎn),并主動(dòng)提醒用戶進(jìn)行深入地分析,且在分析中引擎能夠進(jìn)行智能引導(dǎo)。
最后一款產(chǎn)品是智能語言應(yīng)用系統(tǒng)。我們的很多企業(yè)客戶都有大量語音數(shù)據(jù)特別是客服語音數(shù)據(jù),他們急需對(duì)這些語音數(shù)據(jù)進(jìn)行分析,從中提取出客戶的基本信息、偏好、客戶對(duì)企業(yè)以及產(chǎn)品的評(píng)價(jià),同時(shí),企業(yè)也期望通過智能化的手段對(duì)客服工作狀態(tài)進(jìn)行評(píng)估。endprint
傳統(tǒng)出版:踐行多場景解決方案
出版參考:請(qǐng)分析國內(nèi)新聞出版媒體行業(yè)使用大數(shù)據(jù)和人工智能的必要性。
高體偉:當(dāng)前媒體融合發(fā)展上升為國家戰(zhàn)略,隨著互聯(lián)網(wǎng)和大數(shù)據(jù)的飛速發(fā)展,傳統(tǒng)媒體面臨新的輿論生態(tài)、社會(huì)生態(tài)和產(chǎn)業(yè)生態(tài),其新聞生產(chǎn)、內(nèi)容傳播、技術(shù)創(chuàng)新、產(chǎn)品創(chuàng)新、服務(wù)創(chuàng)新等方面都經(jīng)受著嚴(yán)峻挑戰(zhàn)。
根據(jù)中央對(duì)推動(dòng)傳統(tǒng)媒體和新興媒體融合發(fā)展的重要指示與要求,推動(dòng)媒體融合發(fā)展,遵循新聞傳播規(guī)律和新興媒體發(fā)展規(guī)律,強(qiáng)化互聯(lián)網(wǎng)思維,堅(jiān)持傳統(tǒng)媒體和新興媒體優(yōu)勢(shì)互補(bǔ)、一體發(fā)展,堅(jiān)持先進(jìn)技術(shù)為支撐、內(nèi)容建設(shè)為根本,推動(dòng)傳統(tǒng)媒體和新興媒體在內(nèi)容、渠道、平臺(tái)、經(jīng)營、管理等方面的深度融合,形成立體多樣、融合發(fā)展的現(xiàn)代傳播體系顯得尤為重要。為積極應(yīng)對(duì)互聯(lián)網(wǎng)發(fā)展帶來的傳播格局調(diào)整和用戶需求變化,傳統(tǒng)新聞出版企業(yè),特別是報(bào)業(yè)集團(tuán)有必要踐行大數(shù)據(jù)與智能化的整體解決方案。
傳統(tǒng)出版單位結(jié)合當(dāng)前媒體融合發(fā)展的實(shí)際業(yè)務(wù)需求和大數(shù)據(jù)與智能化前沿技術(shù),在深刻理解互聯(lián)網(wǎng)發(fā)展帶來的新聞傳播格局調(diào)整和媒體用戶需求變化,可以聯(lián)合百分點(diǎn)為受眾提供全媒體資源匯聚融合、全媒體數(shù)據(jù)資產(chǎn)管理、全媒體智能服務(wù)管理、全媒體用戶洞察分析、新聞熱點(diǎn)傳播洞察及影響力分析等多場景解決方案,幫助用戶提升“數(shù)據(jù)整合、能力共享、應(yīng)用創(chuàng)新”等各項(xiàng)業(yè)務(wù)能力,助力新型主流媒體和媒體集團(tuán)融合發(fā)展。
出版參考:百分點(diǎn)在國內(nèi)媒體行業(yè)大數(shù)據(jù)與人工智能升級(jí)方面有著領(lǐng)先的技術(shù),請(qǐng)具體介紹媒體行業(yè)報(bào)業(yè)大數(shù)據(jù)與智能化整體解決方案的方案概述與應(yīng)用場景。
高體偉:百分點(diǎn)基于自身核心的大數(shù)據(jù)技術(shù),分布式技術(shù)、微服務(wù)技術(shù)、容器技術(shù)、自然語言處理技術(shù)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等技術(shù)能力,結(jié)合當(dāng)前媒體內(nèi)容業(yè)務(wù)的實(shí)際需求,構(gòu)建媒體行業(yè)大數(shù)據(jù)支撐能力,提供全媒體數(shù)據(jù)資源統(tǒng)一接入、全媒體大數(shù)據(jù)資源管理平臺(tái)、媒體智能分析引擎、媒體智能服務(wù)引擎、智能數(shù)據(jù)服務(wù)平臺(tái)等多項(xiàng)媒體大數(shù)據(jù)功能系統(tǒng),實(shí)現(xiàn)了從媒體數(shù)據(jù)資源的接入、聚合、整理、全生命周期管控,到媒體數(shù)據(jù)資源庫進(jìn)行業(yè)務(wù)方面的大數(shù)據(jù)應(yīng)用和分析挖掘,并能夠?yàn)槊襟w各類業(yè)務(wù)應(yīng)用提供數(shù)據(jù)資源的智能化服務(wù),形成傳統(tǒng)媒體和新興媒體業(yè)務(wù)的一體化深度融合,幫助傳媒企業(yè)打造出全新媒體融合發(fā)展應(yīng)用服務(wù)體系。
1.全媒體資源匯聚融合
全媒體資源匯聚融合基于核心采編業(yè)務(wù),將散布在各部門和采編環(huán)節(jié)的撰稿素材資源數(shù)據(jù)、內(nèi)部稿件數(shù)據(jù)、產(chǎn)品資源數(shù)據(jù)、運(yùn)營數(shù)據(jù)、用戶行為數(shù)據(jù)、互聯(lián)網(wǎng)資源和第三方數(shù)據(jù)等各類數(shù)據(jù)資源進(jìn)行統(tǒng)一匯聚管理,構(gòu)建基于傳媒企業(yè)自身特點(diǎn)的全媒體資產(chǎn)數(shù)據(jù)匯聚融合能力。同時(shí)基于全媒體數(shù)據(jù)資源統(tǒng)一接入和全媒體大數(shù)據(jù)資源管理平臺(tái)實(shí)現(xiàn)對(duì)多源異構(gòu)數(shù)據(jù)資源的統(tǒng)一適配接入管理,實(shí)現(xiàn)對(duì)采集接入的多方數(shù)據(jù)資源進(jìn)行統(tǒng)一高效的智能化分布式自動(dòng)聚合存儲(chǔ)。
2.全媒體數(shù)據(jù)資產(chǎn)管理
全媒體數(shù)據(jù)資產(chǎn)管理,能夠賦予傳媒企業(yè)基于大數(shù)據(jù)技術(shù)的全媒體資產(chǎn)大數(shù)據(jù)管理能力,提供針對(duì)媒體大數(shù)據(jù)資產(chǎn)的全生命周期的數(shù)據(jù)存儲(chǔ)管理、數(shù)據(jù)標(biāo)準(zhǔn)管理、數(shù)據(jù)流程管理、數(shù)據(jù)質(zhì)量管理和數(shù)據(jù)安全管控。通過從宏觀到微觀的數(shù)據(jù)管理視圖,實(shí)現(xiàn)對(duì)互聯(lián)網(wǎng)數(shù)據(jù)資源、內(nèi)部稿件數(shù)據(jù)、產(chǎn)品數(shù)據(jù)、運(yùn)營數(shù)據(jù)、用戶行為數(shù)據(jù)等各類數(shù)據(jù)資源的全生命周期管控。實(shí)現(xiàn)傳媒機(jī)構(gòu)內(nèi)外部及第三方渠道等數(shù)據(jù)資產(chǎn)的動(dòng)態(tài)掌握,了解當(dāng)前的數(shù)據(jù)資產(chǎn)來源情況、數(shù)據(jù)量、數(shù)據(jù)質(zhì)量、數(shù)據(jù)接口、數(shù)據(jù)使用頻次、數(shù)據(jù)共享情況等。大幅提升數(shù)據(jù)管理效率,并滿足采編發(fā)、供稿、新聞信息統(tǒng)計(jì)監(jiān)測、生產(chǎn)指揮調(diào)度等相關(guān)業(yè)務(wù)的數(shù)據(jù)管控需求。
3.全媒體智能服務(wù)管理
全媒體智能服務(wù)管理,基于微服務(wù)技術(shù)和容器技術(shù)架構(gòu)提供自然語義分析服務(wù)、智能推薦服務(wù)、智能檢索服務(wù)、數(shù)據(jù)訂閱服務(wù)、標(biāo)簽服務(wù)等,同時(shí)能夠?qū)Ω黝愊到y(tǒng)服務(wù)進(jìn)行自動(dòng)識(shí)別、輕量級(jí)封裝化分布式部署、負(fù)載均衡、統(tǒng)一管理、跟蹤監(jiān)控、用戶審計(jì)和授權(quán)等服務(wù)管控功能。實(shí)現(xiàn)針對(duì)采編數(shù)據(jù)、供稿數(shù)據(jù)、多媒體數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)、第三方渠道數(shù)據(jù)、用戶行為數(shù)據(jù)等與新聞采編發(fā)、新聞供稿、生產(chǎn)指揮調(diào)度、新聞熱點(diǎn)傳播洞察、新聞?dòng)绊懥Ψ治?、新聞信息統(tǒng)計(jì)監(jiān)測、統(tǒng)一用戶認(rèn)證、業(yè)務(wù)管理與運(yùn)維監(jiān)控等業(yè)務(wù)系統(tǒng)問的服務(wù)化支撐,滿足數(shù)據(jù)資產(chǎn)對(duì)業(yè)務(wù)系統(tǒng)的分發(fā)共享、數(shù)據(jù)在線交易、數(shù)據(jù)調(diào)用等需求,實(shí)現(xiàn)全媒體信息智能化服務(wù)管理,滿足傳媒企業(yè)各類公共性大數(shù)據(jù)應(yīng)用服務(wù)及管理需求。
4.全媒體用戶洞察分析
全媒體用戶洞察分析,能夠全方位深度洞察傳媒生態(tài)圈中的內(nèi)外部用戶,通過全觸點(diǎn)的用戶數(shù)據(jù)整合和拉通,構(gòu)建完善的媒體用戶標(biāo)簽體系及全生命周期用戶畫像,并對(duì)用戶畫像特征信息進(jìn)行精準(zhǔn)標(biāo)識(shí)刻畫,具備宏觀、微觀和多維度的用戶畫像分析與瀏覽,能夠根據(jù)用戶特征如地域、年齡、興趣等進(jìn)行分聚類分析,實(shí)現(xiàn)傳媒企業(yè)對(duì)內(nèi)外部用戶的價(jià)值度分析、偏好分析、特征分析和傾向性分析等,深度挖掘用戶價(jià)值,從而最大化地釋放用戶需求,促進(jìn)傳媒機(jī)構(gòu)基于以用戶為核心的不斷優(yōu)化創(chuàng)新能力,在產(chǎn)品形態(tài)、傳播媒介、內(nèi)容選擇等多方面,更加貼合用戶需求,不斷增加受眾黏性,提升內(nèi)容的閱讀量和傳播力,擴(kuò)大媒體影響力和輻射度,切實(shí)有效落實(shí)以用戶需求為核心的戰(zhàn)略目標(biāo)。
5.新聞熱點(diǎn)傳播洞察及影響力分析
新聞熱點(diǎn)傳播洞察及影響力分析,提供基于大數(shù)據(jù)技術(shù)的傳播影響力分析挖掘能力,形成新聞熱點(diǎn)傳播影響力數(shù)據(jù)模型和指標(biāo)體系。通過對(duì)互聯(lián)網(wǎng)新聞數(shù)據(jù)持續(xù)性的大數(shù)據(jù)實(shí)時(shí)分析,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)媒體、社交媒體和報(bào)刊上的傳播和影響力深度分析,實(shí)現(xiàn)對(duì)新聞熱點(diǎn)稿件或特定主體如時(shí)間、地點(diǎn)、事件、人物架構(gòu)等維度的分析,實(shí)現(xiàn)對(duì)新聞熱點(diǎn)事件進(jìn)行傳播追蹤,形成關(guān)鍵粉絲分析、傾向性分析、觀點(diǎn)分析等,為傳媒企業(yè)新聞生產(chǎn)提供大數(shù)據(jù)傳播影響力分析手段。endprint