化柏林 劉佳穎 王英澤
(1.北京大學(xué)信息管理系 北京 100871;2.公共文化服務(wù)大數(shù)據(jù)應(yīng)用文化和旅游部重點實驗室 北京 100871)
隨著大數(shù)據(jù)時代的到來,云計算、人工智能、移動互聯(lián)網(wǎng)等新技術(shù)掀起了全球經(jīng)濟(jì)、科技等方面的巨大變革,也對公共文化服條機(jī)構(gòu)產(chǎn)生了不容小覷的影響。一方面,大數(shù)據(jù)技術(shù)為公共文化服條機(jī)構(gòu)的海量數(shù)據(jù)采集與存儲提供了可能,擴(kuò)大了機(jī)構(gòu)的資源存儲容量;另一方面,大數(shù)據(jù)分析技術(shù)也提供用戶數(shù)據(jù)的深入分析與挖掘,推動了公共文化服條的個性化、智能化進(jìn)程。
在這樣的趨勢之下,國內(nèi)一些公共文化服條機(jī)構(gòu)已經(jīng)在大數(shù)據(jù)的利用和挖掘方面進(jìn)行了探索,出現(xiàn)了個性化書目推薦、大數(shù)據(jù)智慧墻、文化地圖等新型服條方式;但是從整個公共文化服條領(lǐng)域來看,這些服條機(jī)構(gòu)對大數(shù)據(jù)與機(jī)構(gòu)業(yè)條的融合方式探索依然呈現(xiàn)出零散、模糊的特點,尚未形成系統(tǒng)、明確的應(yīng)用方向。大數(shù)據(jù)對公共文化領(lǐng)域究竟有哪些影響,具體的應(yīng)用場景包括哪些方面,這一問題需要進(jìn)一步歸納總結(jié),梳理出大數(shù)據(jù)在公共文化領(lǐng)域的應(yīng)用場景。
為了對大數(shù)據(jù)的應(yīng)用場景進(jìn)行較為全面的研究分析,本研究通過閱讀已有的相關(guān)文獻(xiàn)以及分析自主采集整理的公共文化數(shù)據(jù)集合兩種途徑,從定性分析和文本分析兩個角度入手,分別對公共文化領(lǐng)域的現(xiàn)存問題和大數(shù)據(jù)應(yīng)用方向進(jìn)行研究,將二者結(jié)合,歸納出公共文化服條大數(shù)據(jù)的應(yīng)用場景,具體的研究思路如圖1所示。
圖1 公共文化服務(wù)大數(shù)據(jù)應(yīng)用場景分析研究思路
一方面,通過文獻(xiàn)調(diào)研的方式定性分析,總結(jié)并歸納公共文化機(jī)構(gòu)存在的問題和已經(jīng)出現(xiàn)的應(yīng)用場景;另一方面,通過文本分析從公共文化數(shù)據(jù)中抽取“問題”、“大數(shù)據(jù)”的相關(guān)內(nèi)容,并進(jìn)行同義詞擴(kuò)展,再經(jīng)過數(shù)據(jù)標(biāo)引和統(tǒng)計分析,歸納問題類型和大數(shù)據(jù)應(yīng)用場景的類型。最后,將通過兩種方式得到的問題和應(yīng)用場景分別整合,從中析取出適合用大數(shù)據(jù)解決的問題及對應(yīng)的方式,最終形成公共文化服條大數(shù)據(jù)應(yīng)用場景。
(1)公共文化服條大數(shù)據(jù)理論研究
關(guān)于大數(shù)據(jù)與公共文化領(lǐng)域結(jié)合的探討最早始于圖書館研究。在“大數(shù)據(jù)”這一概念被正式提出伊始,韓翠峰指出了大數(shù)據(jù)將對圖書館的資源存儲能力、用戶需求挖掘能力等提出更高要求,需要圖書館改變技術(shù)開發(fā)與運用、數(shù)據(jù)集成與處理、人才培養(yǎng)與管理等方面的模式[1]。隨后,越來越多的學(xué)者將大數(shù)據(jù)對圖書館的影響擴(kuò)展到對整個公共文化服條領(lǐng)域的影響。劉煒等人則針對公共文化服條大數(shù)據(jù)發(fā)展的頂層設(shè)計,研究了這一過程中的政策與宏觀管理、產(chǎn)業(yè)鏈與行業(yè)生態(tài)、技術(shù)標(biāo)準(zhǔn)規(guī)范等問題[2]。李廣建等構(gòu)建了公共文化服條大數(shù)據(jù)的研究體系,指出該體系應(yīng)該包含理論、方法、技術(shù)、用戶、應(yīng)用等五個核心要素,應(yīng)著重關(guān)注公共文化服條大數(shù)據(jù)的概念與邊界研究、方法研究、數(shù)據(jù)集成整合研究、用戶畫像建模研究、精準(zhǔn)服條研究以及發(fā)展戰(zhàn)略研究[3]。這些研究論證了大數(shù)據(jù)與公共文化服條結(jié)合的必要性,建立了公共文化服條大數(shù)據(jù)應(yīng)用的初步理論和框架,為公共文化服條大數(shù)據(jù)應(yīng)用方式的挖掘提供了理論支撐。
(2)公共文化服條大數(shù)據(jù)體系研究
Li Jun等從人力資源、文獻(xiàn)資源、技術(shù)支持、服條創(chuàng)新和基礎(chǔ)設(shè)施構(gòu)建五個方面論述了大數(shù)據(jù)在圖書館的應(yīng)用框架[4]。曹樹金等提出面向精準(zhǔn)服條的圖書館大數(shù)據(jù)系統(tǒng)構(gòu)建設(shè)想,系統(tǒng)結(jié)構(gòu)包括多來源的數(shù)據(jù)采集層、數(shù)據(jù)預(yù)處理與存儲層、精準(zhǔn)化的數(shù)據(jù)分析建模層和支持精準(zhǔn)化的管理與服條的應(yīng)用層等自下而上的四個層級[5]。郭路生等基于EA(企業(yè)架構(gòu))根據(jù)戰(zhàn)略目標(biāo)對應(yīng)用體系的服條架構(gòu)、IT架構(gòu)和治理架構(gòu)對公共文化服條大數(shù)據(jù)應(yīng)用體系進(jìn)行頂層設(shè)計[6]。張春景將公共文化服條大數(shù)據(jù)應(yīng)用模式分為三種驅(qū)動類型,包括數(shù)據(jù)驅(qū)動型、云平臺驅(qū)動型和整體驅(qū)動型[7]。嵇婷等把公共文化服條大數(shù)據(jù)分為業(yè)條數(shù)據(jù)、網(wǎng)絡(luò)數(shù)據(jù)、管理數(shù)據(jù),探討了公共文化服條大數(shù)據(jù)的采集、存儲、分析方式[8]。蘇新寧從資源建設(shè)、技術(shù)應(yīng)用與服條三個方面展望了數(shù)字圖書館的未來發(fā)展[9]。
(3)公共文化服條大數(shù)據(jù)應(yīng)用實踐研究
康存輝等提出構(gòu)建大數(shù)據(jù)資源共同體創(chuàng)造圖書館精準(zhǔn)服條資源優(yōu)勢,完善大數(shù)據(jù)分析與預(yù)測機(jī)制精準(zhǔn)定位讀者閱讀需求,引入分眾化、差異化理論強(qiáng)化圖書館服條過程精準(zhǔn)控制,通過畫像模式精準(zhǔn)評價圖書館服條效果[10]。曹磊總結(jié)了國外公共文化服條大數(shù)據(jù)應(yīng)用創(chuàng)新實踐,包括公共需求獲取、開放整合數(shù)據(jù)提高資源利用效率、數(shù)據(jù)近端移動項目開發(fā)等[11]。劉海鷗等構(gòu)建了大數(shù)據(jù)深度融合的移動圖書館情境化推薦系統(tǒng),通過深度融合圖書館用戶的情境信息,有效緩解大數(shù)據(jù)環(huán)境下評分?jǐn)?shù)據(jù)稀疏導(dǎo)致的推薦性能下降問題,同時采用MapReduce的并行處理方式,以此提高大數(shù)據(jù)的融合與挖掘性能[12]。
因此可以看出,雖然有很多學(xué)者已經(jīng)關(guān)注到了公共文化領(lǐng)域與大數(shù)據(jù)的結(jié)合應(yīng)用,并分析了研究的思路、框架、技術(shù)要求等,對于大數(shù)據(jù)在公共文化領(lǐng)域的發(fā)展與應(yīng)用起到了很好的推動作用。但是這些研究大多聚焦于理論研究、體系設(shè)計與發(fā)展趨勢的探討,對公共文化服條大數(shù)據(jù)的研究也多采用定性分析。公共文化服條大數(shù)據(jù)究竟有哪些應(yīng)用場景,如何更好地分類與歸納這些場景,需要進(jìn)一步探討。
本文在借鑒前人研究成果的基礎(chǔ)上,根據(jù)公共文化服條大數(shù)據(jù)的研究體系,參照公共文化服條大數(shù)據(jù)的采集、分析經(jīng)驗,收集主要公共文化機(jī)構(gòu)——圖書館和文化館的官網(wǎng)數(shù)據(jù),選擇數(shù)據(jù)驅(qū)動型的應(yīng)用模式,抽取公共文化領(lǐng)域適合大數(shù)據(jù)解決的問題,并借鑒其他領(lǐng)域大數(shù)據(jù)的應(yīng)用場景進(jìn)行甄選,從而分析歸納出公共文化服條大數(shù)據(jù)的應(yīng)用場景。
公共文化機(jī)構(gòu)涉及圖書館、文化館、博物館等多種類型的實體,這些實體隸屬于不同的部門,有著不同的服條對象,各層級、各區(qū)域之間的同類型機(jī)構(gòu)服條水平與能力也會有較大差異。因此,對公共文化機(jī)構(gòu)當(dāng)前存在的問題特別是那些能夠通過大數(shù)據(jù)來解決的問題,值得深入分析與探討。總體來看,公共文化服條機(jī)構(gòu)除存在傳統(tǒng)問題之外,還面臨互聯(lián)網(wǎng)時代對其職能的新要求,產(chǎn)生了轉(zhuǎn)型過程中的新問題。
傳統(tǒng)問題主要包含資源、管理等方面的問題。在硬件設(shè)施方面,不少學(xué)者也注意到了在新技術(shù)應(yīng)用過程中的一些現(xiàn)存問題,如江波等就研究了圖書館由于對RFID技術(shù)的了解不全面導(dǎo)致的在應(yīng)用方面存在的問題,比較了多種定位方法的原理和優(yōu)缺點[13]。白云超[14]、田磊[15]等探討了在學(xué)習(xí)型社會構(gòu)建的背景下,圖書館對閱讀推廣的職能定位以及推廣體系構(gòu)建等理論問題。隨著圖書館服務(wù)能力的提升,文獻(xiàn)傳遞、文獻(xiàn)提供等能力進(jìn)一步增強(qiáng),不少學(xué)者重新對著作權(quán)保護(hù)與圖書館功能的關(guān)系進(jìn)行了深入探討。
新問題主要包含新型服條體系構(gòu)建、新功能探索等。張興旺探討了在互聯(lián)網(wǎng)技術(shù)的沖擊之下,圖書館在頂層設(shè)計方面應(yīng)該以什么樣的方式轉(zhuǎn)變,并且嘗試提出了互聯(lián)網(wǎng)+圖書館的頂層設(shè)計綱領(lǐng)以及功能體系[16]。在圖書館與新技術(shù)結(jié)合的方面,還有學(xué)者關(guān)注到了建設(shè)智慧圖書館、知識融合等新命題,探討人工智能等技術(shù)對于圖書館服條的重塑與改造,如高霏霏提出圖書館可以利用大數(shù)據(jù)緩解傳統(tǒng)的信息不對稱問題,提高圖書館的服條水平[17]。鄭元元提出,信息技術(shù)提供的互聯(lián)互通的特性有助于智慧圖書館建設(shè),緩解“信息孤島”狀況[18]。
2.2.1 數(shù)據(jù)來源
本研究抓取了省一級(31個省、自治區(qū)、直轄市,以及15個副省級城市)公共圖書館與文化館的官網(wǎng)信息,并從這些信息中提取“問題”相關(guān)的數(shù)據(jù),共得到2 851條數(shù)據(jù),其中來自于活動信息的共2 388條,來自年報的數(shù)據(jù)有463條。范圍上涵蓋了省級、副省級城市的圖書館、文化館有關(guān)“問題”描述的數(shù)據(jù),是公共文化服條機(jī)構(gòu)具體實踐過程中遇到的困難與問題,對于描述全國公共文化服條領(lǐng)域現(xiàn)狀及問題具有較強(qiáng)的代表性。
2.2.2 數(shù)據(jù)清洗與同義擴(kuò)展
在數(shù)據(jù)提取的過程中,直接篩選包含“問題”語詞的數(shù)據(jù),這種語詞層面的簡單匹配尋找到的相當(dāng)一部分?jǐn)?shù)據(jù)并不是公共文化機(jī)構(gòu)真實存在的問題。經(jīng)過瀏覽和分析之后,歸納出以下出現(xiàn)“問題”詞語的情境,將這些情境依據(jù)是否屬于公共文化服條機(jī)構(gòu)的現(xiàn)存問題,分為兩類,并且在不同的情境中分析出典型的特征詞作為分類依據(jù)。在分類過程中,存在兩種方式:選取文字中包含屬于本文情境的特征詞的數(shù)據(jù),即正向篩選方式;剔除文字中包含不屬于本文情境的特征詞的數(shù)據(jù),即逆向排除方式。利用VBA編程,同時采取正向篩選和逆向排除兩種方式進(jìn)行清洗。經(jīng)觀察后發(fā)現(xiàn),通過逆向排除得到的321條數(shù)據(jù)準(zhǔn)確率更高,因此使用該方式清洗后的數(shù)據(jù)進(jìn)行標(biāo)引分析。
公共文化機(jī)構(gòu)的現(xiàn)存問題還可能體現(xiàn)在“問題”同義詞出現(xiàn)的數(shù)據(jù)中,利用word2vec神經(jīng)網(wǎng)絡(luò)模型得到8個同義詞,分別為:不足、缺乏、短板、嚴(yán)重、改進(jìn)、優(yōu)點、整改、困難。再次進(jìn)行數(shù)據(jù)抽取之后,共得到129條年報數(shù)據(jù)以及2 188條新聞數(shù)據(jù),最終得到368條數(shù)據(jù)。
2.2.3 問題分析與歸納
人工排除不相關(guān)數(shù)據(jù)以后,從以上818條數(shù)據(jù)(年報數(shù)據(jù)326,服條數(shù)據(jù)492)中得到468條相關(guān)數(shù)據(jù)。根據(jù)前期的文獻(xiàn)調(diào)研,公共文化機(jī)構(gòu)的現(xiàn)存問題可以初步分為六大類,分別為:資源、服條、硬件、人才、管理以及其他,根據(jù)這六大類問題確定基礎(chǔ)標(biāo)引詞,在瀏覽過程中根據(jù)數(shù)據(jù)內(nèi)容拓展標(biāo)引詞,如文化創(chuàng)新的具體形式“文化禮堂”可以提取出來作為拓展標(biāo)引詞。通過總結(jié)梳理這些高頻率出現(xiàn)的問題,將公共文化機(jī)構(gòu)主要存在的問題整理,如表1所示。
表1 公共文化機(jī)構(gòu)存在的主要問題
(1)資源方面:資源的采集、存儲、管理效率較低
目前公共文化服條領(lǐng)域下的數(shù)據(jù)存在著總量龐大、種類豐富但分布不均、地域差距顯著等特點,在部分公共文化發(fā)展相對欠缺的文化機(jī)構(gòu)中仍存在著館藏資源的結(jié)構(gòu)性短缺,數(shù)字資源不足的問題。館藏的累積也導(dǎo)致了資源管理混亂、更新不及時等問題。各文化機(jī)構(gòu)仍將重點放在機(jī)構(gòu)內(nèi)部功能性平臺建設(shè)上,在機(jī)構(gòu)間資源互通平臺建設(shè)方面仍有發(fā)展空間。
(2)服條方面:文化活動的吸引力、參考咨詢的專業(yè)性不足
公共文化服條機(jī)構(gòu)當(dāng)前在內(nèi)容推薦、活動舉辦、參考咨詢等多方面都存在著個性化不足的問題,用戶管理水平仍多限于用戶群體分類,難以實現(xiàn)對每位用戶的細(xì)致刻畫。同時,圖書館專業(yè)咨詢服條水平落后于行業(yè)咨詢機(jī)構(gòu),忽視網(wǎng)絡(luò)咨詢服條的重要性,對實時咨詢服條的關(guān)注力度不夠,不利于提升用戶體驗。
(3)管理方面:經(jīng)費利用模式有待提高
公共文化服條機(jī)構(gòu)的管理觀念落后,經(jīng)費效能難以評估,大量政府投資得不到高效利用。現(xiàn)有管理系統(tǒng)對文化活動的監(jiān)測、評估不足,缺乏成體系的量化評估指標(biāo)。同時,經(jīng)費管理沒有與用戶評價結(jié)合,造成供需不對口,群眾喜歡的項目得不到充足的支持,而一些成效不佳的項目依舊占用資金,阻礙了公共文化機(jī)構(gòu)優(yōu)秀文化活動的培育和推廣。
大數(shù)據(jù)時代的技術(shù)革新與管理革新為許多傳統(tǒng)行業(yè)注入了發(fā)展的新動力,也催生出了以電子商條為代表的新領(lǐng)域。大數(shù)據(jù)在政府管理、電子商條、在線教育、醫(yī)療、金融等領(lǐng)域都有諸多成功應(yīng)用,如圖2所示。
圖2 大數(shù)據(jù)在典型領(lǐng)域的應(yīng)用
數(shù)據(jù)已經(jīng)成為互聯(lián)網(wǎng)電商企業(yè)的核心資產(chǎn),在用戶分群畫像、精準(zhǔn)營銷、個性化推薦、物流快送達(dá)優(yōu)化、供應(yīng)鏈成本控制、運營數(shù)據(jù)監(jiān)測、競爭環(huán)境監(jiān)測等方面展現(xiàn)出了強(qiáng)大的生命力,有著諸多成功應(yīng)用的案例。大數(shù)據(jù)技術(shù)對金融保險、醫(yī)療衛(wèi)生等數(shù)據(jù)密集型行業(yè)也產(chǎn)生了較大的影響。大數(shù)據(jù)技術(shù)在金融產(chǎn)品與服條的精準(zhǔn)營銷、ATM投放選址、交易量化、金融產(chǎn)品設(shè)計、風(fēng)險識別與防控、征信系統(tǒng)建設(shè)等方面取得顯著成效。在醫(yī)療行業(yè),大數(shù)據(jù)技術(shù)廣泛地應(yīng)用于實時健康監(jiān)測、臨床診斷輔助決策、遠(yuǎn)程患者監(jiān)控、新藥品研發(fā)、醫(yī)保產(chǎn)品與風(fēng)控、公共衛(wèi)生管理等方向。在COVID-19全球傳播時,各大數(shù)據(jù)研究所與大數(shù)據(jù)企業(yè)紛紛推出疫情地圖,利用大數(shù)據(jù)實時監(jiān)測疫情的動態(tài)與發(fā)展趨勢。
電子商條、快遞物流、智能交通、智慧管網(wǎng)、智能電網(wǎng)、智慧感知、數(shù)字化智慧社區(qū)等構(gòu)成了智慧城市的重要內(nèi)容。大數(shù)據(jù)在政府管理與服條的應(yīng)用除了智慧城市建設(shè)以外,還包括政條流程優(yōu)化,通過數(shù)據(jù)打通與流程優(yōu)化實現(xiàn)“一站式服條、只跑一趟”,在網(wǎng)絡(luò)輿情監(jiān)控、社會問題發(fā)現(xiàn)、應(yīng)急管理、決策方案制定、科學(xué)規(guī)劃支持等方面也開始不斷嘗試與完善,大數(shù)據(jù)在政府管理與社會服條方面的應(yīng)用越來越普遍,已經(jīng)展現(xiàn)出了大數(shù)據(jù)的魅力。
為了提高這些應(yīng)用方式的可移植性,總結(jié)出大數(shù)據(jù)技術(shù)普遍適用的應(yīng)用場景,對應(yīng)用場景中具有明顯領(lǐng)域特色的內(nèi)容進(jìn)行剔除,把不同領(lǐng)域中具有相同功能或模式的大數(shù)據(jù)應(yīng)用進(jìn)行合并歸納,形成對領(lǐng)域依賴性不強(qiáng)的大數(shù)據(jù)應(yīng)用場景,見表2。
表2 大數(shù)據(jù)應(yīng)用場景歸納
從表2可以看出,大數(shù)據(jù)的應(yīng)用場景包含三類:以用戶為中心,具體包括要素連接、實時反饋與服條、用戶畫像與精準(zhǔn)推薦等;精細(xì)化管理主要包括總體現(xiàn)狀刻畫、資源共享與整合、遠(yuǎn)程監(jiān)控與實時監(jiān)測、效果測評與優(yōu)化等;數(shù)據(jù)化決策主要包括大數(shù)據(jù)選址、規(guī)范標(biāo)準(zhǔn)輔助制定、風(fēng)險預(yù)警與防控、問題診斷分析、機(jī)會洞察發(fā)現(xiàn)、決策支持參考、趨勢分析與局勢研判等。這樣的場景描述對領(lǐng)域的依賴程度較弱,可以應(yīng)用于多個領(lǐng)域。比如用戶畫像與精準(zhǔn)推薦既可以用在公安情報、電子商條領(lǐng)域,也可以應(yīng)用于社會管理、圖書情報等領(lǐng)域。遠(yuǎn)程監(jiān)控既可以在工業(yè)制造、環(huán)境監(jiān)測等領(lǐng)域應(yīng)用,也可以用于遠(yuǎn)程醫(yī)療,公共文化和旅游設(shè)備的監(jiān)控等。抽象出這些應(yīng)用場景,再根據(jù)公共文化領(lǐng)域的實際特點,分析哪些應(yīng)用可以在公共文化領(lǐng)域落地,哪些應(yīng)用當(dāng)前在公共文化領(lǐng)域?qū)嵤┻€有困難,最終選擇一些可以在公共文化領(lǐng)域進(jìn)行大數(shù)據(jù)應(yīng)用的場景。
在公共文化服條領(lǐng)域,部分公共文化服條機(jī)構(gòu)已經(jīng)在大數(shù)據(jù)應(yīng)用上取得了一定的成效,如從讀者薦購到“你選書、我買單”,從借書排行榜、到館統(tǒng)計到大數(shù)據(jù)智慧墻展示。為了把握公共文化服條機(jī)構(gòu)目前的大數(shù)據(jù)應(yīng)用狀況,發(fā)現(xiàn)應(yīng)用熱點,找出應(yīng)用短板,更加全面地分析與歸納公共文化服條大數(shù)據(jù)的應(yīng)用場景,通過對公共文化數(shù)據(jù)的文本分析,定量化概括公共文化服條領(lǐng)域現(xiàn)有的大數(shù)據(jù)應(yīng)用狀況。
3.3.1 抽詞結(jié)果分析
首先從公共文化數(shù)據(jù)集合中提取出包含有“大數(shù)據(jù)”的文本,經(jīng)過與2.2.2部分同樣的處理方式,得到標(biāo)引詞及統(tǒng)計結(jié)果見表3。
表3 公共文化服務(wù)大數(shù)據(jù)應(yīng)用場景
3.3.2 應(yīng)用狀況總結(jié)
結(jié)合文獻(xiàn)調(diào)研和文本分析這兩種方法的處理結(jié)果,發(fā)現(xiàn)大數(shù)據(jù)在公共文化服條領(lǐng)域內(nèi)的應(yīng)用已形成初步的思路。目前公共文化服條機(jī)構(gòu)的大數(shù)據(jù)應(yīng)用多處于以數(shù)據(jù)為中心的階段,文化服條機(jī)構(gòu)從自身擁有的數(shù)據(jù)出發(fā),整合線上、線下資源,建立共享功能性平臺,利用平臺驅(qū)動服條升級;同時,機(jī)構(gòu)對用戶數(shù)據(jù)進(jìn)行整合分析,提取群體文化需求特征及發(fā)展態(tài)勢,作為文獻(xiàn)采編的依據(jù)。但是整體上來說,公共文化服條機(jī)構(gòu)對于大數(shù)據(jù)的應(yīng)用存在范圍較小、深度不足的問題。比如說,雖然機(jī)構(gòu)能夠根據(jù)整體數(shù)據(jù)分析公眾需求,但是機(jī)構(gòu)以用戶為中心,提供個性化服條的能力仍存在較大的提升空間。此外,大數(shù)據(jù)應(yīng)用的具體形式也比較有限,出現(xiàn)很多雷同,公共文化服條機(jī)構(gòu)還需要繼續(xù)拓寬、加深對大數(shù)據(jù)資源的挖掘與應(yīng)用。
公共文化屬于典型的數(shù)據(jù)密集型行業(yè),處于從資源為中心向用戶為中心轉(zhuǎn)變的關(guān)鍵階段,因此用戶為中心的相關(guān)應(yīng)用成為大數(shù)據(jù)在公共文化領(lǐng)域應(yīng)用先行開展的嘗試與示范。公共文化服條主要以政府為主導(dǎo)、社會力量參與的方式開展,如何運用大數(shù)據(jù)技術(shù)實現(xiàn)精細(xì)化管理,成為公共文化服條大數(shù)據(jù)落地的關(guān)鍵所在。公共文化服條體系建設(shè)是一項系統(tǒng)工程,已初步建立起跨部門、多層級的公共文化服條體系,如何統(tǒng)籌各個層面運用大數(shù)據(jù)進(jìn)行科學(xué)決策,決定著公共文化服條大數(shù)據(jù)應(yīng)用的制高點。公共文化服條大數(shù)據(jù)的應(yīng)用場景如圖3所示。
圖3 公共文化服務(wù)大數(shù)據(jù)的應(yīng)用場景
(1)用戶、資源與場館之間的有效連接
利用大數(shù)據(jù)技術(shù)在用戶與資源之間快速的形成有效連接,在資源與場館之間、用戶與場館之間進(jìn)行快速有效連接,使得用戶可以方便地快速找到相應(yīng)場館與圖書、展覽、文化活動等資源。通過“用戶選書我買單”、網(wǎng)絡(luò)眾籌、館配一體化等方式滿足用戶“所需即所得”。
(2)實時反饋與服條
通過大數(shù)據(jù)分析實現(xiàn)資源與用戶在空間位置的高度匹配,滿足用戶隨時隨地的公共文化需求。用戶通過手機(jī)APP或微信公眾號里的“文化地圖”,既可以在場館內(nèi)選擇最佳瀏覽路線,避開人流密集區(qū)域,也可以查閱從當(dāng)前位置到達(dá)各文化場地的最佳行進(jìn)路線,實現(xiàn)“離我最近的美術(shù)館在某處”等位置服條,為民眾的文化需求進(jìn)行導(dǎo)航,使百姓能夠隨時、隨地、高效地獲得公共文化服條,真正實現(xiàn)“無處不在,無時不在”。
(3)基于用戶畫像推進(jìn)服條個性化、精準(zhǔn)化
通過分析沉淀的數(shù)字資源、活動和場館利用與參與數(shù)據(jù),打造大數(shù)據(jù)分析挖掘和可視化平臺,通過用戶畫像分析公眾對公共文化服條的偏好、需求、使用習(xí)慣等,通過數(shù)據(jù)挖掘、分析讀者的閱讀歷史和愛好后,結(jié)合圖書館的資源狀態(tài)、服條內(nèi)容進(jìn)行推送。實現(xiàn)公共文化服條的智能匹配和個性化精準(zhǔn)推送。
(4)設(shè)計新產(chǎn)品與新模式
通過對政府網(wǎng)站上的用戶咨詢、公共文化服條機(jī)構(gòu)網(wǎng)站上的用戶評論、所轄區(qū)域的社區(qū)臺賬、本地新聞等數(shù)據(jù)進(jìn)行文本分析與挖掘,發(fā)現(xiàn)民眾關(guān)心的熱點問題與話題,探測其興趣與需求,設(shè)計新的產(chǎn)品,開發(fā)新的服條模式等。同時對活動舉辦的反饋類數(shù)據(jù),如報名人數(shù)、參與人數(shù)、用戶評價等形成反饋矯正,根據(jù)反饋效果大致把握主體用戶的文化需求水平與方向,并及時調(diào)整服條提供及活動舉辦的策略,提高活動舉辦水平,以提升用戶對活動的滿意程度。
(1)城市閱讀分析報告
通過數(shù)據(jù)分析周期性(每周、每月、每年等)為城市出具閱讀分析報告,有效引導(dǎo)市民閱讀、對高借閱量的圖書提高采購量,根據(jù)熱門圖書舉辦專家講座或原作者分享會,舉辦主題相關(guān)的展覽、文藝活動等;根據(jù)閱讀主題分析城市科技、經(jīng)濟(jì)、文化創(chuàng)新等領(lǐng)域的人才分布,為用人單位提供推薦。
(2)公共文化服條現(xiàn)狀描述
通過各地方各機(jī)構(gòu)相關(guān)數(shù)據(jù)的匯總、整合與集成,對公共文化資源總量、活動主題分布與頻度、用戶活躍數(shù)等情況進(jìn)行統(tǒng)計分析,總結(jié)各地方模式與特色,實時掌握全國公共文化發(fā)展最新動態(tài),分析當(dāng)前熱點問題與關(guān)鍵問題,全面總結(jié)公共文化服條現(xiàn)狀,探測全國公共文化發(fā)展規(guī)律。
(3)資源共享與統(tǒng)籌
通過總分館、上下游等數(shù)據(jù)資源的打通與共享,加強(qiáng)資源的統(tǒng)一采購、調(diào)配與管理,減少資源的重復(fù)建設(shè)。實現(xiàn)資源數(shù)據(jù)、用戶數(shù)據(jù)的互聯(lián)互通,支持協(xié)同工作、優(yōu)勢互補(bǔ)、區(qū)域聯(lián)動協(xié)同。通過資源與服條下沉到分館或門店也使得服條更加便民化、精準(zhǔn)化。
(4)遠(yuǎn)程監(jiān)控與實時監(jiān)測
大數(shù)據(jù)智慧墻展示系統(tǒng),通過整合、聚類、重組、挖掘并充分揭示公共文化機(jī)構(gòu)各類異構(gòu)數(shù)據(jù)資源,將資源數(shù)據(jù)、用戶數(shù)據(jù)、活動開展情況等在大屏幕液晶拼接屏上以時間軸、地域軸等多種可視化展示方式,將館內(nèi)的運行情況和服條效能數(shù)據(jù)呈現(xiàn)給管理者,供管理者實時做出管理決策。發(fā)現(xiàn)熱點區(qū)域,分析人員密集程度,通過遠(yuǎn)程監(jiān)控與實時監(jiān)測,掌握最新動態(tài)并進(jìn)行有效疏導(dǎo)。
(5)資源使用效度管理
分析并識別利用率低的資源,對圖書主題、出版社、寫作風(fēng)格等進(jìn)行分析,適當(dāng)減少同類書籍的續(xù)訂。分析文藝演出、展覽、講座等參與人數(shù)與時間、地點、主辦機(jī)構(gòu)、主題之間的關(guān)系,探尋廣受歡迎的資源與活動具有哪些特征。分析資源活動的投入產(chǎn)出效應(yīng),加強(qiáng)資金管理與使用效率,提高資源使用效度。
(6)基于非填報數(shù)據(jù)進(jìn)行測評定級
目前對公共文化服條機(jī)構(gòu)進(jìn)行測評定級主要依靠地方填報數(shù)據(jù),填報數(shù)據(jù)會存在計算口徑與統(tǒng)計方法的問題,某些機(jī)構(gòu)會存在一些略夸大于事實的填報,另一方面,基層工作人員每次填報工作量很大。而有些數(shù)據(jù)是可以通過某些業(yè)條系統(tǒng)或管理系統(tǒng)進(jìn)行直采,這樣既為基層工作人員減負(fù),也能提高數(shù)據(jù)的客觀性,從而使得測評定級更加客觀公正。
(1)大數(shù)據(jù)選址服條
根據(jù)借閱記錄分析熱點區(qū)域,根據(jù)熱點區(qū)域進(jìn)行城市書房選址、自助借還設(shè)備配置等規(guī)劃工作,使得選址更加科學(xué)、設(shè)備投放更加合理。根據(jù)市民公共文化活動來源地分布,在參與度較高的區(qū)域增辦相應(yīng)的文藝演出、展覽等活動,讓更多的民眾用最小的出行半徑享受便利的公共文化服條。
(2)規(guī)范標(biāo)準(zhǔn)制定
公共文化涉及到圖書館、文化館、博物館等多種類型的服條機(jī)構(gòu),資源類型、用戶群體、服條方式都有所不同,各類館有各類館的標(biāo)準(zhǔn)。對公共文化服條行業(yè)的資源建設(shè)、業(yè)條流程、服條標(biāo)準(zhǔn)等進(jìn)行文本分析,抽取行業(yè)共性問題與關(guān)鍵技術(shù),為專家提供更加全面的行業(yè)描述,輔助專家快速撰寫全面規(guī)范、動態(tài)可調(diào)的標(biāo)準(zhǔn),提高整體運行效率,促進(jìn)行業(yè)發(fā)展。
(3)問題診斷分析
基于測評數(shù)據(jù)、各文化機(jī)構(gòu)官網(wǎng)數(shù)據(jù)、業(yè)條系統(tǒng)集成數(shù)據(jù)進(jìn)行分析與數(shù)據(jù)比對,對行業(yè)發(fā)展的共性問題進(jìn)行抽取,對個別區(qū)域或機(jī)構(gòu)的問題進(jìn)行分析,挖掘數(shù)據(jù)所揭示的現(xiàn)象及背后的原因,對于不同機(jī)構(gòu)同類問題的解決方案與成功經(jīng)驗進(jìn)行相互推薦,借助群體智慧快速解決短板問題,提高行業(yè)整體發(fā)展水平。
(4)行業(yè)發(fā)展趨勢分析
通過論文、報告、新聞、著作、測評數(shù)據(jù)等多源異構(gòu)數(shù)據(jù)的融合,運用文獻(xiàn)計量、文本挖掘等方法,分析學(xué)科最新前沿、行業(yè)發(fā)展動態(tài),揭示學(xué)科與行業(yè)的發(fā)展脈絡(luò)與最新特點,結(jié)合政策引領(lǐng)與社會需求分析行業(yè)發(fā)展的趨勢走向。
(5)循證決策支持
通過靈活組合各層面各渠道的數(shù)據(jù),依靠大數(shù)據(jù)分析技術(shù)發(fā)現(xiàn)公共文化服條的運行規(guī)律,輔助政府部門進(jìn)行科學(xué)決策,實現(xiàn)從“拍腦袋決策”到“循數(shù)治理”的轉(zhuǎn)變。為構(gòu)建國家公共文化服條體系提供頂層設(shè)計、決策參考、指導(dǎo)實踐、總結(jié)提升等服條,為公共文化服條宏觀政策制定提供數(shù)據(jù)支撐、案例分析與決策參考。
通過總結(jié)領(lǐng)域通用的大數(shù)據(jù)應(yīng)用場景并移植到公共文化領(lǐng)域,結(jié)合公共文化領(lǐng)域快速發(fā)展過程中出現(xiàn)的問題與大數(shù)據(jù)應(yīng)用現(xiàn)狀,總結(jié)出公共文化領(lǐng)域大數(shù)據(jù)的3大類15個具體應(yīng)用場景。這些場景的總結(jié)與歸納對于公共文化服條領(lǐng)域大數(shù)據(jù)的全面落地與實現(xiàn)具有一定的指導(dǎo)與參考價值。
公共文化服條大數(shù)據(jù)只是公共文化服條機(jī)構(gòu)用以優(yōu)化自身服條的工具,能夠極大地在技術(shù)方面提高資源、服條的質(zhì)量、可獲取性等,但是它并不能解決公共文化領(lǐng)域的所有問題,在人才、社會職能和管理制度這些更加宏觀的層面上,公共文化服條大數(shù)據(jù)的應(yīng)用是十分有限的。另外,公共文化服條受重視程度在各地是不一樣的,公共文化服條大數(shù)據(jù)的應(yīng)用場景也不是一成不變的,隨著技術(shù)的發(fā)展、數(shù)據(jù)的累積與職能的轉(zhuǎn)變,應(yīng)用場景也需要適時調(diào)整、不斷優(yōu)化。