李慶華?楊俊杰
摘 要:隨著國(guó)民經(jīng)濟(jì)的快速發(fā)展,人們生活水平的提高,文化消費(fèi)需求持續(xù)增長(zhǎng),為文化產(chǎn)業(yè)帶來(lái)發(fā)展機(jī)遇。但傳統(tǒng)民俗資源利用效率低,文化服務(wù)形式落后,無(wú)法滿足群眾對(duì)文化服務(wù)消費(fèi)升級(jí)的需求。本文以傳統(tǒng)民俗文化為研究對(duì)象,以傳統(tǒng)文化知識(shí)體系作為研究范圍,探索基于大數(shù)據(jù)處理技術(shù)的傳統(tǒng)民俗文化數(shù)字化方法和手段,從而實(shí)現(xiàn)民俗數(shù)據(jù)的可視化。民俗文化地圖的構(gòu)建能夠?yàn)橥诰蜇S富的民俗文化資源、實(shí)現(xiàn)文化領(lǐng)域的供給側(cè)改革提供技術(shù)支持,因此,本文的探討具有重要的理論和現(xiàn)實(shí)意義。
關(guān)鍵詞:大數(shù)據(jù);民俗文化;數(shù)字化;數(shù)據(jù)可視化
0 引言
民俗文化的數(shù)字化水平已經(jīng)成為一個(gè)國(guó)家信息基礎(chǔ)設(shè)施完善程度的一個(gè)重要標(biāo)志。[1]當(dāng)前,一些國(guó)家無(wú)不以國(guó)家政策為主導(dǎo),以公共資金為啟動(dòng)資源,來(lái)建設(shè)民俗文化的數(shù)字化平臺(tái)。民俗文化的數(shù)字化保護(hù)工作也隨著信息基礎(chǔ)設(shè)施的建設(shè)而逐步展開。民俗地圖作為民俗文化研究的可視化表現(xiàn)方式和手段,在民俗學(xué)的研究中具有較好的應(yīng)用。因此,利用當(dāng)下熱門的大數(shù)據(jù)等現(xiàn)代信息技術(shù)手段,構(gòu)建數(shù)字化的民俗文化地圖,可有效地促進(jìn)民俗文化的大發(fā)展、大繁榮,有利于民俗文化的發(fā)展和傳承。
1 傳統(tǒng)民俗文化資源的知識(shí)化
民俗文化地圖的構(gòu)建過(guò)程,涉及民俗文化原始素材的采集和整理、民俗文化的知識(shí)化和數(shù)字化、民俗知識(shí)的大數(shù)據(jù)爬取以及民俗數(shù)據(jù)的可視化等多個(gè)方面。其中,民俗文化的知識(shí)化是民俗地圖構(gòu)建的基礎(chǔ),民俗知識(shí)的大數(shù)據(jù)爬取是關(guān)鍵,接下來(lái)我們首先探討民俗文化的知識(shí)化過(guò)程。
中華傳統(tǒng)民俗文化豐富多彩,形式多樣,不同地域、不同姓氏的遺產(chǎn)素材會(huì)略有差別。在素材的收集和整理過(guò)程中,可以首先對(duì)素材按形成因素進(jìn)行分類,如語(yǔ)音類民俗可以采用電子錄音等形式采集。而對(duì)歌舞類動(dòng)態(tài)素材則采用視頻收集以及傳承人口傳身受的方式采集;然后再按人文特征、地域特征、倫理特征以及因果特征等因素進(jìn)行分類,以便后續(xù)民俗文化本體建模。民俗文化展示形態(tài)多樣,包括歌舞、音視頻、器物擺設(shè)以及田野調(diào)查的圖片等,民俗文化豐富的表現(xiàn)形態(tài)與數(shù)據(jù)庫(kù)建設(shè)單一的數(shù)據(jù)編碼形成了一對(duì)天然的矛盾。因此,我們根據(jù)本體模型構(gòu)建的一般原則和思路,民俗本體構(gòu)建遵循本體完整性、真實(shí)性、實(shí)用性、可維護(hù)性和可擴(kuò)展性等原則;根據(jù)民俗領(lǐng)域?qū)<液椭R(shí)專家的建議在民俗文化建模,在民俗本體模型的基礎(chǔ)上,再對(duì)領(lǐng)域本體細(xì)化,構(gòu)建領(lǐng)域本體的概念屬性及分面定義,為表現(xiàn)形態(tài)豐富的民俗文化創(chuàng)建民俗知識(shí)庫(kù)。
2 民俗文化知識(shí)抓取、存儲(chǔ)及抽取策略
現(xiàn)有的傳統(tǒng)民俗文化除了一些基本的文字材料外,其他的結(jié)構(gòu)化知識(shí)很少,大部分的民俗文化體現(xiàn)在各種WEB頁(yè)面和自媒體文檔中,難以直接應(yīng)用于民俗地圖研究。前述民俗本體模型相當(dāng)于系統(tǒng)中的元數(shù)據(jù),分散在各個(gè)系統(tǒng)中的民俗文化資料才是本項(xiàng)目研究所需要的數(shù)據(jù),可用于民俗地圖應(yīng)用的數(shù)據(jù)獲取涉及數(shù)據(jù)的爬取、存儲(chǔ)以及抽取等技術(shù)環(huán)節(jié)。在后面的研究中,我們將基于大數(shù)據(jù)技術(shù),在眾多的URL數(shù)據(jù)源中,采取多線程網(wǎng)絡(luò)爬蟲,基于改進(jìn)的廣度,優(yōu)先搜索策略爬取相關(guān)數(shù)據(jù),并完成民俗知識(shí)庫(kù)的存儲(chǔ)設(shè)計(jì)。在知識(shí)庫(kù)基礎(chǔ)上,設(shè)計(jì)基于民俗文化本體的本體屬性關(guān)系抽取算法,研究關(guān)系描述模式挖掘、上下文模式規(guī)則庫(kù)生成以及字符匹配規(guī)則庫(kù)生成;從而完成基于字符的匹配和基于規(guī)則的上下文模式識(shí)別,完成原始爬取數(shù)據(jù)的解析和抽取,從而為民俗地圖的構(gòu)建提供有效數(shù)據(jù)。
3 民俗文化數(shù)據(jù)的可視化
基于民俗文化知識(shí)圖譜集成平臺(tái),運(yùn)用分布式處理系統(tǒng)將海量傳統(tǒng)文化資源數(shù)字化、結(jié)構(gòu)化和知識(shí)化,為實(shí)現(xiàn)數(shù)字文化提供技術(shù)支持和平臺(tái)支持。此外,為實(shí)現(xiàn)信息共享和提高平臺(tái)可用性,該平臺(tái)以知識(shí)抽取層為核心、以數(shù)據(jù)存儲(chǔ)層為基礎(chǔ)、以數(shù)據(jù)控制層為保障、以查詢處理層為業(yè)務(wù),研究民俗文化中的地名地理數(shù)據(jù)與GIS系統(tǒng)中的地理數(shù)據(jù)匹配。其實(shí)現(xiàn)了數(shù)據(jù)獲取、處理和民俗地理數(shù)據(jù)與GIS系統(tǒng)的無(wú)縫銜接,從而完成傳統(tǒng)民俗文化信息的可視化展示與應(yīng)用,為粵西民俗文化的傳承與保護(hù)提供新的技術(shù)手段,為其他民俗文化和非物質(zhì)文化遺產(chǎn)的保護(hù)與傳承提供借鑒。在民俗數(shù)據(jù)可視化階段,我們以民俗知識(shí)圖譜和GIS模塊為基礎(chǔ),研究民俗地理數(shù)據(jù)與GIS地理數(shù)據(jù)的整合,以示意圖的方式將不同地域特征的民俗事件顯示在地理信息系統(tǒng)之上。同時(shí),將不同時(shí)間段不同民俗事件的出現(xiàn)頻率保存在相關(guān)數(shù)據(jù)項(xiàng)中,為民俗文化工作者判斷民俗事件的發(fā)展傳承規(guī)律,提供一手?jǐn)?shù)據(jù),從而促進(jìn)民俗文化的大發(fā)展和大繁榮。[1]
4 結(jié)語(yǔ)
隨著大數(shù)據(jù)、云計(jì)算以及物聯(lián)網(wǎng)技術(shù)的發(fā)展,民俗文化的數(shù)字化有必要從原始的保存最基本的文字資料和音視頻資料的低水平數(shù)字化提升到民俗文化的知識(shí)化、大數(shù)據(jù)化,從而為文化數(shù)字平臺(tái)建設(shè)提供海量數(shù)據(jù)資源。民俗文化地圖的構(gòu)建,能夠?yàn)橥诰蛑腥A民族豐富的民俗文化資源、實(shí)現(xiàn)文化服務(wù)形式創(chuàng)新和文化資源共享提供技術(shù)支持,因此,本文的探索具有重要的理論意義和現(xiàn)實(shí)意義。
參考文獻(xiàn):
[1] 彭冬梅,潘魯生,孫守遷.數(shù)字化保護(hù)——非物質(zhì)文化遺產(chǎn)保護(hù)的新手段[J].美術(shù)研究,2006(1).