• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于大數(shù)據(jù)的非物質(zhì)文化信息分析方法

      2021-03-22 02:53:17蔣姍姍梁建偉邸臻煒
      電腦知識(shí)與技術(shù) 2021年4期
      關(guān)鍵詞:非物質(zhì)文化大數(shù)據(jù)

      蔣姍姍 梁建偉 邸臻煒

      摘要:大數(shù)據(jù)環(huán)境中,非物質(zhì)文化的數(shù)據(jù)信息分析是以其信息建設(shè)、管理為前提?;诖?,提出基于大數(shù)據(jù)的非物質(zhì)文化信息分析方法。首先利用數(shù)據(jù)挖掘?qū)?shù)據(jù)信息進(jìn)行采集和加工,之后對(duì)其進(jìn)行清洗、信息關(guān)鍵特征提取以及數(shù)據(jù)信息建設(shè),從而有效實(shí)現(xiàn)對(duì)非物質(zhì)文化信息的分析管理。實(shí)驗(yàn)結(jié)果表明,本文提出的基于大數(shù)據(jù)的非物質(zhì)文化信息分析方法,在非物質(zhì)文化信息測(cè)試中可以有效實(shí)現(xiàn)錯(cuò)誤信息文本的自動(dòng)分析,從而減少了人工分析錯(cuò)誤信息文本的工作量,且具備時(shí)間短,工作效率高的優(yōu)勢(shì)。

      關(guān)鍵詞:大數(shù)據(jù);非物質(zhì)文化;信息分析

      中圖分類(lèi)號(hào):G350? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A

      文章編號(hào):1009-3044(2021)04-0039-02

      大數(shù)據(jù)作為數(shù)據(jù)在一種全新的處理模式下自動(dòng)生成龐大的、海量的、多樣化的信息資產(chǎn)的現(xiàn)代代名詞[1]。其最關(guān)鍵的技術(shù)變革就是促使人們能夠利用更多海量數(shù)據(jù),而非對(duì)某個(gè)數(shù)據(jù)的隨機(jī)取樣;人們不再過(guò)分苛求數(shù)據(jù)信息之間的因果關(guān)系,而轉(zhuǎn)變?yōu)閷?duì)相關(guān)關(guān)系體系的重視[2]。非物質(zhì)文化在數(shù)據(jù)信息分析上的研究是非常及時(shí)和有必要的。通過(guò)信息的智能化手段,對(duì)非物質(zhì)文化的數(shù)據(jù)信息分析是在目前非物質(zhì)文化應(yīng)對(duì)嚴(yán)峻社會(huì)環(huán)境下生成的新方法、新手段。

      1基于大數(shù)據(jù)的非物質(zhì)文化信息分析方法

      1.1數(shù)據(jù)的采集與加工

      大數(shù)據(jù)在信息獲取過(guò)程上具備一定難度和復(fù)雜,是由于現(xiàn)代社會(huì)中生成的龐大數(shù)據(jù),雖然人們基本上是將其所需信息儲(chǔ)存在計(jì)算機(jī)網(wǎng)絡(luò)之中,然而其中也存在著很多和自身發(fā)展并無(wú)多大關(guān)聯(lián)的冗雜信息,使得信息變得更為復(fù)雜多樣。數(shù)據(jù)信息只有被實(shí)際應(yīng)用的前提下才可以完全發(fā)揮出其應(yīng)有的功能,使用者在計(jì)算機(jī)網(wǎng)絡(luò)上按照關(guān)鍵詞對(duì)信息進(jìn)行有用搜索,計(jì)算機(jī)對(duì)和關(guān)鍵詞有關(guān)的信息進(jìn)行仔細(xì)的篩選和整理,最終將搜索結(jié)果具體展現(xiàn)出來(lái),使用者按照這些搜索結(jié)果最終確定信息內(nèi)容,這就是對(duì)信息的獲取和采集過(guò)程[3]。

      加工過(guò)程:一般狀況下,假如使用者獲取到的數(shù)據(jù)信息較多,那么其就越需要利用計(jì)算機(jī)更為復(fù)雜多樣的程序來(lái)對(duì)檢索工具的準(zhǔn)確度和嚴(yán)謹(jǐn)性進(jìn)行提高,進(jìn)而提升使用者獲取信息的精準(zhǔn)性。計(jì)算機(jī)在為使用者加工信息的全過(guò)程中,為進(jìn)一步保證信息的準(zhǔn)確性,就需要對(duì)計(jì)算機(jī)的應(yīng)用狀態(tài)進(jìn)行實(shí)時(shí)監(jiān)管,過(guò)濾掉垃圾信息,從而實(shí)現(xiàn)對(duì)數(shù)據(jù)信息的重點(diǎn)加工[4]。在對(duì)信息數(shù)據(jù)進(jìn)行加工的時(shí)候,有必要利用計(jì)算機(jī)信息處理對(duì)使用者提供的信息關(guān)鍵點(diǎn)進(jìn)行精準(zhǔn)定位,并對(duì)數(shù)據(jù)庫(kù)信息進(jìn)行二次歸類(lèi)和整合,從而為客戶提供其所需的有效信息。加工環(huán)節(jié)中,將從CNKI導(dǎo)出我國(guó)非物質(zhì)文化一系列的研究數(shù)據(jù),依次保存為Refworks格式、Endnote格式[5]。Refworks格式內(nèi)的數(shù)據(jù)可引入Cite space,借助轉(zhuǎn)換格式能夠生成有關(guān)作者、合作組織以及關(guān)鍵詞共現(xiàn)等加工而成的知識(shí)圖譜。Endnote格式內(nèi)的數(shù)據(jù)可引入SATI,借助轉(zhuǎn)換格式能夠就作者、機(jī)構(gòu)名稱(chēng)、關(guān)鍵詞分別建立Excel格式的共現(xiàn)矩陣,之后將共現(xiàn)矩陣導(dǎo)進(jìn)Ucinet從而生成**h文本格式,利用Netdraw選調(diào)能夠自動(dòng)加工生成實(shí)際可需的可視化圖譜。也可以利用Ucinet轉(zhuǎn)換成.net格式下的文本矩陣,導(dǎo)進(jìn)VOS viewer就能夠自動(dòng)加工生成實(shí)際可需的可視化圖譜。如此一來(lái),在數(shù)據(jù)完成采集和加工的基礎(chǔ)上就可以為后續(xù)數(shù)據(jù)清洗提供便捷。

      1.2數(shù)據(jù)清洗

      數(shù)據(jù)清洗的目的就在于將原始文本數(shù)據(jù)中出現(xiàn)的不規(guī)范、格式重復(fù)、語(yǔ)義歧義、冗余數(shù)據(jù)以及信息指向不明確的數(shù)據(jù)完全排除。數(shù)據(jù)清洗一般會(huì)利用空值、差誤值、不完整數(shù)據(jù)、干擾數(shù)據(jù)類(lèi)型、異常數(shù)據(jù)等清洗方法。在以上手段的應(yīng)用基礎(chǔ)上,還利用了以下數(shù)據(jù)清洗法:第一,增加限定狀語(yǔ),如“形容詞+名詞”等;第二,按照發(fā)布者的具體IP地址,排除非限定地區(qū)搜索出來(lái)的信息;第三,按照微博上顯示的前后時(shí)間關(guān)聯(lián),排除掉一些延續(xù)性信息的微博;第四,按照發(fā)布內(nèi)容的有關(guān)性,排除和社會(huì)一般認(rèn)識(shí)無(wú)關(guān)的評(píng)論、新聞等;第五,排除非人群特征類(lèi)信息,譬如轉(zhuǎn)發(fā)的報(bào)紙、學(xué)報(bào)、期刊、官方新聞等。將所有數(shù)據(jù)清洗完畢后,獲取到的數(shù)據(jù)信息本身在格式、規(guī)范、語(yǔ)義以及指向性等方面是合格的,這在很大程度上可以為之后關(guān)鍵特征的提取減少阻力,降低操作環(huán)節(jié)的復(fù)雜性。

      1.3提取信息關(guān)鍵特征

      數(shù)據(jù)清洗后,將完成清洗的文本信息進(jìn)行掃描,將計(jì)算機(jī)網(wǎng)絡(luò)中出現(xiàn)的關(guān)鍵詞以詞頻的方式,作為對(duì)應(yīng)對(duì)象描述的主要內(nèi)容。另外,文本利用tf-idf權(quán)重來(lái)確定關(guān)鍵詞的重要性,衡量非物質(zhì)文化和一系列關(guān)鍵詞間的關(guān)系。tf-idf權(quán)重在基于大數(shù)據(jù)的基礎(chǔ)上在信息分析與管理等領(lǐng)域上已經(jīng)有了成功案例,分析手段已經(jīng)發(fā)展的比較成熟了。利用閾值設(shè)定和排序分列,篩選出權(quán)重比較高的關(guān)鍵詞。tf-idf值的計(jì)算公式表示為:

      式中:[x]代表文檔[D]內(nèi)所有的關(guān)鍵詞;[tf(x)]代表某一提取關(guān)鍵特征值在文檔中出現(xiàn)的實(shí)際次數(shù);[idf(x)]代表某一提取特征值在整個(gè)文檔內(nèi)的分布狀況;[N]代表文檔[D]數(shù)據(jù)內(nèi)的文本數(shù)目,[D]代表某個(gè)非物質(zhì)文化信息的數(shù)據(jù)集合;[d∈D:x∈d]代表文檔[D]內(nèi)包括關(guān)鍵詞x在內(nèi)的所有文本總數(shù);[fx]代表關(guān)鍵詞出現(xiàn)的具體頻次;[Nd]代表關(guān)鍵詞出現(xiàn)的總數(shù)。

      通過(guò)上列公式獲得tf-idf值來(lái)確定關(guān)鍵詞的重要程度后,就可以對(duì)后續(xù)數(shù)據(jù)信息的建設(shè)提供重要依據(jù),從數(shù)據(jù)上增加非物質(zhì)文化信息分析的在關(guān)鍵詞上的準(zhǔn)確度。

      1.4數(shù)據(jù)信息建設(shè)

      在非物質(zhì)文化的數(shù)據(jù)信息建設(shè)上,首先要?jiǎng)?wù)就是將原始數(shù)據(jù)進(jìn)行細(xì)致分類(lèi),構(gòu)建數(shù)據(jù)關(guān)系,以及對(duì)數(shù)據(jù)邏輯體系下的關(guān)鍵數(shù)據(jù)進(jìn)行分析。在上述操作環(huán)節(jié)完成的基礎(chǔ)之上,將在非物質(zhì)文化信息的前期調(diào)研中采集到的諸多海量的圖片、文字、視頻等信息加工在一起,因?yàn)槭艿郊夹g(shù)、采訪環(huán)境、以及偶然因素等限制,還沒(méi)有形成一個(gè)統(tǒng)一的標(biāo)準(zhǔn)化組織形態(tài)。從非物質(zhì)文化數(shù)據(jù)信息建設(shè)的立場(chǎng)上,利用技術(shù)標(biāo)準(zhǔn)的統(tǒng)一制定,對(duì)原始信息進(jìn)行標(biāo)準(zhǔn)化處理。對(duì)于龐大的非物質(zhì)文化信息資源,借助大數(shù)據(jù)技術(shù),以數(shù)據(jù)統(tǒng)計(jì)學(xué)的手段,構(gòu)建數(shù)據(jù)之間的邏輯關(guān)系結(jié)構(gòu),將會(huì)為非物質(zhì)文化的深入發(fā)展奠定一定研究基礎(chǔ)。非物質(zhì)文化信息資源在歸類(lèi)整理上也能夠根據(jù)研究屬性來(lái)劃定。而在屬性研究上,對(duì)其劃分的主要依據(jù)就是根據(jù)非物質(zhì)文化的信息門(mén)類(lèi),以各個(gè)領(lǐng)域內(nèi)的具體內(nèi)容為標(biāo)準(zhǔn)進(jìn)行劃分。歸類(lèi)構(gòu)建數(shù)據(jù)庫(kù)時(shí)必須以非物質(zhì)文化為一級(jí)目錄,以目錄類(lèi)別為準(zhǔn)構(gòu)建二級(jí)目錄,比如民族舞蹈、民俗音樂(lè)、傳統(tǒng)曲藝、傳統(tǒng)手藝(如雜技、體育競(jìng)技等)、傳統(tǒng)美術(shù)、傳統(tǒng)醫(yī)藥等,以具體內(nèi)容構(gòu)建三級(jí)目錄。另外一方面,對(duì)非物質(zhì)文化信息資源來(lái)說(shuō),還需要利用信息建設(shè)、使用者分析、傳播途徑等角度對(duì)其進(jìn)行進(jìn)一步的研究,研究?jī)?nèi)容視研究視角不同而有所區(qū)別。完成一系列分類(lèi)整理建設(shè)之后,我們就可以將信息分析交給元數(shù)據(jù)來(lái)實(shí)現(xiàn)。

      1.5大數(shù)據(jù)信息分析

      對(duì)于非物質(zhì)文化而言,對(duì)其元數(shù)據(jù)進(jìn)行設(shè)計(jì)前必須首先了解有關(guān)非物質(zhì)文化館藏資料的部分特殊屬性,并對(duì)這些特殊屬性進(jìn)行分析管理,不同類(lèi)別的非物質(zhì)文化遺產(chǎn)資料對(duì)應(yīng)的元數(shù)據(jù)信息類(lèi)型也各不相同,如此一來(lái)才可以實(shí)現(xiàn)對(duì)元數(shù)據(jù)的更好管理。非物質(zhì)文化信息元數(shù)據(jù)管理分析設(shè)計(jì)的主要目標(biāo)是為了便于對(duì)非物質(zhì)文化信息資料的元數(shù)據(jù)進(jìn)行精準(zhǔn)分析與管理。這部分工作主要有兩方面來(lái)完成,即元數(shù)據(jù)數(shù)據(jù)庫(kù)和功能設(shè)計(jì)。

      元數(shù)據(jù)數(shù)據(jù)庫(kù)設(shè)計(jì):首先需要制作一張?jiān)獢?shù)據(jù)表(Metadata),在元數(shù)據(jù)表中按照數(shù)據(jù)信息下不同類(lèi)型的非物質(zhì)文化添加不同信息,同時(shí)在非物質(zhì)文化類(lèi)別表中也需要按照添加的內(nèi)容的不同自動(dòng)添加元數(shù)據(jù)信息的新字段。向元數(shù)據(jù)總表內(nèi)添加新的元數(shù)據(jù)以后,非物質(zhì)文化類(lèi)別表就會(huì)自動(dòng)添加新信息,該信息對(duì)應(yīng)了總表中元數(shù)據(jù)的全部記錄。

      功能設(shè)計(jì):非物質(zhì)文化元數(shù)據(jù)管理主要是采取C/S構(gòu)造,具體包括了非物質(zhì)文化元數(shù)據(jù)管理、專(zhuān)業(yè)資料信息管理這兩方面內(nèi)容。它能夠?qū)υ獢?shù)據(jù)進(jìn)行動(dòng)態(tài)實(shí)時(shí)的管理,如信息刪改、增添和查看等一系列操作。其中自定義編號(hào)是為了進(jìn)一步保證元數(shù)據(jù)在內(nèi)容修改上的方便,如有助于增添新的元數(shù)據(jù),同時(shí)表單將會(huì)按照自定義的編號(hào)順序排列,使用者在實(shí)際操作過(guò)程中,以非物質(zhì)文化的具體類(lèi)別為主,能夠自行查閱已經(jīng)輸入和導(dǎo)入進(jìn)去的元數(shù)據(jù)表單。還有利于增添新的元數(shù)據(jù)信息,也能夠?qū)Ρ砀駜?nèi)的現(xiàn)有元數(shù)據(jù)進(jìn)行刪改,如元數(shù)據(jù)的字段、長(zhǎng)度、類(lèi)別、實(shí)例、名稱(chēng)等。

      2實(shí)驗(yàn)與效果分析

      為了更加清楚、具體的看出本文提出的基于大數(shù)據(jù)的非物質(zhì)文化信息分析方法的實(shí)際應(yīng)用效果,特與傳統(tǒng)的非物質(zhì)文化信息分析方法進(jìn)行對(duì)比,對(duì)其信息分析的平均耗時(shí)進(jìn)行比較。

      2.1實(shí)驗(yàn)準(zhǔn)備

      為保證試驗(yàn)的準(zhǔn)確性,以某地非物質(zhì)文化信息數(shù)據(jù)庫(kù)的測(cè)試用例作為基本資料,將兩種非物質(zhì)文化信息分析方法設(shè)計(jì)置于相同的硬軟件配置之中,進(jìn)行錯(cuò)誤文本信息的分析,實(shí)驗(yàn)其信息分析平均耗時(shí)。配置參數(shù)見(jiàn)下表。

      2.2實(shí)驗(yàn)結(jié)果分析

      試驗(yàn)過(guò)程中,通過(guò)兩種不同的非物質(zhì)文化信息分析方法設(shè)計(jì)同時(shí)在相同配置環(huán)境下進(jìn)行工作,分析其信息分析平均耗時(shí)的變化。實(shí)驗(yàn)效果對(duì)比圖1所示。

      實(shí)驗(yàn)結(jié)果表明,本文提出的基于大數(shù)據(jù)的非物質(zhì)文化信息分析方法,在非物質(zhì)文化信息測(cè)試中可以有效實(shí)現(xiàn)錯(cuò)誤信息文本的自動(dòng)分析,從而大大減少了人工分析錯(cuò)誤信息文本的工作量,且具備時(shí)間短,工作效率高的優(yōu)勢(shì)。

      3結(jié)束語(yǔ)

      對(duì)基于大數(shù)據(jù)的非物質(zhì)文化信息分析方法進(jìn)行分析,雖然大數(shù)據(jù)的非物質(zhì)文化信息分析法的應(yīng)用已經(jīng)在社會(huì)各領(lǐng)域獲得了比較好的應(yīng)用效果,然而影響非物質(zhì)文化信息的建設(shè)因素是多種多樣的,要想完全了解各類(lèi)人群對(duì)非物質(zhì)文化信息的認(rèn)知,就具備較大的挑戰(zhàn)。希望本文對(duì)非物質(zhì)文化信息分析方法可以為未來(lái)有關(guān)大數(shù)據(jù)以及非遺保護(hù)和傳承提供一定價(jià)值的借鑒。

      參考文獻(xiàn):

      [1] 馬思根,趙小明,吳勇.貴州非物質(zhì)文化遺產(chǎn)的數(shù)據(jù)挖掘與分析[J].計(jì)算機(jī)時(shí)代,2020,10(5):41-45,49.

      [2] 張一然,陳愛(ài)強(qiáng).信息可視化設(shè)計(jì)下的非物質(zhì)文化遺產(chǎn)保護(hù)和傳承——以北塘飛鈸為例[J].工業(yè)設(shè)計(jì),2020,12(4):137-138.

      [3] 余佳睿.非物質(zhì)文化遺產(chǎn)數(shù)字化保護(hù)與開(kāi)發(fā)——以南京為例[J].華夏文化,2020,1(1):41-42.

      [4] 張軒宇.基于大數(shù)據(jù)的江南非物質(zhì)文化遺產(chǎn)品牌網(wǎng)絡(luò)影響力實(shí)證研究[J].中國(guó)經(jīng)貿(mào)導(dǎo)刊(中),2020,15(5):66-71.

      [5]侯效彬.基于“大數(shù)據(jù)”時(shí)代的計(jì)算機(jī)信息處理技術(shù)探討[J].現(xiàn)代信息科技,2019,3(2):89-91.

      【通聯(lián)編輯:張薇】

      猜你喜歡
      非物質(zhì)文化大數(shù)據(jù)
      日本非物質(zhì)文化遺產(chǎn)保護(hù)及啟示
      新疆地區(qū)非物質(zhì)文化旅游經(jīng)濟(jì)開(kāi)發(fā)實(shí)證分析
      以影像為載體的河南非遺文化傳播探究
      大數(shù)據(jù)環(huán)境下基于移動(dòng)客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
      新聞世界(2016年10期)2016-10-11 20:13:53
      基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
      科技視界(2016年20期)2016-09-29 10:53:22
      數(shù)據(jù)+輿情:南方報(bào)業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
      非物質(zhì)文化遺產(chǎn)梧州龍母文化動(dòng)畫(huà)劇本研究
      戲劇之家(2016年14期)2016-08-02 11:44:34
      非物質(zhì)文化遺產(chǎn)中民間舞蹈的特點(diǎn)與表現(xiàn)形態(tài)解讀
      戲劇之家(2016年7期)2016-05-10 12:42:26
      初探貴州花苗“長(zhǎng)衫龍”蘆笙舞
      戲劇之家(2016年4期)2016-03-25 12:46:26
      海盐县| 开远市| 大姚县| 蒙山县| 海盐县| 丰镇市| 什邡市| 竹溪县| 芦山县| 迭部县| 南涧| 浦江县| 稷山县| 蒙山县| 卓资县| 桂林市| 思茅市| 宣化县| 淮北市| 宜都市| 潮安县| 西宁市| 佛教| 徐水县| 宝山区| 从化市| 瓦房店市| 湘西| 凌海市| 肃北| 敦化市| 定结县| 喀喇沁旗| 衡水市| 大理市| 文登市| 马尔康县| 高安市| 南川市| 吉木乃县| 陇川县|