• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    文本大數(shù)據(jù)的環(huán)境治理應(yīng)用研究

    2020-01-17 02:05:30
    關(guān)鍵詞:環(huán)境治理情緒文本

    一、前言

    近年來,隨著互聯(lián)網(wǎng)、計(jì)算機(jī)的飛速發(fā)展和技術(shù)進(jìn)步以及人工智能軟硬件技術(shù)的發(fā)展和廣泛應(yīng)用,數(shù)據(jù)作為記錄各種人類活動的一種重要資源而呈現(xiàn)出爆發(fā)式增長,而從海量的、非結(jié)構(gòu)化的數(shù)據(jù)中獲取、處理、分析、挖掘其中有價值的信息成為國際國內(nèi)政界、學(xué)界以及企業(yè)界關(guān)注的焦點(diǎn)問題。國務(wù)院在2015年印發(fā)的《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》,成為首次從國家層面的信息化發(fā)展戰(zhàn)略角度把數(shù)據(jù)認(rèn)定為國家的基礎(chǔ)性戰(zhàn)略資源,由此,數(shù)字化治理方式也成為提升政府治理能力的新途徑。

    實(shí)證經(jīng)濟(jì)學(xué)需要數(shù)據(jù)作為基礎(chǔ),數(shù)據(jù)也是經(jīng)濟(jì)指標(biāo)形成的背后因素,在宏觀經(jīng)濟(jì)研究、政策制定、經(jīng)濟(jì)理論驗(yàn)證、企業(yè)應(yīng)對市場發(fā)展、個人做出經(jīng)濟(jì)決策等各領(lǐng)域均有重要作用[1]。目前,大數(shù)據(jù)在經(jīng)濟(jì)學(xué)和金融學(xué)領(lǐng)域中應(yīng)用較為廣泛,拓寬了經(jīng)濟(jì)和金融領(lǐng)域的實(shí)證研究,既能夠?yàn)榻?jīng)典研究問題提供新的視角,又可以用于研究最新的熱點(diǎn)問題。在經(jīng)濟(jì)學(xué)研究領(lǐng)域中,文本大數(shù)據(jù)主要用于度量經(jīng)濟(jì)以及相關(guān)政策等的不確定性、基于文本的行業(yè)動態(tài)分類、測度并預(yù)測商業(yè)周期,以及量化媒體的政治傾向和新聞需求等問題。此外,在金融學(xué)研究領(lǐng)域中,文本大數(shù)據(jù)主要用于度量投資者和媒體的關(guān)注度、不同市場參與主體的情緒或語調(diào)以及分析投資者出現(xiàn)的意見分歧等指標(biāo)。

    2016年生態(tài)環(huán)境部(原環(huán)境保護(hù)部)印發(fā)《生態(tài)環(huán)境大數(shù)據(jù)建設(shè)總體方案》,可以說是正式從政府層面開啟了“互聯(lián)網(wǎng)+生態(tài)環(huán)境”戰(zhàn)略,這個戰(zhàn)略對推動政府環(huán)境治理創(chuàng)新有著積極的作用。因此,大數(shù)據(jù)逐步成為環(huán)境治理的重要戰(zhàn)略資源和政府提升環(huán)境治理能力的重要手段,發(fā)展數(shù)字經(jīng)濟(jì)也成為可持續(xù)發(fā)展的重要方向,同時,對于推動加快生態(tài)文明建設(shè)進(jìn)程和生態(tài)環(huán)境治理能力現(xiàn)代化具有跨時代的重要意義。大數(shù)據(jù)中蘊(yùn)含著重要的價值信息,文本大數(shù)據(jù)作為大數(shù)據(jù)的重要組成部分,是人類知識的主要載體。[2]非結(jié)構(gòu)化的文本大數(shù)據(jù)作為一種新的數(shù)據(jù)源,也是最重要的信息載體之一,往往帶有明顯的領(lǐng)域特征和獨(dú)特的語言模式,也常常包含大量的專業(yè)詞匯,能夠?yàn)榄h(huán)境治理問題提供有效的信息和獨(dú)特的分析視角。例如,文本大數(shù)據(jù)可以用于測度環(huán)境政策的不確定性、量化媒體關(guān)注度以及輿論導(dǎo)向、不同環(huán)境治理主體的情緒對相應(yīng)問題解決方式的影響、基于新聞的隱含波動因素等。

    二、文本大數(shù)據(jù)的特征和提取重點(diǎn)難點(diǎn)

    文本作為語言的視覺形式是人類最重要的交流工具,基于文本的信息隱藏算法具有很高的實(shí)用價值,文本的一個明顯特點(diǎn)是高度凝練,信息冗余少。[3]大數(shù)據(jù)中蘊(yùn)含著重要的價值信息,文本大數(shù)據(jù)作為大數(shù)據(jù)的重要組成部分,是人類知識的主要載體。傳統(tǒng)的數(shù)據(jù)收集往往借助于紙質(zhì)媒介,體量較小,數(shù)據(jù)獲取成本高,獲取時間相對滯后;而通過互聯(lián)網(wǎng)媒介進(jìn)行文本數(shù)據(jù)收集和處理,不僅成本大幅降低,數(shù)據(jù)的可得性大幅增加,數(shù)據(jù)的體量也呈現(xiàn)幾何級數(shù)增長的特征。同時,隨著網(wǎng)絡(luò)平臺發(fā)布信息普及度的提高,除了傳統(tǒng)的政府職能部門和相關(guān)機(jī)構(gòu)發(fā)布信息之外,微博、微信公眾號、朋友圈、論壇帖子等新媒體形式也逐漸成為數(shù)據(jù)來源的重要渠道,文本大數(shù)據(jù)的發(fā)布主體從單一向多樣化進(jìn)行轉(zhuǎn)變,頻率變得更高。通過互聯(lián)網(wǎng)平臺積累起來的數(shù)據(jù),就存儲在網(wǎng)絡(luò)空間中,文本信息即刻在網(wǎng)絡(luò)中留下痕跡,通過一定的方法和技術(shù)進(jìn)行提取,信息獲取更加及時,數(shù)據(jù)獲取的成本也相對降低。通過利用互聯(lián)網(wǎng)大數(shù)據(jù)信息,可以獲取接近全體的樣本信息,海量的樣本量支持下,避免了由于信息不全面導(dǎo)致的錯覺以及判斷失誤,未來還將開拓更為豐富的數(shù)據(jù)源,如政府工作報(bào)告、規(guī)劃、書籍、檔案等。

    文本信息挖掘的過程就是從海量的、非結(jié)構(gòu)化的文本數(shù)據(jù)中獲取有價值的信息的過程。數(shù)據(jù)挖掘中的一個重要研究方向就是文本信息挖掘,目前文本信息挖掘技術(shù)在政府、企業(yè)以及各行各業(yè)都有廣泛的應(yīng)用,通過文本信息挖掘的結(jié)果可以對政府、企業(yè)等決策的制定提供數(shù)據(jù)依據(jù)。[4]對信息的高度抽象提煉得到的就是文本數(shù)據(jù),正是由于海量文本數(shù)據(jù)信息的存在,獲取、處理和分析文本大數(shù)據(jù)方面仍然存在一些問題,其中最重要的是從海量的文本數(shù)據(jù)中提取出所需要的核心信息并且保證信息的準(zhǔn)確性和有效性,同時考察其對相應(yīng)問題的解釋或預(yù)測能力。從技術(shù)層面來說,提取文本數(shù)據(jù)信息需要綜合考慮多種因素,這些因素既包含文本數(shù)據(jù)的來源、所處的語言環(huán)境、文本內(nèi)容的長短、句式結(jié)構(gòu),也包含需提取信息的特征等,同時也要考慮信息提取的成本和收益。在綜合條件允許的情況下,可以采用相對復(fù)雜的統(tǒng)計(jì)學(xué)習(xí)和深度學(xué)習(xí)相結(jié)合的信息提取方法來提高信息提取的準(zhǔn)確性,優(yōu)化人機(jī)合作成為解決困難的重要方式。使用復(fù)雜方法時還需要保證這些方法的透明性和可復(fù)制性。最后還要注意的一個問題是,關(guān)鍵技術(shù)中的數(shù)據(jù)結(jié)構(gòu)化轉(zhuǎn)換和文本數(shù)據(jù)信息提取,這兩個重要步驟的執(zhí)行順序需要根據(jù)具體問題來分析決定,有時可能需要經(jīng)過多次嘗試才能找到最優(yōu)的決策方案。

    三、文本大數(shù)據(jù)在環(huán)境治理方面的應(yīng)用

    現(xiàn)有環(huán)境領(lǐng)域主要有兩大類文本相關(guān)分析的問題,第一大類是對文本顯示的公民積極或消極情緒、輿論或者文件語調(diào)正負(fù)等進(jìn)行區(qū)分的聚類問題,第二大類是度量相關(guān)群體情緒、輿論走向不確定性、社會恐慌程度、公民意見分歧程度等和其所對應(yīng)的回歸問題。

    (一)文本情緒

    因?yàn)榍榫w的變化可能會導(dǎo)致問題處理的結(jié)果不同,度量情緒并預(yù)測風(fēng)險是文本大數(shù)據(jù)在環(huán)境治理領(lǐng)域的重要應(yīng)用方向,典型的例子是鄰避效應(yīng)。通常用“語調(diào)”來表示“情緒”,語調(diào)的不同表示了情緒的正面和負(fù)面、樂觀和悲觀、積極和消極等。根據(jù)情緒的主題可以對文本情緒的研究對象進(jìn)行不同分類,主要包括媒體語調(diào)(媒體新聞)、管理層語調(diào)(當(dāng)事公司管理層討論與分析、環(huán)評報(bào)告以及其他公開披露的信息文件)、公民情緒(微信轉(zhuǎn)發(fā)評論、微博熱搜、網(wǎng)絡(luò)論壇發(fā)帖)等。

    度量媒體情緒的媒體新聞報(bào)道內(nèi)容中包含的樂觀與悲觀情緒。通常來看,媒體負(fù)面語氣能夠解釋鄰避問題的風(fēng)險和解決方案,但正面語氣卻沒有解釋能力。

    管理層的信息披露往往能反映管理層的決策和意圖,信息公開不全面、甚至相關(guān)信息空白,環(huán)評報(bào)告獨(dú)立性存疑,相當(dāng)于利益集團(tuán)放大了鄰避效應(yīng),無助于問題的解決。

    文本大數(shù)據(jù)挖掘技術(shù)的出現(xiàn)為度量公民情緒提供了新的數(shù)據(jù)源。第一個原因是,公民越來越傾向于選擇在微博、微信公眾號、網(wǎng)絡(luò)論壇上發(fā)布相關(guān)的評論或者做出相關(guān)搜索,這些文本數(shù)據(jù)能直接反映出公眾對類似鄰避事件的看法、對當(dāng)前狀態(tài)的解讀和預(yù)期以及與自身決策相關(guān)的信息。第二個原因是,這些數(shù)據(jù)獲得性高且覆蓋群體范圍廣,滿足了從不同頻率、不同層面研究情緒與鄰避風(fēng)險關(guān)系的需求。

    (二)媒體關(guān)注和傾向

    傳統(tǒng)的數(shù)據(jù)指標(biāo)和環(huán)境問題治理之間的關(guān)系不穩(wěn)定,且只能反映部分信息,相對于傳統(tǒng)數(shù)據(jù)來說,文本數(shù)據(jù)覆蓋的領(lǐng)域更加廣泛、文本信息獲取主體更多、并且新聞內(nèi)容可能與當(dāng)前和未來狀態(tài)有更高相關(guān)性。利用文本數(shù)據(jù)度量公民關(guān)注的環(huán)境問題采用的主要指標(biāo)有搜索指數(shù)、閱讀頻率數(shù)據(jù)和論壇發(fā)帖量等。媒體作為重要的信息制造者和傳播者,其關(guān)注和傾向一方面可以影響普通公民對環(huán)境問題治理的關(guān)注,另一方面也可以影響輿論信息的傳播效率和傳播模式。

    媒體對環(huán)境政策的變動和未來趨勢可能產(chǎn)生很重要的影響,比較典型的例子是“PM2.5”、“霧霾”等關(guān)鍵詞在一段時間內(nèi)在媒體中頻繁出現(xiàn),推動了PM2.5的數(shù)據(jù)公開以及《大氣污染防治行動計(jì)劃》等一系列治理大氣污染改善空氣質(zhì)量政策措施的出臺與實(shí)施。相比而言,傳統(tǒng)的自上而下的政策頒布實(shí)施時間跨度較長,而主流新聞媒體的新聞文本、網(wǎng)絡(luò)搜索短時間內(nèi)同一關(guān)鍵詞頻繁出現(xiàn),對新的環(huán)境政策的實(shí)施具有明顯的促進(jìn)作用。

    四、文本大數(shù)據(jù)未來發(fā)展

    統(tǒng)籌規(guī)劃,協(xié)同推進(jìn)文本數(shù)據(jù)資源整合,建設(shè)現(xiàn)代化高技術(shù)的數(shù)據(jù)中心,加強(qiáng)內(nèi)部共享和動態(tài)更新;整合信息平臺,逐漸形成統(tǒng)一的互聯(lián)網(wǎng)文本數(shù)據(jù)平臺,實(shí)現(xiàn)信息的有效共享和開放交換;建立文本數(shù)據(jù)正負(fù)面清單,完善健全文本數(shù)據(jù)開放制度和機(jī)制,提高各政府部門和社會機(jī)構(gòu)的文本數(shù)據(jù)開放熱情。

    加強(qiáng)文本大數(shù)據(jù)處理和分析的技術(shù)創(chuàng)新、建立一體化的大數(shù)據(jù)平臺和完善的數(shù)據(jù)管理體系,通過對文本大數(shù)據(jù)的高效采集、有效整合,加強(qiáng)對政府?dāng)?shù)據(jù)的共享開放和社會數(shù)據(jù)的挖掘應(yīng)用,提升環(huán)境問題決策能力,提高風(fēng)險防范水平,進(jìn)一步深化環(huán)境治理的精準(zhǔn)性和有效性。

    熟練掌握文本大數(shù)據(jù)需要跨學(xué)科領(lǐng)域的人才,專業(yè)的研究人員不僅需要對政治、經(jīng)濟(jì)、金融、心理學(xué)、環(huán)境治理等領(lǐng)域有較為深入的認(rèn)知和研究,同時還應(yīng)掌握文本挖掘技術(shù)等較為豐富的知識基礎(chǔ),了解不同算法的優(yōu)缺點(diǎn)和典型特征,因此對高素質(zhì)的跨學(xué)科復(fù)合型人才的需求量會大量增加,科研機(jī)構(gòu)和高校等可根據(jù)自身學(xué)科優(yōu)勢對此類跨學(xué)科復(fù)合型的研究人才進(jìn)行培養(yǎng)。

    猜你喜歡
    環(huán)境治理情緒文本
    聯(lián)合國環(huán)境治理體制
    綠色中國(2019年13期)2019-11-26 07:11:00
    在808DA上文本顯示的改善
    數(shù)字傳聲:環(huán)境治理變中向好
    基于doc2vec和TF-IDF的相似文本識別
    電子制作(2018年18期)2018-11-14 01:48:06
    小情緒
    小情緒
    小情緒
    堅(jiān)決打好環(huán)境治理攻堅(jiān)戰(zhàn)持久戰(zhàn)
    文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
    情緒認(rèn)同
    古田县| 商丘市| 宜宾县| 鹤岗市| 香河县| 江口县| 东台市| 陵水| 抚顺市| 无锡市| 吉木乃县| 绵竹市| 龙川县| 平塘县| 深泽县| 红原县| 鲁山县| 四平市| 什邡市| 石泉县| 元江| 安福县| 炉霍县| 大兴区| 西华县| 色达县| 普安县| 铜川市| 平果县| 滦南县| 水富县| 泸州市| 武夷山市| 宁蒗| 囊谦县| 咸阳市| 富顺县| 湖南省| 图们市| 南皮县| 永福县|