• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      政府?dāng)?shù)據(jù)開放平臺用戶評論情感差異分析

      2019-03-25 15:18:18劉桂琴
      數(shù)字圖書館論壇 2019年2期
      關(guān)鍵詞:開放平臺分類政府

      劉桂琴

      (湖北師范大學(xué)圖書館,黃石 435002)

      1 研究背景與現(xiàn)狀

      政府?dāng)?shù)據(jù)開放與傳統(tǒng)的政府信息公開相比,在提高政府透明度,提高政府治理能力與服務(wù)效率,以及推動社會經(jīng)濟(jì)發(fā)展等方面具有重要意義[1]。開放政府?dāng)?shù)據(jù)資源具有巨大的應(yīng)用價(jià)值和發(fā)展?jié)摿?,隨著移動互聯(lián)網(wǎng)的發(fā)展和公眾對公共數(shù)據(jù)的迫切需求,政府?dāng)?shù)據(jù)開放成為必然趨勢,各國紛紛建立不同層級的數(shù)據(jù)開放平臺以打破“信息孤島”,應(yīng)對各行業(yè)的信息需求。2009年,美國奧巴馬政府頒布《開放政府指令》,并推出全球首個(gè)政府?dāng)?shù)據(jù)開放平臺Data.gov,此后英國、澳大利亞、新加坡、日本等緊跟潮流,紛紛制定政府?dāng)?shù)據(jù)開放戰(zhàn)略并建設(shè)國家級政府?dāng)?shù)據(jù)開放平臺[2]。我國為了建設(shè)服務(wù)型政府,進(jìn)一步推進(jìn)新型工業(yè)化、城鎮(zhèn)化、農(nóng)業(yè)現(xiàn)代化發(fā)展,對政府?dāng)?shù)據(jù)開放也顯現(xiàn)出巨大的熱情并投入了大量工作。2015年8月31日,國務(wù)院發(fā)布《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》,明確我國將在2018年底前建成國家政府?dāng)?shù)據(jù)統(tǒng)一開放平臺,截至2018年6月,我國已有46個(gè)地方政府?dāng)?shù)據(jù)開放平臺,這些平臺的成立為國家政府?dāng)?shù)據(jù)統(tǒng)一開放平臺的建設(shè)提供了有益的探索。

      我國地方政府?dāng)?shù)據(jù)平臺的建設(shè)能夠成為國家政府?dāng)?shù)據(jù)開放平臺的藍(lán)本,但與國外相對成熟的政府?dāng)?shù)據(jù)開放平臺相比,我國地方政府?dāng)?shù)據(jù)開放的效果及其應(yīng)用實(shí)踐仍有不足,存在不少亟待完善的問題(如數(shù)據(jù)質(zhì)量不高、數(shù)據(jù)覆蓋面不均衡等),而國內(nèi)學(xué)者也從多個(gè)角度進(jìn)行了探討。如余奕昊等[3]采用案例研究和對比研究方法,從功能架構(gòu)的視角分析了我國地方政府?dāng)?shù)據(jù)開放平臺的現(xiàn)狀及存在的問題,并提出相應(yīng)的優(yōu)化策略;沈晶等[4]建立了政府?dāng)?shù)據(jù)開放發(fā)展速度評估體系,并選取5個(gè)省級政府?dāng)?shù)據(jù)開放平臺計(jì)算得到政府?dāng)?shù)據(jù)開放發(fā)展速度指數(shù);夏姚璜[5]通過文獻(xiàn)調(diào)研發(fā)現(xiàn),我國開放政府?dāng)?shù)據(jù)平臺的地理空間元數(shù)據(jù)標(biāo)準(zhǔn)還不夠成熟,提出應(yīng)當(dāng)依據(jù)國情注重地理空間元數(shù)據(jù)標(biāo)準(zhǔn)的功能開發(fā);湯志偉等[6]基于政府創(chuàng)新擴(kuò)散理論,構(gòu)建“政治-經(jīng)濟(jì)-社會”三要素模型來探究政府?dāng)?shù)據(jù)開放發(fā)展水平的影響因素;劉暢等[7]基于天津市政府信息公開平臺,考察了天津市政府?dāng)?shù)據(jù)開放的實(shí)踐情況并提出建議;李梅等[8]通過分析政府?dāng)?shù)據(jù)開放的主要影響因素及各因素間的復(fù)雜關(guān)系,找出影響政府?dāng)?shù)據(jù)開放的直接因素、間接因素及深層次基礎(chǔ)因素,用以全面地提升政府?dāng)?shù)據(jù)開放水平。

      分析發(fā)現(xiàn),已有研究多從指標(biāo)確定、模型構(gòu)建、實(shí)證分析角度出發(fā),探討我國政府?dāng)?shù)據(jù)開放平臺的建設(shè)現(xiàn)狀并提出相應(yīng)的優(yōu)化策略,以提高我國政府?dāng)?shù)據(jù)開放水平。而政府?dāng)?shù)據(jù)開放平臺的用戶是實(shí)際體驗(yàn)者和數(shù)據(jù)的使用者,用戶在使用過程中,對整個(gè)平臺或某一項(xiàng)服務(wù)會產(chǎn)生積極或負(fù)面的情感。通過對用戶的評論反饋進(jìn)行情感分析,能夠發(fā)現(xiàn)平臺的服務(wù)效率、數(shù)據(jù)質(zhì)量、功能完備等是否讓用戶滿意。而已有研究較少從用戶角度入手,將政府?dāng)?shù)據(jù)開放平臺的用戶評論進(jìn)行分類,通過分析不同類型評論情感差異,進(jìn)行政府?dāng)?shù)據(jù)開放平臺滿意度評價(jià),發(fā)現(xiàn)平臺服務(wù)中存在的問題。與此同時(shí),隨著人們對人工智能、機(jī)器學(xué)習(xí)的不斷應(yīng)用,傳統(tǒng)實(shí)證調(diào)查受限于時(shí)間和空間,調(diào)查效率相對偏低;而大數(shù)據(jù)時(shí)代的來臨,為我們創(chuàng)新調(diào)查方式,為更加快捷、高效、科學(xué)地評估政府?dāng)?shù)據(jù)開放平臺的服務(wù)質(zhì)量提供了一種可能。因此,本文從用戶角度出發(fā),以目前較為成熟的情感分析技術(shù)為手段,以國內(nèi)建議反饋功能較為完善的武漢市政府?dāng)?shù)據(jù)開放平臺為例,搜集用戶評論數(shù)據(jù),將主題模型與深度神經(jīng)網(wǎng)絡(luò)結(jié)合進(jìn)行用戶評論主題提取以及評論分類,探討在評論分類基礎(chǔ)上的用戶情感趨勢;將時(shí)序變化與情感差異結(jié)合起來,對不同類型的評論情感差異進(jìn)行分析,確定用戶對政府?dāng)?shù)據(jù)開放平臺的滿意度;結(jié)合反饋內(nèi)容,快速定位痛點(diǎn),并提出優(yōu)化策略,以提升我國政府?dāng)?shù)據(jù)開放平臺建設(shè)的水平。

      2 深度神經(jīng)網(wǎng)絡(luò)簡介

      深度神經(jīng)網(wǎng)絡(luò)又稱為深度學(xué)習(xí),是由人工神經(jīng)網(wǎng)絡(luò)發(fā)展而來,是一種無監(jiān)督特征學(xué)習(xí)和特征層次結(jié)構(gòu)的學(xué)習(xí)方法,實(shí)際上是一種包含多個(gè)隱藏層的神經(jīng)網(wǎng)絡(luò)算法。Hinton在2006年首次提出深度學(xué)習(xí)的主要觀點(diǎn),認(rèn)為多隱層的神經(jīng)網(wǎng)絡(luò)可以通過無監(jiān)督的學(xué)習(xí)來逐層初始化,從而有效地標(biāo)示出深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練上的難度;其本質(zhì)思想是通過海量訓(xùn)練數(shù)據(jù)構(gòu)建多隱層的模型,來學(xué)習(xí)更有用的特征,從而提高預(yù)測的準(zhǔn)確性[9]。

      神經(jīng)網(wǎng)絡(luò)作為一種計(jì)算模型,是模擬大腦皮層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和功能而提出的,其表示輸入的信號經(jīng)由大量的神經(jīng)節(jié)點(diǎn)構(gòu)成的網(wǎng)絡(luò),按一定的規(guī)則進(jìn)行大規(guī)模并行計(jì)算,得到輸出的完整過程。其中,每個(gè)神經(jīng)節(jié)點(diǎn)都需要進(jìn)行函數(shù)計(jì)算,稱為激勵(lì)函數(shù);每兩個(gè)節(jié)點(diǎn)之間的權(quán)重用來模擬“記憶”強(qiáng)度,經(jīng)過多個(gè)隱藏層的節(jié)點(diǎn)計(jì)算之后能夠得到一系列的輸出值,輸出的結(jié)果與期望值進(jìn)行對比之后可以用來調(diào)整函數(shù)和權(quán)重,從而更加接近預(yù)期結(jié)果。將學(xué)習(xí)得來的神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于新的輸入(即進(jìn)行預(yù)測),就能得到預(yù)測的結(jié)果,這樣就實(shí)現(xiàn)了機(jī)器學(xué)習(xí)的目的[10],其模型架構(gòu)見圖1。

      圖1 神經(jīng)網(wǎng)絡(luò)模型架構(gòu)

      其中,a表示輸入層原始數(shù)據(jù),b為輸出層的結(jié)果,w表示權(quán)重,θ表示偏移量,f為激勵(lì)函數(shù),計(jì)算過程見公式(1)。

      3 政府?dāng)?shù)據(jù)開放平臺用戶情感分析步驟

      3.1 LDA模型主題提取

      (1)文本分詞。首先對評論文本進(jìn)行去停用詞處理;然后運(yùn)用公共詞庫,結(jié)合自定義詞典對評論文本進(jìn)行分詞;進(jìn)而將每次分詞中出現(xiàn)的新詞加入到自定義詞庫,經(jīng)過多次詞庫更新,重復(fù)迭代,最終形成分詞結(jié)果。

      (2)確定最優(yōu)主題數(shù)目。對分詞處理后的評論文本進(jìn)行主題建模,在利用LDA的過程中需要人工確定最優(yōu)主題數(shù)目,此處要綜合考慮算法的時(shí)間復(fù)雜度和算法復(fù)雜度,本文利用所有主題之間的平均余弦相似度來度量該主題結(jié)構(gòu)的穩(wěn)定性。計(jì)算過程見公式(2)和公式(3)。

      其中,Sim(Ti,Tj)表示主題Ti和Tj之間的余弦相似度;avg-Sim(structure)表示所有主題的平均余弦相似度,平均余弦值的取值區(qū)間在0和1之間,值越小,表明主題結(jié)構(gòu)最優(yōu)。

      (3)主題建模。獲取最優(yōu)主題結(jié)構(gòu)后,利用LDA模型對評論語料庫進(jìn)行主題建模,產(chǎn)生包含T個(gè)主題的“評論-主題”概率矩陣,其中每一行代表一個(gè)用戶的評論,每一列表示某個(gè)主題對不同評論的支持度,支持度越大,表示該評論與相應(yīng)主題越相關(guān)。

      3.2 深度神經(jīng)網(wǎng)絡(luò)進(jìn)行文本分類

      3.2.1 搭建神經(jīng)網(wǎng)絡(luò)層

      ①將“評論-主題”矩陣作為特征矩陣,并分割特征矩陣,20%的數(shù)據(jù)作為測試集,80%的數(shù)據(jù)作為訓(xùn)練集;②搭建輸入層,根據(jù)特征矩陣的維數(shù)確定輸入層神經(jīng)元數(shù)量;③搭建隱藏層,根據(jù)輸入層和輸出層的神經(jīng)元數(shù)量推測隱藏層中每層的神經(jīng)元數(shù)量,并嘗試搭建不同的隱藏層數(shù)(大于或等于3層),為了加快模型訓(xùn)練收斂速度,在隱藏層采用relu函數(shù)作為激活函數(shù);④搭建輸出層,選用softmax作為激活函數(shù)處理分類任務(wù),根據(jù)輸出結(jié)果獲取一條評論屬于每一主題的可能性,其中數(shù)值最高的作為分類結(jié)果。

      圖2 圖書館用戶情感分析流程

      3.2.2 文本分類

      ①將“評論-主題”概率矩陣的訓(xùn)練集作為原始輸入,輸入到深度神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行模型的訓(xùn)練;②依據(jù)主題支持度確定分類結(jié)果是否合理,結(jié)合分類精準(zhǔn)度和損失度來調(diào)整隱藏層的層數(shù),確定最優(yōu)預(yù)測模型;③將測試集輸入到已訓(xùn)練好的模型中,經(jīng)過softmax激活函數(shù)進(jìn)行分類輸出之后,得到每條評論的判別結(jié)果,根據(jù)判別結(jié)果對評論進(jìn)行分類。

      3.3 基于評論分類進(jìn)行用戶情感分析

      根據(jù)分類結(jié)果,對原始評論文本進(jìn)行分類,進(jìn)而對每一分類下的評論進(jìn)行情感分析;使用python提供的SnowNLP包,獲取每條評論代表正面情感的概率值;并基于ggplot繪圖工具包按照時(shí)間序列繪制情感分析可視化圖譜,明確用戶對某一服務(wù)在不同時(shí)間段的情感變化,并匯總統(tǒng)計(jì)負(fù)面評價(jià);將用戶情感趨向分為3個(gè)狀態(tài),通過橫向和縱向?qū)Ρ?,展現(xiàn)用戶對政府?dāng)?shù)據(jù)開放平臺所提供服務(wù)的滿意度,定位存在的不足。整個(gè)情感分析流程見圖2。

      4 數(shù)據(jù)處理與結(jié)果分析

      4.1 數(shù)據(jù)處理

      依據(jù)《2018年中國地方政府?dāng)?shù)據(jù)開放報(bào)告》的統(tǒng)計(jì)結(jié)果,北京市、貴陽市、武漢市、江西省、廣東省5個(gè)政府?dāng)?shù)據(jù)開放平臺提供了較好的建議反饋功能模塊,評分較高,對這5個(gè)平臺通過電話和郵件咨詢的方式請求獲取用戶評論數(shù)據(jù)。武漢市政務(wù)公開數(shù)據(jù)服務(wù)網(wǎng)提供了平臺技術(shù)人員聯(lián)系方式,通過申請獲取到評論數(shù)據(jù)、問卷調(diào)查的統(tǒng)計(jì)數(shù)據(jù),結(jié)合平臺網(wǎng)站中顯示的評論,經(jīng)過數(shù)據(jù)清洗,共選取1 000條評論,內(nèi)容包括評論時(shí)間和內(nèi)容,時(shí)間跨度為2015年3月—2018年10月,對每條評論進(jìn)行編碼,編碼順序?yàn)?~1000。首先利用R語言中jiebaR包進(jìn)行中文分詞、去停用詞等自然處理規(guī)范化過程以構(gòu)建實(shí)驗(yàn)語料庫,剔除一些常用的詞語(如“的”“嗎”等),并依據(jù)每次的分詞結(jié)果對自定義詞庫進(jìn)行更新,通過多次迭代獲得最終分詞結(jié)果。然后基于開源包JGibbLDA實(shí)現(xiàn)LDA主題建模,通過嘗試不同的主題數(shù)目,計(jì)算主題間平均余弦相似度,獲取最優(yōu)的主題結(jié)構(gòu),并依據(jù)每個(gè)主題下的相關(guān)詞為主題命名。而后對LDA提取的“評論-主題”概率矩陣進(jìn)行分割,80%的數(shù)據(jù)作為訓(xùn)練集,20%的數(shù)據(jù)作為測試集;利用python的pandas包進(jìn)行數(shù)據(jù)導(dǎo)入,采用建立在Tensorflow之上的高度抽象框架Tflearn,構(gòu)建深度神經(jīng)網(wǎng)絡(luò)模型,逐步搭建神經(jīng)網(wǎng)絡(luò)層,依據(jù)工程學(xué)的通用做法,輸入層和輸出層的神經(jīng)元數(shù)量相加除以2取整作為隱藏層的神經(jīng)元數(shù)量,并嘗試搭建3層以上的隱藏層,根據(jù)每條評論的主題支持度驗(yàn)證深度神經(jīng)網(wǎng)絡(luò)的分類結(jié)果,依據(jù)準(zhǔn)確率和損失度,調(diào)整隱藏層神經(jīng)元數(shù)量和隱藏層數(shù),以獲得最優(yōu)的分類模型。最后將測試集輸入到模型中,獲得分類結(jié)果,并依據(jù)分類結(jié)果根據(jù)編號對原始評論文本進(jìn)行分類,對于每個(gè)主題下評論文本,利用python的SnowNLP包進(jìn)行情感分析,得到每條評論的正面情感概率值,并利用ggplot繪圖工具包繪制時(shí)間序列情感統(tǒng)計(jì)圖。

      4.2 結(jié)果分析

      根據(jù)LDA模型提取結(jié)果,結(jié)合平均余弦相似度的計(jì)算結(jié)果,當(dāng)主題數(shù)為9時(shí),對應(yīng)模型結(jié)構(gòu)最優(yōu),依據(jù)主題相關(guān)詞對主題進(jìn)行命名,9個(gè)評論主題分別為數(shù)據(jù)容量、數(shù)據(jù)更新、數(shù)據(jù)全面性、可視化、下載權(quán)限、APP應(yīng)用、數(shù)據(jù)接口、網(wǎng)站優(yōu)化、平臺調(diào)研。

      通過對包含800條數(shù)據(jù)的“評論-主題”矩陣進(jìn)行訓(xùn)練,通過多次調(diào)整確定,當(dāng)輸入層包含9個(gè)神經(jīng)元,輸出層包含9個(gè)神經(jīng)元,隱含層的神經(jīng)元數(shù)量為9,隱藏層為3層時(shí),分類結(jié)果最優(yōu)。將包含200條數(shù)據(jù)的“評論-主題”概率矩陣導(dǎo)入訓(xùn)練好的模型中進(jìn)行分類測試,根據(jù)結(jié)果對200條評論文本進(jìn)行分類,并逐一進(jìn)行情感分析,繪制情感分析結(jié)果數(shù)值時(shí)間序列圖,結(jié)合各評論主題的時(shí)間序列圖進(jìn)行情感差異分析。

      分析發(fā)現(xiàn),關(guān)于下載權(quán)限的評論,除個(gè)別極值點(diǎn),其情感分析結(jié)果數(shù)值基本處于0.2以下,表明評論沒有正面情感。通過python數(shù)據(jù)框pandas顯示評論里情感分析數(shù)值較低的評論發(fā)現(xiàn),內(nèi)容較多涉及“登錄下載數(shù)據(jù)麻煩”“下載數(shù)據(jù)步驟煩瑣”等,而出現(xiàn)個(gè)別極值點(diǎn)的原因是少數(shù)用戶認(rèn)可注冊登錄才能獲取數(shù)據(jù)的方式,提高數(shù)據(jù)獲取門檻有利于數(shù)據(jù)的安全,但多數(shù)用戶認(rèn)為登錄后才能下載數(shù)據(jù)增加了時(shí)間成本,建議擴(kuò)大數(shù)據(jù)下載權(quán)限。關(guān)于數(shù)據(jù)更新和平臺調(diào)研的評論,其情感分析數(shù)值都處于0.65以上,而平臺調(diào)研分值基本處于0.8以上,表明用戶對這兩項(xiàng)服務(wù)的評論都趨向強(qiáng)烈的正面情感。武漢市政務(wù)公開數(shù)據(jù)服務(wù)網(wǎng)自2015年上線以來,數(shù)據(jù)持續(xù)更新,目前公開的數(shù)據(jù)和服務(wù)有2 700多項(xiàng);而針對高校、企業(yè)用戶的調(diào)研需求,平臺都能積極反饋,提供聯(lián)系方式,以滿足用戶的調(diào)研需求,通過情感分析能發(fā)現(xiàn)用戶對這兩項(xiàng)服務(wù)有較高滿意度。而關(guān)于網(wǎng)站優(yōu)化的評論,2015—2016年用戶基本趨向負(fù)面情感,由于平臺剛剛上線,會出現(xiàn)延遲、卡頓、服務(wù)器響應(yīng)失敗等問題,極大地影響用戶體驗(yàn);而武漢市政府通過不斷升級平臺系統(tǒng),積極向北京市、貴陽市等地方平臺學(xué)習(xí),優(yōu)化布局設(shè)計(jì)與功能模塊,2017年之后,用戶對網(wǎng)站優(yōu)化的評論都趨向正面情感。關(guān)于數(shù)據(jù)容量和數(shù)據(jù)接口的評論,情感分析數(shù)值基本處于0.5以下,受數(shù)據(jù)收集復(fù)雜度的影響,導(dǎo)致用戶獲取的部分?jǐn)?shù)據(jù)存在缺失和容量不足,同時(shí)用戶獲取數(shù)據(jù)的方式存在多樣性,而平臺提供的數(shù)據(jù)接口難以應(yīng)對需求,導(dǎo)致這兩項(xiàng)評論的情感值偏低。但武漢市政務(wù)公開數(shù)據(jù)服務(wù)網(wǎng)提供了12個(gè)主題數(shù)據(jù),涉及公共衛(wèi)生、醫(yī)療服務(wù)等多個(gè)方面,雖然主題覆蓋度仍需增加,但半數(shù)評論的情感值都呈現(xiàn)正面情感。對于可視化和APP應(yīng)用的評論情感值,都經(jīng)歷了從開始的負(fù)面情感到正面情感的過渡,體現(xiàn)網(wǎng)站在不斷優(yōu)化,以提升用戶滿意度。

      通過對9個(gè)主題下評論的情感分析,能夠發(fā)現(xiàn)用戶對政府開放數(shù)據(jù)平臺的情感變化,部分主題如下載權(quán)限、網(wǎng)站優(yōu)化、可視化、APP應(yīng)用等,在不同時(shí)間下,其情感差異較為顯著,經(jīng)歷了從負(fù)面情感向正面情感的轉(zhuǎn)變,體現(xiàn)了武漢市政務(wù)公開數(shù)據(jù)服務(wù)網(wǎng)在不斷提高用戶滿意度方面所做的努力。通過對情感數(shù)值較低的評價(jià)進(jìn)行統(tǒng)計(jì)分析,能夠探尋當(dāng)前平臺存在的不足,有利于及時(shí)抓住問題,為完善平臺的相關(guān)服務(wù)、優(yōu)化平臺提供決策支持,9個(gè)主題下評論的情感分析結(jié)果平均數(shù)值統(tǒng)計(jì)見表1。

      表1 9個(gè)評論主題情感分析結(jié)果平均數(shù)值統(tǒng)計(jì)

      分析可知,根據(jù)均值不同,將用戶評論的情感趨向分為3個(gè)狀態(tài):滿意(均值〉0.700)、一般(均值〉0.400)、不滿意。根據(jù)計(jì)算結(jié)果,處于滿意狀態(tài)的評論分類有數(shù)據(jù)更新、平臺調(diào)研;處于一般狀態(tài)的評論分類有數(shù)據(jù)全面性、可視化、APP應(yīng)用、網(wǎng)站優(yōu)化;處于不滿意狀態(tài)的評論分類有數(shù)據(jù)容量、數(shù)據(jù)接口、下載權(quán)限。根據(jù)評論分類的情感趨向劃分,結(jié)合每個(gè)分類的情感分析時(shí)間序列圖,能夠清晰地了解在某個(gè)評論分類下,每位用戶的情感趨向,根據(jù)情感分析結(jié)果均值探尋用戶整體滿意度,并結(jié)合極值點(diǎn),統(tǒng)計(jì)閱讀負(fù)面評論,明確用戶指向,快速定位政府?dāng)?shù)據(jù)開放平臺服務(wù)中存在的不足。從總體上看,情感趨向?yàn)闈M意狀態(tài)的評論分類,是對政府?dāng)?shù)據(jù)開放平臺服務(wù)工作的肯定,需要繼續(xù)堅(jiān)持和努力;而更為重要的是,需要重點(diǎn)關(guān)注情感趨向?yàn)橐话慊虿粷M意狀態(tài)的評論分類,通過分析,目前武漢市政府?dāng)?shù)據(jù)開放平臺主要存在4個(gè)需要改進(jìn)的方面:①數(shù)據(jù)容量過低,開放數(shù)據(jù)集主題覆蓋率不均衡,統(tǒng)計(jì)數(shù)據(jù)量較多但價(jià)值較低;②可視化動態(tài)展示內(nèi)容較為單一,APP覆蓋領(lǐng)域仍需豐富;③獲取數(shù)據(jù)門檻較高,數(shù)據(jù)接口較少,缺乏靈活性和便捷性;④平臺缺少個(gè)性化服務(wù),平臺之間缺乏互聯(lián)互通,智能化水平仍需提高。

      4.3 平臺優(yōu)化策略

      通過以上分析,根據(jù)武漢市政府?dāng)?shù)據(jù)開放平臺中存在的問題,從以下4個(gè)方面制定了有針對性的優(yōu)化策略,以提高平臺的服務(wù)能力,真正實(shí)現(xiàn)政府開放數(shù)據(jù)的價(jià)值增值。

      (1)培養(yǎng)“大數(shù)據(jù)”思維,加大數(shù)據(jù)開放力度。提高數(shù)據(jù)集質(zhì)量,減少統(tǒng)計(jì)數(shù)據(jù),多開放原始數(shù)據(jù),提供完整的數(shù)據(jù)字段;增加數(shù)據(jù)主題覆蓋面,鼓勵(lì)各部門提高數(shù)據(jù)開放的參與度,及時(shí)根據(jù)社會需求覆蓋相關(guān)主題;同時(shí),保持?jǐn)?shù)據(jù)可持續(xù)性更新,并將歷史上多個(gè)批次的數(shù)據(jù)留存供用戶獲取。

      (2)深化技術(shù)研發(fā),提高平臺工具的可利用性。充分考慮不同用戶群體的需求差異和使用體驗(yàn),提供更為豐富的可視化功能,動態(tài)展示多樣化的內(nèi)容,實(shí)現(xiàn)可視化工具與平臺數(shù)據(jù)的互聯(lián)互通;同時(shí),政府要發(fā)揮先鋒作用,充分利用物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)等技術(shù)平臺,挖掘社會大數(shù)據(jù),開發(fā)覆蓋多領(lǐng)域、全部門的APP應(yīng)用,并保持應(yīng)用版本的迭代更新,向公眾展示政府開放數(shù)據(jù)的內(nèi)在價(jià)值,方便群眾的同時(shí),進(jìn)一步密切市民與政府的關(guān)系,提升政府服務(wù)職能。

      (3)采取數(shù)據(jù)分級分類注冊的方式,提高數(shù)據(jù)接口開放率。不分?jǐn)?shù)據(jù)類型和用戶類型,數(shù)據(jù)獲取采用嚴(yán)格的注冊登錄方式,極大地影響用戶數(shù)據(jù)獲取和利用數(shù)據(jù)的體驗(yàn)感,增加用戶時(shí)間成本。因此,采取數(shù)據(jù)分級分類的注冊方式,設(shè)置普遍開放、依申請開放和有限開放的數(shù)據(jù)獲取門檻,降低多數(shù)用戶獲取數(shù)據(jù)的復(fù)雜度,以進(jìn)一步推進(jìn)數(shù)據(jù)開放的廣度和深度。同時(shí),平臺應(yīng)為每個(gè)數(shù)據(jù)集提供API接口,提升數(shù)據(jù)接口的開放率,降低數(shù)據(jù)獲取的權(quán)限,便于互聯(lián)網(wǎng)企業(yè)快速利用數(shù)據(jù),通過政府?dāng)?shù)據(jù)開放帶動創(chuàng)新發(fā)展,實(shí)現(xiàn)數(shù)據(jù)價(jià)值增值。

      (4)“個(gè)人中心”實(shí)現(xiàn)個(gè)性化整合,提高智能化服務(wù)水平。優(yōu)化平臺設(shè)計(jì),用戶“個(gè)人中心”應(yīng)實(shí)現(xiàn)各項(xiàng)服務(wù)的個(gè)性化整合,用戶通過自定義場景功能,實(shí)現(xiàn)個(gè)性化搜索、下載和分析,增強(qiáng)用戶使用體驗(yàn)。同時(shí),政府應(yīng)依托數(shù)據(jù)開放平臺實(shí)現(xiàn)向“數(shù)據(jù)治理”轉(zhuǎn)型,應(yīng)用大數(shù)據(jù)、云計(jì)算技術(shù),實(shí)現(xiàn)海量政府?dāng)?shù)據(jù)資源的互聯(lián)互通;通過人工智能、機(jī)器學(xué)習(xí)等手段,在平臺中為用戶提供個(gè)性化數(shù)據(jù)推薦、智能交互、精準(zhǔn)檢索等功能,提高信息處理能力,使數(shù)據(jù)價(jià)值得到充分體現(xiàn)。

      5 結(jié)語

      本文以武漢市政府?dāng)?shù)據(jù)開放平臺的用戶評論建議為實(shí)驗(yàn)數(shù)據(jù),融合LDA模型和深度神經(jīng)網(wǎng)絡(luò)進(jìn)行主題提取和文本分類,借助python的SnowNLP包進(jìn)行情感分析,并繪制情感分析時(shí)間序列圖,總結(jié)了武漢市政府?dāng)?shù)據(jù)開放平臺建立以來存在的問題,并提出了針對性建議。

      本文的研究價(jià)值在于,運(yùn)用主題模型認(rèn)知對象維度,利用主題模型,從1 000條用戶評論中提取出9個(gè)主題,明確政府?dāng)?shù)據(jù)開放平臺中用戶關(guān)注的服務(wù)及其存在的問題;并通過量化的手段將定性文字轉(zhuǎn)為用戶情感定量評價(jià),結(jié)合情感分析結(jié)果時(shí)間序列圖,對用戶評論進(jìn)行定量評估,通過縱向和橫向比較,明確用戶的服務(wù)滿意度變化;通過查閱用戶評論,及時(shí)定位痛點(diǎn),優(yōu)化服務(wù);通過機(jī)器學(xué)習(xí)對文本數(shù)據(jù)的挖掘和開發(fā),也會成為傳統(tǒng)統(tǒng)計(jì)調(diào)查的有益補(bǔ)充,二者結(jié)合將協(xié)助我們更客觀地理解問題并得到更科學(xué)的評估結(jié)果;更重要的是通過本文的實(shí)驗(yàn)過程,也為分析其他政府?dāng)?shù)據(jù)開放平臺提供一定的借鑒與參考,通過對用戶評論建議進(jìn)行情感分析,深度挖掘用戶數(shù)據(jù),為優(yōu)化政府?dāng)?shù)據(jù)開放平臺的建設(shè)提供幫助。

      需要說明的是,本文的研究僅以一個(gè)地方政府?dāng)?shù)據(jù)開放平臺為主,樣本較少,數(shù)據(jù)源有待進(jìn)一步擴(kuò)展豐富;在文本分類過程中,其建模效果受機(jī)器學(xué)習(xí)參數(shù)值的影響,合理性需要進(jìn)一步驗(yàn)證;另外,模型并沒有推廣實(shí)施,其適用性還有待進(jìn)一步確認(rèn),這些都會對本文結(jié)論產(chǎn)生一定影響,我們將在下一步的研究中進(jìn)行改進(jìn)。

      猜你喜歡
      開放平臺分類政府
      分類算一算
      基于在線開放平臺的混合式課堂教學(xué)模式構(gòu)建與實(shí)踐
      分類討論求坐標(biāo)
      知法犯法的政府副秘書長
      基于AliGenie語音開放平臺的傳統(tǒng)家居智聯(lián)網(wǎng)解決方案
      電子制作(2018年17期)2018-09-28 01:56:46
      數(shù)據(jù)分析中的分類討論
      教你一招:數(shù)的分類
      搭建開放平臺 收獲真情實(shí)感——談《品德與生活》教學(xué)中開放式教學(xué)的實(shí)施
      依靠政府,我們才能有所作為
      政府手里有三種工具
      伊通| 甘泉县| 大同市| 仪陇县| 绥宁县| 富源县| 临猗县| 南平市| 长丰县| 五华县| 迁西县| 无棣县| 横峰县| 马公市| 县级市| 安徽省| 锦州市| 无为县| 汉川市| 隆林| 清新县| 丹棱县| 漳浦县| 阳原县| 且末县| 田林县| 常山县| 勐海县| 柘城县| 吕梁市| 高州市| 洪江市| 大港区| 金川县| 普洱| 霍林郭勒市| 阿拉善左旗| 北京市| 秀山| 义乌市| 方正县|