• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      三種新型智能算法在疫情預警模型中的應用
      ——基于百度搜索指數(shù)的COVID-19疫情預警

      2021-04-23 04:33:32高鋮鋮陳錫程宋秋月伍亞舟
      計算機工程與應用 2021年8期
      關鍵詞:黏菌主題詞百度

      高鋮鋮,陳錫程,張 瑞,宋秋月,易 東,伍亞舟

      陸軍軍醫(yī)大學 軍事預防醫(yī)學系 軍隊衛(wèi)生統(tǒng)計學教研室,重慶400038

      2019 年12 月,湖北武漢地區(qū)爆發(fā)新型冠狀病毒性肺炎(Corona Virus Disease 2019,COVID-19)疫情,給我國經(jīng)濟社會造成巨大負面影響[1]。盡早知曉COVID-19的流行趨勢有利于更好地控制疾病的傳播與進展,進而降低其社會危害[2]。傳統(tǒng)的流行病監(jiān)測系統(tǒng)因數(shù)據(jù)來源和數(shù)據(jù)種類較為有限,對于新發(fā)性傳染病存在一定程度的報告延遲,無法提前對傳染病的發(fā)生進行有效預警[3]。近年來,利用網(wǎng)絡數(shù)據(jù)監(jiān)測公共衛(wèi)生事件的研究逐漸增多,常用的傳染病預警模型主要包括支持向量機、神經(jīng)網(wǎng)絡、多元線性回歸和時間序列法[4]。其中最小二乘支持向量機(Least Squares Support Veotor Machine,LSSVM)是根據(jù)基礎模型的改進優(yōu)化,已廣泛運用于各類預警系統(tǒng)[5-7]。實際應用時,LSSVM 核心參數(shù)的精確選取將直接影響其泛化性和稀疏性,也是目前LSSVM模型相關研究的重點之一[8-9]。

      LSSVM 模型參數(shù)選取傳統(tǒng)方法主要為經(jīng)驗法、試湊法、交叉驗證法等,但上述方法存在計算耗時長、代價大、準確度低等不足,因此很難達到實際應用要求[10]。近年來隨著人工智能領域的快速發(fā)展,多種新型智能優(yōu)化算法相繼發(fā)表,為預測模型的參數(shù)選取提供了新的思路。智能優(yōu)化算法無中心控制,有效增加了模型的魯棒性,且群體中的合作個體能力簡單,具有一定擴充性,大大提高了模型參數(shù)尋優(yōu)的速度和精確性,已成為人工智能研究領域的熱點之一[11]。

      因此,本研究利用百度指數(shù)及疫情數(shù)據(jù)分析網(wǎng)絡健康信息檢索數(shù)據(jù)與發(fā)病數(shù)據(jù)的相關性,構(gòu)建COVID-19的預警模型以指導疫情常態(tài)化防控。同時,利用多種新型智能優(yōu)化算法,分別對百度指數(shù)COVID-19預警模型進行參數(shù)尋優(yōu),對比各智能優(yōu)化算法的實際應用效果,為新型智能優(yōu)化算法的推廣應用提供一定的理論依據(jù)和分析策略。

      1 算法原理

      1.1 新型智能優(yōu)化算法

      1.1.1 多元宇宙優(yōu)化算法

      多元宇宙優(yōu)化算法(Multi-Verse Optimizer,MVO)是近年來提出的一種元啟發(fā)式優(yōu)化算法,其靈感源于多元宇宙的物理理論,依據(jù)白洞、黑洞及蟲洞等主要概念構(gòu)建數(shù)學模型,模擬宇宙中物質(zhì)通過蟲洞由白洞向黑洞轉(zhuǎn)移的思想[12]。MVO算法的優(yōu)勢在于注重全局尋優(yōu)效果,僅需調(diào)控較少參數(shù)即可達到實現(xiàn)效果,操作難度較低且性能較佳,當前已廣泛應用于壓力容器設計、焊接梁設計等經(jīng)典工程問題中[13-14]。

      MVO算法假定探索空間存在宇宙矩陣為:

      其中,d為變量個數(shù),n為宇宙數(shù)量(候選解)。

      圖1 MVO算法概念模型

      為提升宇宙通過蟲洞改善物體膨脹率的可能性,假設蟲洞隧道總是建立在宇宙和最優(yōu)宇宙間,此機制可表述為:

      其中,Xj代表目前最優(yōu)宇宙的第j個變量;ubj代表第j個變量的最高值;lbj代表第j個變量的最低值;xj i代表第k個宇宙的第j個變量;r2、r3、r4均代表0與1取值范圍的隨機數(shù)。上述機制中出現(xiàn)了蟲洞存在可能性(Wormhole Existence Probability,WEP)及旅程距離速率(Travelling Distance Rate,TDR)等兩個算法主要參數(shù),其隨時間(迭代次數(shù))變化曲線圖詳見圖2。

      圖2 MVO算法WEP及TDR參數(shù)變化趨勢

      1.1.2 黏菌優(yōu)化算法

      黏菌優(yōu)化算法(Slime Mould Algorithm,SMA)由Li等[15]于2020年提出,其靈感來自于黏菌的擴散和覓食行為,屬于元啟發(fā)算法。該算法與以往類似命名優(yōu)化算法有較大差異,主要模擬了黏菌在覓食過程中的行為和形態(tài)變化,而未對其完整生命周期進行建模。通過權(quán)值指標模擬黏菌靜脈狀管的形態(tài)變化和收縮模式之間的三種相關性[16]。

      黏菌覓食過程,首先根據(jù)空氣中氣味接近食物,食物濃度越高,生物振蕩器波越強,細胞質(zhì)流動越快,黏菌靜脈狀管越粗。通過函數(shù)表達模擬該其逼近行為:

      其中,LB與UB表示搜索范圍的上下邊界,vb的參數(shù)取值范圍是[-a,a],vc從1 線性減少至0。t表示當前迭代,Xb表示當前發(fā)現(xiàn)食物氣味濃度最高位置,X表示黏菌當前位置,XA和XB表示隨機選取的兩個黏菌位置,W表示黏菌重量,S(i)表示X的適應度,而DF表示所有迭代中的最佳適應度。其中,參數(shù)a的函數(shù)表達為:

      其中,max_t表示最大迭代次數(shù)。而W的表達式為:

      其中,condition 表示S(i)排在前一半的種群,r表示[0,1]區(qū)間內(nèi)的隨機值,bF表示在當前迭代過程中獲得的最優(yōu)適應度,wF表示當前迭代過程中得到的最差適應度值,SmellIndex表示適應度序列(最小值問題中為遞增序列)。

      公式(4)表示的黏菌逼近食物行為,搜索黏菌個體位置X可以根據(jù)目前獲得的XB最佳位置進行更新,同時vb、vc和W參數(shù)的微調(diào)可以改變黏菌位置。黏菌搜索個體在三維空間中的位置變化,可通過rand函數(shù)使個體形成任意角度的搜索向量,此概念同樣可擴展至更高維空間。

      1.1.3 平衡優(yōu)化算法

      平衡優(yōu)化算法(Equilibrium Optimizer,EO)由Faramarzi等[17]于2020年提出,屬于元啟發(fā)算法,其靈感來自于在控制體積上進行簡單混合的動態(tài)質(zhì)量平衡,其中使用質(zhì)量平衡方程來描述控制體積中非反應性成分的濃度。與大多數(shù)元啟發(fā)算法相似,EO 使用初始種群啟動優(yōu)化過程,初始濃度由粒子的數(shù)量、尺寸及在規(guī)定搜索空間內(nèi)進行均勻隨機初始化構(gòu)建,函數(shù)表達式如下:

      其中,Cinitiali是第i個粒子的初始濃度,Cmin和Cmax表示維數(shù)的最小值和最大值,rand是取值范圍[0,1]的隨機向量,n為總體粒子數(shù)。評估粒子的適應度函數(shù),然后將其排序確定平衡候選者。將5 個粒子確定為平衡候選者,并用于構(gòu)建一個平衡池向量,函數(shù)表達為:

      濃度更新規(guī)則中的另一項指標為指數(shù)項F,該指標的準確定義有助于EO算法在勘探與開發(fā)之間取得合理平衡,其函數(shù)表達為:

      其中,a1是控制勘探能力的恒定值,其值越高,算法的勘探能力越強,而開發(fā)性能就越弱,根據(jù)經(jīng)驗測試一般a1設為恒定值2,r是介于0 到1 之間的隨機向量。EO算法中最為重要的算法指標為生成速率(Generation rate)G,其通過改善開發(fā)階段來提供最為精確的解決方案,EO算法引入該指標后,更新規(guī)則如下:

      等式右邊第一項表示一個平衡濃度,而第二項和第三項則代表濃度的變化。第二項負責全局空間搜索尋優(yōu),第三項有助于使解決方案更加準確。濃度更新示意圖如圖3所示。

      1.2 最小二乘支持向量機

      最小二乘支持向量機是標準支持向量機模型的變型改進,其采用二次損失函數(shù)取代原先的不敏感損失函數(shù),從而將不等式約束問題轉(zhuǎn)化成等式約束問題,避免了二次規(guī)劃問題,可以有效提高模型運算求解速度,其具體方程表達式為:

      圖3 EO算法濃度更新示意圖

      其中,目標函數(shù)前一項確定了模型的泛化能力,后一項則對應精確性,γ是正則化參數(shù),為可調(diào)節(jié)參數(shù),可用于控制J(w,ξ),其中ξ=[ξ1,ξ2,…,ξn]T表示預測值與真實值的誤差,w表示高維平面的相應權(quán)值向量,而φ(xi)則用于將數(shù)據(jù)集映射至高維空間。模型引入Lagrange函數(shù)后可將w與ξ去除,最終用核函數(shù)形式表示矩陣方程并求解,得到?jīng)Q策函數(shù)為:

      其中,k(xi,x)為核函數(shù),常用的核函數(shù)包括多項式核函數(shù)、線性核函數(shù)、Sigmoid 核函數(shù)和徑向基核(Radial Basis Function,RBF)核函數(shù),由于RBF 核函數(shù)只需要確定一個關鍵參數(shù)σ,即可用最小代價發(fā)揮核函數(shù)性能,完成特征空間的線性可分。因此,本研究選用的核函數(shù)為徑向基核函數(shù):

      最小二乘支持向量機中有兩個關鍵參數(shù),分別為γ和σ,其中γ為正則化參數(shù),γ越大支持向量越大,從而影響模型訓練和預測的速度;另一個關鍵參數(shù)σ是RBF核函數(shù)的參數(shù),表示RBF 核函數(shù)的寬度,σ低易導致模型欠擬合,而σ高則容易過擬合。LSSVM 中所有數(shù)據(jù)對于決策函數(shù)皆有貢獻,并采用核函數(shù)映射而進行非線性變換,其相關參數(shù)都必須要求精確匹配,否則將影響其稀疏性和泛化性。本研究初始預警模型構(gòu)建時,設置關鍵參數(shù)為默認值,之后分別采用MVO、SMA和EO算法選擇參數(shù),核函數(shù)皆選擇RBF。

      2 百度搜索指數(shù)COVID-19預警模型構(gòu)建

      2.1 數(shù)據(jù)來源

      2.1.1 疫情數(shù)據(jù)

      本次研究中的COVID-19 每日確診病例數(shù)據(jù)均來源于國家衛(wèi)健委及各地區(qū)(納入31個省市區(qū)、不含港澳臺)衛(wèi)健委等官方渠道。每日全國新增確診數(shù)與國家衛(wèi)健委發(fā)布數(shù)據(jù)保持一致,其數(shù)據(jù)每日更新。因2月12日國家衛(wèi)健委頒發(fā)了《新型冠狀病毒感染的肺炎診療方案(試行第五版)》,將“臨床診斷病例”統(tǒng)計為確診病例,因此當日新增14 840 例確診病例,屬于異常值,因此數(shù)據(jù)選取2020年2月13日始至2020年11月1日止。

      2.1.2 百度指數(shù)

      本次研究的網(wǎng)絡數(shù)據(jù)來源于百度搜索指數(shù)(http://index.baidu.com/)。百度指數(shù)是基于大量用戶檢索行為數(shù)據(jù)的共享平臺,以用戶檢索量為基礎、主題詞為統(tǒng)計對象,利用系統(tǒng)算法對各主題詞在搜索引擎中被檢索次數(shù)進行加權(quán)求和。

      2.2 主題詞篩選

      2.2.1 初步搜集

      主題詞的初步搜集方法包括經(jīng)驗搜集法、技術(shù)搜集法及范圍搜集法[18]。本次研究選取范圍搜集法,其關鍵在于在篩選分析之前先依據(jù)經(jīng)驗確定主題詞的選擇范圍,有利于在規(guī)避主題詞遺漏的同時降低工作量。依據(jù)機體的發(fā)病階段將主題詞分為預防、癥狀、治療及名稱類等,此外還利用百度自帶的主題詞推薦功能進行詞匯擴充,盡可能確保初步搜集的完整性,最終構(gòu)建初步主題詞表(20個主題詞),詳見表1。

      表1 COVID-19初步主題詞表

      2.2.2 互相關分析

      互相關分析指利用互相關系數(shù)r對兩個不同時間序列間的相關程度進行評估的方法,包括相關性分析及先行性分析。其實施方法為將被選指標相較于基礎指標進行前后移動,然后對移動后序列及基準序列求相關系數(shù),相關系數(shù)最大時所對應的移動時間即為該指標先行或延后的時間段。公式如下:

      其中,y(i)代表基線指標,x(i)代表相對指標,其中i=1,2,…,n,d表示延遲數(shù),取正數(shù)時表示相對指標x(i)向后移動,取負數(shù)時相對指標x(i)向前移動。本研究中對疫情每日新增病例數(shù)與百度指數(shù)進行互相關分析,由于百度指數(shù)每日公布前一日統(tǒng)計數(shù)據(jù),而作為預警模型的主要變量,需要至少提前2 天才具有實際應用價值,因此分別計算先行2至7天(疫情數(shù)據(jù)相對滯后2至7天)初選主題詞與疫情數(shù)據(jù)的相關系數(shù)r,再在得到的多個相關系數(shù)(要求具有統(tǒng)計學意義)中找出最大值,最終獲取16個主題詞(表2,標記有“*”或“**”號),具體包括先行2 天的主題詞“新冠病毒”“新冠肺炎”“2019-nCoV/COVID-19”及“頭疼”,先行3天的主題詞“呼吸道感染”,先行5 天的主題詞“退燒藥”,先行6 天的主題詞“新型冠狀病毒”“體溫”“發(fā)熱”“口罩”“體溫計”“核酸檢測”“消毒劑”“疫情防控”“新冠疫苗”及“抗病毒藥物”。

      2.3 COVID-19預警模型構(gòu)建

      2.3.1 數(shù)據(jù)預處理

      因數(shù)據(jù)間數(shù)量級或量綱間存在差異,為確保量級較小的數(shù)據(jù)不會被掩蓋與忽略,需在建模前對數(shù)據(jù)行歸一化處理;公式如下:

      其中,xi代表歸一化前各因素的輸入值;x'i代表歸一化后各因素的輸入值;xmax代表各因素的最大值;xmin代表各因素的最小值。以每日新增確診病例數(shù)(2020-02-13—2020-11-01)為因變量,自變量則依次選取歸一化處理后的各有效先行主題詞的百度指數(shù);共有263 組數(shù)據(jù),隨機抽取80%作為訓練數(shù)據(jù)集(210組),剩下20%留做驗證數(shù)據(jù)集(53組)。

      2.3.2 LSSVM預警模型構(gòu)建

      采用訓練集(210 組)數(shù)據(jù)進行模型構(gòu)建,使用MATLAB 中的lssvm 工具箱,參數(shù)設置默認值:正則化參數(shù)γ=2,RBF核寬度σ=3。最終構(gòu)建模型均方誤差MSE=8.796 5,平均絕對誤差MAE=43.584 5,均方根誤差RMSE=127.472 8,決定系數(shù)R2=0.918 3,各項指標結(jié)果表明模型擬合訓練集數(shù)據(jù)情況較好(圖4)。

      圖4 LSSVM模型訓練集真實值與預測值對比

      2.3.3 預測性能評價

      提取測試數(shù)據(jù)集(53組),代入已經(jīng)構(gòu)建好的訓練集LSSVM 預警模型,最終模型誤差分析結(jié)果:MSE=47.16,MAE=124.16,RMSE=343.35,R2=0.12,結(jié)果表明該模型的預測性能較低。模型測試集預測值與真實值對比情況詳見圖5。

      3 新型智能算法優(yōu)化預警模型

      3.1 預警模型參數(shù)尋優(yōu)過程對比

      分別選用MVO、SMA 和EO 三種新型智能算法優(yōu)化LSSVM模型,各智能優(yōu)化算法的關鍵參數(shù)設置如表3所示,目標函數(shù)皆定為求不同迭代次數(shù)訓練集(歸一化處理后)均方誤差MSE 的最小值,而MVO 算法將MSE設置為宇宙膨脹率,SMA 將MSE 設置為黏菌位置的適應度,EO算法將MSE設置為粒子濃度的適應度。LSSVM模型參數(shù)尋優(yōu)迭代收斂過程如圖6 所示,結(jié)果表明,MVO 和EO 算法在迭代初期迅速收斂,而SMA 算法收斂速度較慢,表明SMA 的全局搜索能力較MVO 和EO較弱,SMA 陷入局部最優(yōu)的風險更大。MVO、SMA 和EO 三種優(yōu)化算法尋優(yōu)50 次迭代耗時分別為44.25 s、45.11 s、89.75 s,結(jié)果表明EO算法的運算效率低于MVO和SMA算法。

      表2 新增病例數(shù)與主題詞百度指數(shù)的相關系數(shù)

      圖5 LSSVM模型測試集真實值與預測值對比

      表3 各智能優(yōu)化算法關鍵參數(shù)設置及迭代耗時

      3.2 模型預測性能對比

      三種智能優(yōu)化算法優(yōu)化LSSVM預警模型、MVO與EO 算法最終輸出相同的模型參數(shù),預測性能對比結(jié)果如表4所示。結(jié)果表明:三種模型對于訓練集和測試集擬合情況相近,測試集的誤差分析和擬合情況較優(yōu)化前皆有顯著提升,三種智能優(yōu)化算法皆提升了LSSVM 疫情預警模型的預測性能。圖7 展示了MVO-LSSVM 模型的真實值和預測值的擬合情況。

      圖6 不同算法優(yōu)化LSSVM模型收斂曲線

      圖7 MVO-LSSVM預警模型真實值與預測值對比

      4 討論

      4.1 元啟發(fā)式算法研究分析

      元啟發(fā)算法是在仿生學的啟發(fā)下,從自然界的隨機現(xiàn)象中收獲靈感,并將局部算法與隨機算法相結(jié)合的算法統(tǒng)稱[19]。其是在啟發(fā)算法的基礎上進行的改進,雖然二者皆不能完全保證得到全局最優(yōu)解,但元啟發(fā)算法中引入了隨機因素,更不易陷入局部最優(yōu),同時其目標函數(shù)無特殊要求,具有更廣泛應用范圍,已成為目前最優(yōu)化問題求解、模型參數(shù)尋優(yōu)等研究中的熱點[20]。

      表4 不同算法優(yōu)化LSSVM模型預測性能對比

      據(jù)最新研究統(tǒng)計,目前,元啟發(fā)算法已提出超過150多種,但大多數(shù)算法僅對部分特定問題具有較好優(yōu)化效果,尚未發(fā)現(xiàn)某元啟發(fā)算法能夠勝任所有的優(yōu)化問題[21]。元啟發(fā)算法根據(jù)受啟發(fā)機制差異,大致可分為模仿生物學過程與基于物理學理論兩大類,本研究選擇的三種新型智能算法,SMA 模仿了黏菌生物學過程,而MVO 和EO 為基于物理學理論的元啟發(fā)算法。元啟發(fā)算法的設計與改進重點,應為平衡好集中式挖掘與多樣化探索之間的關系。集中式挖掘便于算法在某區(qū)域內(nèi)根據(jù)經(jīng)驗快速、準確尋出最優(yōu),但易導致算法陷入局部最優(yōu);多樣化探索可允許算法在較大可行域內(nèi)探索,避免陷入局部最優(yōu),但易導致算法耗時延長,獲取最優(yōu)解精度下降。因此,如何平衡好集中式挖掘與多樣化探索之間的關系,是目前元啟發(fā)式算法開發(fā)、改進的關鍵。

      4.2 三種智能優(yōu)化算法對比

      本研究構(gòu)建的百度搜索指數(shù)COVID-19 預警模型中,引入了三種新型智能優(yōu)化算法進行模型參數(shù)尋優(yōu)對比。各優(yōu)化算法的算法結(jié)構(gòu)、計算過程和研究特性皆有其各自特點,相同標準參數(shù)設置時,根據(jù)尋優(yōu)過程和最終模型預測性能對比結(jié)果,可得出以下結(jié)論:

      (1)EO 算法收斂性強,但算法的尋優(yōu)耗時較長,運算效率較MVO和SMA算法低,對于復雜和實效性要求高的體系,EO算法優(yōu)勢較低。EO算法將粒子濃度作為搜索代理,濃度隨機更新以適應平衡候選,這種隨機更新濃度的模式可以有效提升EO算法初始迭代的全局探索能力,從而避免其在整個優(yōu)化過程中陷入局部最優(yōu)解[17]。本次研究,EO算法的收斂效果較好,但實際應用時應注意規(guī)避其運算時間較長的問題,可通過設置目標函數(shù)尋優(yōu)閾值,減少實際迭代次數(shù),從而達到提升算法的運算效率的目的。

      (2)SMA優(yōu)化算法,收斂性較差,收斂速度較慢,表明其全局搜索能力較弱,陷入局部最優(yōu)的風險更大。分析認為,該算法是一種基于黏菌的擴散和覓食行為的智能優(yōu)化算法,但該算法為了提高其可擴展性,算法開發(fā)過程使用了較為簡單的算法原理,未來可利用各類變異機制或加速機制增強算法的全局探索能力[15]。

      (3)MVO優(yōu)化算法,運算效率短,收斂性速度快,收斂性強,最終構(gòu)建的MVO-LSSVM 模型預測精度和穩(wěn)定性皆較好,表明MVO 算法更適合解決此類優(yōu)化問題。分析認為,該結(jié)果與MVO 算法原理更加注重全局尋優(yōu)效果有關,僅需調(diào)控較少參數(shù)即可達到實現(xiàn)效果,從而表現(xiàn)出了更優(yōu)異的性能[12-13]。

      4.3 預警模型推廣應用價值

      本研究構(gòu)建的MVO-LSSVM 預警模型,具有較高的預測精度和穩(wěn)定性,具備一定的實際推廣應用價值。同時,在預警模型構(gòu)建階段充分考慮了實現(xiàn)的簡便性及預測的準確性,旨在用簡潔、可行的操作實現(xiàn)對疫情的準確預警。既往研究中還曾提及多種改善檢索數(shù)據(jù)準確性的方案,包括還原百度指數(shù)的原始檢索數(shù)據(jù)進而構(gòu)建模型[22]、針對各地區(qū)進行各自建模以規(guī)避地區(qū)因素的影響[23]、利用語義分析技術(shù)進而深入探究用戶檢索動機等[24]。但以上方法均需要復雜的實施過程、極大程度地耗費時間精力,且對于其能否有效提升檢索數(shù)據(jù)的準確性尚無明確有效的研究支撐。本次研究的重點在于主題詞的搜集、篩選,確定相關性、先行性好的主題詞,進而構(gòu)建預警模型。因此,本次研究一方面實現(xiàn)了模型構(gòu)建的簡易性,另一方面確保了模型的預測能力,可為后續(xù)疫情常態(tài)化防控階段的防疫行為預判提供一定參考。

      4.4 研究不足與展望

      4.4.1 智能算法優(yōu)化模型方面

      本研究選取的MVO、SMA 和EO 算法皆為近年來新提出的智能優(yōu)化算法,相關的應用研究報道較少,單從本次研究結(jié)果分析,MVO 算法優(yōu)勢明顯。但本次研究的對比結(jié)果是否具有代表性,尚需后期多種形式應用研究的證實。隨著人工智能技術(shù)的深入發(fā)展,會有更多趨于完善的智能優(yōu)化算法提出,而如何避免陷入局部最優(yōu)解問題是未來智能算法重點需要解決的問題,同時需要警惕算法早熟的現(xiàn)象。

      4.4.2 數(shù)據(jù)來源方面

      隨著互聯(lián)網(wǎng)的多樣性發(fā)展,目前微博、微信等多家公司均已推出了自身的搜索平臺,雖然目前百度仍是目前國內(nèi)最大的搜索引擎,但其無法完整反映國內(nèi)的檢索需求。而百度指數(shù)僅是對于百度搜索平臺檢索量的間接性評價,無法獲取二者間的精確數(shù)量關系,亦無法評價用戶直接瀏覽、參與主題詞相關內(nèi)容的頻次。此外,歷史數(shù)據(jù)可能對于檢索數(shù)據(jù)具有較好的互補作用,若將檢索數(shù)據(jù)構(gòu)建的預警模型與歷史發(fā)病數(shù)據(jù)結(jié)合,可能獲取效果更好的綜合模型[25];但COVID-19 疫情為首次爆發(fā),無法利用其發(fā)病的歷史數(shù)據(jù)對模型進行修正及完善,限制了模型預警效能的進一步提升。

      后期研究展望:(1)整合各主流搜索平臺的檢索數(shù)據(jù),對于國內(nèi)用戶的實際檢索數(shù)據(jù)進行全面性、綜合性評價;(2)將單純檢索行為向瀏覽、參與等多樣化行為擴充,納入更多的相關性信息。

      4.4.3 主題詞選取方面

      主題詞的選擇主要依據(jù)主觀經(jīng)驗及相關聯(lián)想,不可避免地存在相關主題詞的遺漏。此外,部分主觀上認為COVID-19 存在相關性的主題詞可能出現(xiàn)百度指數(shù)過低,甚至未被收錄為百度指數(shù),因此個體認知與公眾關注點可能存在一定偏差。技術(shù)選詞法有利于提升選擇精度,但其對于時間、精力、經(jīng)濟水平及設備條件等方面的要求較高,限制了其應用于推廣[26]。此外,本文所選主題詞僅可代表2020年2月—11月間的用戶檢索行為,是否依然適用于長期后續(xù)結(jié)果仍尚需要進一步分析。隨著用戶信息需要及檢索偏好的改變,后續(xù)應適度改變主題詞以繼續(xù)確保檢索數(shù)據(jù)與疫情數(shù)據(jù)間的相關性。

      猜你喜歡
      黏菌主題詞百度
      養(yǎng)黏菌當寵物,對身體有害嗎
      黏菌觀察記
      養(yǎng)群黏菌當寵物
      Robust adaptive UKF based on SVR for inertial based integrated navigation
      黏菌一點不簡單
      華夏地理(2019年2期)2019-07-24 10:05:57
      百度年度熱搜榜
      青年與社會(2018年2期)2018-01-25 15:37:06
      百度遭投行下調(diào)評級
      IT時代周刊(2015年8期)2015-11-11 05:50:22
      我校學報第32卷第5期(2014年10月)平均每篇有3.04個21世紀的Ei主題詞
      我校學報第32卷第6期(2014年12月)平均每篇有3.00個21世紀的Ei主題詞
      2014年第16卷第1~4期主題詞索引
      江城| 淮滨县| 桂阳县| 太湖县| 湘潭市| 哈巴河县| 偏关县| 丰镇市| 远安县| 龙山县| 抚顺市| 镇原县| 航空| 安西县| 营山县| 东辽县| 班戈县| 古田县| 光山县| 嘉义县| 社旗县| 无锡市| 舞阳县| 南京市| 辽宁省| 乐安县| 元谋县| 招远市| 屯昌县| 秦皇岛市| 永济市| 高淳县| 富裕县| 霍林郭勒市| 和平区| 将乐县| 翼城县| 浮山县| 长阳| 沾益县| 遵义县|