交通運(yùn)輸部科學(xué)研究院 張蕊
智能搜索系統(tǒng)是政府網(wǎng)站賦能數(shù)字政府的重要手段,交通運(yùn)輸部政府網(wǎng)站充分利用智能搜索技術(shù),建立了“交通智搜”系統(tǒng),提供了范圍更廣泛、功能更實(shí)用、結(jié)果更準(zhǔn)確的搜索服務(wù)。
2022 年,《國(guó)務(wù)院關(guān)于加強(qiáng)數(shù)字政府建設(shè)的指導(dǎo)意見(jiàn)》(國(guó)發(fā)〔2022〕14 號(hào))正式印發(fā),《意見(jiàn)》指出:到2035 年,與國(guó)家治理體系和治理能力現(xiàn)代化相適應(yīng)的數(shù)字政府體系框架更加成熟完備,整體協(xié)同、敏捷高效、智能精準(zhǔn)、開(kāi)放透明、公平普惠的數(shù)字政府基本建成,為基本實(shí)現(xiàn)社會(huì)主義現(xiàn)代化提供有力支撐[1]。
數(shù)字政府建設(shè)需要通過(guò)對(duì)政府?dāng)?shù)據(jù)進(jìn)行挖掘、分析、融合、共享、開(kāi)發(fā)、利用,以消除數(shù)字鴻溝,實(shí)現(xiàn)各業(yè)務(wù)領(lǐng)域的互聯(lián)互通、協(xié)同聯(lián)動(dòng),促進(jìn)政府治理革新,推進(jìn)服務(wù)流程優(yōu)化,而數(shù)字政府的對(duì)外展示、對(duì)外服務(wù)需要依托政府網(wǎng)站。
黨的十八大以來(lái),在政府網(wǎng)站與政務(wù)新媒體檢查、政府網(wǎng)站績(jī)效評(píng)估等一系列“以評(píng)促建”活動(dòng)的推動(dòng)下,政府網(wǎng)站建設(shè)工作取得了積極進(jìn)展,網(wǎng)站建設(shè)規(guī)范、內(nèi)容豐富詳實(shí)、功能便捷完善、互動(dòng)暢通及時(shí),為數(shù)字政府提供了良好的展現(xiàn)平臺(tái)。智能搜索系統(tǒng)的建設(shè),不僅可以精準(zhǔn)定位信息和服務(wù),實(shí)現(xiàn)“搜索即服務(wù)”,同時(shí)也賦能數(shù)字政府的“敏捷高效、智能精準(zhǔn)”服務(wù)。
近些年,依據(jù)《國(guó)務(wù)院辦公廳關(guān)于印發(fā)“互聯(lián)網(wǎng)+政務(wù)服務(wù)”技術(shù)體系建設(shè)指南的通知》(國(guó)辦函[2016]108號(hào))和《國(guó)務(wù)院辦公廳關(guān)于印發(fā)政府網(wǎng)站發(fā)展指引的通知》(國(guó)辦發(fā)[2017]47 號(hào))提出的優(yōu)化政府網(wǎng)站搜索功能,開(kāi)發(fā)模糊搜索、目錄搜索[2]、拼音轉(zhuǎn)化搜索、通俗語(yǔ)言搜索、服務(wù)事項(xiàng)和辦事指南搜索、關(guān)鍵詞推薦、辦事進(jìn)度和信件回復(fù)情況查詢(xún)、錯(cuò)別字自動(dòng)糾正、搜索結(jié)果排序、多維度分類(lèi)展現(xiàn)、聚合相關(guān)信息和服務(wù)等功能,實(shí)現(xiàn)“搜索即服務(wù)”[3]的要求,交通運(yùn)輸部積極推進(jìn)智能化搜索系統(tǒng)建設(shè),開(kāi)展集約化搜索應(yīng)用,本著統(tǒng)一性、實(shí)用性、安全性、先進(jìn)性、規(guī)范性、開(kāi)放性的原則,不斷升級(jí)“交通智搜”系統(tǒng),擴(kuò)大搜索范圍,提升搜索結(jié)果準(zhǔn)確性,豐富搜索結(jié)果展現(xiàn)形式,使用戶(hù)可以方便快捷地在交通運(yùn)輸部政府網(wǎng)站查找所需信息和服務(wù)內(nèi)容,政府的對(duì)外服務(wù)形象得到了顯著提高。
“交通智搜”系統(tǒng)通過(guò)構(gòu)建集約化搜索引擎應(yīng)用平臺(tái)(如圖1 所示)提供交通運(yùn)輸行業(yè)政府網(wǎng)站跨站點(diǎn)信息搜索服務(wù),搜索引擎與內(nèi)容管理系統(tǒng)之間通過(guò)數(shù)據(jù)接口進(jìn)行信息數(shù)據(jù)傳遞、維護(hù)、更新,網(wǎng)站信息經(jīng)分析、處理后索引進(jìn)入集約化搜索引擎平臺(tái),保障網(wǎng)站信息與搜索信息的及時(shí)同步與一致性。
圖1 交通運(yùn)輸部集約化智能搜索平臺(tái)Fig.1 Intensive intelligent search platform of ministry of transport
目前,“交通智搜”的搜索范圍涵蓋了交通運(yùn)輸部政府網(wǎng)站群(含門(mén)戶(hù)網(wǎng)站、子站)的全部信息、辦事服務(wù)和互動(dòng)服務(wù)內(nèi)容、微信公眾號(hào)以及交通運(yùn)輸部海事局、長(zhǎng)江航務(wù)管理局、珠江航務(wù)管理局、直屬海事機(jī)構(gòu)和地方交通運(yùn)輸主管部門(mén)的政府信息公開(kāi)內(nèi)容,實(shí)現(xiàn)了全行業(yè)政策信息的一站式搜索。
“交通智搜”系統(tǒng)總體技術(shù)架構(gòu)結(jié)構(gòu)分為:基礎(chǔ)設(shè)施層、信息資源層、接口層、搜索應(yīng)用支撐層和搜索功能層,各層通過(guò)相應(yīng)的技術(shù)接口進(jìn)行參數(shù)與數(shù)據(jù)、命令的傳遞。
信息資源層與搜索應(yīng)用支撐層之間通過(guò)XML/Web Service 技術(shù)進(jìn)行網(wǎng)站信息(包括:ID、更新標(biāo)志、時(shí)間、內(nèi)容等)的數(shù)據(jù)傳遞、維護(hù)與更新,并完成索引工作,保障搜索信息與發(fā)布信息的及時(shí)同步與一致性,更新頻率可以根據(jù)業(yè)務(wù)需要自定義(分鐘、小時(shí))等。
搜索應(yīng)用支撐層與搜索功能層之間通過(guò)HTTP/XML技術(shù)進(jìn)行請(qǐng)求提交與數(shù)據(jù)交換,通過(guò)JSON/XML 獲得返回的結(jié)果數(shù)據(jù)并包裝成業(yè)務(wù)結(jié)果返回給用戶(hù)。即互聯(lián)網(wǎng)用戶(hù)通過(guò)門(mén)戶(hù)網(wǎng)站搜索框提交搜索請(qǐng)求后,搜索條件傳遞到集約化智能搜索應(yīng)用中,搜索應(yīng)用將轉(zhuǎn)化后的請(qǐng)求傳遞到分布式搜索引擎中,通過(guò)索引庫(kù)的搜索返回相關(guān)的結(jié)果列表。
“交通智搜”系統(tǒng)采用分布式控制系統(tǒng)應(yīng)對(duì)交通運(yùn)輸部政府網(wǎng)站群大數(shù)據(jù)量、高并發(fā)、高性能、高可用性的應(yīng)用需求,保證系統(tǒng)的容災(zāi)備份、故障切換和負(fù)載均衡。其主要組成模塊包括以下幾個(gè)部分:
(1)分布式請(qǐng)求服務(wù)器:使用加權(quán)算法將請(qǐng)求轉(zhuǎn)發(fā)至不同的智能搜索引擎系統(tǒng)上,實(shí)現(xiàn)容災(zāi)備份和負(fù)載均衡。
(2)分布式索引服務(wù)器:將文檔分別索引至不同的智能搜索引擎系統(tǒng)中,實(shí)現(xiàn)故障切換和負(fù)載均衡。
(3)分布式管理服務(wù)器:為智能搜索引擎系統(tǒng)各模塊提供關(guān)鍵的維護(hù)、管理、控制和監(jiān)測(cè)功能,采用統(tǒng)一的方式從中央位置與所有智能搜索引擎系統(tǒng)服務(wù)進(jìn)行通訊。
為提高搜索引擎的響應(yīng)速度,“交通智搜”系統(tǒng)根據(jù)信息源的范圍,為網(wǎng)站群設(shè)計(jì)多個(gè)索引庫(kù)(即每個(gè)站點(diǎn)一個(gè)索引庫(kù))來(lái)分散搜索引擎的搜索壓力。
針對(duì)具體的搜索應(yīng)用,“交通智搜”系統(tǒng)根據(jù)搜索數(shù)據(jù)的特點(diǎn),采用合理冗余的索引字段設(shè)計(jì)方式,提高搜索引擎響應(yīng)時(shí)間。例如,日期字段2008-01-09,在索引庫(kù)中存儲(chǔ)時(shí),設(shè)計(jì)為:
年:2008
月:2008-01
日:2008-01-09
雖然這種設(shè)計(jì)會(huì)導(dǎo)致索引空間膨脹,但可以提高搜索速度,符合索引系統(tǒng)空間換時(shí)間的理念。
通常情況下,在某一時(shí)間段內(nèi),80%的用戶(hù)搜索請(qǐng)求會(huì)集中于某些特定內(nèi)容,在搜索引擎收到相同或相似的搜索請(qǐng)求時(shí),“交通智搜”系統(tǒng)合理采用搜索緩存技術(shù)緩存上個(gè)用戶(hù)的搜索結(jié)果,以減少服務(wù)器負(fù)載及快速返回搜索結(jié)果。
依據(jù)上述合理的技術(shù)應(yīng)用與數(shù)據(jù)庫(kù)設(shè)計(jì),交通運(yùn)輸部政府網(wǎng)站在日均頁(yè)面搜索量約1.5 萬(wàn)的情況下,搜索結(jié)果仍可以快速反饋,服務(wù)穩(wěn)定可靠。
“交通智搜”系統(tǒng)不僅搜索范圍廣泛、響應(yīng)速度快速,其搜索方式和搜索結(jié)果展示也滿(mǎn)足了用戶(hù)多樣化的需求。
系統(tǒng)提供了普通搜索、高級(jí)搜索、二次搜索(如圖2所示)等搜索方式。
圖2 普通搜索和二次搜索Fig.2 General search and secondary search
(1)普通搜索,用戶(hù)僅需輸入搜索詞,點(diǎn)擊搜索按鈕,即可得到相關(guān)的搜索結(jié)果;
(2)高級(jí)搜索,可以對(duì)關(guān)鍵詞、文檔格式、時(shí)間范圍、排序方式、搜索位置等進(jìn)行設(shè)置;
(3)二次搜索:在第一次搜索的搜索詞后空一格,并繼續(xù)輸入二次搜索的搜索詞,即可對(duì)包含某一搜索詞的信息數(shù)據(jù)進(jìn)行二次搜索,二次搜索的次數(shù)不限,直至搜索到目標(biāo)信息。
系統(tǒng)建立了停用詞、全拼、大眾詞匯、同義詞、行業(yè)相關(guān)主題詞、部門(mén)領(lǐng)導(dǎo)人、內(nèi)設(shè)機(jī)構(gòu)名稱(chēng)、直屬機(jī)構(gòu)名稱(chēng)、行業(yè)相關(guān)長(zhǎng)尾關(guān)鍵詞、辦事事項(xiàng)、政策、問(wèn)題等詞典,與網(wǎng)站內(nèi)容管理系統(tǒng)對(duì)接,全面提升搜索詞的準(zhǔn)確性以及網(wǎng)站自查和校對(duì)能力,針對(duì)不同的搜索需求,提供了拼音搜索、模糊搜索等,用戶(hù)輸入拼音、同/近義詞、大眾詞匯后,系統(tǒng)會(huì)對(duì)相關(guān)搜索詞進(jìn)行提示、智能糾錯(cuò),還會(huì)推薦其他相關(guān)搜索。
(1)拼音搜索:系統(tǒng)基于漢字注音技術(shù)和多音排歧技術(shù),在大量拼音語(yǔ)料基礎(chǔ)上,統(tǒng)計(jì)漢字串的分布規(guī)律、拼音串的分布規(guī)律等,形成了基于上下文的注音算法技術(shù),保證了注音的準(zhǔn)確性。當(dāng)用戶(hù)只輸入拼音時(shí),系統(tǒng)可推薦相關(guān)的搜索詞匯,完成搜索。例如,用戶(hù)輸入拼音“jiazhao”,系統(tǒng)會(huì)返回含有“駕照”和“機(jī)動(dòng)車(chē)駕駛證”兩個(gè)相關(guān)搜索詞的搜索結(jié)果。
(2)大眾詞匯搜索:系統(tǒng)將白話文/大眾詞匯與專(zhuān)有詞匯、專(zhuān)業(yè)術(shù)語(yǔ)一一對(duì)應(yīng),建立了大眾詞匯庫(kù),通過(guò)詞庫(kù)匹配將其轉(zhuǎn)換為網(wǎng)站中的專(zhuān)業(yè)術(shù)語(yǔ)或準(zhǔn)確表述,并返回相關(guān)搜索結(jié)果。例如,用戶(hù)輸入“駕照”時(shí),系統(tǒng)會(huì)提示“您是不是要搜索機(jī)動(dòng)車(chē)駕駛證或僅搜駕照”,并返回與“駕照”和“機(jī)動(dòng)車(chē)駕駛證”相關(guān)的信息。
(3)模糊搜索:系統(tǒng)建立了同義詞庫(kù),用戶(hù)輸入的搜索詞有同義詞時(shí),系統(tǒng)會(huì)自動(dòng)按照同義詞進(jìn)行模糊搜索,并返回相關(guān)搜索結(jié)果。例如,用戶(hù)輸入“交費(fèi)”時(shí),系統(tǒng)會(huì)反饋含有“繳費(fèi)”和“交費(fèi)”的相關(guān)信息,得到較全面的搜索結(jié)果。
(4)智能糾錯(cuò):對(duì)于經(jīng)常性輸入錯(cuò)誤的詞語(yǔ),系統(tǒng)會(huì)提示按正確詞語(yǔ)作為搜索詞進(jìn)行搜索,以減少重復(fù)輸入操作。例如,用戶(hù)輸入“簡(jiǎn)歷工程師”就可以得到“監(jiān)理工程師”相關(guān)的結(jié)果。
(5)搜索詞推薦:由于用戶(hù)使用的搜索詞不準(zhǔn)確,往往不能得到想要的結(jié)果,系統(tǒng)會(huì)在用戶(hù)每次搜索時(shí),依據(jù)相關(guān)度算法,自動(dòng)分析出一系列相似或相關(guān)搜索詞,并在頁(yè)面下方按照搜索熱度進(jìn)行推薦,點(diǎn)擊新搜索詞即可完成相關(guān)搜索。例如,用戶(hù)輸入“旅游”后,系統(tǒng)會(huì)在搜索結(jié)果列表下方自動(dòng)推薦“旅游法、云南旅游、旅游公路標(biāo)準(zhǔn)”等相關(guān)搜索詞。
(6)熱搜詞推薦:系統(tǒng)可根據(jù)用戶(hù)搜索頻率統(tǒng)計(jì)熱門(mén)搜索詞的排名,并在搜索框下推薦熱搜詞,用戶(hù)可以直接點(diǎn)擊熱搜詞進(jìn)行搜索。
(1)分類(lèi)展示:用戶(hù)可選擇信息所在板塊(包括交通運(yùn)輸部門(mén)戶(hù)、政策、新聞、服務(wù)、數(shù)據(jù)、互動(dòng)、微信、圖片等)和信息來(lái)源(含子站、部管政府網(wǎng)站和地方交通運(yùn)輸主管部門(mén)網(wǎng)站)對(duì)搜索結(jié)果進(jìn)行分類(lèi)展示。
(2)自定義排序:用戶(hù)可按照相關(guān)度、更新時(shí)間等自定義搜索結(jié)果的排序方式。
(3)縮小搜索結(jié)果的顯示范圍:用戶(hù)可通過(guò)設(shè)置搜索詞所在位置(如全文、標(biāo)題)、信息的附件類(lèi)型、更新時(shí)間等進(jìn)一步縮小搜索結(jié)果范圍。
系統(tǒng)可根據(jù)用戶(hù)的搜索詞,在搜索框的下拉框中或搜索結(jié)果列表的右側(cè)按照信息所在板塊智能分類(lèi)提示相關(guān)搜索結(jié)果(如圖3、圖4 所示)。
圖3 下拉框搜索結(jié)果推薦Fig.3 Drop-down search results recommendation
圖4 搜索結(jié)果列表右側(cè)智能推薦Fig.4 Smart recommendations to the right of the search results list
強(qiáng)大的統(tǒng)計(jì)分析功能是智能搜索賦能數(shù)字政府建設(shè)的一個(gè)重要表現(xiàn)。系統(tǒng)可進(jìn)行可靠即時(shí)地搜索統(tǒng)計(jì),內(nèi)容包括搜索用戶(hù)數(shù)、熱搜詞排名、流量趨勢(shì)、用戶(hù)來(lái)訪地區(qū)等,幫助網(wǎng)站管理者了解用戶(hù)搜索行為,為做好服務(wù)型政府網(wǎng)站提供決策性數(shù)據(jù)支撐。
5.1.1 常用搜索詞排名
系統(tǒng)可采集分析站群或某個(gè)特定站點(diǎn)的所有搜索詞,并通過(guò)柱圖等展現(xiàn)各搜索詞的搜索占比,政府部門(mén)可以及時(shí)掌握輿情動(dòng)態(tài)、了解用戶(hù)需求。
5.1.2 站內(nèi)搜索詞列表
系統(tǒng)可采集所有搜索詞,并通過(guò)列表方式分析展現(xiàn)搜索詞的名稱(chēng)、搜索次數(shù)、命中次數(shù)、作為二次搜索的次數(shù)、結(jié)果頁(yè)瀏覽量、帶來(lái)再次搜索的次數(shù)和平均訪問(wèn)深度等,以幫助系統(tǒng)管理者優(yōu)化搜索詞庫(kù)、索引庫(kù)和相關(guān)算法等。
5.1.3 搜索詞多維度分析
系統(tǒng)可圍繞用戶(hù)輸入的搜索詞提供熱度分析、增長(zhǎng)率分析、相關(guān)分析、終端分析等多維度統(tǒng)計(jì),并支持按時(shí)段查看,使網(wǎng)站管理者深入了解用戶(hù)搜索需求,并進(jìn)一步分析用戶(hù)的主要訴求,為網(wǎng)站的資源組織、信息發(fā)布和其他相關(guān)業(yè)務(wù)開(kāi)展提供基礎(chǔ)決策支持,以?xún)?yōu)化線上辦事流程、引導(dǎo)社會(huì)輿論,從而有效提升政府治理能力。
系統(tǒng)可按照搜索詞和索引量進(jìn)行統(tǒng)計(jì),分析“0 結(jié)果”的搜索百分比、搜索結(jié)果“0 點(diǎn)擊”的百分比、搜索終端訪問(wèn)量占比、搜索結(jié)果訪問(wèn)趨勢(shì)等,為系統(tǒng)運(yùn)維和運(yùn)營(yíng)提供客觀可靠的數(shù)據(jù)支持,并進(jìn)一步開(kāi)展熱詞、搜索排行榜及特定搜索詞的相關(guān)信息統(tǒng)計(jì)。
在未來(lái)的發(fā)展上,“交通智搜”還可以探索開(kāi)展搜索結(jié)果的場(chǎng)景化服務(wù),根據(jù)用戶(hù)歷史搜索情況和訪問(wèn)轉(zhuǎn)化情況,為用戶(hù)整合與其搜索內(nèi)容相關(guān)的服務(wù)、信息和互動(dòng)內(nèi)容,實(shí)現(xiàn)千人千面,針對(duì)不同用戶(hù)提供不同的搜索結(jié)果,以提高用戶(hù)的體驗(yàn)感和獲得感,進(jìn)一步提升用戶(hù)對(duì)數(shù)字政府治理能力的滿(mǎn)意度。