• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于語義擴展搜索的圖書館服務研究

    2013-09-15 14:21:30陳萍秀
    圖書與情報 2013年4期
    關鍵詞:知識庫檢索語義

    陳萍秀

    (成都航空職業(yè)技術學院圖書館 四川成都 610010)

    作為社會信息和知識存儲、 服務、 加工中心的圖書館,向用戶提供咨詢服務是體現(xiàn)其存在價值的主要方式。隨著知識社會的到來,民眾的知識需求逐漸向專業(yè)化、學科化、泛在化發(fā)展,圖書館的咨詢服務、學科服務等更進一步體現(xiàn)出了其存在的價值和服務效益,因而成為現(xiàn)代圖書館服務方式和內容的主要組成部分,并隨著用戶的需求變化而變化,現(xiàn)已從簡單的文獻服務、信息服務階段發(fā)展到了嵌入式服務、知識服務階段,圖書館服務所借助的工具也不再僅僅是工具書、目錄卡等,知識來源也不再只是來源于館藏文獻或數(shù)據(jù)庫信息,從海量、異構、復雜的知識庫、Web 資源信息中通過自然語言、語義擴展搜索所需的知識成為了圖書館服務的新的增長點,也成為了當前圖書館員所需要研究和思考的問題。

    1 語義擴展搜索模型的構建

    本文提出的語義擴展檢索模型基于 HNC(Hierarchical Network of Concepts,一個以概念聯(lián)想脈絡為主線,融語義、語法、語用為依托的自然語言理論的理論體系)理論,借助于美國搜索引擎公司Powerset 的搜索產(chǎn)品Search Wikipedia Articles 使用的自然語言處理技術,將圖書館員的信息檢索從以前的關鍵詞層面提升到了可對詞組或整句自然語言檢索的知識檢索層面,并在知識檢索的基礎上進行了知識的理解與處理,如分析與抽取等,以提高人們如用戶和圖書館咨詢服務人員的語義搜索能力。本文所提出的基于知識庫的語義擴展搜索模型主要包括:擴展查詢條件,映射知識庫,相關度分析和圖書館延伸服務(模型見圖1)。主要步驟為:(1)根據(jù)用戶需求輸入查詢條件,使用領域知識詞典對其輸入進行擴展,得到擴展搜索引擎條件,并分析得出各擴展查詢條件間的關聯(lián);(2)將查詢條件映射到知識庫、Web 資源之中,并對映射得到的知識數(shù)據(jù)進行相關度分析;(3)返回排序后的查詢結果,并通過圖書館豐富的服務方式輸出給用戶。

    圖1 語義擴展搜索模型

    從模型可以看出,圖書館實施語義擴展搜索服務的工作主要有:(1)領域知識詞典的構建;(2)相關度分析的實現(xiàn)與算法優(yōu)化;(3)擴展搜索資源的建設與選取,如機構知識庫的構建與Web 資源的獲??;(4)查詢結果的輸出與相關服務的實現(xiàn)。其中,領域知識詞典的構建、相關度分析的實現(xiàn)以及算法優(yōu)化需要研究的問題都已超出了圖書館學和情報學的研究范疇,同時也是近年來計算機科學、人工智能、管理科學與工程等學科的研究熱點之一,因此本文的研究重點是在語義擴展搜索資源的選取與構成基礎上,對可以提供的圖書館相關服務以及方式、方法與途徑進行研究,并將圖書館對用戶的具體服務延伸與深化。

    2 圖書館語義擴展搜索資源的組成與構建

    在本文所設計的語義擴展搜索模型中,圖書館語義擴展搜索的資源主要由數(shù)據(jù)庫、機構知識庫和Web 資源組成。其中,圖書館現(xiàn)已建成的大量特色數(shù)據(jù)庫以及CALIS、CADAL、文化資源共享工程資源數(shù)據(jù)庫、商業(yè)數(shù)據(jù)庫組成了數(shù)量龐大、資源豐富的數(shù)據(jù)庫資源,也成為了語義擴展搜索的主要數(shù)據(jù)來源。其次,語義擴展搜索的第二大數(shù)據(jù)來源就是機構知識庫。機構知識庫是近年來高校等科研機構與圖書館等信息中心實現(xiàn)學術資源開放獲取與知識服務的主要創(chuàng)新發(fā)展途徑之一,且自2003 年開放存取國際會議首次召開以來,機構知識庫在不同的國家和地區(qū)均獲得了不同程度的發(fā)展,據(jù)開放獲取學術信息資源檢索的主要平臺OpenDOAR 統(tǒng)計,截至2012 年5 月6 日,歐洲的機構知識庫數(shù)量達到了1022 個,北美洲有472 個機構知識庫,南美洲有153 個機構知識庫,澳洲有69 個機構知識庫,非洲也有50 個機構知識庫。而在亞洲,日本有137 個機構知識庫,印度有54 個機構知識庫,中國的機構庫數(shù)量則為34 個。這些數(shù)據(jù)一方面說明已建成的機構知識庫數(shù)量龐大,且在迅猛增加;另一方面也說明機構知識庫在中國還未得到充分發(fā)展,未來發(fā)展?jié)摿薮?,同時由于其是科研機構開放獲取服務與學術服務的未來發(fā)展趨勢之一,沒有是否是注冊用戶或IP 內用戶的限制,因此利用其進行的圖書館服務前景廣闊。在機構知識庫的構建中,我國圖書館界可充分借鑒廈門大學、 中科院國家科學圖書館等已建成知識庫的建設經(jīng)驗,充分利用現(xiàn)有系統(tǒng)開發(fā)平臺,建設具有自身特色與優(yōu)勢的知識庫,并在語義擴展搜索中注重知識庫間的資源共享,達到豐富搜索資源的目的。再次,語義擴展搜索資源的第三大組成部分是Web 資源。大數(shù)據(jù)時代的到來會極大豐富Web 資源的組成和存在形態(tài),其組成不僅有傳統(tǒng)的結構化數(shù)據(jù),也將有產(chǎn)生于社交網(wǎng)絡、移動終端、消費場所等場合的非結構化數(shù)據(jù)、半結構化數(shù)據(jù),因而未來的服務機構所借助和分析的數(shù)據(jù)也將向這些外部數(shù)據(jù)轉移,企業(yè)將更多關注非傳統(tǒng)的數(shù)據(jù)類型和外部數(shù)據(jù)源。因此,當圖書館越來越多的借助這些非傳統(tǒng)數(shù)據(jù)進行資源的檢索時,其所得到的數(shù)據(jù)分析結果能為用戶解決問題的價值性、 知識性會極大提高。關于Web數(shù)據(jù)資源的構建,目前對于大量的非機構化、半結構化數(shù)據(jù)還不夠成熟,但已有的Hadoop、NoSQL 等分布式系統(tǒng)架構平臺的資源收集方式則為我們提供了思路。

    3 基于語義擴展搜索的圖書館服務延伸與創(chuàng)新

    3.1 知識咨詢與挖掘服務

    網(wǎng)絡社交活動的頻繁及移動設備的大量使用,使得數(shù)據(jù)的產(chǎn)生、來源、類型變得簡單而豐富,越來越多的非結構化數(shù)據(jù)、半結構化數(shù)據(jù)呈爆發(fā)式增長趨勢,且其組成結構、類型格式、存在形態(tài)等都愈加復雜,整個社會發(fā)展進入到了一個大數(shù)據(jù)時代,數(shù)據(jù)將成為社會資源的一部分被加以重視,基于數(shù)據(jù)的處理、分析、挖掘等都將被信息服務機構所應用和開展,這對承載著知識存儲、組織、開發(fā)與傳播重任的傳統(tǒng)圖書館及以文獻信息分析為基礎的咨詢服務工作造成了強烈沖擊。而基于語義的擴展搜索,不僅能實現(xiàn)對所建知識庫、數(shù)據(jù)庫的關聯(lián)搜索引擎,還能實現(xiàn)對Web 資源的搜索、整理與分析,最終向用戶提供以用戶知識需求為起點、 以實現(xiàn)用戶知識價值增值為目標、以動態(tài)、交互、連續(xù)的服務模式貫穿于知識咨詢與知識挖掘服務的全過程。

    3.2 可行性分析服務

    大數(shù)據(jù)時代的到來,使得Web 信息資源豐富而富有價值,圖書館服務的理念也將從以前追求數(shù)據(jù)分析較為簡單的信息咨詢等服務深化到以數(shù)據(jù)分析和挖掘為主的數(shù)據(jù)服務,從數(shù)據(jù)的角度出發(fā)去挖掘其存在的價值,如企業(yè)決策的可行性分析。2012 年10 月23 日,著名信息技術研究和分析公司Gartner 認為云計算、打包分析應用和大數(shù)據(jù)將在未來加速發(fā)展,移動設備將能訪問數(shù)據(jù)和參與業(yè)務決策制定,可行性分析將成為未來科技發(fā)展的十大趨勢之一?;谡Z義的擴展搜索,因其搜索了大量的Web 資源,如資源最豐富的五大數(shù)據(jù)資源社交圖譜、意向圖譜、消費圖譜、興趣圖譜和移動圖譜,因而能從數(shù)據(jù)和表面現(xiàn)象中去發(fā)現(xiàn)事實發(fā)展真像,進而去預測事物在未來發(fā)展的趨勢,達到對現(xiàn)時決策的可行性分析。這種對決策、 行為進行的可行性分析必將在圖書館的企業(yè)用戶服務如企業(yè)情報服務中發(fā)揮重要作用。

    3.3 用戶個人信息資源結構的關聯(lián)、擴展服務

    隨著信息技術的發(fā)展與信息資源存在結構的日益豐富,特別是現(xiàn)代意義的數(shù)字圖書館出現(xiàn),使得圖書館不僅要實現(xiàn)對所藏信息資源本身的保存、加工與利用,對描述這些信息資源的著錄元數(shù)據(jù)、 關聯(lián)信息等也要進行相應存儲。圖書館為了服務與檢索便捷,一方面根據(jù)這些信息資源的表現(xiàn)形式、 內容構成進行資源的分類,如根據(jù)學科、所屬年代的劃分與關聯(lián)鏈接,并對這些信息資源進行元數(shù)據(jù)描述、標注與相關知識關聯(lián)。同時,也根據(jù)信息資源表達內容的層級結構進行資源的劃分與關聯(lián),如將表達和描述同一信息描述對象的資源既劃分為其所屬學科之中,又可按其描述單元的細化來切分為不同的若干信息。這些信息資源的歸類與關聯(lián),方便了圖書館資源的保存與利用,也有利于用戶的檢索,但圖書館目前只是對自身資源進行如此分類,并沒有對用戶的檢索信息、私有資源進行相關關聯(lián)與擴展服務,因此,在圖書館基于知識庫語義擴展搜索實現(xiàn)后來提供此類服務,如在信息咨詢、學科服務過程中,通過對語義擴展搜索得到信息資源進行關聯(lián)和擴展,來全面表現(xiàn)用戶所擁有信息資源的著錄信息和結構信息。

    3.4 基于圖書館知識社區(qū)的知識發(fā)現(xiàn)服務

    圖書館作為社會信息、知識存儲、加工和服務中心,一直以來在為用戶提供信息服務的過程中積累了豐富的經(jīng)驗,培養(yǎng)了一批批優(yōu)秀的信息服務專業(yè)人才,也擁有了其它社會機構無法比擬的資源優(yōu)勢,因而也形成了一個集資源優(yōu)勢、 服務優(yōu)勢、 人才優(yōu)勢于一體的知識社區(qū)。Web、本體、XML、RDF、標簽等技術產(chǎn)物的出現(xiàn),使得圖書館資源的共享、檢索、標注與利用更加便捷,圖書館的服務環(huán)境走向信息化、 網(wǎng)絡化與語義化,信息用戶成為主體,通過創(chuàng)建個性化的書簽、標簽等來整合用戶感興趣的信息資源,系統(tǒng)通過對用戶行為的跟蹤建立符合用戶偏好的動態(tài)認知地圖,用戶在圖書館這個知識社區(qū)內就可通過表達自己興趣愛好的關鍵詞、 自然語言來搜索引擎相關信息,最終實現(xiàn)知識的積累。IT 界則清晰的看到了用戶的這種需求和愿望,于是產(chǎn)生了以谷歌為代表的IT 搜索巨頭,并掀起了搜索引擎的發(fā)展熱潮,基于語義擴展搜索的信息資源發(fā)現(xiàn)系統(tǒng)如ExLibris 公司的Primo、EBSCO公 司 的 EBSCO Discovery Service (EDS)、Innovative Interfaces 公司的Encore 等也相繼問世并投入到圖書館等信息服務機構的用戶知識服務之中。在用戶需求的驅動下,圖書館界也不甘示弱,開發(fā)了一批基于圖書館知識社區(qū)的資源發(fā)現(xiàn)系統(tǒng),如OCLC 的一站式知識資源發(fā)現(xiàn)與服務系統(tǒng)Worldcat Local,提供了全世界近2 萬個圖書館的館藏紙質資源和部分數(shù)字資源的信息共17 億條。

    5 結語

    語義網(wǎng)和圖書館看似屬于不同領域,但因為之間存在的共性,隨著兩者之間的發(fā)展,語義網(wǎng)已被圖書館特別是數(shù)字圖書館所用。以信息服務為其存在價值體現(xiàn)的圖書館需在信息服務中加深檢索的語義含義理解,避免傳統(tǒng)以關鍵詞檢索為主的多次檢索,在信息搜索中引入語義擴展搜索,無疑將對圖書館服務的延伸與創(chuàng)新帶來便捷與可行基礎。

    [1]劉幺和,李巧云.基于語義搜索的語音交互系統(tǒng)模型研究[J].計算機應用,2009,29(7):1978-1980.

    [2]萬靜,王文聰,易軍凱.一種基于本體的知識庫語義擴展搜索方法[J].計算機工程,2012,38(6):19-22.

    [3]席運江.組織知識的網(wǎng)絡表示模型及分析方法[D].大連:大連理工大學,2007.

    [4]The Directory of Open Access Repositories-OpenDOAR[EB/OL].[2013-07-12].http://www.opendoar.org/.

    [5]Gartner:2013 年十大科技趨勢[EB/OL].[2013-07-12].http://www.ctocio.com/trend/9239.html.

    [6]司輝,成全,曹高輝.基于本體的語義數(shù)字圖書館知識檢索服務研究[J].情報理論與實踐,2009,32(1):113-116.

    [7]孫楊.OCLC Worldcat local 發(fā)展綜述[J].山東圖書館學刊,2011,(5):46-54.

    猜你喜歡
    知識庫檢索語義
    語言與語義
    2019年第4-6期便捷檢索目錄
    基于TRIZ與知識庫的創(chuàng)新模型構建及在注塑機設計中的應用
    高速公路信息系統(tǒng)維護知識庫的建立和應用
    “上”與“下”語義的不對稱性及其認知闡釋
    專利檢索中“語義”的表現(xiàn)
    專利代理(2016年1期)2016-05-17 06:14:36
    基于Drupal發(fā)布學者知識庫關聯(lián)數(shù)據(jù)的研究
    圖書館研究(2015年5期)2015-12-07 04:05:48
    認知范疇模糊與語義模糊
    語義分析與漢俄副名組合
    外語學刊(2011年1期)2011-01-22 03:38:33
    國際標準檢索
    津南区| 延庆县| 石柱| 旅游| 清徐县| 诏安县| 万载县| 忻城县| 太湖县| 梁山县| 肥东县| 永城市| 上饶县| 灵丘县| 凭祥市| 将乐县| 马山县| 阿拉尔市| 小金县| 靖江市| 蕉岭县| 黄梅县| 漳浦县| 万盛区| 东乌珠穆沁旗| 建瓯市| 固安县| 嵊泗县| 安泽县| 杨浦区| 绥滨县| 桐柏县| 宜城市| 通榆县| 万宁市| 策勒县| 京山县| 水城县| 昔阳县| 竹山县| 漳平市|