• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于開放存取組織分析的隱形網絡資源顯性化

    2011-07-24 08:32:42邱春艷
    圖書館學刊 2011年11期
    關鍵詞:搜索引擎網絡資源隱形

    邱春艷

    (武漢大學信息管理學院,湖北 武漢 430072)

    邱春艷 女,1987年生。碩士在讀,研究方向:信息檢索與咨詢。

    自20世紀90年代以來,開放存?。∣pen Access,縮寫為OA)作為學術界、出版界以及圖書館界等為打破商業(yè)出版者的壟斷而采取的免費自由存取和利用的一項重大舉措,為科研成果的廣泛無障礙傳播提供了有效的途徑和方式。OA資源與隱形網絡資源有諸多相似之處,OA資源是學術隱形網絡資源的重要組成部分,因此,OA資源的組織和揭示是隱形網絡資源顯性化發(fā)展的實例,隱形網絡資源的顯性化發(fā)展可以借鑒其成功經驗。

    1 開放存取與隱形網絡的概念及研究

    1.1 開放存取和隱形網絡的定義

    目前比較權威的3個國際性相關文件《布達佩斯開放存取動議》(Budapest Open Access Initiative,縮寫為BOAI)、《貝塞斯達原則》(Bethesda Principles)和《關于自然科學與人文科學資源的開放存取柏林宣言》(Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities)分別對OA作了定義。筆者比較認同BOAI的定義,認為“對文獻的開放存取即意味著它在公共網絡可以被免費獲取,允許任何用戶閱讀、下載、復制、分發(fā)、打印、檢索、超鏈接該文獻的全文信息”。[1]

    隱形網絡(Invisible Web),又名隱蔽網絡、深網(Deep Web)、看不見的網絡或者黑洞、黑色資源(Dark Net)等。自2001年美國圖書館員和信息學者Chris Sherman和Gray Price合著的《The invisible web:uncovering information sources search engines can’t see》出版之后,隱形網絡逐漸受到計算機界、圖書館界等各方的廣泛關注。Sherman和Price將隱形網絡定義為:在網絡上可以獲得的資源,但由于技術限制或者由于特定選擇而不能或未被納入通用搜索引擎中的文本網頁、文件或其他高質量的權威性信息資源。[2]

    1.2 開放存取與隱形網絡相關研究文獻統(tǒng)計分析

    筆者于2011年以關鍵詞、主題、題名等途徑檢索,對CNKI中2001~2010年OA和隱形網絡相關文獻數量進行統(tǒng)計(見表1)。統(tǒng)計結果顯示:國內對OA的研究文獻從2002年開始出現并逐年遞增,對隱形網絡的研究則相對較晚,從2003年開始出現關于“隱性信息”的文章。2004年對隱形網絡的研究文獻開始逐漸增多,2008、2009、2010每年關于隱形網絡的研究文獻保持在80篇以上。

    表1 2001~2010 CNKI中OA和隱形網絡相關文獻數量統(tǒng)計(單位:篇)

    對OA的研究主題集中在國外經驗介紹、對知識交流的影響、OA模式、知識產權問題、OA實現途徑、運行技術、質量控制、對策等方面。對隱形網絡的研究主題初期多集中于隱形網絡的概念特征、成因、類型等介紹性內容,之后開始探討隱形網絡的宏觀控制、檢索策略、隱形網絡資源的采集與整合、數據挖掘、檢索工具的改進以及圖書館對于隱形網絡資源的開發(fā)利用等。

    從研究文獻數量和時間看,對OA的研究文獻數量是隱形網絡的近4倍,同時對隱形網絡的研究要晚于對OA的研究,可看出在國內OA較之隱形網絡更受關注。從研究主題來看,多數研究文獻著重對OA和隱形網絡兩者之一進行單獨研究,對兩者的綜合研究則以免費網絡資源的獲取為主要內容,數量較為稀少,有待深入和拓展。

    2 開放存取與隱形網絡的關系

    2.1 開放存取與隱形網絡的區(qū)別

    2.1.1 內容范圍

    OA資源主要是科研數據、學術研究論文、科研報告、專著、教學課件等學術類資源。而隱形網絡資源除學術類資源,還包含了政府信息、新聞資訊、娛樂資訊等,相比OA資源內容更為豐富,因此也相對復雜。通常特定的隱形網絡資源集中于特定的主題領域,如政府部門和學術機構所提供的特定專題或學科領域的數據庫資源。

    2.1.2 資源格式

    OA資源多數為靜態(tài)的文件格式,OA期刊多以PDF和HTML格式文件的形式存在,OA倉儲多數收錄PDF格式和Word格式的文件。而隱形網絡資源格式則更為多樣,除了PDF和Word等靜態(tài)文件外,還有大量的FLASH文件、網頁等動態(tài)格式文件。

    2.1.3 受關注程度

    從相關會議分析,國內參與或召開的以OA為主題的會議(如柏林會議等)較多,而與隱形網絡相關的會議較少。由此可見,國內對隱形網絡的關注遠不及對開放存取的關注。受關注程度的不同導致開發(fā)和利用程度的不同。

    2.2 OA資源與隱形網絡資源的聯(lián)系

    OA資源與隱形網絡資源具有諸多相同點,主要表現在:①隱蔽性。兩者都難以通過通用搜索引擎獲取,因而對于習慣使用通用搜索引擎的用戶具有隱蔽性。②資源數量大。根據Bright Planet于2001年發(fā)表的白皮書所述,隱形內容大約有5000億個文檔,至少是有形內容的50倍。[3]OpenDOAR收錄1800多個OA倉儲,Open Science Directory收錄約13000種OA期刊,可見OA資源數量之大。③內容豐富。隱形網絡資源的內容包含了多種文件格式的文件內容,涉及政治、社會、科研等多個領域。開放存取資源則包含了所有學科的學術資源。④價值大。隱形網絡資源具有特定的內容、專業(yè)的檢索界面、更高的檢全率和檢準率以及最高水平的權威性,[4]因而對于用戶具有比較大的利用價值。OA資源的學術性和免費性使其對科研用戶具有較高的參考價值。⑤主要傳播載體相同。兩者都通過互聯(lián)網提供獲取和使用。

    由于OA資源具有隱形網絡資源的主要特點,可以將OA資源歸為隱形網絡資源。學術隱形網絡是隱形網絡資源中具有重要學術價值的組成部分,是包含所有數據庫和相關學術收藏但不被普通搜索引擎所檢索的信息資源。[5]OA資源多數為學術隱形網絡資源。

    3 開放存取資源的組織與揭示

    隨著開放存取理念的廣泛傳播,開放存取受到各界人士、特別是科學研究領域的認同和推崇,對OA資源的組織、揭示、傳播以及開發(fā)、利用也逐漸成熟。

    3.1 開放存取資源的主體

    許多參與到OA運動中的組織機構,將自己的研究成果或出版物以開放存取的形式向外界傳播,此類機構對自身OA資源以特定方式進行組織和揭示。①在學術界,科研機構將本機構開展或給予資金支持的科研項目的進展、成果、結論數據和內容信息以機構庫或學科庫的形式存儲,通過網絡向全世界或部分地區(qū)提供存取。②在出版界,許多出版機構出版OA形式的原生出版物,部分傳統(tǒng)出版機構將固有出版物轉為OA形式的出版物。

    3.2 開放存取資源的組織

    3.2.1 組織方法

    對OA資源的組織主要利用分類法和主題法。OA資源的組織吸收了傳統(tǒng)文獻組織的主要方法即分類法和主題法的精髓,并根據資源狀況和用戶需求作了改進。如多數開放存取期刊目錄(如DOAJ等)按照學科和主題來組織收錄的期刊,但其分類目錄和主題劃分并未嚴格采用某種特定分類法和主題法。

    3.2.2 組織技術

    ①元數據互操作。OA資源內容龐雜,格式多樣,對其組織必須解決其元數據的互操作問題。OA資源采用開放文檔協(xié)議(Open Archives Initiative,縮寫為 OAI),需提供DC元數據和其他格式元數據。開放文檔元數據采集協(xié)議OAI-PMH的制定和實施,促進了不同系統(tǒng)、國別、語種的OA資源元數據的互操作。

    ②資源定位。作為網絡資源的OA資源具有較大的不穩(wěn)定性,通過賦予OA資源以唯一的永久的標識符,即數字對象唯一標識符(Digital Object Unique Identifier,縮寫為DOI),從而加強OA資源的定位,使用戶可以定位確定的OA資源。

    ③永久保存。長期保存是網絡資源面臨的重要問題。通過采用基于開放檔案信息系統(tǒng)(Open Archival Information System,縮寫為OAIS)的永久保存機制,從而實現對OA資源的永久保存。以OAIS為基礎的項目較多,如加利福尼亞大學數字保存?zhèn)}儲(Digital Preservation Repository,縮寫為DPR)等。

    3.2.3 相關軟件的開發(fā)和應用

    目前已開發(fā)了較多用于建立、組織和管理OA倉儲和OA期刊的軟件系統(tǒng)。較為成熟的OA倉儲軟件系統(tǒng)有Dspace、Eprints、Fedora、Escholarship、CDSWare、ARNO等,其中應用最為廣泛的是Dspace和Eprints。公共知識計劃(Public Knowledge Project,縮寫為PKP)包含了開放期刊系統(tǒng)(Open Journal System,縮寫為OJS)、開放會議系統(tǒng)(Open Conference System,縮寫為OCS)、開放收割系統(tǒng)(Open Harvester Systems,縮寫為OHS)、開放專著系統(tǒng)(Open Monograph Press,縮寫為OHS)等,其中OJS被超過5000種學術期刊使用。[6]此類軟件系統(tǒng)的開發(fā)和應用為開放存取的實施和資源組織提供了便利。

    3.2.4 組織工作

    對OA資源的組織工作主要體現在對OA資源的編目。根據Anna K.Hood于2007年對ARL成員利用OA資源情況的調查,86%的成員館從OCLC下載OA資源的目錄信息,69%的成員館自行編制,56%的成員館從其他組織下載編目信息。[7]可見,圖書館較早就開始重視對OA資源的編目。圖書館通過對傳統(tǒng)編目著錄格式的特定字段進行修改、補充,以實現對網絡信息資源的編目。其中比較典型的為OCLC運用USMARC對網絡資源進行編目,用256字段標識計算機文件特征,856字段標識網絡資源的URL信息。[8]

    3.3 開放存取資源的揭示

    3.3.1 開放存取資源目錄

    對OA資源最直接的揭示方式即以目錄形式提供OA資源的內容信息和鏈接入口。如OA期刊目錄將其收錄的大量期刊信息,如刊名、ISSN號、學科主題信息等進行揭示,同時提供該期刊的鏈接入口。

    3.3.2 第三方機構對開放存取資源的揭示

    除上述機構,還有自身資源不提供開放存取的圖書館、科研機構以及OA資源站點等第三方機構進行開放存取資源組織、揭示和傳播。①圖書館。眾多圖書館在其網站上開辟專欄對OA資源進行介紹和導航,許多圖書館還對OA資源進行整合提供。對OA資源和相關理論的研究在圖書館界也備受關注。②科研機構。許多科研機構對其他機構提供的OA資源進行組織,多以資源導航的形式提供。③OA資源站點。OA資源數量巨大,內容龐雜,許多站點致力于以目錄形式對其進行組織和揭示。

    3.3.3 開放存取資源搜索引擎

    OA資源分布在不同的國家和研究機構,通過針對OA資源的專門搜索引擎將不同地區(qū)和不同語種的OA資源進行標引。通常包括綜合性、專類和??芆A資源搜索引擎,通過用戶的檢索來揭示。

    3.4 人文關注

    近幾年,國內許多領域召開以OA為主題的會議,2010年10月26日,“第八屆開放獲取柏林國際會議”在中國科學院國家科學圖書館成功舉行。隨著各項會議的召開以及越來越多致力于OA的機構參與,OA資源相關的活動和項目不斷開展,對OA的關注不斷深入。第三方機構在提供OA資源鏈接或導航時,通常提供相關介紹等,對各領域用戶了解和關注OA資源起到了推廣和宣傳的作用。

    4 隱形網絡資源的顯性化發(fā)展

    隱形網絡資源通常具有特定的內容、較高檢全率和檢準率、較高權威性等特點,因而具有較大的價值。只有當相對于大多數用戶而言,隱形網絡資源處于顯性化狀態(tài)時,隱形網絡資源的巨大價值才能得到充分的發(fā)掘和利用。隱形網絡資源與OA資源有諸多相同點,因而對隱形網絡資源的組織和揭示可以借鑒OA資源已有的組織和揭示方法,同時應針對區(qū)別于OA資源的特點采取有針對性的措施。

    4.1 隱形網絡資源所有者促進自身資源顯性化

    隱形網絡資源要得到顯性化的揭示和利用,需要資源自身的轉變。OA資源之所以得到重視并不斷被深入開發(fā)利用,很大程度上取決于其“開放”地面向用戶,從而增強了用戶對OA資源的認識和利用率。因此隱形網絡資源所有者需通過向搜索引擎提交網址,使該資源能夠被通用搜索引擎檢索,提高用戶的點擊率與資源的利用率。

    4.2 第三方對隱形網絡資源的揭示

    第三方對資源的揭示是用戶獲取OA資源的重要中轉途徑,也是了解和獲取隱形網絡資源的重要途徑。隱形網絡資源是圖書館、研究機構等信息服務機構拓展自身資源的重要來源之一。通過搜索引擎、資源目錄等方式,對隱形網絡資源進行更為廣泛精確的搜集和整合,提供一站式檢索,是今后第三方機構對隱形網絡資源揭示的重要方式。

    4.3 理論和技術研究的支持

    任何行動都需要強有力的理論和技術支撐。對開放存取相關理論和技術的研究與應用,推動了OA資源的開發(fā)和利用。對隱形網絡資源的開發(fā)利用亦需有理論和技術研究為先導。當前對于隱形網絡的研究還僅局限于定義、類型、簡單獲取策略等淺層次的內容。此外,技術是導致隱形網絡資源隱蔽性的重要原因,隱形網絡的特性需要包括信息挖掘技術、搜索引擎以及元數據等信息描述技術在內的各種網絡資源的深入發(fā)展。隨著本體技術、網絡爬蟲技術、數據采集和整合技術、元數據等相關技術的發(fā)展,對隱形網絡的揭示與發(fā)掘將更加深入。[9-10]

    4.4 法律和政策的保證

    除了技術的限制,隱形網絡資源的隱蔽性在很大程度上取決于資源所有者對于侵權等方面的顧慮,解決相關網絡資源的知識產權、隱私權保護等問題,對于隱形網絡資源的顯性化揭示有重要的作用。

    4.5 增強對隱形網絡資源的人文關注

    用戶的需求是資源利用的重要動力。相比隱形網絡資源的巨大價值,用戶的需求力不足,其推動力未能充分顯現。這需要用戶自身對于隱形網絡資源相關知識的了解和學習,提高自身的信息意識和信息獲取能力。同時在獲取和使用隱形網絡資源時,用戶應加強對所獲取資源的整理和保存。此外,OA資源的相關會議、文件、活動,在很大程度上對開放存取起到了宣傳推廣作用,相比之下,對于隱形網絡資源的宣傳推廣力度還遠遠不足,應加強對隱形網絡資源和工具等基本內容的推廣宣傳,帶動對整個隱形網絡資源的認識和研究。

    [1]Budapest Open Access Initiative[OL].[2011-03-02].http://www.soros.org/Openaccess/read.shtml.

    [2]馬費成等.看不見的網站——Internet專業(yè)信息檢索指南[M].沈陽:遼寧科學技術出版社,2003:48.

    [3]Bright Planet.The Deep Web:Surfacing Hidden Value[OL].[2011-05-12].http://www.brightplanet.com/images/uploads/12550176481-deepwebwhitepaper.pdf.

    [4]馬費成等.看不見的網站—Internet專業(yè)信息檢索指南[M].沈陽:遼寧科學技術出版社,2003:79-80.

    [5]陳紅勤.學術隱蔽網絡和學術搜索引擎[J].現代情報,2008(7):118.

    [6]Kilgour Award recipient named[OL].[2011-05-12].http://www.ala.org/ala/mgrps/divs/lita/newandnoteworthy/kilgourwinner2010.cfm.

    [7]Anna K.Hood.Open Access Resources[OL].[2011-03-07].www.arl.org/bm~doc/spec300web.pdf.

    [8]邱燕燕.開放存取資源的組織和揭示[J].圖書館雜志,2006(6):20-22.

    [9]張芳,肖國強.基于專業(yè)搜索引擎的元搜索引擎的設計[J].鄭州大學學報,2007(2):38-41.

    [10]黃聰會,張水平,胡洋.主題Deep Web爬蟲框架研究[J].計算機工程與設計,2010(5):929-935.

    [11]高明,王繼成,李江峰.基于語義支持的Deep Web數據抽取[J].計算機科學,2010(3):156-158.

    猜你喜歡
    搜索引擎網絡資源隱形
    隱形人
    我變成了一個隱形人
    網絡資源在高中班級管理中的運用
    談網絡資源在大學計算機教學中的應用
    網絡搜索引擎亟待規(guī)范
    “0感無暇” 隱形妝
    Coco薇(2015年1期)2015-08-13 02:52:21
    基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
    廣告主與搜索引擎的雙向博弈分析
    對等網絡資源搜索模型研究
    搜索,也要“深搜熟濾”
    西贡区| 新绛县| 朝阳区| 昭觉县| 交口县| 东至县| 锦屏县| 莒南县| 定日县| 津南区| 临潭县| 吐鲁番市| 兴义市| 长葛市| 阿巴嘎旗| 贺兰县| 新兴县| 平邑县| 田东县| 西盟| 北川| 蚌埠市| 云和县| 宝丰县| 招远市| 油尖旺区| 中西区| 府谷县| 江城| 玉屏| 当阳市| 东台市| 西畴县| 博乐市| 鄢陵县| 阜康市| 察雅县| 宜兰县| 洛隆县| 宁海县| 读书|