• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      圖書館學(xué)研究文獻網(wǎng)絡(luò)引文的可追溯性考察
      ——以四種核心期刊為例

      2015-07-22 08:19:52莊曉喆
      圖書館 2015年4期
      關(guān)鍵詞:圖書館學(xué)域名網(wǎng)頁

      莊曉喆

      (武漢大學(xué)信息管理學(xué)院 湖北武漢 430072)

      ·實證研究·

      圖書館學(xué)研究文獻網(wǎng)絡(luò)引文的可追溯性考察
      ——以四種核心期刊為例

      莊曉喆

      (武漢大學(xué)信息管理學(xué)院湖北武漢430072)

      〔摘要〕網(wǎng)絡(luò)環(huán)境下,網(wǎng)絡(luò)引文已成為參考文獻的重要組成部分,其可追溯性也日益受到關(guān)注。文章選取四種中國圖書館學(xué)核心期刊,對其2009至2013年間所刊載論文中網(wǎng)絡(luò)引文(P-W型網(wǎng)絡(luò)引文)的歷年和總體可追溯情況、不可追溯的原因,以及網(wǎng)絡(luò)引文的可追溯率與網(wǎng)站域名、網(wǎng)頁格式、網(wǎng)頁語種、頁面類型與網(wǎng)址深度間的關(guān)系進行實證分析。認為強化網(wǎng)絡(luò)信息資源的存檔工作、加大網(wǎng)站的維護力度、審慎地選擇網(wǎng)絡(luò)信息源是提升網(wǎng)絡(luò)引文可追溯率的有效舉措。

      〔關(guān)鍵詞〕網(wǎng)絡(luò)引文可追溯性圖書館學(xué)期刊

      信息技術(shù)的發(fā)展、互聯(lián)網(wǎng)的普及和網(wǎng)絡(luò)信息資源的激增使人們的信息獲取途徑和學(xué)術(shù)交流方式發(fā)生了巨變。隨著互聯(lián)網(wǎng)逐漸成為重要的學(xué)術(shù)信息源,越來越多的網(wǎng)絡(luò)信息被直接應(yīng)用于學(xué)術(shù)研究,從而使著錄內(nèi)容中含有網(wǎng)址(URL)的網(wǎng)絡(luò)引文廣泛出現(xiàn)在學(xué)術(shù)文獻中。

      可追溯性是網(wǎng)絡(luò)引文應(yīng)具備的基本特征之一,即讀者根據(jù)引文條目中的著錄信息可獲得引文的內(nèi)容。一般認為,若引文中著錄的URL所指向的頁面能正常打開(包括自動重定向至新網(wǎng)址后能正常打開),且其內(nèi)容未發(fā)生變化,則該引文是可追溯的;否則即為不可追溯。由于網(wǎng)絡(luò)信息的生命周期較短,導(dǎo)致網(wǎng)絡(luò)引文的可追溯性弱于傳統(tǒng)引文。不可追溯的網(wǎng)絡(luò)引文不僅喪失了參考價值,也令引證文獻的可信度大為削弱。測定網(wǎng)絡(luò)引文的可追溯性可以評估網(wǎng)絡(luò)信息的學(xué)術(shù)參考功能,使研究者知曉引用網(wǎng)絡(luò)信息的風(fēng)險。

      目前,圖書情報學(xué)期刊論文中網(wǎng)絡(luò)引文的數(shù)量、類型、分布及其整體可追溯性已受到國內(nèi)外學(xué)者的普遍關(guān)注,但從更細維度、更深層面探討網(wǎng)絡(luò)引文的可追溯性的研究尚不多見。丁俊達和楊思洛[1]利用軟件檢測了我國2005-2010年間圖書情報學(xué)期刊中不同格式、域名的網(wǎng)絡(luò)引文的可追溯性。張麗敏和王平[2]就我國情報學(xué)科研人員引證網(wǎng)絡(luò)引文的總體可追溯情況以及不同域名、網(wǎng)頁類型、URL深度的網(wǎng)絡(luò)引文與可追溯性間的關(guān)系進行實證分析。朱瑩和望俊成[3]計算了中文圖書情報領(lǐng)域核心期刊的網(wǎng)絡(luò)引文的半衰期,探索其年際數(shù)量變化以及域名、深度與其衰減規(guī)律的聯(lián)系。但上述研究存在統(tǒng)計時段偏早、分析角度較少、過分依賴軟件工具等缺陷。從網(wǎng)絡(luò)引文的格式、域名、語種、頁面類型的分布出發(fā),分析不同維度下網(wǎng)絡(luò)引文的可追溯性,有利于更全面、深入地了解網(wǎng)絡(luò)信息的可追溯性和變更頻率,為圖書館學(xué)研究者有選擇地搜索、利用網(wǎng)絡(luò)信息資源提供指導(dǎo),使網(wǎng)絡(luò)信息更好地服務(wù)于研究。

      1 數(shù)據(jù)來源及處理過程

      筆者在圖書館學(xué)領(lǐng)域選擇四種中文期刊:《中國圖書館學(xué)報》、《大學(xué)圖書館學(xué)報》、《圖書情報工作》(上半月刊)和《圖書館雜志》。四者均為CSSCI源刊,在本學(xué)科領(lǐng)域內(nèi)具有較強的學(xué)術(shù)影響力;其出版發(fā)行周期各異,且在統(tǒng)計時段內(nèi)無變化;引文著錄格式相對規(guī)范,內(nèi)容較完整,便于驗證網(wǎng)絡(luò)引文的可追溯性。

      筆者首先利用中國社會科學(xué)引文索引數(shù)據(jù)庫獲取四種期刊2009-2013年間所刊載論文的全部引文信息(下載所得的參考文獻已自動去重)。為避免遺漏網(wǎng)絡(luò)引文,筆者登錄萬方數(shù)據(jù)庫,瀏覽相應(yīng)文獻記錄下的“參考文獻”欄目,進行人工檢查。共得到網(wǎng)絡(luò)引文15221條,其基本信息見表1、表2。

      表1 網(wǎng)絡(luò)引文的期刊分布情況

      表2 網(wǎng)絡(luò)引文的年度分布情況

      統(tǒng)計說明:

      (1)編務(wù)文章、新聞簡訊、講話報告、講座記錄、轉(zhuǎn)載文章、通知公告等不納入統(tǒng)計范圍。(2)如某文多次引用同一網(wǎng)絡(luò)引文,不重復(fù)計算。但若同一網(wǎng)絡(luò)引文出現(xiàn)在多篇文章中,則重復(fù)計算。(3)注明來源網(wǎng)址但訪問日期缺失的引文,仍視為網(wǎng)絡(luò)引文。(4)若某文中多條網(wǎng)絡(luò)引文的URL相同,僅說明文字不同,仍視為同一引文。(5)統(tǒng)計范圍僅限于參考文獻中的網(wǎng)絡(luò)引文。鑒于腳注中的網(wǎng)絡(luò)引文很少且著錄欠完整,故未作統(tǒng)計。

      在獲取統(tǒng)計時段內(nèi)所有網(wǎng)絡(luò)引文的基礎(chǔ)上,筆者選用網(wǎng)站鏈接分析軟件Web Link Validator中文版之1.1版檢測網(wǎng)絡(luò)引文的可追溯性[4]。以篇為單位,將網(wǎng)絡(luò)引文的URL分批導(dǎo)入軟件(軟件會自動對URL執(zhí)行去重,一次性導(dǎo)入所有URL將使出現(xiàn)在不同論文中的同一網(wǎng)絡(luò)引文被刪除;且軟件單次至多可檢測500個URL),之后選擇“驗證”功能項進行檢測。檢測完成后,對于不可追溯的URL,依據(jù)其錯誤類型進行分類統(tǒng)計。

      檢測中,有少數(shù)URL的訪問錯誤類型顯示為“Unidentified Error(未識別錯誤)”。為了解具體的錯誤類型,筆者使用該軟件英文版之5.7版對這些URL再行檢測[5]。但受其功能所限,檢測時只能逐個輸入URL進行驗證。對于狀態(tài)碼顯示為“200 OK”的URL,則在瀏覽器中再次打開,以判斷頁面內(nèi)容是否發(fā)生改變。最終確定各年度內(nèi)可追溯的網(wǎng)絡(luò)引文總數(shù),并按網(wǎng)站域名、網(wǎng)頁格式、來源頁類型、URL深度分別統(tǒng)計出網(wǎng)絡(luò)引文的可追溯數(shù)量。檢測時間為2014年6月2日至30日。

      2 網(wǎng)絡(luò)引文可追溯性的總體情況

      2.1網(wǎng)絡(luò)引文的歷年可追溯率

      圖1 網(wǎng)絡(luò)引文可追溯率的歷年總體情況(2009-2013年)

      統(tǒng)計顯示,2009-2013年間,四種期刊中網(wǎng)絡(luò)引文的總體可追溯率為66.9%,與國外圖書情報學(xué)期刊網(wǎng)絡(luò)引文64%-69%的可追溯率基本持平[6-7]??傮w而言,各刊網(wǎng)絡(luò)引文的可追溯率基本呈逐年上升趨勢,且彼此間差距不大??傮w可追溯率從2009年的55.4%漲至2013年的78%,年均增長8.9%;其中2010-2011年間增幅較小,而2011-2012年間增幅較大。網(wǎng)絡(luò)引文的可追溯率以《圖書情報工作》最高,達70.7%;《中國圖書館學(xué)報》次之,為67.4%;《大學(xué)圖書館學(xué)報》和《圖書館雜志》則均在62%左右。如圖1所示,四者2009年刊載的論文中,仍可追溯的網(wǎng)絡(luò)引文均超過半數(shù)??紤]到從作者引用網(wǎng)絡(luò)信息到文章發(fā)表歷時1年左右,加之相應(yīng)信息的上線時間更早,筆者推斷四種期刊網(wǎng)絡(luò)引文的半衰期都不小于6年,《中國圖書館學(xué)報》、《圖書情報工作》的網(wǎng)絡(luò)引文的半衰期還要更長一些。而據(jù)國外多份研究報告顯示,網(wǎng)頁的平均壽命估計僅為44-100天[8]??梢?,上述論文中所引網(wǎng)絡(luò)信息的生命周期明顯長于普通網(wǎng)絡(luò)信息,且穩(wěn)定性較好。

      2.2網(wǎng)絡(luò)引文不可追溯的原因

      不可追溯的網(wǎng)絡(luò)引文多數(shù)表現(xiàn)為其URL指向的網(wǎng)頁無法訪問。對于未能成功訪問的URL,Web Link Validator軟件返回的錯誤類型如表3所示。

      表3 網(wǎng)絡(luò)引文訪問錯誤的類型

      注:“其它”包括無效的服務(wù)器響應(yīng)、此文檔/資源當(dāng)前不可用、網(wǎng)站已停止服務(wù)、錯誤的請求、MySQL語法錯誤、未識別的參數(shù)等錯誤。因為總數(shù)甚少,文章不予討論。

      由表3可知,網(wǎng)絡(luò)引文的訪問錯誤高度集中于一種錯誤——頁面/文檔未找到(Not Found),即服務(wù)器找不到請求的網(wǎng)頁或文檔,其數(shù)量占到錯誤總數(shù)(不含頁面內(nèi)容改變)的87.5%。主要原因是服務(wù)器刪除了網(wǎng)頁,或網(wǎng)頁位置發(fā)生變更卻未提供自動重定向機制。此外,URL輸入有誤亦可造成該錯誤的產(chǎn)生??紤]到部分網(wǎng)站服務(wù)器對未找到的URL執(zhí)行了自動重定向至首頁或其它頁面的操作,該錯誤的實際數(shù)量應(yīng)多于統(tǒng)計數(shù)量。筆者還發(fā)現(xiàn),URL檢測軟件通常將該錯誤定義為“所請求的網(wǎng)頁已消失”,而不包括重定向至404錯誤頁面和頁面尚存而其中的文檔已不存在等情況。因此,較之完全基于軟件檢測的同類研究,本研究中該錯誤所占的比例明顯更高。

      其余錯誤為數(shù)稀少且分布零散。其中數(shù)量最多的是“無法連接(數(shù)據(jù)庫連接失?。?。這表明互聯(lián)網(wǎng)信息服務(wù)(IIS)未啟動或無法從訪問端取得服務(wù),以致在設(shè)定的時間內(nèi)未收到來自服務(wù)器的任何響應(yīng),其實質(zhì)是客戶端無法與服務(wù)器建立連接。此錯誤的產(chǎn)生原因主要是網(wǎng)絡(luò)連通性差,以及服務(wù)器或網(wǎng)關(guān)故障。當(dāng)欲連接到的 Internet 服務(wù)器不存在或代理服務(wù)器上有多個默認網(wǎng)關(guān)且這些網(wǎng)關(guān)位于互不連接的網(wǎng)絡(luò)上時,也可能出現(xiàn)此錯誤。“連接已重置”的出現(xiàn)次數(shù)居第三,表明目標(biāo)網(wǎng)站的并發(fā)連接數(shù)較多,超出網(wǎng)站服務(wù)器處理能力或設(shè)置的連接數(shù)上限。該錯誤亦可見于訪問某些遭人為封禁的網(wǎng)站(如Facebook、YouTube)。

      網(wǎng)絡(luò)引文不可追溯的另一種情況是:部分網(wǎng)頁的URL雖未改變,但其內(nèi)容較作者引用時發(fā)生變化。不可追溯的網(wǎng)絡(luò)引文中約有17%屬于這類網(wǎng)頁。內(nèi)容改變主要分為三種情況:因域名到期導(dǎo)致主機名(網(wǎng)站)改變、因網(wǎng)站維護導(dǎo)致網(wǎng)頁內(nèi)容更新、因網(wǎng)站結(jié)構(gòu)布局調(diào)整導(dǎo)致頁面主題改變。統(tǒng)計顯示,在內(nèi)容發(fā)生改變的網(wǎng)絡(luò)引文中,com域名最為普遍,占總數(shù)的31.3%。這反映出商業(yè)類信息的動態(tài)性強,更新相對頻繁。Edu和org域名的網(wǎng)絡(luò)引文中,內(nèi)容發(fā)生改變的也較多,分別占23.5%和22.6%。這顯然與全球教育、科研事業(yè)發(fā)展迅猛、成果顯著有關(guān)。

      3 不同域名、格式、語種、頁面類型、深度下網(wǎng)絡(luò)引文的可追溯率

      3.1網(wǎng)絡(luò)引文的可追溯率與域名的關(guān)系

      網(wǎng)絡(luò)引文的可追溯率與域名的關(guān)系揭示了不同網(wǎng)絡(luò)信息源的信息穩(wěn)定程度。不同域名的網(wǎng)絡(luò)引文,其可追溯率如圖2所示。

      圖2 不同域名網(wǎng)絡(luò)引文的可追溯率

      由圖2可見,ac、org域名的網(wǎng)絡(luò)引文擁有最高的可追溯率,達70%左右,可見學(xué)術(shù)、科研機構(gòu)的網(wǎng)站是研究者們值得信賴的信息源,這與屈衛(wèi)群等人[9]的研究結(jié)果一致。雖然商業(yè)網(wǎng)站的信息往往被認為缺乏嚴(yán)肅性、真實性,但檢測結(jié)果表明com域名的網(wǎng)絡(luò)引文可追溯率稍遜于ac、org域名,而明顯高過政府部門、教育機構(gòu)等非盈利機構(gòu)網(wǎng)站所使用的gov、edu等域名。這既與商業(yè)網(wǎng)站的運營管理人員重視網(wǎng)絡(luò)營銷、勤于網(wǎng)站維護有關(guān),同時亦表明圖書館學(xué)學(xué)者在利用網(wǎng)絡(luò)信息時對商業(yè)類網(wǎng)絡(luò)信息源進行了審慎的鑒別和篩選,內(nèi)容穩(wěn)定性較好的門戶網(wǎng)站、博客平臺、網(wǎng)絡(luò)百科更受青睞。令人遺憾的是,gov域名的網(wǎng)絡(luò)引文的可追溯率僅為50.3%,衰減最為迅速,且能自動重定向的URL數(shù)量很少。這嚴(yán)重影響了政府信息公開的力度與績效,制約著電子政務(wù)事業(yè)的發(fā)展。此外,edu域名的可追溯率也低于平均水平,原因可能是新的信息和研究成果迅速涌現(xiàn),網(wǎng)站更新時舊的網(wǎng)頁、文檔被更新或替換。由此看來,擁有大量權(quán)威、可靠的信息資源的政府部門、教育機構(gòu)亟需加強對其網(wǎng)站及站內(nèi)內(nèi)容、鏈接的維護。3.2網(wǎng)絡(luò)引文的可追溯率與網(wǎng)頁格式的關(guān)系

      筆者根據(jù)網(wǎng)頁后綴,將網(wǎng)絡(luò)引文分為靜態(tài)類網(wǎng)絡(luò)引文、動態(tài)類網(wǎng)絡(luò)引文以及無后綴名的網(wǎng)絡(luò)引文。不同格式的網(wǎng)絡(luò)引文,其可追溯率如表4所示。

      表4 不同格式網(wǎng)絡(luò)引文的可追溯性

      由表4可知,無后綴名子頁的整體可追溯率最高,靜態(tài)網(wǎng)頁次之,動態(tài)網(wǎng)頁最低。原因可能是無后綴名子頁的開發(fā)過程中通常使用了URL重寫技術(shù),將網(wǎng)頁的實際訪問路徑隱藏,而代之以自定義的、較為簡短易記的URL,以提升網(wǎng)站內(nèi)容的安全性。當(dāng)實際訪問路徑發(fā)生改變時,重寫的URL不必隨之改變。靜態(tài)網(wǎng)頁中,shtml/shtm/stm格式(使用服務(wù)器端包含技術(shù)的html)的網(wǎng)頁的可追溯率明顯高出其它格式。使用該格式的網(wǎng)頁能不斷更新自身的信息,以保證瀏覽器顯示的是該頁面的最新版本,而不必刪除舊網(wǎng)頁,新聞網(wǎng)站等內(nèi)容更新非常頻繁的網(wǎng)站常使用這種格式。它雖屬于靜態(tài)網(wǎng)頁,卻能呈現(xiàn)動態(tài)效果,兼有靜態(tài)、動態(tài)網(wǎng)頁之長,已逐漸得到網(wǎng)站開發(fā)者的青睞。有理由相信,將shtml格式更多地應(yīng)用于網(wǎng)頁制作,有助于延長網(wǎng)頁的生命周期,提升網(wǎng)絡(luò)引文的可追溯率。其余格式的靜態(tài)網(wǎng)絡(luò)引文可追溯率則基本相同。動態(tài)網(wǎng)頁的信息顯示依賴于網(wǎng)頁與后臺數(shù)據(jù)庫的交互以及數(shù)據(jù)傳遞,一旦后臺數(shù)據(jù)庫的結(jié)構(gòu)發(fā)生改變即無法訪問,且動態(tài)網(wǎng)頁的URL中通常含有較多參數(shù)或特殊字符,解析較為困難,也降低了其可追溯率。但不同格式的動態(tài)網(wǎng)絡(luò)引文可追溯率差別不大,php、cfm格式相對較高。3.3網(wǎng)絡(luò)引文的可追溯率與語種的關(guān)系

      筆者將網(wǎng)絡(luò)引文分為中文、外文網(wǎng)絡(luò)引文。不同語種的網(wǎng)絡(luò)引文,其可追溯率見圖3。

      圖3 中、外文網(wǎng)絡(luò)引文的可追溯性

      如圖3所示,外文網(wǎng)絡(luò)引文各年度的可追溯率均高于中文網(wǎng)絡(luò)引文7-16個百分點。這得益于其更多地利用了自動重定向機制,在可追溯的外文網(wǎng)絡(luò)引文中,URL自動重定向的引文占17.5%,而中文網(wǎng)絡(luò)引文中該比例僅為7.7%。同時錯誤種類也稍多,表明其錯誤的分布更加分散。但兩者的主要錯誤類型相同,數(shù)量居前兩位的錯誤均為“頁面/文檔未找到”和“無法連接(數(shù)據(jù)庫連接失?。薄4送?,外文網(wǎng)絡(luò)引文中,內(nèi)容發(fā)生改變者所占比例更大。以上表明,與國外相比,我國網(wǎng)站管理人員的網(wǎng)站維護意識還有待加強,對網(wǎng)站結(jié)構(gòu)、內(nèi)容的穩(wěn)定性也不夠重視。網(wǎng)站管理人員應(yīng)定期檢測網(wǎng)站的內(nèi)、外鏈,不輕易調(diào)整網(wǎng)站結(jié)構(gòu),并盡量減少網(wǎng)頁地址的變更和網(wǎng)站內(nèi)容的遷移。

      3.4網(wǎng)絡(luò)引文的可追溯率與頁面類型的關(guān)系

      筆者根據(jù)網(wǎng)絡(luò)引文所指向頁面在網(wǎng)站中的層級,將網(wǎng)絡(luò)引文分為來自主頁、來自子頁和來自下載鏈接頁三類。由圖4可見,各年度內(nèi),主頁的可追溯率均明顯高于子頁和下載鏈接頁。其原因在于,只要網(wǎng)站不發(fā)生服務(wù)器遷移或停止運營的情況,其主頁一般不會消亡。子頁的整體可追溯率又略高于下載鏈接頁。這可能與后者多為會議論文、研究報告等學(xué)術(shù)文獻,超出某一時限后即被網(wǎng)站方刪除或遷移至新地址有關(guān)。除此之外,下載鏈接頁的URL深度通常較大,也使其可追溯率受到一定影響。下載鏈接頁中的信息具有較高的學(xué)術(shù)價值,而可追溯率卻較低,說明大量寶貴的學(xué)術(shù)信息和研究成果隨時間流失。這無疑使圖書館學(xué)研究遭受不小的損失。

      圖4 不同頁面類型網(wǎng)絡(luò)引文的可追溯性

      3.5網(wǎng)絡(luò)引文的可追溯率與URL深度的關(guān)系

      筆者按照URL的深度,分別統(tǒng)計不同深度下網(wǎng)絡(luò)引文的可追溯率。文章考察的網(wǎng)絡(luò)引文的URL深度介于0-14間。因深度6以上的URL數(shù)量較少,在此一并統(tǒng)計。具體情況見圖5。

      圖5 隨URL深度變化的網(wǎng)絡(luò)引文的可追溯性

      Spinellis[10]認為隨著URL深度的增加,網(wǎng)絡(luò)引文不可追溯的可能性逐漸加大。其原因在于:URL越長,其中元素的變更概率越大;URL越短則越易于被人們識記和引用,從而促使網(wǎng)頁提供者保存該網(wǎng)頁。本處的統(tǒng)計結(jié)果與該結(jié)論基本契合。圖5中,除主頁外,其余頁面的URL深度與可追溯率呈現(xiàn)弱相關(guān)關(guān)系,即隨著URL層級的增加,網(wǎng)頁的可追溯率有所降低,但并非呈持續(xù)下降趨勢。總體而論,網(wǎng)絡(luò)引文的可追溯率隨URL深度增加而逐漸下降。但當(dāng)深度為4和6時,引文的可追溯率均有明顯回升,深度為4的網(wǎng)絡(luò)引文可追溯率在所有深度的引文中甚至位居第二,其原因有待探討。

      4 結(jié)論與思考

      由表2可見,四種圖書館學(xué)期刊所載論文中,含有網(wǎng)絡(luò)引文的論文占論文總數(shù)之比、網(wǎng)絡(luò)引文占引文總數(shù)之比、篇均網(wǎng)絡(luò)引文數(shù)均呈上升趨勢。這說明網(wǎng)絡(luò)信息資源已得到我國圖書館學(xué)界的廣泛認可和使用。但歷經(jīng)數(shù)年后,相當(dāng)一部分網(wǎng)絡(luò)引文(包括一些發(fā)表年代較早但被引率頗高的經(jīng)典論文)已經(jīng)不可追溯,這對于研究者而言無疑是一大憾事。

      如前所述,網(wǎng)絡(luò)引文不可追溯的主要原因在于網(wǎng)站遷移或停止運營而導(dǎo)致的頁面和文檔消失。有鑒于此,以信息資源的收集、保存與管理為核心職責(zé)之一的圖書館、檔案館亟待強化對具有較高參考價值的網(wǎng)絡(luò)資源(如博文、維基、開放存取學(xué)術(shù)資源)的存檔。20世紀(jì)90年代以來,許多國家開展了網(wǎng)絡(luò)信息保存實驗項目,其中代表性的有美國的Internet Archive、澳大利亞的PANDORA等。我國國家圖書館也于2003年開展了網(wǎng)絡(luò)信息資源采集與保存實驗項目(WICP),北京大學(xué)計算機網(wǎng)絡(luò)與分布式系統(tǒng)實驗室開發(fā)了中國網(wǎng)頁歷史信息存儲與展示系統(tǒng)“中國Web 信息博物館”[11]。但當(dāng)前網(wǎng)絡(luò)信息的保存仍滯后于網(wǎng)絡(luò)信息的高速增長。圖書館、檔案館應(yīng)制訂和完善網(wǎng)絡(luò)信息采集方案,確定采集范圍、頻率和策略,擇用合適的技術(shù)手段建設(shè)網(wǎng)絡(luò)資源存檔網(wǎng)站或中心,并提供信息檢索服務(wù),以滿足各種學(xué)術(shù)、商業(yè)與個人用途。在此過程中,尤須注意對網(wǎng)絡(luò)信息版權(quán)的處理。國內(nèi)相關(guān)管理部門應(yīng)借鑒有關(guān)國際經(jīng)驗,在《公共圖書館法》、《著作權(quán)法》等法規(guī)中就網(wǎng)絡(luò)信息存檔的主體、存檔的原則與標(biāo)準(zhǔn)、版權(quán)人的認定、存檔的授權(quán)許可機制、存檔資源的訪問和獲取、合理使用原則的適用情況等方面作出規(guī)定或補充,協(xié)調(diào)創(chuàng)作者、網(wǎng)站方、保存者、使用者等各方利益,妥善應(yīng)對可能產(chǎn)生的版權(quán)糾紛,減少相應(yīng)風(fēng)險;還可考慮通過制訂、簽署多邊條約等方式為國外網(wǎng)絡(luò)信息的存檔掃除障礙。同時,完善現(xiàn)有的出版物呈繳制度,將網(wǎng)頁納入電子出版物呈繳的范圍,以保障該項工作的穩(wěn)步推進。

      首先,網(wǎng)站管理可以為改善網(wǎng)絡(luò)引文的可追溯性發(fā)揮重要作用。網(wǎng)站改版時,只要主頁地址未變,網(wǎng)站管理與維護人員應(yīng)通過自動重定向機制將用戶引導(dǎo)至新網(wǎng)址而無需另行搜索;或者向用戶指明欲訪問內(nèi)容所在的欄目,以便用戶查找、獲取所需信息。這樣即可有效抑制“頁面/文檔未找到”錯誤的產(chǎn)生。此外,定期檢測網(wǎng)址鏈接,及時清除死鏈、修復(fù)壞鏈也頗為必要。值得一提的是,政府部門、教育機構(gòu)和研究機構(gòu)尤應(yīng)重視其網(wǎng)站歷史頁面的存檔工作,對URL未變而頁面內(nèi)容有所更新的網(wǎng)頁應(yīng)提供其不同時期歷史版本的快照鏈接,同時向承擔(dān)網(wǎng)絡(luò)信息存檔職責(zé)的圖書館、檔案館定期提交這些歷史頁面,使用戶能在較長時間內(nèi)利用其發(fā)布的學(xué)術(shù)價值較高的網(wǎng)絡(luò)信息。此外,“無法連接”和“連接已重置”這兩種錯誤的出現(xiàn)頻次也相對稍多,其原因往往在于服務(wù)器發(fā)生故障或處理能力不足。由此可見,網(wǎng)站管理對網(wǎng)站服務(wù)器進行持續(xù)性維護和升級是改善網(wǎng)絡(luò)引文可追溯性的又一重要手段。

      再次,研究者利用網(wǎng)絡(luò)信息的習(xí)慣也會對網(wǎng)絡(luò)引文的可追溯性有所影響。統(tǒng)計表明,深度在7以上的引文可追溯率較低,URL中含有多個參數(shù)或特殊字符的網(wǎng)頁(多為動態(tài)網(wǎng)頁)也難以追溯,因此研究者應(yīng)盡可能謹慎使用URL深度過大、所含參數(shù)過多的網(wǎng)絡(luò)引文。此外,研究者有必要樹立“參考文獻再利用”的意識,重視網(wǎng)絡(luò)信息的穩(wěn)定性,盡可能地了解本領(lǐng)域內(nèi)信息豐富、權(quán)威、可信且網(wǎng)站運營相對穩(wěn)定、維護得力的網(wǎng)絡(luò)信息源,選用其中的信息作為參考,以便自己和他人日后查考、引證之用。

      最后,極少數(shù)網(wǎng)絡(luò)引文可能因作者著錄不規(guī)范(如缺少網(wǎng)站名)、出錯(如漏、誤輸字母和符號)或編排、印刷環(huán)節(jié)之誤而導(dǎo)致不可追溯,但實際上通過原網(wǎng)址仍可訪問。若作者在提交論文時仔細核對引文著錄內(nèi)容,編輯人員在審稿、編排時注意核實引文來源,當(dāng)可有助于網(wǎng)絡(luò)引文可追溯率的提升。

      網(wǎng)絡(luò)引文所指向的網(wǎng)絡(luò)信息資源是人類文化遺產(chǎn)的一部分。筆者認為,一方面,提升圖書館學(xué)乃至其它學(xué)科期刊論文中網(wǎng)絡(luò)引文的可追溯率,有賴于作者、編輯、讀者、網(wǎng)站管理人員的共同努力。另一方面,圖書館等公共機構(gòu)也需廣泛開展網(wǎng)絡(luò)資源存檔項目,并建立健全合作、協(xié)調(diào)機制。唯有多措并舉、多管齊下,方能切實保障這些資源為廣大研究人員長期利用,充分發(fā)掘其內(nèi)在價值。

      (來稿時間:2014年10月)

      參考文獻:

      1.丁敬達,楊思洛. 國內(nèi)圖書情報學(xué)期刊網(wǎng)絡(luò)引文的類型、分布與可追溯性分析. 圖書情報工作,2012(24):60-64

      2.張麗敏,王平. 基于P-W型網(wǎng)絡(luò)引文引證可追溯性研究. 情報雜志,2012(7):61-65

      3.朱瑩,望俊成. 情報學(xué)領(lǐng)域網(wǎng)絡(luò)引文衰減規(guī)律研究——以三種核心期刊為例. 情報科學(xué),2010(5):699-704

      4.Web Link Validator 1.1. [2014-08-18]. http://www.hanzify. org/software/368.html

      5.Download Web Link Validator.[2014-08-15]. http://www. relsoftware.com/wlv/ downloads/

      6.Ali Sadat-Moosavi, etc. Accessibility of online resources cited in scholarly LIS journals: A study of Emerald ISI-ranked journals. Aslib Proceedings, 2012(2): 178-192

      7.Dion Hoe-Lian Goh, Peng Kin Ng. Link Decay in Leading Information Science Journals. Journal of the American Society for Information Science and Technology, 2007(1): 15-24

      8.The Library of Congress. The Average Lifespan of a Webpage. [2014-07-28]. http://blogs.loc.gov/digitalpreservation/ 2011/11/ the-average-lifespan-of-a-webpage/

      9.屈衛(wèi)群,姚小嬌,魏丹等. 網(wǎng)絡(luò)引文量及其可獲取性的調(diào)查與分析. 情報雜志,2008(12):112-114

      10. Spinellis, D. The decay and failures of Web references. Communications of the ACM, 2003 (1): 1-77

      11.劉青,孔凡蓮. 中國網(wǎng)絡(luò)信息存檔及其與國外的比較——基于國家圖書館WICP項目的研究. 圖書情報工作,2013(18):80-86,93

      〔分類號〕G203

      〔作者簡介〕莊曉喆(1989- ),男,武漢大學(xué)信息管理學(xué)院2013級博士研究生,研究方向:知識組織與知識管理。

      An Investigation of the Availability of Web Citations in Chinese Library Science Journals——Taking Four Core Journals as an Example

      Zhuang Xiaozhe
      ( School of Information Management, Wuhan University )

      〔Abstract〕As web citation becomes an important component in references under the network environment that availability has received increasing attention. Choosing four core library science journals in China published between 2009 and 2013, this study takes an empirical analysis of their web citations (P-W web citation). The yearly as well as overall availability of web citations, the reasons for web citation’s unavailability, and the relations between web citations’availability and corresponding webpage’s domain, format, language, type and URL depth are explored. The study argues that strengthening the archiving of online information resources, improving the maintenance of websites, and selecting online information sources prudently are effective measures to increase the availability of web citations.

      〔Key words 〕Web citationTraceabilityLibrary scienceJournal

      猜你喜歡
      圖書館學(xué)域名網(wǎng)頁
      2023 年寧夏圖書館學(xué)會年會順利召開
      基于CSS的網(wǎng)頁導(dǎo)航欄的設(shè)計
      電子制作(2018年10期)2018-08-04 03:24:38
      如何購買WordPress網(wǎng)站域名及綁定域名
      基于URL和網(wǎng)頁類型的網(wǎng)頁信息采集研究
      電子制作(2017年2期)2017-05-17 03:54:56
      網(wǎng)頁制作在英語教學(xué)中的應(yīng)用
      電子測試(2015年18期)2016-01-14 01:22:58
      騰訊八百萬美元收購域名
      10個必知的網(wǎng)頁設(shè)計術(shù)語
      中國圖書館學(xué)之當(dāng)下:反思與瞻望
      圖書館論壇(2014年9期)2014-03-11 18:48:08
      廣西圖書館學(xué)會2013年年會暨第31次科學(xué)討論會在貴港舉行
      圖書館界(2013年6期)2013-03-11 18:50:45
      廣西圖書館學(xué)會2012年年會暨第30次科學(xué)討論會在南寧舉行
      圖書館界(2013年1期)2013-03-11 18:50:04
      富源县| 马龙县| 文昌市| 商丘市| 宝丰县| 肥西县| 桐柏县| 巢湖市| 旌德县| 包头市| 德清县| 枣强县| 昭通市| 绍兴市| 黄浦区| 康保县| 石屏县| 徐汇区| 四平市| 平果县| 阜康市| 灵璧县| 荃湾区| 新巴尔虎右旗| 龙川县| 册亨县| 略阳县| 阳泉市| 海兴县| 巴彦县| 新巴尔虎左旗| 天峨县| 全州县| 岳池县| 钟祥市| 宜黄县| 宜兴市| 达拉特旗| 望都县| 会理县| 漯河市|