●王 錳,陳 雅(南京大學信息管理學院,南京210023)
2004-2013年國內機構知識庫演進與發(fā)展研究
●王 錳,陳 雅(南京大學信息管理學院,南京210023)
機構知識庫;主題分析;發(fā)展趨勢;CNKI
利用CNKI統(tǒng)計2004~2013年機構知識庫研究論文的關鍵詞,并進行聚類分析。分析總結出國內機構知識庫研究主題的主要發(fā)展趨勢為:機構知識庫相關技術的研究表現在新技術的引入與使用;資源存儲與組織研究會朝著關聯數據、知識挖掘和知識可視化等方向不斷發(fā)展,機構知識庫評價研究會更加深入等。
根據OpenDOAR統(tǒng)計,到2014年4月5日,其收錄的機構知識庫總數已達2624個,其中美國最多,有443個,占16.9%,英國其次,有221個,占8.4%,而中國只有39個。[1]國內機構知識庫研究始于吳建中教授于2004年發(fā)表的《圖書館VS機構庫》,[2]此后,有關其研究逐漸成為圖書情報與檔案管理學科的熱門話題。據文獻調查,近年發(fā)表的機構知識庫綜述性論文比較少,對研究主題從整體上進行梳理的也不多見。因此,本文將著眼于近十年來有關機構知識庫主題的文章,并通過關鍵詞進行聚類分析,探索當前機構知識庫主要研究領域及其發(fā)展趨勢。
以CNKI為統(tǒng)計來源,通過檢索詞“機構知識庫”、“機構庫”、“機構典藏”、“機構倉儲”、“機構存儲”對2004~2013年的文獻進行檢索,文獻類型包括期刊、學位論文、會議論文、報紙等,并對重復論文合并,無關論文剔除,共得到相關主題領域論文919篇。圖1顯示了2004~2013年機構知識庫關鍵詞年度數量變化情況。
如圖1所示,2004年之前,國內學者對機構知識庫研究基本沒有涉足,而2004~2006年是國內機構知識庫研究的起步階段,這個階段通過對機構知識庫的引入,為國內機構知識庫研究奠定了基礎;從2007年開始國內機構知識庫研究有較大幅度增長;到2013年國內文獻量達到153篇的高峰,近幾年研究數量趨于穩(wěn)定在140篇以上。而且通過機構知識庫關鍵詞數量變化情況,發(fā)現國內研究雖然起步較晚,但關注度較高,特別是在2007年之后增幅較大,隨著國內機構知識庫建設工作的開展,逐漸成熟,可以預見,今后的研究論文數量將基本保持穩(wěn)定。
圖1 機構知識庫關鍵詞年度數量變化
關鍵詞一般可以在某種程度上展現研究主題,通過它可以整體把握國內機構知識庫的研究領域,所以首先對論文中作者給出的關鍵詞進行統(tǒng)計分析。(1)篩去含義比較寬泛的詞匯,如“發(fā)展研究”、“調查分析”、“應用策略”、“風險”、“現狀”、“對策”等。(2)合并同義但表述不一樣的詞匯。如“機構知識庫”、“機構倉儲”、“機構知識倉儲”、“機構庫”、“機構存儲庫”、“機構典藏庫”這些專業(yè)術語表達對象基本相同,而機構知識庫出現的頻次最高,認可度高,用它對同義詞進行替換。開放獲取、開放存取、開放利用是國內對Open Access的譯法,其中開放存取出現最多,用其進行同義替換等。
表中給出了機構知識庫研究出現頻率較高的關鍵詞及頻次??梢钥闯觯_放獲取是機構知識庫產生的大環(huán)境,作為開放存取的一種實現模式,機構知識庫對提高學術交流的效率,促進學術資源共享發(fā)揮著重要作用,它是數字時代、大數據時代促進學術研究的一項關鍵基礎設施,作為關鍵詞出現頻繁。圖書館、高校圖書館、數字圖書館、高校是關注機構知識庫的主體也是實踐的主體,出現次數也高。資源共享、信息服務、知識服務是研究者關注機構知識庫的主要作用,緊隨其后。在機構知識庫資源建設和使用過程中的版權、知識產權問題以及資源的長期保存問題也為學者所重視。在實踐中,學者關注其他國家或地區(qū)的實踐經驗和機構知識庫聯盟經驗,機構知識庫建設中的知識管理問題也是不可忽視的要素。此外機構知識庫資源建設質量控制、Dspace、開源軟件等技術性問題在機構知識庫構建和服務中也受到關注,而系統(tǒng)軟件又以Dspace為研究重點。
表 2004~2013機構知識庫研究領域高頻關鍵詞及頻次
通過使用聚類功能對高頻關鍵詞進行系統(tǒng)分析,如圖2所示,最終得出近十年來國內機構知識庫研究的主題,這為了解國內機構知識庫研究的重要領域提供了相對客觀的依據。
2.1 機構知識庫構建的關鍵技術研究
機構知識庫研究涉及許多技術,其建設不僅要考慮軟件引進或開發(fā),還要考慮軟件使用中的功能擴展問題,以及用戶界面的友好性、易用性。出現的關鍵詞主要有:Dspace、OAI、OAI-PMH、開源機構庫軟件、數據恢復、開源軟件、管理系統(tǒng)、Fedora等。從關鍵詞可以看出,DSpace軟件是國內機構知識庫建設最常用的軟件,這一定程度上反映了國內技術力量薄弱,大多使用國外開發(fā)的開放源碼軟件平臺。隨著機構知識庫關鍵技術開發(fā)與應用,對知識共享和知識庫建設有極大的推動作用。
2.2 機構知識庫資源共享研究
在機構知識庫研究中,學者十分重視信息資源的服務與共享。作為以信息服務為主的機構知識庫,信息資源共享很重要。由于機構知識庫是服務的新領域,需要各方協(xié)調、合作,因此對機構知識庫的資源共享研究顯得十分突出。共享類詞匯包括:資源共享、高校、機構庫聯盟、自存儲等。資源共建、共享研究自2005年以來,每年都有關鍵詞出現,可見各機構比較重視合作。而對孤立的機構知識庫進行整合,實現聯盟化,也是促進資源共享的重要手段,研究逐漸熱門。
圖2 2004~2013年國內機構知識庫研究主題領域
2.3 機構知識庫資源存儲、組織與質量控制研究
對于機構知識庫而言,如何有效地整合資源是提高機構知識庫效能的一個重要方面。其中在信息存儲與組織相關的高頻關鍵詞中,元數據、數字圖書館、長期保存、知識組織、資源整合、數字資源、學科機構知識庫等關鍵詞頻頻出現,表明機構知識庫建設中信息存儲與組織研究的理論研究和實踐增加。然而在機構知識庫資源建設中,版權問題和質量控制、評價問題也不可忽視。根據CNKI提取的關鍵詞,質量評價類關鍵詞有:可用性評估,評估方法,質量控制,學術評價,評價體系,分布評價,結構評價等,而且在有關研究中,除前期質量控制論述比較寬泛外,近年來機構知識庫評價類關鍵詞逐年增多,不斷深入,這說明學界很重視機構知識庫的建設質量與效用。
2.4 機構知識庫法律問題研究
隨著實踐的深入,在數量增長的同時,機構知識庫的知識版權、產權問題開始顯現。機構知識庫建設既要考慮軟件本身的產權問題,還要保證存儲的各類信息資源具有合法性,作為收藏信息資源的主體具有合法性,而且在學術交流、學術資源共享、圖書館資源建設中都涉及法律問題。在機構知識庫研究領域中,知識產權問題作為一個熱門的研究主題,主要涉及知識產權、開放內容許可協(xié)議、著作權等問題。其中開放存取的研究與實踐的產權問題是很重要的一個方面,開放存取出現次數僅次于機構知識庫,而且頻次數逐年增加。相信隨著機構知識庫在理論與實踐方面的不斷深入,有關著作權和知識產權的研究仍是圖書情報界比較關注的問題之一。
2.5 機構知識庫知識服務研究
機構知識庫的基本職能就是為用戶服務,其成效主要體現在它的服務上。與服務相關詞匯包括:高校圖書館、美國、信息服務、知識管理、學科館員、圖書館服務、服務模式、學術傳播、知識服務、個性化服務等。研究主題除寬泛的“圖書館服務”等難以辨別具體研究對象外,個性化服務、用戶服務的研究幾乎年年出現,特別是后幾年,用戶研究大量增加。從關鍵詞的變化可以看出,數字圖書館中有關信息服務的研究呈不斷增長趨勢。在圖書館服務的研究主題中,知識服務研究得到重視,特別是近兩年,在實踐中借鑒國外經驗,比如美國,注重學科館員的設立,注重知識管理,這都說明在機構知識庫研究領域中,注重服務質量的提升,注重高端服務的研究與實踐。
2.6 其他領域
機構知識庫建設的制度、政策和機制研究。政策、機制是具體實施的原則和指導方針,政策規(guī)定、機制確立是建設好機構知識庫的基礎。相關關鍵詞有:建設政策、建設機制、動力機制、政策框架、建設模式、體系結構等,而且研究主題由寬泛走向深入,“自存儲政策”、“呈繳模式”、“學術交流模式”等具體研究在近幾年有所增加。隨著機構知識庫從理論研究走向實踐應用,對于大陸、港臺地區(qū)和國外機構知識庫進展情況的介紹逐漸增多。日本大學圖書館、印度機構知識庫、美國機構知識庫、英國機構知識庫、中國科學院、國家科學圖書館、臺灣地區(qū)等關鍵詞逐漸增加,研究主題逐漸從日本、美國、臺灣、香港等轉移到中國大陸,在研究范圍上涉及外語院校、大專院校、大學等。由此可以看出,機構知識庫的實踐應用已在國內展開。
通過對主題研究領域的分析,我們對10年來機構知識庫的研究與實踐有了初步的了解,結合論文和對機構知識庫國家社科項目、省部級項目的調查,可以推測機構知識庫研究大致呈以下趨勢。
3.1 關鍵技術研究不斷深入
機構知識庫是依賴數字圖書館理論和信息技術支撐的新型信息管理架構,理論研究使機構知識庫更加合理,先進技術的應用則會使其更加高效。國內機構知識庫建設技術力量薄弱,大多使用國外開發(fā)的開放源碼軟件平臺,并且?guī)缀跞渴褂肈Space軟件,只簡單對DSpace進行本地化,機構知識庫軟件平臺功能單一,個性化不足。所以,機構知識庫異構系統(tǒng)互操作,機構知識庫中數據資源更新,機構知識庫的數據備份、數據保存以及機構知識庫系統(tǒng)軟件本地化開發(fā)和應用等方面的研究將會深入。比如中國科學院機構知識庫CASOpenIR,提出一種多維可定制的知識資產統(tǒng)計數據組織模式;[3]徐華對Dspace和關聯數據在構建機構知識庫服務模式中的應用研究;[4]張旺強在機構知識庫系統(tǒng)中集成開放知識組織引擎OpenKOS相關功能,對機構知識庫中的知識進行主題自動標引,對檢索結果進行DDC聚類瀏覽等服務功能[5]的研究,都是在關鍵技術領域研究的新成果。
3.2 資源存儲、組織與質量評價研究是研究熱點
信息資源內容構建機構知識庫的重點與關鍵,不僅影響著機構知識庫運行效能,還對信息資源服務和共享有保障作用。要想資源得到合理地利用和高效的服務,對其進行存儲和組織研究也必不可少。目前國內機構知識庫內容建設存在資源數量匱乏、資源類型單一、資源更新緩慢、資源全文獲取率較低、資源質量不高等問題,有的研究者認為可能是開放存取理念比較薄弱、政策支持缺位、建設主體錯位、以及過度的版權保護等,并提出從宣傳推廣、存繳政策、版權協(xié)議、質量控制來推動機構知識庫內容建設。[6]從近年的機構知識庫的研究發(fā)展來看,對于資源的存儲和組織的研究不斷增加??梢灶A見的是,未來有關資源存儲與組織的研究仍然是機構知識庫研究的重要任務,隨著大數據、云計算的深入,會朝著知識組織、關聯數據、知識關聯、知識挖掘和知識可視化的方向不斷發(fā)展。
在機構知識庫建設中,質量評價也很重要,如何確定科學的評價指標與評價方法仍需要繼續(xù)研究。其中,合理的激勵機制的制定是保證質量的重要因素,而姜勇峰以廈門大學學術典藏庫和美國機構知識庫刊物下載信息為例,運用聚類分析法,對用戶生成內容論文質量和刊物影響力進行質量評估,[7]就為機構知識庫的激勵機制實施提供了借鑒。未來有關機構知識庫質量的研究將表現在對各項指標探討,對指標內容細化,并用具體實踐來驗證各項評價指標的科學性、準確性,以建立科學的評價體系。
3.3 機構知識庫資源服務與共享是當前和未來的研究重點
目前,學者對機構知識庫中信息服務的研究比重在上升,特別是個性化服務的研究與實踐,建立機構知識庫聯盟以促進服務的論文越來越多。有的研究者通過中外比較,認為機構知識庫不僅能為圖書館用戶如高校師生提供保存、展示和傳播信息知識服務,還能為圖書館用戶提供長期的數據挖掘、數據發(fā)布、數據整合等服務。隨著機構知識庫的逐步發(fā)展,機構知識庫服務將出現重心轉移:比如共性服務向個性化服務轉移,文獻服務向知識服務轉移等,而這些轉移必然會引發(fā)大量的研究與實踐,對服務模式、服務技術、服務手段等需要深入探討。因此,信息服務研究還將會增加,特別是隨著機構知識庫實踐的不斷深入,不同系統(tǒng)之間的資源集成與服務也會受到學界的關注,資源共享與服務仍然是未來若干年內機構知識庫的重要任務,會朝著提高信息揭示深度、加強知識關聯和重視知識發(fā)現能力方面發(fā)展。
3.4 有關知識產權等問題研究更加深入
解決機構知識庫知識產權、著作權問題,對其建設有著非常重要的作用。機構知識庫資源種類豐富,產權歸屬復雜,有的研究者認為不論資源版權歸屬何方,機構知識庫對資源合理地進行網絡傳播、長期保存都需要版權持有者之許可,這需要國家著作權法律法規(guī)、出版商的合作、機構知識庫自身資源管理行為的規(guī)范、用戶使用行為的約束。[8]還有的以美國為例,分析其解決機構知識庫版權問題之政府強制開放存取方式、開放源代碼軟件方式和知識共享許可協(xié)議方式三種實踐方式。[9]隨著機構知識庫的更加普及,應用軟件涉及的法律問題,在開放存取及長期保存中涉及的版權問題,在網絡傳播以及讀者利用中的侵權責任主體的界定方面等問題會顯現,同時,利益平衡機制的建立和版權政策的研究將會增加,數字資源相關的知識產權法律也需出臺。所以,機構知識庫研究的知識產權等問題的研究短期也不會下降。
3.5 制度、政策、機制研究是普通研究領域的基礎
美國在2007年底國會就通過了強制性開放存取政策,并正式具備法律效力。英國、澳大利亞、荷蘭得到大型的國家項目支持。[10]國內機構知識庫建設和其相比,無論數量還是質量還處于初級階段,如果讓各機構憑借物力和財力獨立建設,明顯不行。因此,在機構知識庫建設初期必須在國家相關政策的指引和項目資金的支持下,確保機構知識庫建設有序進行和可持續(xù)發(fā)展。如肖希明等認為機構知識庫建設應由教育部牽頭,并提供政策、資金支持。[11]臺灣機構典藏的發(fā)展受到臺灣教育主管部門資金政策的大力支持,香港地區(qū)也根據香港大學資助委員會的要求將其資助的研究成果存放于統(tǒng)一的機構知識庫當中,這說明,學術機構知識庫的發(fā)展離不開相關政策、資金的支持。隨著機構知識庫建設理論的深化發(fā)展,許多宏觀問題都會得到大家的認同或者解決,但是涉及機構知識庫建設之具體政策指導和建設模式的研究仍會是側重點,需要在實踐中不斷探索與解決。
3.6 機構知識庫建設實踐研究增加
國內機構知識庫建設有一定程度的發(fā)展,取得一些成績。但與西方國家的機構知識庫建設相比,國內相關建設還不成體系,仍處于起步階段。我們應在構建機構知識庫的實踐中不斷總結經驗,并借鑒國外構建機構知識庫的成功案例,有的學者對日本機構知識庫進行引進介紹,并以京都大學實踐為例,對于其自引進以來至今的運用和實踐進行了詳細分析等。[12]基于此,我們需要從多個層面采取有效措施來推動機構知識庫建設,形成具有特色,使其真正發(fā)揮數字科研時代新的學術交流和知識共享平臺的作用。所以,隨著機構知識庫建設實踐的不斷深入,有關機構知識庫的案例研究還將會增加,案例研究將會從引進國外建設經驗轉向注重國內案例研究和實踐研究。
[1]OpenDOAR.Directory of Open Access Repositories[EB/OL].[2014-04-05].http://www.opendoar. org/.
[2]吳建中.圖書館VS機構庫——圖書館戰(zhàn)略發(fā)展的再思考[J].中國圖書館學報,2004(5):5-8.
[3]劉巍,等.機構知識庫個性化知識資產統(tǒng)計服務的設計與實現研究[J].現代圖書情報技術,2012(4):17-21.
[4]徐華.基于Dspace和關聯數據的機構知識庫合作服務模式構建研究[J].情報科學,2012(7):1021-1024.
[5]張旺強,等.機構知識庫集成OpenKOS主題標引與檢索聚類服務的實現及應用[J].現代圖書情報技術,2012(3):1-7.
[6]萬文娟,吳高.我國機構知識庫內容建設問題與策略分析[J].圖書館,2013(1):110-113.
[7]姜勇峰,等.基于質量評估的機構知識庫激勵機制研究——以廈門大學學術典藏庫和美國RePEc為例[J].情報理論與實踐,2013(11):41-44.
[8]李楠楠.機構知識庫資源版權問題的解決策略[J].圖書館建設,2012(7):1-5.
[9]柳菁.美國機構知識庫版權問題的解決方式及啟示[J].情報科學,2013(6):157-160.
[10]趙莉娜,徐春艷.國內外機構知識庫建設情況調查研究[J].圖書館學研究,2011(12):38-43.
[11]唐義,肖希明.港臺學術機構知識庫的調查與分析[J].圖書館論壇,2011(4):9,38-41.
[12]赤澤久彌,李霞.日本機構知識庫的歷史和現狀[J].圖書館雜志,2014(2):72-83.
G255.76
A
1005-8214(2015)06-0042-04
王錳(1989-),男,南京大學信息管理學院博士研究生,研究方向:數字信息資源管理、信息咨詢;陳雅(1965-),女,南京大學信息管理學院教授,研究方向:數字信息資源管理、信息法。
2014-09-09[責任編輯]李金甌
本文系2014年國家社科基金項目“我國圖書館大眾化服務模式定位和建設策略研究”(項目編號:14BTQ019)和2014年江蘇高校哲學社會科學研究重大項目“創(chuàng)新江蘇社會數字文化治理體制機制研究”(項目編號:2014ZDAXM001)的研究成果之一。