• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      面向社會的學(xué)位論文信息開放獲取與共享平臺建設(shè)?

      2014-12-25 02:15:18
      圖書館 2014年1期
      關(guān)鍵詞:學(xué)位論文服務(wù)

      (華東師范大學(xué)圖書館 上海 200062)

      學(xué)位論文,一般指博碩士研究生為獲取相應(yīng)的學(xué)位資格,在導(dǎo)師的指導(dǎo)下對所從事的科研活動進行論述總結(jié)而撰寫的一次文獻。論文的研究對象多涉及所在學(xué)科的關(guān)鍵、前沿問題,部分論文本身即是研究團隊所承擔(dān)的國家各級重大科研課題的成果。學(xué)位論文與普通科研論文相比,具有文獻分析面廣、數(shù)據(jù)與圖表量大、理論分析充分、參考文獻大等特點,是一種不可忽視的信息源?!?〕基于對學(xué)位論文價值的充分認識,華東師范大學(xué)引入清華同方TPI系統(tǒng)進行本校學(xué)位論文電子化數(shù)據(jù)庫建設(shè)。在將現(xiàn)有學(xué)位論文納入電子化管理的同時,圖書館逐步完成了華東師范大學(xué)早期學(xué)位論文的回溯工作,并著手聯(lián)合該校研究生院、信息化辦公室實施“學(xué)位論文數(shù)據(jù)庫推進計劃”。該計劃將學(xué)位論文信息以Web Service的方式推送到研究生院網(wǎng)站的教師名錄上,提供了歷年教師指導(dǎo)學(xué)位論文的選題、研究方向、摘要等信息,有效增強考生填報志愿的針對性,為學(xué)位論文信息社會化服務(wù)提供了啟示,使項目組認識到充分挖掘這部分學(xué)術(shù)資源的理論與實用價值,探索更廣泛的服務(wù)方式,是大學(xué)圖書館服務(wù)社會的有效途徑?!?〕

      1 學(xué)位論文信息社會開放獲取與共享的意義

      1.1 學(xué)位論文價值實現(xiàn)的內(nèi)在需求

      學(xué)位論文是人類科研探索活動中所獲取知識的文字表達形式,具有文字符號系統(tǒng)所內(nèi)涵的交流功能,其承載思想的理論與應(yīng)用價值有待于使用者的解讀才能得以實現(xiàn)。相關(guān)研究認為交流在科學(xué)探索中扮演著重要的角色,因為除非被具有興趣的社群所知,進行至關(guān)重要的評估,發(fā)現(xiàn)和思想僅具有較低的價值?!?〕作為人類發(fā)現(xiàn)與思想的重要組成部分,學(xué)位論文信息更應(yīng)當(dāng)能在社會上被廣泛獲取與共享。

      1.2 社會對圖書館及學(xué)校的要求

      教育部2002年2月21日頒發(fā)的《普通高等學(xué)校圖書館規(guī)程(修訂)第二十一條》明確指出:“有條件的高等學(xué)校圖書館應(yīng)盡可能向社會讀者和社區(qū)讀者開放”。自上世紀(jì)50年代以來,大量的文獻就學(xué)術(shù)圖書館服務(wù)公眾進行了討論?!?〕學(xué)位論文是高校和科研機構(gòu)特有的文獻資源,是國家投入巨量資金和各種科研資助下完成的科技發(fā)展和技術(shù)進步的結(jié)論性載體,理應(yīng)為我國和人類科技發(fā)展做出貢獻?!?〕對學(xué)校而言,通過向社會開放大學(xué)的學(xué)術(shù)資源,有助于向社會宣傳大學(xué)的教學(xué)研究動態(tài),展現(xiàn)教學(xué)科研成果,提高學(xué)校的知名度,促進大學(xué)在全社會范圍內(nèi)進行更多的產(chǎn)學(xué)研合作,用技術(shù)吸引社會資金,進而促進大學(xué)在競爭中求得發(fā)展和完善?!?〕

      1.3 國家中長期科學(xué)和技術(shù)發(fā)展規(guī)劃的要求

      《國家中長期科學(xué)和技術(shù)發(fā)展規(guī)劃綱要》中“建立科技基礎(chǔ)條件平臺的共享機制”部分要求針對不同類型科技條件資源的特點,采用靈活多樣的共享模式,打破當(dāng)前條塊分割、相互封閉、重復(fù)分散的格局?!?〕學(xué)位論文信息的社會化開放存取與共享無疑是一種靈活多樣的學(xué)位論文利用方式。

      1.4 學(xué)位論文時效性與版權(quán)沖突的迫切要求

      學(xué)位論文所承載的知識信息新穎,具有較強的時效性,及時為社會所發(fā)掘利用十分必要。但由于學(xué)位論文版權(quán)涉及多方關(guān)系,制定及實施操作復(fù)雜,版權(quán)問題的解決也還處于學(xué)界探討階段,目前圖書館普遍面臨版權(quán)困境?!?〕這極大地阻礙了學(xué)位論文的及時利用。通過提供學(xué)位論文信息服務(wù),可以巧妙地避開全文版權(quán)問題,不僅讓學(xué)位論文所承載的知識及時地為社會了解,也可以成為后續(xù)全文服務(wù)全面開展的試金石。

      1.5 對現(xiàn)行國內(nèi)學(xué)位論文服務(wù)模式的有效補充

      圖書館界對學(xué)位論文的探討與實踐主要集中在國家學(xué)位論文運作機制、論文呈繳管理制度、版權(quán)解決辦法、可持續(xù)性運作、元數(shù)據(jù)集中于項目中心、數(shù)字對象(論文全文)等〔9-11〕方面。本項目提出的“學(xué)位論文信息社會化開放存取與共享”正是對既有服務(wù)模式在學(xué)位論文信息的社會情報價值、基于學(xué)位論文信息的知識發(fā)現(xiàn)、基于學(xué)位論文信息的文獻計量方面的有益補充。

      2 學(xué)位論文信息社會開放獲取與共享的可行性

      2.1 學(xué)位論文資源保障體系已具規(guī)模

      我國的學(xué)位論文資源保障體系經(jīng)過多年的發(fā)展,已經(jīng)形成了各高校、科研單位普遍擁有自建學(xué)位論文數(shù)據(jù)庫,多個國家級中心學(xué)位論文保障體系以及多家全國性的商業(yè)數(shù)據(jù)庫供應(yīng)商共存的局面。得益于商業(yè)化的建庫系統(tǒng)TPI、TRS,開源的DSpace倉儲平臺,以及自主開發(fā)能力的增強,各高校科研單位普遍實現(xiàn)了學(xué)位論文的電子化、網(wǎng)絡(luò)化管理與服務(wù)。國家級的學(xué)位論文保障體系包括CALIS高校學(xué)位論文庫、NSTL中文學(xué)位論文庫、國家圖書館學(xué)位論文庫、中國科學(xué)院學(xué)位論文庫?!?2〕其中CALIS高校學(xué)位論文庫不僅對國內(nèi)高校的各類學(xué)位論文信息庫進行收割,還集成了PQDD以及NDLTD等國外學(xué)位論文系統(tǒng)中的元數(shù)據(jù),目前博碩士學(xué)位論文數(shù)據(jù)逾384萬條,其中中文數(shù)據(jù)約172萬條,外文數(shù)據(jù)約212萬條,數(shù)據(jù)持續(xù)增長中?!?3〕商業(yè)的萬方學(xué)位論文數(shù)據(jù)庫收錄約240余萬篇、CNKI中國優(yōu)秀博、碩士學(xué)位論文數(shù)據(jù)庫收錄約170余萬篇。上述學(xué)位論文資源建設(shè)的成果為學(xué)位論文信息的社會開放獲取與共享提供了基本的數(shù)據(jù)保障。

      2.2 學(xué)位論文元數(shù)據(jù)標(biāo)準(zhǔn)的研究成果豐富

      提供學(xué)位論文信息服務(wù)的效果有賴于學(xué)位論文元數(shù)據(jù)的質(zhì)量。作為實現(xiàn)文獻揭示的一項基本工具,業(yè)界對此的研究由來已久,而且取得了豐富的成果。包括被廣泛采用的DC Metadata Element Set(都柏林核心元素集),美國ETD互用性元數(shù)據(jù)標(biāo)準(zhǔn)、CALIS高校學(xué)位論文數(shù)據(jù)庫元數(shù)據(jù)規(guī)范、北京大學(xué)圖書館的學(xué)位論文元數(shù)據(jù)方案〔14〕、德國電子學(xué)位論文元數(shù)據(jù)XMetaDiss〔15〕,以及許多僅在小范圍內(nèi)使用的學(xué)位論文元數(shù)據(jù)方案。上述標(biāo)準(zhǔn)及方案為我們選擇所需的元素的著錄項,使用規(guī)范的著錄項名,進行廣泛的學(xué)位論文元數(shù)據(jù)交換提供了豐富而高質(zhì)量的參考源。

      2.3 計算平臺易于建立及網(wǎng)絡(luò)信息開發(fā)技術(shù)豐富成熟

      得益于計算平臺投入的持續(xù)降低,網(wǎng)絡(luò)環(huán)境的不斷升級,以及豐富的開源平臺、框架與工具,使得更多的高校、科研機構(gòu)能夠加入到學(xué)位論文數(shù)據(jù)庫的建設(shè)中來,有機會形成一個基于動態(tài)聯(lián)盟的學(xué)位論文集成服務(wù)平臺〔16〕來提供學(xué)位論文信息服務(wù)。虛擬化、分布式計算、SOA、RIA等技術(shù)為這種松散、低耦合的動態(tài)聯(lián)盟提供了技術(shù)支撐。既有的專業(yè)統(tǒng)計分析軟件包,包括關(guān)聯(lián)數(shù)據(jù)在內(nèi)的語義網(wǎng)技術(shù)為學(xué)位論文信息服務(wù)的多樣化提供了契機。

      2.4 逐步成熟的全國性管理機構(gòu)及管理機制

      我國有明確的學(xué)位論文法定收藏單位,國務(wù)院學(xué)位辦于1983年、1984年和1986年相繼發(fā)文,要求將已通過的全部博士和碩士學(xué)位論文,自然科學(xué)類寄送中國科技情報所,社會科學(xué)類寄送中國社會科學(xué)院文獻信息中心;博士論文寄送北京圖書館。從此確立了以這三家單位為重心的國家學(xué)位論文收藏體系?!?7〕CALIS高校學(xué)位論文全文數(shù)據(jù)庫的建設(shè)工作成效顯著,并且形成了一套較為成熟的以CALIS全國中心、CALIS地區(qū)中心、CALIS成員館三方互動管理機制。上述機構(gòu)及相應(yīng)的機制為類似于本項目的研究探索成果提供了轉(zhuǎn)化到更廣范圍、更高層面的機會。

      3 平臺的結(jié)構(gòu)與功能

      平臺由使用平臺服務(wù)的最終用戶、一級服務(wù)方、二級服務(wù)方與服務(wù)注冊發(fā)布中心四方構(gòu)成,其中一級服務(wù)方也可以是使用平臺服務(wù)的用戶,服務(wù)注冊發(fā)布中心也可以是提供集成性服務(wù)的一級服務(wù)方(如圖1)。

      使用平臺服務(wù)的最終用戶可以是社會中任意的個人。他們可以自由使用由多方提供的以網(wǎng)頁形式呈現(xiàn)的學(xué)位論文信息服務(wù)。對于最終用戶的認證、管理可由相應(yīng)的服務(wù)方實施彈性控制。服務(wù)注冊發(fā)布中心可要求最終用戶進行必要的注冊,以便對不同層次的服務(wù)進行調(diào)節(jié),以及對服務(wù)的使用情況進行統(tǒng)計分析。

      平臺的一級服務(wù)方一般是高校、科研單位、政府、公益組織、商業(yè)機構(gòu)。他們擁有自建的學(xué)位論文數(shù)據(jù)庫,通過向服務(wù)注冊發(fā)布中心進行登記注冊來發(fā)布服務(wù)。其應(yīng)該具備下述基本功能:①確定本地的學(xué)位論文元數(shù)據(jù)集,設(shè)計規(guī)劃學(xué)位論文元數(shù)據(jù)存儲模式、實現(xiàn)學(xué)位論文元數(shù)據(jù)的長期保存及獲取。②提供面向用戶的B/S結(jié)構(gòu)的學(xué)位論文信息服務(wù),包括基于簡單、高級的查詢模式提供事實型信息,對論文文摘和前16頁提供全文檢索,按學(xué)科、項目類別、行業(yè)瀏覽學(xué)位論文信息。③基于SOA、RIA架構(gòu),以Web Service、Web Widget等形式向平臺二級服務(wù)方提供學(xué)位論文信息服務(wù)接口。④利用信息計量學(xué)、語義網(wǎng)等方法向最終用戶以及二級服務(wù)方提供可視化的分析功能。⑤對學(xué)位論文信息服務(wù)的使用實施彈性的用戶、安全控制,實現(xiàn)必要的統(tǒng)計分析功能。⑥積極提供本地學(xué)位論文元數(shù)據(jù)收割接口,配合整體平臺的集成性學(xué)位論文信息服務(wù)。平臺的二級服務(wù)方一般是不具備自建學(xué)位論文數(shù)據(jù)庫但具有提供學(xué)位論文信息服務(wù)需求的機構(gòu),如高校中研究生院、社會上的教育培訓(xùn)機構(gòu)。他們通過服務(wù)發(fā)布注冊中心獲取由中心、一級服務(wù)方提供的服務(wù)接口來實現(xiàn)自身的學(xué)位論文信息服務(wù)。雖然他們不需要加入整個平臺的學(xué)位論文元數(shù)據(jù)建設(shè),但也應(yīng)配合平臺一級服務(wù)方和中心實施必要的學(xué)位論文信息服務(wù)的安全控制。

      平臺的服務(wù)注冊發(fā)布中心是一個以門戶網(wǎng)站形式運作的服務(wù)匯聚點和系統(tǒng)級事務(wù)服務(wù)的提供者,可以由一家或多家一級服務(wù)方承擔(dān)。

      該中心應(yīng)具備下述基本功能:①負責(zé)開發(fā)、維護服務(wù)注冊發(fā)布中心的門戶網(wǎng)站,對所提交的服務(wù)進行審核與管理。②制訂服務(wù)的注冊發(fā)布規(guī)范。③實施學(xué)位論文元數(shù)據(jù)收割、負責(zé)整體學(xué)位論文元數(shù)據(jù)的長期保存。④為一級服務(wù)方提供學(xué)位論文元數(shù)據(jù)映射工具,以實現(xiàn)多方元數(shù)據(jù)的互操作。⑤在整體學(xué)位論文元數(shù)據(jù)的基礎(chǔ)上提供與一級服務(wù)方類似的信息服務(wù)。⑥為多方服務(wù)提供橋接功能,如整體平臺的統(tǒng)一認證、安全控制。⑦為多方服務(wù)提供必要的事務(wù)處理基礎(chǔ)。⑧統(tǒng)計、分析平臺服務(wù)情況。

      4 平臺建設(shè)的基本原則

      平臺在本質(zhì)上是一個可行的學(xué)術(shù)交流系統(tǒng)模型,〔18〕它應(yīng)該遵循基本的學(xué)術(shù)交流原則,同時,作為一個松散、動態(tài)的計算機網(wǎng)絡(luò)系統(tǒng),它應(yīng)當(dāng)遵循基本的計算機系統(tǒng)原則。

      4.1 開放性原則

      平臺的開放性是指隨著我國學(xué)位論文數(shù)量的快速增加,將學(xué)位論文資源進行獨占式的開發(fā)已經(jīng)變得不太現(xiàn)實?!?9〕必須廣泛接納希望加入到平臺中來的服務(wù)方,包括港臺的服務(wù)機構(gòu),商業(yè)的數(shù)據(jù)庫廠商,以此保持平臺的動態(tài)增長。對于平臺提供的服務(wù)堅持開放存取(OA),因為開放存取在擴大傳播范圍的同時,降低傳播成本,促進科學(xué)信息的即時傳播、廣泛交流與出版,提升科學(xué)研究的公共利用程度,利于科學(xué)信息的長期保存?!?0〕對于學(xué)位論文元數(shù)據(jù)的范圍保持開放,雖然目前少有將學(xué)士學(xué)位論文納入到學(xué)位論文數(shù)據(jù)庫,但也有研究指出不少專家、學(xué)者,如蕭乾、費孝通、侯仁之等,就因本科畢業(yè)論文而嶄露頭角,從此步入學(xué)術(shù)殿堂,〔21〕建議將其納入學(xué)位論文庫的建設(shè)中。對于技術(shù)規(guī)范保持開放性,有利于平臺的拓展與多態(tài)。

      4.2 集成性原則

      平臺的集成性是指:在既有的分散的學(xué)位論文元數(shù)據(jù)上提供集成的服務(wù),發(fā)揮平臺資源的優(yōu)勢開展數(shù)據(jù)挖掘等特色服務(wù),以區(qū)別于原有分散學(xué)位論文服務(wù)體系。從服務(wù)的價值角度來看建設(shè)學(xué)位論文元數(shù)據(jù)集成揭示系統(tǒng)成為重中之重?!?2〕此類集成性的平臺在國內(nèi)外已有成功的先例,如美國NDLTD、國內(nèi)的CALIS。對于系統(tǒng)級的服務(wù),應(yīng)有服務(wù)注冊發(fā)布中心提供集成支持,如統(tǒng)一認證、消息服務(wù)、事務(wù)集成。

      4.3 弱耦合、兼容性

      作為一個匯聚廣泛服務(wù)方的平臺,必然面對異構(gòu)系統(tǒng)間的互操作問題。因此平臺須在體系結(jié)構(gòu)上符合分布式的開發(fā)標(biāo)準(zhǔn)。在中心與服務(wù)方以及服務(wù)方之間通過協(xié)議層級的約定來實現(xiàn)互操作,而非將其硬編碼到程序中。在數(shù)據(jù)上鼓勵以通用的交換格式,如XML、JSON等,進行編碼。在程序的實現(xiàn)上采用業(yè)界主流的兼容性方案進行開發(fā),如用JQuery、Dojo等進行Web Widget的開發(fā),而非直接的Javascript編碼。所開發(fā)的服務(wù)端應(yīng)用能夠讓客戶端實現(xiàn)自發(fā)現(xiàn),如 WSDL、SRU。

      4.4 服務(wù)持續(xù)創(chuàng)新

      平臺服務(wù)的基礎(chǔ)是學(xué)位論文元數(shù)據(jù),其能直接傳遞的知識信息有限,對有限的元數(shù)據(jù)進行變換處理,發(fā)掘其潛在的信息價值尤為必要。應(yīng)當(dāng)利用數(shù)據(jù)間,數(shù)據(jù)與受體間的關(guān)聯(lián)發(fā)掘其情報價值,如擴展二級服務(wù)方的范圍,豐富最終用戶的類型。平臺提供的服務(wù)應(yīng)采用成熟、有效、前沿的科學(xué)方法,如共詞分析、多元統(tǒng)計分析和信息可視化方法〔23〕、信息計量學(xué)、語義網(wǎng)、自然語言處理,來進行諸如前沿?zé)狳c分析、學(xué)科間關(guān)聯(lián)、知識推理等增值服務(wù)。

      5 關(guān)于平臺學(xué)位論文元數(shù)據(jù)集的建議

      學(xué)位論文元數(shù)據(jù)是將學(xué)位論文看作一種數(shù)據(jù)形式,為了對其進行揭示、發(fā)現(xiàn)、管理而創(chuàng)建的依附性數(shù)據(jù),即我們常說的關(guān)于數(shù)據(jù)的數(shù)據(jù)。它是對學(xué)位論文本身所含知識信息的一種精煉表達,其表達的精確度、全面性對后續(xù)的基于學(xué)位論文元數(shù)據(jù)的信息服務(wù)起著至關(guān)重要的影響。

      如何保證所設(shè)計的學(xué)位論文元數(shù)據(jù)集在精確與全面這兩個矛盾的需求中達到平衡,需要對學(xué)位論文這一文獻類型及其應(yīng)用方式作反復(fù)的推敲與探討,需要在實踐中通過使用效果的反饋進行反復(fù)的修正,這無疑需要經(jīng)歷時間的洗練。考慮到學(xué)位論文數(shù)據(jù)庫經(jīng)過多年建設(shè),已在國內(nèi)外形成了許多優(yōu)良的元數(shù)據(jù)標(biāo)準(zhǔn),項目組建議:①學(xué)位論文元數(shù)據(jù)集的確定應(yīng)廣泛考察國內(nèi)外主流的元數(shù)據(jù)標(biāo)準(zhǔn),重視與國際接軌。②作為一個聯(lián)盟性質(zhì)的服務(wù)平臺,應(yīng)提供實現(xiàn)各服務(wù)方元數(shù)據(jù)兼容與互操作的機制。③鑒于學(xué)位論文元數(shù)據(jù)著錄工作具有不可重復(fù)的特點,盡量保存有價值的字段作為外圍元數(shù)據(jù)集或備用。④應(yīng)考慮在存儲層與事務(wù)層為元數(shù)據(jù)集的拓展提供彈性,保證元數(shù)據(jù)集的動態(tài)、開放,以滿足實際的需求。⑤應(yīng)考慮到原數(shù)據(jù)標(biāo)準(zhǔn)對編碼、傳輸層的支持,宜兼容XML、HTTP、OAI-PMH等規(guī)范。⑥重視元數(shù)據(jù)利用的統(tǒng)計分析,為元數(shù)據(jù)集調(diào)整提供科學(xué)的依據(jù)。

      經(jīng)過對現(xiàn)有元數(shù)據(jù)研究的多方調(diào)查,發(fā)現(xiàn)包括國內(nèi)的《學(xué)位論文描述性元數(shù)據(jù)標(biāo)準(zhǔn)》草案、美國的ETD-MS、德國的XMetaDiss以及一些館制定的元數(shù)據(jù)標(biāo)準(zhǔn)都很好的兼容了DC的基本元素?!?4-28〕在綜合現(xiàn)有主流學(xué)位論文元數(shù)據(jù)標(biāo)準(zhǔn)及研究的基礎(chǔ)上,項目組從學(xué)位論文信息服務(wù)而非學(xué)位論文典藏利用角度,以DC基礎(chǔ)借鑒ETD-MS、XMetaDiss形成平臺的學(xué)位論文信息服務(wù)核心元數(shù)據(jù)集推薦(如表1)。

      表1 學(xué)位論文信息服務(wù)核心元數(shù)據(jù)集推薦

      6 平臺的計算架構(gòu)

      此處的計算架構(gòu)是推薦作為平臺一級服務(wù)方、服務(wù)注冊發(fā)布中心的系統(tǒng)架構(gòu),服務(wù)端開放架構(gòu)與客戶端開放框架。

      6.1 平臺的系統(tǒng)架構(gòu)

      系統(tǒng)架構(gòu)主要包括服務(wù)器、存儲、操作系統(tǒng)、持久化層、虛擬化五個方面。單方的平臺服務(wù)對計算能力、存儲空間的要求并不是很高,主流的X86服務(wù)器即可滿足常規(guī)需求,如果自身平臺同時提供全文服務(wù),也可考慮更高計算級別的SPARC、RISC服務(wù)器。在存儲架構(gòu)上,可選擇經(jīng)濟的直連型存儲(DAS,Direct-attached storage),但應(yīng)考慮數(shù)據(jù)的安全性,應(yīng)起碼具備RAID 5級別的冗余能力。操作系統(tǒng)的選擇應(yīng)該根據(jù)自身的服務(wù)端框架進行選擇,在可能的情況下,如果具備足夠的技術(shù)能力,可選擇類UNIX系統(tǒng),以便取得較好的穩(wěn)定性。持久化層,通常由文件系統(tǒng)與關(guān)系數(shù)據(jù)庫管理系統(tǒng)構(gòu)成,前者用于存儲論文全文或前16頁,后者用于存儲元數(shù)據(jù)和文摘,一般以選擇C/S結(jié)構(gòu)的數(shù)據(jù)庫服務(wù)器為佳,如開源的PostgreSQL、MySQL。

      圖2 項目所依存的系統(tǒng)架構(gòu)〔29〕

      上述是從滿足基本學(xué)位論文信息服務(wù)的角度出發(fā)推薦的系統(tǒng)架構(gòu)。就目前IT架構(gòu)的發(fā)展情況而言,系統(tǒng)架構(gòu)的建設(shè)應(yīng)該注意投入成本、管理的便利以及對先進計算模式的支持。虛擬化技術(shù)對消減IT基礎(chǔ)架構(gòu)成本,增強計算資源的彈性分配與管理,以及對先進的計算模式,如分布式計算/云計算方面提供了強勁的支持。項目組現(xiàn)有的應(yīng)用即建立在虛擬化的系統(tǒng)架構(gòu)上(如圖2)。

      依托于華東師大圖書館既有的硬件資源,通過VMWare虛擬化方案,該館在應(yīng)用快速部署、服務(wù)動態(tài)遷移、數(shù)據(jù)容災(zāi)上取得了良好的效果。同時,虛擬化提供了對計算資源精細的粒度掌控,有利于在需要的時候?qū)崿F(xiàn)分布式計算,建設(shè)云計算平臺。VMWare是一個商業(yè)的解決方案,若存在資金的限制,也可考慮開源的VirtualBox,測試報告顯示,在圖形處理、數(shù)據(jù)庫應(yīng)用、Web服務(wù)應(yīng)用等各方面的性能并不遜于VMWare〔30〕。

      6.2 平臺的服務(wù)端開發(fā)架構(gòu)

      平臺的服務(wù)端開發(fā)架構(gòu)主要指服務(wù)應(yīng)用開發(fā)的計算模式,開發(fā)的語言、框架,輔助的開發(fā)包。

      平臺所提供的學(xué)位論文信息服務(wù)主要由各個服務(wù)方獨立提供,一般的單機計算模式即可滿足需求。從當(dāng)前業(yè)界在信息服務(wù)上的研究與實踐來看,基于數(shù)據(jù)挖掘、語義分析提供集成性的學(xué)位論文信息服務(wù)已是一種趨勢。要實現(xiàn)數(shù)據(jù)挖掘、語義分析以及在分散的學(xué)位論文元數(shù)據(jù)環(huán)境中完成統(tǒng)計、計量分析,這一切都需要依賴分布式計算技術(shù)/云計算。分布式計算包括了類如移動 agent、P2P、網(wǎng)格(Grid)、Web Service、普適計算(Pervasive Computing)、云計算等諸多的方式?!?1〕項目組在服務(wù)端開發(fā)中采用了Web Service,同時經(jīng)過調(diào)研認為可選擇開源的Hadoop實現(xiàn)平臺的云環(huán)境。Hadoop不僅提供了MapReduce編程模型,它作為一種海量數(shù)據(jù)處理的并行編程模型,目前已經(jīng)廣泛應(yīng)用在網(wǎng)頁索引、數(shù)據(jù)挖掘、科學(xué)模擬以及云計算平臺中〔32〕,而且包括了Hadoop Common、Hadoop Distributed File System(HDFSTM)、Hadoop YARN等一系列分布式計算所需的基礎(chǔ)設(shè)施。

      服務(wù)器端的開發(fā)語言、框架、工具集由平臺所需的兩種服務(wù)類型決定。一是面向用戶的服務(wù),如學(xué)位論文信息查詢網(wǎng)頁、平臺服務(wù)方注冊發(fā)布網(wǎng)頁;一是面向程序的服務(wù),如提供給二級服務(wù)方的Web Service接口,注冊發(fā)布中心提供的OAI-PMH收割接口、消息隊列、統(tǒng)一認證服務(wù)等。對于前者,常見的 Web開發(fā)架構(gòu),如 LAMP、JSP、ASP.NET、Ruby on Rails配以合適的全文索引工具,如lucence,solr,即可以滿足需求。對于后者,最好選擇支持面向服務(wù)架構(gòu) (Service-Oriented Architecture,SOA)的開發(fā)框架,如Zend、J2EE、WCF、Ruby on Rails。這不僅是像提供Web Service這樣的接口所必需的,也是提供異步的消息隊列服務(wù),中間層級的事務(wù)邏輯控制、集中的統(tǒng)一認證以及對可能的分布式計算支持的基礎(chǔ)。而SOA作為一種粗粒度、松耦合服務(wù)架構(gòu)〔33〕也滿足了平臺的基本原則??紤]到本館遺留系統(tǒng)的客觀情況,項目組選擇了WCF來實現(xiàn)學(xué)位論文信息服務(wù),與一些獨立的技術(shù)相比,它對項目所需要的特性提供了集成的支持 (見表2)。

      相對于WCF,J2EE,特別是其開源實現(xiàn),在功能的可獲得性上似乎更具吸引力,對于分布式計算、語義網(wǎng)實現(xiàn)都有開源的解決方案,如 Hadoop、Sesame、Jena。

      表2 WCF功能比較〔34〕

      6.3 平臺的客戶端開發(fā)框架

      強化客戶端開發(fā)的思想來自于為了將學(xué)位論文信息服務(wù)快速部署到二級服務(wù)方的需求。通過Web Service發(fā)布的服務(wù),需要二級服務(wù)方進行服務(wù)端的編程開發(fā)才能獲得其所需要的效果,如果能將一級服務(wù)方的數(shù)據(jù)直接嵌入到二級服務(wù)方的網(wǎng)頁中無疑有助于服務(wù)的快速推廣與部署。作為富客戶端應(yīng)用(RIA)中的佼佼者,基于HTML5與JavaScript,具有桌面應(yīng)用風(fēng)格的Web Widget很好的滿足了這一需求。這種基本的架構(gòu)為混搭提供了無限可能的設(shè)計選擇與組合?!?5〕而混搭(Mush-up)正是項目所需要的。使用項目組開發(fā)的學(xué)位論文信息Web Widget,二級服務(wù)方僅需要5行左右的純HTML代碼就可以在其網(wǎng)頁中嵌入所需的服務(wù),其基本的工作原理(如圖3)。

      圖3 學(xué)位論文信服務(wù)Web Widget的工作原理

      為了保證訪問者來自二級服務(wù)方的網(wǎng)站,Web Widget的服務(wù)端代碼中包含了對請求HTTP Referer的驗證,此處也可以使用更加規(guī)范的OAuth等認證方案??蛻舳碎_發(fā)常見的一個問題是瀏覽器的兼容性,為了最大范圍的兼容,建議采用JQuery、Dojo等JavaScript框架進行 Web Widget開發(fā)。由于該服務(wù)模式涉及到跨域訪問,需要使用JSON格式進行數(shù)據(jù)編碼。富客戶端應(yīng)用(RIA)開發(fā)中的其他技術(shù),如Adobe Flex、Microsoft Silverlight,雖相對呈下降趨勢,〔36〕但也可以作為候選方案。

      7 平臺注冊發(fā)布中心的基本結(jié)構(gòu)

      圖4 注冊發(fā)布中心結(jié)構(gòu)圖

      作為整個平臺實現(xiàn)服務(wù)注冊、發(fā)布、獲取,以及集成性服務(wù)的匯聚點,中心應(yīng)具備的功能與計算架構(gòu)已在上述各部分進行了說明,其中一些事務(wù)性功能需要依賴第三方工具的支持,如LDAP服務(wù)器、CAS服務(wù)器、JMS服務(wù)器,每一個都是一項獨立的技術(shù),不宜作具體的說明。本文僅就中心的功能模塊給出一個粗略的結(jié)構(gòu)圖,以便參考(見圖4),其中虛線的部分是平臺的語義功能拓展,其實現(xiàn)還有待商榷。中心的注冊、發(fā)布功能都集中在CMS部分,其實現(xiàn)可以參考一個優(yōu)秀的 API發(fā)布平臺 http://www.programmableweb.com/。

      8 結(jié)論

      論文提出的“面向社會的學(xué)位論文信息開放獲取與共享平臺”是在華東師大圖書館“學(xué)位論文數(shù)據(jù)庫推進計劃”實踐的基礎(chǔ)上廣泛調(diào)研相關(guān)研究成果所提出的建設(shè)目標(biāo)。其中的部分功能都已經(jīng)實現(xiàn),并取得了良好的效果。

      項目本身是在華東師大實施開展的,其作為學(xué)位論文資源建設(shè)的一種嘗試要想在更廣的范圍實現(xiàn)其價值,還有待納入國家層面的架構(gòu)中。

      1.羅鳳平,崔緒美.高校學(xué)位論文的管理實踐及開發(fā)利用的思考.圖書館學(xué)研究,2005(8):40-42

      2,6.李欣.提升大學(xué)學(xué)術(shù)資源的社會服務(wù)功能 -以博碩士學(xué)位論文數(shù)據(jù)庫為例.圖書館雜志,2011(12):56-58

      3.Ng,T.W.“Electronic digests in scientific communication”,Internet Research:Electronic Networking Applications and Policy,1998,8(3):243-6

      4.Lynne Weber,Peg Lawrence.Authentication and Access Accommodating Public Users in an Academic World.Information Technology and Libraries,2010(9):128-138

      5.楊少萱,褚漢啟.我國博碩士學(xué)位論文的服務(wù)模式及版權(quán)問題探索.圖書情報知識,2011(2):44-49

      7.國家中長期科學(xué)和技術(shù)發(fā)展規(guī)劃綱要.〔2013-01-28〕.http://www.gov.cn/jrzg/2006-02/09/content_183787.htm

      8.陳慧娜.學(xué)位論文的典藏困境與解決策略.圖書館建設(shè),2010(7):39-41

      9.賀德方等.國家學(xué)位論文資源管理現(xiàn)狀及其對策研究.情報學(xué)報,2006(10):531-539

      10.趙陽,姜愛蓉.“CALIS學(xué)位論文全文數(shù)據(jù)庫”的建設(shè)實踐.大學(xué)圖書館學(xué)報,2006(4):48-52

      11,26.金毅,王紹平.元數(shù)據(jù)在電子化學(xué)位論文中的應(yīng)用探討.大學(xué)圖書館學(xué)報,2002(2):71-74

      12.胡潛,張敏.學(xué)位論文資源的跨系統(tǒng)共享與集成服務(wù)的推進.圖書情報知識,2008(11):75-79

      13.CALIS學(xué)位論文中心服務(wù)系統(tǒng)-讀者指南.〔2013-01-28〕.http://etd.calis.edu.cn/etdportal/pages/others/readerguide.html

      14,28.胡燕菘.博碩士學(xué)位論文數(shù)據(jù)庫元數(shù)據(jù)標(biāo)準(zhǔn)的制定 -以深圳大學(xué)為例.圖書情報知識,2005(8):71-74

      15,25.羅博,吳丹.德國電子學(xué)位論文元數(shù)據(jù)XMetaDiss及對我國的啟示.大學(xué)圖書館學(xué)報,2010(3):85-90

      16.張敏等.動態(tài)聯(lián)盟的學(xué)位論文資源集成服務(wù)的實現(xiàn).情報科學(xué),2008(9):1375-1379

      17.賀德方.國家學(xué)位論文服務(wù)體系研究.情報學(xué)報,2004(12):697-702

      18.Mahmood Khosrowjerdi.Designing a viable scientific communication model:VSM approach.Library Hi Tech,2011.29(2):359-372

      19.陳傳夫,符玉霜,孫凱.我國學(xué)位論文服務(wù)模式調(diào)查與服務(wù)機制創(chuàng)新.圖書館,2008(4):59-62

      20.劉文科,鄭曉霞,李彥麗.基于OA理念的國家學(xué)位論文資源共享體系發(fā)展戰(zhàn)略研究.圖書館學(xué)刊,2008(6):58-60

      21.李靜.高校學(xué)位論文的數(shù)字圖書館館藏及其利用 -以上海松江大學(xué)城高校為例.圖書館論壇,2010(8):179-181

      22.張學(xué)福.我國博碩士學(xué)位論文資源共建共享機制構(gòu)建.中國圖書館學(xué)報,2008(3):47-51

      23.王君,劉竟.我國圖書館學(xué)碩博士學(xué)位論文研究熱點可視化分析.圖書情報工作,2010(10):28-31

      24.趙陽,吳開華,鄭雯譯.學(xué)位論文描述性元數(shù)據(jù)的設(shè)計.圖書情報工作,2005(6):49-53

      27.賀德方,曾建勛,張敏.中國學(xué)位論文收集與服務(wù)系統(tǒng)的構(gòu)建.情報學(xué)報,2009(8):634-640

      29.VmwareInfrastructureArchitectureOverview.〔2013-01-28〕.http://www.vmware.com/pdf/vi_architecture_wp.pdf

      30.王家兵.VirtualBox服務(wù)器虛擬化系統(tǒng)在圖書館中的應(yīng)用.現(xiàn)代圖書情報技術(shù),2012(9):93-96

      31.葛澎.分布式計算技術(shù)概述.微電子學(xué)與計算機,2012(5):201-204

      32.李玉林,董晶.基于Hadoop的MapReduce模型的研究與改進.計算機工程與設(shè)計,2012(8):3110-3115

      33.SOA.〔2013-01-28〕.http://baike.baidu.com/view/21305.htm#sub5033544

      34.Wei Zhang.A Service-Oriented Distributed Framework-WCF.2009 International Conference on Web Information Systems and Mining,2009:302-305

      35.Godmar Back,Annette Bailey.Web Services and Widgets for Library Information Systems.Information Technology and Libraries,2010(6):76-86

      36.〔2013-01-28〕.http://www.google.com/trends/explore#q=adobe++flex,microsoft+silverlight,java++applet,HTML5,gwt

      猜你喜歡
      學(xué)位論文服務(wù)
      服務(wù)在身邊 健康每一天
      服務(wù)在身邊 健康每一天
      服務(wù)在身邊 健康每一天
      學(xué)位授予和人才培養(yǎng)學(xué)科目錄(2018年)
      『博士后』是一種學(xué)位嗎?
      文苑(2018年21期)2018-11-15 11:52:20
      招行30年:從“滿意服務(wù)”到“感動服務(wù)”
      商周刊(2017年9期)2017-08-22 02:57:56
      俄羅斯兒童教育:超80%入園率與供不應(yīng)求的學(xué)位
      幼兒100(2016年4期)2016-11-30 03:19:55
      下期論文摘要預(yù)登
      下期論文摘要預(yù)登
      下期論文摘要預(yù)登
      繁昌县| 鄂州市| 运城市| 齐齐哈尔市| 淳化县| 长顺县| 高阳县| 四会市| 南江县| 安西县| 永泰县| 金塔县| 慈溪市| 连城县| 即墨市| 抚州市| 象山县| 广安市| 剑阁县| 尚志市| 卓资县| 浮山县| 酒泉市| 台湾省| 安阳县| 文山县| 通道| 吐鲁番市| 纳雍县| 兴化市| 那坡县| 垣曲县| 汉川市| 黄大仙区| 新蔡县| 从江县| 陕西省| 金阳县| 巧家县| 汉源县| 东乡|