文/寧夏師范學(xué)院圖書館 張春麗
大學(xué)創(chuàng)新人才的培養(yǎng),除了要發(fā)揮課堂教學(xué)的優(yōu)勢以外,還要重視以人工智能技術(shù)為導(dǎo)向的大學(xué)智慧圖書館對創(chuàng)新人才培養(yǎng)的作用。智慧圖書館產(chǎn)生影響力的主要因素在于館內(nèi)數(shù)據(jù)庫的建構(gòu)規(guī)模和質(zhì)量,丁敬達(dá)和朱夢月曾對我國大學(xué)圖書館數(shù)據(jù)庫建設(shè)情況進(jìn)行過評估,認(rèn)為我國大學(xué)智慧圖書館數(shù)據(jù)庫建設(shè)滯后,還處于低水平發(fā)展的狀態(tài)。因而,未來大學(xué)智慧圖書館數(shù)據(jù)庫建設(shè)有很大的發(fā)展前景。
影響大學(xué)智慧圖書館數(shù)據(jù)庫建設(shè)的因素包括信息技術(shù)和學(xué)科館員兩個方面。信息技術(shù)層面主要包括人工智能技術(shù)與計算機(jī)技術(shù)兩個方面,人工智能技術(shù)與計算機(jī)技術(shù)融合代表了未來信息技術(shù)發(fā)展的新方向,也是智慧圖書館數(shù)據(jù)庫建設(shè)的核心技術(shù)因素。在同等信息技術(shù)條件下,學(xué)科館員是決定圖書館數(shù)據(jù)庫建設(shè)水平的決定性因素。鄧澤宇和王旭認(rèn)為,學(xué)科館員的素質(zhì)主要表現(xiàn)為科研素質(zhì)、數(shù)據(jù)獲取等方面,指出了學(xué)科館員在大學(xué)圖書館發(fā)展中的重要性。上述兩個方面中科研素質(zhì)影響數(shù)據(jù)庫的總體設(shè)計和布局規(guī)劃,而數(shù)據(jù)獲取能力決定學(xué)科館員對人工智能技術(shù)與計算機(jī)技術(shù)所蘊(yùn)含的無限潛能的挖掘程度??傊诖髮W(xué)智慧圖書館文學(xué)數(shù)據(jù)庫建構(gòu)的過程中,高水平的學(xué)科館員是核心因素,人工智能技術(shù)與計算機(jī)技術(shù)是信息技術(shù)保障,這兩個方面的密切配合才能完成高質(zhì)量圖書館數(shù)據(jù)庫建構(gòu)的任務(wù)。
構(gòu)建以大數(shù)據(jù)技術(shù)為支撐的文學(xué)數(shù)據(jù)庫是一個龐大的系統(tǒng)工程,在建設(shè)過程應(yīng)主要考慮以下幾方面的因素:首先,因為歷代文學(xué)文獻(xiàn)資源數(shù)量浩繁,因而數(shù)據(jù)庫的建設(shè)是一個漫長的過程,各大學(xué)智慧圖書館之間需要建立行動聯(lián)盟,有計劃、有組織地展開行動。各大學(xué)智慧圖書館和各種研究機(jī)構(gòu)應(yīng)該建立聯(lián)盟組織,統(tǒng)一制定行動計劃,設(shè)立文學(xué)數(shù)據(jù)庫建設(shè)的各種子項目,由各大學(xué)智慧圖書館分別承擔(dān),既可以減少資源的浪費,又可以在較短的時間內(nèi)建成文學(xué)文獻(xiàn)數(shù)據(jù)庫。其次,為了使各個圖書館的文學(xué)文獻(xiàn)資源數(shù)據(jù)庫能夠在統(tǒng)一的平臺供全國各大學(xué)智慧圖書館使用,文學(xué)文獻(xiàn)資源數(shù)據(jù)庫要按照國際通用的數(shù)字文獻(xiàn)資源國際統(tǒng)一標(biāo)準(zhǔn)來執(zhí)行,以便于成果的推廣和普及。再次,要充分利用現(xiàn)有的文學(xué)文獻(xiàn)數(shù)字資源。在此過程中,需要學(xué)科館員熟練掌握數(shù)字挖掘技術(shù)。數(shù)字挖掘技術(shù)就是采取關(guān)鍵詞檢索的方式實現(xiàn)信息的有效查詢,在數(shù)字圖書館的檢索技術(shù)領(lǐng)域中發(fā)揮著重要作用,數(shù)字挖掘技術(shù)將在未來圖書館技術(shù)中有著非常廣泛的應(yīng)用前景,成為未來圖書館學(xué)研究的熱點。利用大數(shù)據(jù)技術(shù)建構(gòu)文學(xué)作品數(shù)據(jù)庫,主要包括四大模塊:文學(xué)作品文本數(shù)據(jù)庫、文學(xué)作品注解數(shù)據(jù)庫、文學(xué)作品評論數(shù)據(jù)庫、中國文學(xué)圖像數(shù)據(jù)庫。
(一)文學(xué)作品文本數(shù)據(jù)庫。作品數(shù)據(jù)庫包括文學(xué)作品文本數(shù)據(jù)庫和文學(xué)作品注解數(shù)據(jù)庫兩部分。文學(xué)作品文本數(shù)據(jù)庫的建構(gòu),從總體布局方面來考慮,應(yīng)該以朝代先后為順序,每一個朝代要以作家為基本建構(gòu)單元來進(jìn)行,具體的排列以作家的生卒年先后為順序,每一位作家的作品,按照寫作時間的先后排列。按照這樣的建構(gòu)模型,可以把從先秦到當(dāng)代所有文學(xué)作品文本都納入其中,從而建成一個完整的、系統(tǒng)的文學(xué)作品文本數(shù)據(jù)庫。
(二)文學(xué)作品注解數(shù)據(jù)庫。文學(xué)作品注解數(shù)據(jù)庫的建設(shè)主要是針對古代文學(xué)作品而言的,現(xiàn)當(dāng)代文學(xué)作品只涉及文學(xué)評論,基本不涉及文本注解的問題。從事文學(xué)作品注解數(shù)據(jù)庫建設(shè)的人員應(yīng)該從各大學(xué)智慧圖書館中高職稱、高學(xué)歷的古代文學(xué)專業(yè)館員中選取,從事該項工作的圖書館館員的選取標(biāo)準(zhǔn)應(yīng)參照高校《中國古代文學(xué)作品選》的編選人員的要求,除了具備熟悉中國古代文學(xué)的素養(yǎng)外,必須具有相當(dāng)高的計算機(jī)水平,熟悉大數(shù)據(jù)技術(shù)。歷代文學(xué)作品注解數(shù)據(jù)庫的建構(gòu),要求學(xué)科館員應(yīng)該具備較高的古代文學(xué)素養(yǎng),學(xué)科館員能夠從歷代大量的注解文獻(xiàn)中選取最具代表性的注釋觀點,同時在數(shù)據(jù)庫該詞條下對這種代表觀點的發(fā)展演變過程中的每一種修訂觀點按時代先后進(jìn)行說明,以此形成一種以時間先后為線索的作品注解系統(tǒng)。句子的注解文獻(xiàn)、段落注解文獻(xiàn)資料的選取等同于字詞注解文獻(xiàn)資料的選取以及書寫方法。
(三)文學(xué)作品評論數(shù)據(jù)庫。文學(xué)作品評論數(shù)據(jù)庫就是將歷代學(xué)者對每一篇文學(xué)作品的批評資料進(jìn)行收集,然后按照對作品思想性的批評、對作品藝術(shù)性的批評等要素進(jìn)行分類,利用大數(shù)據(jù)技術(shù)建成數(shù)據(jù)庫。在具體操作的過程中,資料收集要注意以下幾個方面的問題:首先,對文學(xué)作品批評資料的收集一定要齊全和完整。其次,要選取具有代表性的評論觀點,并且要對這些觀點發(fā)展流變的學(xué)術(shù)史進(jìn)行梳理,不可重復(fù)堆積資料。最后,把收集的文獻(xiàn)按照朝代順序排列,以朝代順序及具體時間為第一層級分類依據(jù),以作品思想性、作品藝術(shù)性評論為第二層級分類依據(jù)來建構(gòu)數(shù)據(jù)庫模塊。
(四)中國文學(xué)圖像數(shù)據(jù)庫。有文字記載的中國文學(xué)史大概有3000年的歷史,在這樣漫長的文學(xué)史歷程中,產(chǎn)生了大量的文學(xué)圖像及繪畫作品,這些文獻(xiàn)資料被稱為文學(xué)圖像文獻(xiàn)。文學(xué)圖像文獻(xiàn)具有重要價值,張朋兵認(rèn)為,圖像文獻(xiàn)是構(gòu)成文學(xué)史的重要材料。文學(xué)圖像文獻(xiàn)包括作家畫像、文本拓片、歷代畫家按照其對作家作品的理解畫成的各種畫像,例如歷代文人畫家根據(jù)杜甫的許多經(jīng)典作品畫成的圖像,這些圖像文本的紙質(zhì)版一般不易保存,而且成本較高,不便在大眾中間傳播,而利用數(shù)字媒體技術(shù)把這些圖像制作成數(shù)字圖像資料,對建立中國文學(xué)圖像數(shù)據(jù)庫有很大的幫助,而且在技術(shù)操作層面是可行的。這種文獻(xiàn)數(shù)據(jù)庫具有很大的研究價值,例如杜甫的《北征》這篇作品講述了作者從陜西鳳翔到鄜州看望家人的經(jīng)歷,歷代畫家多以此篇作品為素材畫成畫像,但是有些畫家在畫作繪制的過程中對杜甫回家的方向理解有誤,而且各種畫作中呈現(xiàn)出來的杜甫的具體形象千差萬別,研究這些差異,可以得到不同畫家對作品理解差異產(chǎn)生的原因,這也是文學(xué)研究的一個重要課題。因此,中國文學(xué)圖像數(shù)據(jù)庫有很重要的學(xué)術(shù)價值。
在各種作家、作品、文學(xué)理論數(shù)據(jù)庫的基礎(chǔ)上,使用云計算技術(shù),為研究者提供各種統(tǒng)計數(shù)據(jù),這些數(shù)據(jù)可以實現(xiàn)跨圖書館的文獻(xiàn)資源共享,因而可以實現(xiàn)不同圖書館之間的溝通及聯(lián)系,從而提高數(shù)字文獻(xiàn)資源的利用率。云計算是通過計算機(jī)網(wǎng)絡(luò)信息技術(shù)實現(xiàn)數(shù)字資源的快速計算服務(wù)和數(shù)據(jù)存儲,用戶可以通過網(wǎng)絡(luò)獲取海量的數(shù)據(jù)資源。云計算獲取資源的方式可以超越時空的限制,而且可以實現(xiàn)計算結(jié)果的合并,提供一種全新的數(shù)據(jù)體驗,云計算強(qiáng)大的資源整合能力和快速的數(shù)據(jù)提取能力,在未來科技發(fā)展中具有廣闊的發(fā)展前景,將會成為大學(xué)智慧圖書館的核心技術(shù)。利用云計算技術(shù)可以形成如下數(shù)據(jù)分析平臺:
(一)經(jīng)典作家和經(jīng)典作品排行榜。使用云計算技術(shù),利用作家數(shù)據(jù)庫中的各種數(shù)據(jù)資料,通過對各種數(shù)據(jù)庫中作家姓名出現(xiàn)的次數(shù)、各個歷史時期的評論家對作家好評出現(xiàn)的次數(shù)、作家的作品在各種文學(xué)選本中入選的次數(shù)進(jìn)行統(tǒng)計,對上述數(shù)據(jù)進(jìn)行加權(quán)處理,最后得出的數(shù)值就是該作家的“經(jīng)典性得分”,按照這個得分,對作家進(jìn)行排名,形成經(jīng)典作家排行榜。經(jīng)典作品排行榜數(shù)據(jù)庫的建構(gòu)和經(jīng)典作家數(shù)據(jù)的建構(gòu)程序相同。
(二)中國文學(xué)數(shù)據(jù)分析平臺。利用云計算數(shù)據(jù),可以為研究者和學(xué)生學(xué)年論文撰寫提供一個數(shù)據(jù)分析平臺,為科研工作者提供數(shù)據(jù)支撐。例如,在古代文學(xué)研究中,“風(fēng)骨”這一美學(xué)范疇因為其內(nèi)涵的模糊性,因此歷代學(xué)者對這一術(shù)語內(nèi)涵的解釋千差萬別。在界定“風(fēng)骨”內(nèi)涵的過程中,首先要對其出現(xiàn)的時間進(jìn)行考證,因為“風(fēng)骨”這一美學(xué)范疇的內(nèi)涵與中國歷史上的美學(xué)思潮有密切關(guān)系,通過中國文學(xué)數(shù)據(jù)分析系統(tǒng)的檢索,可以確定該名詞出現(xiàn)的最早時間、出現(xiàn)的作品名稱及具體批評家姓名與學(xué)術(shù)成就,有了以上數(shù)據(jù)可以形成理解“風(fēng)骨”內(nèi)涵的基本思想。又如在中國散文史的研究中,傳統(tǒng)的觀點認(rèn)為唐代韓愈是文學(xué)史上第一位對散文語言進(jìn)行革新的作家,但是通過中國文學(xué)數(shù)據(jù)分析平臺的檢索可以發(fā)現(xiàn),在散文史上最早對中國古代散文從理論主張到創(chuàng)作實踐進(jìn)行全方位革新的是唐代作家陳子昂。這一發(fā)現(xiàn)可以改變我們對散文史、文學(xué)史中一些長期以來形成的觀念的評估。利用這個數(shù)據(jù)分析平臺,通過一系列文學(xué)關(guān)鍵詞的檢索,可以發(fā)現(xiàn)許多新的文學(xué)思想,同時也可以得到許多與傳統(tǒng)文學(xué)觀念不同的文學(xué)史結(jié)論,這些結(jié)論都可以形成重要的文學(xué)研究課題。
虛擬現(xiàn)實技術(shù)是通過計算機(jī)將已經(jīng)收集到的日常生活數(shù)據(jù)存儲起來,然后通過電子信號將各種計算機(jī)數(shù)據(jù)與這些信號對應(yīng)起來,在一定的條件下利用計算機(jī)仿真系統(tǒng)將各種數(shù)據(jù)還原為真實的日常生活現(xiàn)象。中國工程院院士王堅認(rèn)為,虛擬現(xiàn)實是數(shù)字化之后下一個技術(shù)革命,虛擬現(xiàn)實技術(shù)也將帶來智慧圖書館的技術(shù)革命。所謂中國文學(xué)作品還原系統(tǒng),就是以虛擬現(xiàn)實技術(shù)為理論支撐、以歷史紀(jì)錄片為范本來建構(gòu)整個中國文學(xué)原景形象系統(tǒng)。通過該數(shù)據(jù)系統(tǒng),可以建立兩個數(shù)據(jù)庫:作家生平數(shù)字媒體數(shù)據(jù)庫、作品情景數(shù)字媒體數(shù)據(jù)庫。
(一)作家生平數(shù)字媒體數(shù)據(jù)庫。高校中文專業(yè)的教師在中國文學(xué)課程的教學(xué)工作中,首先要對作家生平進(jìn)行介紹,這種介紹一般都是比較平淡、枯燥的,但是,如果能夠模仿歷史紀(jì)錄片的形式,把每位作家的生平還原為中國文學(xué)史作家生平歷史紀(jì)錄片,不僅可以引起讀者的興趣,提高高校中國文學(xué)教學(xué)的效果,也可以提高大眾對中國文學(xué)的接受。在具體操作的層面,對于現(xiàn)當(dāng)代作家,可以從歷史遺留下來的作家圖片中提供作家本人及其家屬的照片等信息作為作家生平紀(jì)錄片制作的依據(jù),利用類似于數(shù)字動漫技術(shù)制作作家日常生活史視頻,還原作家生平經(jīng)歷,因為在成像的過程中使用的是真人的照片,所以這種視頻可以達(dá)到超真實的效果。對于古代的作家,一方面可以從文學(xué)史中提取作家的畫像,例如屈原、杜甫、陸游等經(jīng)典作家,歷代畫家曾為他們留下了各種類型的畫像,這些資料可以作為作家形象制作的依據(jù)。對于有些作家,各種電視、電影中已經(jīng)形成了他們的形象,可以直接提取。對于沒有留下畫像的作家,可以根據(jù)作家傳世的作品,分析作家的相貌,利用數(shù)字影像還原技術(shù)生成作家的畫像。然后通過作家的傳記資料、各種文學(xué)史資料,利用影視劇制作技術(shù)來制作作家生平影像數(shù)據(jù)庫。
(二)經(jīng)典作品情景還原數(shù)據(jù)庫。以四大名著的電視劇為經(jīng)典范本,利用影像及虛擬現(xiàn)實技術(shù),對中國文學(xué)史中經(jīng)典的文學(xué)作品進(jìn)行影視劇的加工制作,形成中國經(jīng)典作品情景還原數(shù)據(jù)庫。在該數(shù)據(jù)庫建立的過程中,主要應(yīng)用數(shù)字媒體技術(shù)來合成影視媒體,這樣成本比較低,而且效率高。在作品還原的過程中,首先遇到的是技術(shù)上的困難,承擔(dān)此項工作的大學(xué)智慧圖書館館員需要同時具備中國文學(xué)的修養(yǎng)和數(shù)字媒體技術(shù),這種人才目前還比較缺乏,但是,大學(xué)智慧圖書館應(yīng)該以此項文獻(xiàn)數(shù)據(jù)庫的建設(shè)為契機(jī),以創(chuàng)新人才培養(yǎng)為抓手,著重培養(yǎng)具有中國文學(xué)和數(shù)字媒體技術(shù)的復(fù)合型大學(xué)智慧圖書館館員。
在中國文學(xué)作品還原數(shù)據(jù)庫建立的過程中,最核心的工作是利用虛擬現(xiàn)實技術(shù)和數(shù)字媒體技術(shù)進(jìn)行作品還原,因為諸如四大名著、《聊齋》等影視作品,其制作成本是比較高的。而利用虛擬現(xiàn)實技術(shù)制作影像文件則成本較低,但是困難在于對文學(xué)文本內(nèi)容闡釋的多義性及這種理解轉(zhuǎn)化為影像情景過程的復(fù)雜性。這種數(shù)據(jù)庫建設(shè)在大學(xué)智慧圖書館及高校人文社科類課程的建設(shè)中有很大的發(fā)展空間和發(fā)展前景,也可以作為一項重大的科研課題來展開。
在文學(xué)史建構(gòu)的過程中,文學(xué)觀念的起源、發(fā)展、演變研究頗為重要,在過去的文學(xué)史建構(gòu)中,文學(xué)觀念的闡釋有兩種缺陷:一是對中國古代重要的文學(xué)觀念的闡釋往往語焉不詳,因為這種文學(xué)觀念的追溯需要文學(xué)史家具有廣博而精深的文學(xué)史修養(yǎng),文學(xué)史家必須具備全面的文學(xué)史文獻(xiàn)的儲備,才能清楚地呈現(xiàn)出文學(xué)觀念發(fā)展演變的過程,而一般的文學(xué)史家大多不能做到這一點。二是受到上述文學(xué)史家理論修養(yǎng)的限制,很多文學(xué)觀念的重要性不能夠被凸顯,這些觀念在文學(xué)史長河中被淹沒無法被提取出來加以特別強(qiáng)調(diào),因而,很多文學(xué)觀念不能確立起其經(jīng)典性。而利用數(shù)字挖掘技術(shù),把經(jīng)典作家及其經(jīng)典作品按照其出現(xiàn)的先后時間加以排列,同時運(yùn)用數(shù)字挖掘技術(shù)建立歷代經(jīng)典批評家的經(jīng)典性批評的描述體系,文學(xué)史數(shù)據(jù)庫的模型將被建立起來。
通過數(shù)字挖掘技術(shù)還可以糾正很多已有文學(xué)史的誤解。例如,在20世紀(jì)文學(xué)自覺的研究中,大多數(shù)學(xué)者認(rèn)為中國文學(xué)的自覺期是在漢末建安時期,這一觀念后來形成中國文學(xué)史研究中關(guān)于文學(xué)自覺觀念的代表性觀點。但是,筆者通過數(shù)字挖掘技術(shù)對文學(xué)史的文獻(xiàn)資料進(jìn)行檢索發(fā)現(xiàn),在西漢很多文學(xué)家的文集中,文章辨體的觀念就已經(jīng)流行起來。例如,西漢文獻(xiàn)學(xué)家劉向的著述中已經(jīng)出現(xiàn)了文章辨體的觀念,到了東漢,文章辨體的意識更加自覺。例如楊雄、班固等人的著述中就經(jīng)常涉及文章辨體的理論,而文章辨體的觀念是文學(xué)自覺的前提。由此可見,至少在東漢時期,文學(xué)自覺的觀念就已經(jīng)初步形成。那么,中國文學(xué)自覺起源在建安時期的觀念可能是一種文學(xué)史的誤解。
總之,大學(xué)智慧圖書館文學(xué)數(shù)字資源庫體系完備、傳播速度快、覆蓋范圍廣,因而在高校圖書館建設(shè)中有著廣闊的應(yīng)用前景。