杜慧平 李旭光
【摘要】以問卷方式調(diào)查英國謝菲爾德大學(xué)中國留學(xué)生的檢索信息習(xí)慣與偏好、存在的問題和對多語言信息存取功能的需求。結(jié)果發(fā)現(xiàn)他們對翻譯工具依賴性較強,相比生成英文檢索詞,對檢索結(jié)果的閱讀和理解更困難些;總體上,留學(xué)生對多語言信息存取功能的需求不是很強烈,較專業(yè)和較準確的翻譯工具對提高信息利用的效率會有很大幫助。
【關(guān)鍵詞】多語言信息存取 跨語言信息檢索 數(shù)字圖書館 留學(xué)生
1前言
多語言信息存取(multilingual information access,MLIA),指所有涉及存取、查詢和檢索語種不同于查詢提問式的文獻集合的相關(guān)方法和技術(shù),包括字體編碼、語言識別、多語種文檔標引、跨語言信息檢索等[1-2]。其中,跨語言信息檢索(cross-language information retrieval,CLIR)特指用一種語言(源語言)查詢提問去檢索其他語種(目標語言)信息資源的技術(shù)[1,3]。數(shù)字圖書館是MLIA的重要應(yīng)用領(lǐng)域,在英語國家、日本和印度等地,特別是語言情況比較復(fù)雜的歐洲,已有很多相關(guān)研究立項,如歐盟聯(lián)機目錄的跨語言檢索項目CACAO、文化遺產(chǎn)多語言檢索項目MultiMatch、歐洲數(shù)字圖書館項目TEL等。盡管在個別高校圖書館已有實際應(yīng)用[4],該服務(wù)卻未得到廣泛推廣,除了技術(shù)原因外,還需進一步明確潛在用戶群。
近年來,到英語國家深造的中國留學(xué)生人數(shù)迅速增加。以英國為例,2010年來英的中國學(xué)生人數(shù)達到67 000人,比前一年增加18.1%,在英國海外學(xué)生中比例最高,約為15.7%[5]。每年激增的中國留學(xué)生已經(jīng)成為英語國家高校圖書館的主要用戶群之一。先前研究表明,中國留學(xué)生檢索英文信息時存在一些困難[6-7],但他們是否需要圖書館提供一定的MLIA輔助功能還未見系統(tǒng)的調(diào)查,因此本文以英國謝菲爾德大學(xué)的中國留學(xué)生為例,調(diào)查了他們的信息檢索行為和偏好、存在的問題和對MLIA基本功能的需求,此調(diào)查不僅有利于確認MLIA技術(shù)的潛在用戶,也能為改善數(shù)字圖書館的功能和服務(wù)提供依據(jù)。謝菲爾德大學(xué)是英國招收海外學(xué)生最多的高校之一,龐大的中國留學(xué)生群體為本調(diào)研提供了充足的數(shù)據(jù)來源。
2研究方法
2.1 問卷設(shè)計與回收
問卷分為5部分:用戶背景和語言技能、中外文信息檢索行為、對翻譯工具的依賴、信息檢索障礙、MLIA功能偏好。語言技能考察了與英文信息檢索相關(guān)的寫作能力和閱讀能力,采取六點李克特量表,明確定義各級別代表的含義。在閱讀水平量表中,1=“只能理解日常詞匯和短語”,6=“能理解幾乎所有東西,但不如母語那樣流利”;寫作水平量表中,1=“不會英文寫作”,6=“能流利和精確地寫作專業(yè)學(xué)科命題的文章”,高分數(shù)代表更高的語言流利度。
問卷以在線和手工發(fā)放兩種形式回收,在線問卷投放在問卷調(diào)研網(wǎng)站“問卷星”上,通過謝菲爾德大學(xué)郵件列表發(fā)送邀請給全校師生,請中國留學(xué)生到鏈接地址回答問卷;手工發(fā)放主要在圖書館和課堂前完成。問卷回收時間從2012年5月14日到6月14日,網(wǎng)上回收54份,手工回收97份,其中5份因內(nèi)容不全被剔除,因此有效問卷共計146份。
2.2 統(tǒng)計工具與方法
統(tǒng)計所使用軟件為SPSS。由于處理的數(shù)據(jù)是從5點李克特量表所得到的定序數(shù)據(jù)(ordinal data),本文采用非參數(shù)檢驗方法Spearman相關(guān)系數(shù)統(tǒng)計兩因素之間是否存在顯著關(guān)系,用Kruskal-Wallis test檢驗分類變量(包括英語水平、性別、年齡、學(xué)科類別、教育層次和留學(xué)英語國家時間)中不同類別的用戶對MLIA功能需求是否存在顯著差異,如果(P<0.05),則推測為差異顯著[8],以發(fā)現(xiàn)各分類變量對MLIA功能需求的預(yù)測作用。其中英語水平系數(shù)和MLIA功能需求系數(shù)均采取加權(quán)方法,取量表得分的和。
3調(diào)查結(jié)果分析
3.1 用戶背景
在146個被調(diào)查對象中,大部分為女性(67.1%),并以18-24歲年齡組(74.7%)和25-34歲年齡組(22.6%)居多,35歲以上者只有4人。其中,本科生(29.5%)、碩士研究生(55.5%)、博士生(9.6%)占絕大多數(shù),其他人員為訪學(xué)人員(5.5%)。他們分別來自43個不同專業(yè),其中從事社會科學(xué)領(lǐng)域?qū)W習(xí)和研究的人居多(58.2%),其次為理工科(23.3%)和人文藝術(shù)學(xué)科(18.5%)??傮w上看,所調(diào)研的中國留學(xué)生在英語國家居住時間分布較為均勻,一年以內(nèi)占48%,一年到兩年時間占30.1%,兩年以上占21.9%。
從調(diào)查對象對自身英語水平的評估看,他們對自己的英文閱讀和寫作水平非常自信,閱讀水平勾選4分以上者占94.5%,寫作水平4分以上者占97.3%,均值分別為4.90和4.82。
3.2 中英文信息檢索目的與種類比較
3.2.1 中英文信息檢索目的
關(guān)于留學(xué)生檢索中英文信息的目的,調(diào)查結(jié)果見圖1。中英文信息檢索的目的呈現(xiàn)出相似的特征,即以學(xué)習(xí)、娛樂和購物為主。但是在檢索娛樂信息時,接近90%的人傾向于使用中文信息源,使用英文信息的人數(shù)則只占60%。而學(xué)習(xí)和購物目的的信息檢索,查找英文信息的人數(shù)較多,但差距不大。這一結(jié)果表明,留學(xué)生雖然身處英文生活和學(xué)習(xí)環(huán)境,他們?nèi)匀淮罅渴褂弥形男畔?,特別是在休閑和娛樂時。
3.2.2 檢索中英文信息的種類和頻次
問卷以5點李克特量表提問了留學(xué)生檢索以下信息種類的頻次,從表1中的均值看,其檢索英文書籍和文章的頻次比中文高,介于3分(“有時”)和4分(“經(jīng)常”)之間,而檢索中文音視頻和圖像頻次明顯高于英文,這一結(jié)果進一步印證了圖1的調(diào)查結(jié)果,因為書籍和期刊、會議論文是主要的學(xué)習(xí)參考信息源,音視頻和圖像則主要用于娛樂目的。此外,他們檢索網(wǎng)頁信息最為頻繁,而且兩種語種的使用頻次差別不大。
3.3 學(xué)術(shù)信息檢索用語言偏好
當被問及“檢索學(xué)術(shù)信息時,您更傾向于使用哪種語言”時,116名留學(xué)生選擇了英文,占81.1%。只有27人選擇了中文,沒有人選擇其他語種。
優(yōu)選英文執(zhí)行檢索的理由,按人數(shù)自高到低為:“因為我的專業(yè)領(lǐng)域中的大部分信息是以該語種寫的”(90人);“一般情況下,用該語種我能找到更多信息”(84人);“因為我現(xiàn)處在該語種的學(xué)習(xí)和工作環(huán)境中”(73人);“因為老師要求我參照該語種的信息資源”(32人)。
優(yōu)選中文執(zhí)行檢索的主要理由包括:“因為它是我的母語”(25人);“因為一般情況下,用該語種我能找到更多信息”(13人),經(jīng)過進一步確認,選擇此項的學(xué)生中有5人學(xué)習(xí)中文相關(guān)專業(yè),包括“東亞經(jīng)濟”和“對外漢語教學(xué)”。
以上結(jié)果表明,大部分留學(xué)生能積極主動地適應(yīng)英文學(xué)習(xí)環(huán)境,檢索和利用英文信息,只有少數(shù)仍然習(xí)慣于用中文執(zhí)行檢索。
3.4 對翻譯工具的依賴
當被問到“查找英文信息時,通常您借助翻譯工具形成查詢詞的頻次如何”時,只有大約28%的調(diào)查對象很少或從未使用過翻譯工具,三分之一以上被調(diào)查者經(jīng)常或頻繁使用翻譯工具,另外三分之一被調(diào)查者有時會用到翻譯工具(見圖2)。他們產(chǎn)生英文檢索詞所借助的外界方法包括:73.3%的留學(xué)生使用在線翻譯服務(wù)(如Google Translate),54.1%的人使用電子詞典,其次為“從閱讀的文獻中選取”(23.3%)、“問其他人”(8.9%)、“老師提供”(4.8%)。
在使用過翻譯工具的人群中,當被問及翻譯工具是否有幫助時,只有41.1%認為比較有用或非常有用,其余人持中立或者否定態(tài)度(見圖3)。問卷以開放填空題詢問了被調(diào)查人員持中立或否定態(tài)度的原因。共有45人提供了反饋,總結(jié)起來主要有兩種原因:翻譯結(jié)果不是很準確,也不夠?qū)I(yè)。
以上結(jié)果說明,形成查詢提問式時,中國留學(xué)生對翻譯工具的依賴性很強,但是大部分人對翻譯工具的效果不是很滿意。更準確和更專業(yè)的翻譯工具對多數(shù)留學(xué)生來說會很有幫助。
3.5 英文信息檢索困難
由表2可知,留學(xué)生在檢索英文信息時遇到如下困難的頻次均值均小于5點李克特量表中的3分(量表與圖2中相同),這表明他們對檢索英文信息比較自信;其中“不知道如何使用檢索工具”的平均分最低,為1.90分,且眾數(shù)為1,表明操作英文信息檢索系統(tǒng)對留學(xué)生的阻礙最小。檢索結(jié)果的檢查和理解階段遇到的障礙頻次均值高于查詢關(guān)鍵詞形成階段,對留學(xué)生來說,閱讀和理解英文文獻存在的問題似乎更為突出。
3.6 對多語言信息存取基本功能的需求
MLIA需求量表考察了最基本的數(shù)字圖書館多語言信息存取功能,使用5點李克特量表,請留學(xué)生打分,1分代表“完全不需要”,5分代表“非常需要”,高分數(shù)代表對MLIA功能更大的需求程度,另外設(shè)置0代表“不確定”。
除去對MLIA功能表示“不確定”的18人,表中的均值、中數(shù)和眾數(shù)均是在剩余128名留學(xué)生的評分基礎(chǔ)上統(tǒng)計得出的。他們對各項功能的需求程度打分均值接近3分,意味著從總體上看,他們認為這些功能有一定的必要性,但需求程度不是很強高。對第二和第三個功能選擇“不確定”的人數(shù)明顯比其他功能要多,這可能由于兩者均以假設(shè)系統(tǒng)提供有跨語言信息檢索(CLIR)功能為前提。
從均值看,留學(xué)生對檢索結(jié)果的翻譯功能需求程度較檢索提問式的自動翻譯功能(即CLIR功能)的需求更大。這進一步說明,用戶在閱讀檢索結(jié)果時,更需要一些翻譯輔助功能,機器翻譯可能會有很大幫助。留學(xué)生對信息檢索系統(tǒng)界面語種選擇功能的打分最低,進一步表明操作英文檢索系統(tǒng)已不是主要問題。相比之下,他們對檢索結(jié)果按語種過濾功能要求較高。
4結(jié)語
本研究調(diào)查了在英國謝菲爾德大學(xué)留學(xué)的中國學(xué)生檢索信息的習(xí)慣和偏好、遇到的困難以及對MLIA功能的需求。從調(diào)查結(jié)果看,留學(xué)生檢索中英文信息的主要目的均為學(xué)習(xí)、娛樂和購物,其中用中文檢索娛樂信息較使用英文的人數(shù)更多些,盡管以學(xué)習(xí)為目的的信息檢索使用兩種語言的人數(shù)差別不是很大,但在檢索學(xué)術(shù)信息時,絕大多數(shù)人會優(yōu)選英文執(zhí)行檢索。
盡管留學(xué)生對他們的英語水平較為自信,但大部分人在形成查詢提問式時對翻譯工具很依賴,卻對翻譯效果并不滿意。在他們遇到的檢索困難中,對檢索結(jié)果的閱讀和理解相比形成英文查詢詞的困難更嚴重些,在MLIA功能的選擇上,對檢索結(jié)果的翻譯功能需求也較查詢提問的自動翻譯功能(CLIR功能)更強烈些,機器翻譯對提高留學(xué)生的信息利用效率可能會有很大幫助。
在所考察的因素中,只有英語水平與MLIA功能需求關(guān)系最顯著,是判斷對MLIA功能需求的最重要因素。從總體上看,留學(xué)生對MLIA功能有一定需求,但不是很強烈。其原因是由于英語水平較高還是由于對MLIA功能的效率存有懷疑還需進一步考察。值得肯定的是,他們需要更“專業(yè)”和更“準確”的翻譯工具。例如, CNKI在專業(yè)論文基礎(chǔ)上統(tǒng)計生成的“CNKI翻譯助手”,如能嵌入到英文信息檢索系統(tǒng)中,對用戶產(chǎn)生英文查詢詞會是很好的參照。
在本文的探索性研究基礎(chǔ)上,未來還需要以用戶實驗進一步考察使用跨語言信息檢索和機器翻譯對提高留學(xué)生檢索效率的作用。
[參考文獻]
[1] Peters C, Sheridan P. Multilingual information access[J]. Lectures Notes in Computer Science, 2001,(1980):51-80.
[2] Oard D W. Multilingual information access[M]// Bates M J, Maack M N. Encyclopedia of Library and Information Sciences. New York: Taylor & Francis, 2009.
[3] Oard D W. Serving users in many languages, cross-language information retrieval for digital libraries [EB/OL]. [2012-08-02].http://www.dlib.org/dlib/december97/oard/12oard.html.
[4] Bernardi R, Calvanese D, Dini L, et al. Multilingual search in libraries: The case-study of the Free University of Bozen-Bolzano[C]// Fellbaum C, Miller G. LREC 2006 proceedings,European Language Resource Association,Genoa,Italy, 2006:2287-2290.
[5] Internet World Stats [EB/OL].[2012-08-10].http://www.intenetworldstats.com/stats7.htm.
[6] Liao Yan, Finn M, Lu Jun. Information-seeking behaviour of international graduate students vs. American graduate students: A user study at Virginia Tech 2005 [J]. College and Research Libraries, 2007, 68(1):5-25.
[7] Mehra B, Bilal D. International students' perceptions of their information seeking strategies [C]// Dalkir K, Arsenault C. Proceedings of the 35th Annual Conference of the Canadian Association for Information Science(CAIS/ACSI): Information Sharing in a Fragmented World: Crossing Boundaries, Montreal, 2007:10-12.
[8] Field A. Discovering statistics using SPSS[M]. London: Sage Publications, 2005: 548-549.