王 琛
摘要分析了網(wǎng)絡(luò)信息的分類方法,并對比了不同分類設(shè)置的優(yōu)勢及不足,提出借鑒傳統(tǒng)分類法的優(yōu)點并結(jié)合網(wǎng)絡(luò)信息資源的特點,對網(wǎng)絡(luò)信息資源進行有效組織,構(gòu)建分類目錄體系。
關(guān)鍵詞網(wǎng)絡(luò)資源;分類法;分類目錄體系;評價
中圖分類號TP393文獻標識碼A文章編號 1007-5739(2009)21-0304-02
網(wǎng)絡(luò)中的許多站點都有網(wǎng)絡(luò)分類目錄供用戶查詢,它往往是一種瀏覽型目錄,使用自然語言作標識,這種信息輔助查詢方式由專家從茫茫網(wǎng)海中挑選出質(zhì)量較高的網(wǎng)頁,依照某種分類法進行組織,并和檢索法集成在一起。網(wǎng)絡(luò)目錄具有瀏覽方式直觀、查準率高等特點,尤其適應(yīng)檢索目的不明及網(wǎng)絡(luò)新手的網(wǎng)絡(luò)信息檢索。網(wǎng)絡(luò)的使用對象涉及所有的終端用戶,這就要求網(wǎng)絡(luò)的類目體系簡明、易于使用,使用戶不經(jīng)過預(yù)先了解,就可以通過類目表進行查找。因此,類目體系應(yīng)具有更強的通用性、直接性,并且能滿足從各種不同的角度查找的要求。
1網(wǎng)絡(luò)信息分類方法
1.1網(wǎng)站自行設(shè)計的分類法
一是主題分類法。主題分類法的特征是1個主題充當1個類目,類目像主題詞表一樣按字順排列,而不是依邏輯順序排列。1個類目又可以分為若干細目,同位類的細目也是按字順排列,這種分類法實質(zhì)上是分類法和主題法互相融合的產(chǎn)物。大多數(shù)網(wǎng)絡(luò)目錄只選取一些熱點事物作為主題類目,如汽車、房地產(chǎn)、計算機、因特網(wǎng)、教育、健康等。主題分類法一般設(shè)置14~18個一級主題類目,層次多為4級,最末一級就是列成表的超文本鏈接點,每個鏈接點伴有編輯對網(wǎng)頁的簡要介紹。主題分類法將與該事物相關(guān)的內(nèi)容全部集中在一起,如汽車大類下包括汽車制造、交易、維修、博覽會、汽車書籍和雜志、各種汽車、賽車、高速公路、運輸?shù)茸幽夸?它以事物為綱,而不以學科為綱,適應(yīng)交叉學科的主題。但主題分類法容量太小,對網(wǎng)絡(luò)資源的覆蓋率極為有限,如Yahoo、Lycos、Infoseek、網(wǎng)易等。二是分面組配法。分面組配的原理是,首先確定幾個分類標準,即分面,再確定每個分類標準中的若干特征值,即類目,每一個分面的類目與其他分面的類目分別組配,形成許多組配類目,達到細分的目的。中華搜索引擎“中華網(wǎng)目”采用了分面組配分類法。系統(tǒng)設(shè)計了2個分面,第1個是地域分面,分為2層,一級類目為省、市、自治區(qū),二級類目為城市。第2個分面是主題分面,一級類目有政府/組織、財政/工商、旅行/觀光/旅館、媒體/出版等幾個主題類目,各類目又可分為若干子類目,共有2層。查詢時,2個分面的類目以及細目可以兩兩組配,組成細目分類。如查詢有關(guān)西安市旅游景點的網(wǎng)頁,從地域分面進入類目“陜西”,再進入子類目“西安”從主題分面進入“旅行/觀光/旅館”,再進入子類目“觀光景點”,系統(tǒng)自動將“西安”與“觀光景點”組配,輸出相關(guān)的網(wǎng)頁鏈接點。分面組配法專指度高,因而具有較高的查準率,但要提高分面組配法的容量,需要進行分面分析,編制周密的分類方案,才能獲得良好的效果。對于龐大的、瞬息萬變的網(wǎng)絡(luò)資源來說,編制一個大型的分面分類方案是很困難的。
1.2套用圖書分類法
為了提高分類方案的容量,對網(wǎng)絡(luò)信息資源進行大規(guī)模的組織與整序,網(wǎng)絡(luò)目錄的設(shè)計者將目光投向大型圖書分類法,也就是體系分類法,如DDC、UDC、LC和《中圖法》等。
2網(wǎng)絡(luò)分類體系大類設(shè)置
基本大類的設(shè)置在整個分類體系中占有十分重要的地位。它是分類體系的一級類目,是分類法基本框架的體現(xiàn),也是所含信息內(nèi)容范圍的劃定?;敬箢惖脑O(shè)置與檢索工具的性質(zhì)、學科發(fā)展水平及信息資源的數(shù)量密切聯(lián)系,通常應(yīng)做到類目劃分均衡、涵蓋面廣。傳統(tǒng)的文獻分類法一般以學科為中心設(shè)置基本大類,從學科角度來展開類目。早期的文獻分類法,如杜威法,由于當時學科門類不多,基本大類僅設(shè)置了10個,比較概略。爾后編制的分類法逐漸增加了大類數(shù)目,一般以傳統(tǒng)學科領(lǐng)域為基礎(chǔ),基本大類保持在20個左右,如《國會法》21個、《布立斯書目分類法》22個、《中圖法》22個、《科圖法》25個。與傳統(tǒng)分類法不同的是大多數(shù)網(wǎng)絡(luò)分類工具的大類設(shè)置放棄了以學科為中心來確定類目結(jié)構(gòu)的傳統(tǒng),而采用以主題為中心或主題學科相結(jié)合的設(shè)類方式,形成與傳統(tǒng)分類法不同的直接性、通用性相結(jié)合的類目設(shè)置方式。大類的數(shù)量一般保持在14~18個。另外,這些分類法還著重考慮信息量、信息內(nèi)容的重要性及使用頻率。表1為2008年4月所查6個國內(nèi)外比較典型的分類搜索引擎的大類體系。
從表1的大類體系的劃分來看,國內(nèi)外網(wǎng)絡(luò)分類目錄在類目設(shè)置方面有以下特點:一是采用以主題為中心或主題與學科相結(jié)合的2種設(shè)類方式。該方式直接性和包容性好,使用十分普遍。從表1可以看出,除Magellan的大類基本以主題、對象為中心設(shè)置外,其他搜索引擎在不同程度上采用了主題對象與學科相結(jié)合的設(shè)類方式。二是突出熱門類目。將那些重要的、信息量大的、用戶感興趣的、訪問頻率高的類目設(shè)為一級類目,突出其類目級位,方便用戶檢索。如搜狐主頁將“新聞媒體”、“衛(wèi)生健康”、“社會文化”、“娛樂休閑”等設(shè)為一級類目,與“社會科學”并列。相反地,大類的設(shè)置弱化了科學技術(shù)、學術(shù)性類目的設(shè)置。三是提供多維檢索入口。除按主題、學科設(shè)類外,一般還從地區(qū)、資源類型、機構(gòu)等角度設(shè)類,便于用戶從不同角度檢索,如Yahoo、Hotbot、搜狐等都提供從地區(qū)和資源類型檢索的入口,網(wǎng)易還直接將個人主頁、公司企業(yè)等設(shè)為一級類目。
3網(wǎng)絡(luò)分類法的評價
3.1網(wǎng)絡(luò)分類法的優(yōu)勢
(1)類目收錄范圍寬泛。類目體系展開時,其下位類不僅收錄該類的從屬類目,而且收錄各種相關(guān)類目。例如在舞蹈類下設(shè)“舞蹈家”,在娛樂類下設(shè)“書商”,從而使得一些類目的下位類數(shù)量大大增加。如Yahoo各大類下,除區(qū)域類比較特殊、二級類目較少外,其余二級類目遠遠高于傳統(tǒng)文獻分類法同級類目的數(shù)量。
(2)以事物為中心設(shè)置類目。絕大多數(shù)網(wǎng)絡(luò)分類體系為便利用戶使用,極少按學科來設(shè)置類目,而主要以檢索的事物為中心來設(shè)置類目。以中文搜索引擎為例,如搜狐“電腦網(wǎng)絡(luò)”中的“軟件”、“游戲”、“下載”、“壁紙”,又如在“娛樂休閑”中的“影視”、“音樂”、“寫真”、“明星”等,都是根據(jù)用戶的需求,按事物組織相應(yīng)資源的類目設(shè)置架構(gòu)。
(3)多重列類,重復(fù)反映。由于網(wǎng)絡(luò)信息資源的易重復(fù)反映性,網(wǎng)絡(luò)分類體系也形成了該特點。采用多重列類方法組織網(wǎng)絡(luò)信息資源,便于用戶從不同角度進行檢索。多重列類通常是通過采用多個分類標準,同時還可以在多個劃分標準的基礎(chǔ)上,根據(jù)不同類目的特點,采用不同的引用次序列類。如新浪“社會科學”類下采用“主題對象”、“學科”、“資源類型”3個劃分標準,方便用戶選擇自己最適當?shù)臋z索途徑。國內(nèi)搜索引擎對文學作品類的設(shè)置,大都采用不同的引用次序組織類目:體裁-國別-時代-題材;國別-體裁-時代-題材;時代-國別-體裁-題材;題材-體裁-國別-時代。
(4)直接以語詞組織信息。網(wǎng)絡(luò)分類法放棄了傳統(tǒng)分類法以標記符號表達主題的方式,直接以語詞表達類目體系。這是由于傳統(tǒng)分類法的主要作用之一是便于文獻的分類排架,方便讀者查找,而采用鏈接技術(shù)鏈接網(wǎng)絡(luò)文獻,比使用分類標記更為直觀,易于理解。
(5)動態(tài)設(shè)類。根據(jù)使用需要組織和顯示相關(guān)資源,使分類體系能及時反映用戶需求與資源的變化。如通過設(shè)置鏡像類目,以鏈接的方式,在春節(jié)、圣誕節(jié)、重大事件前提前設(shè)置有關(guān)類目(如奧運會期間,可將“奧運賽事”等類目突出反映),事后可取消該鏡像類目。網(wǎng)絡(luò)分類法的動態(tài)性是傳統(tǒng)分類法無法比擬的。
(6)結(jié)合屏幕特點進行智能化顯示。搜索引擎系統(tǒng)一般都會結(jié)合屏幕特點,排列同位類,揭示類目間關(guān)系,排列檢索結(jié)果,方便用戶使用。搜索引擎對同位類的排列是依據(jù)名稱順序,或者依據(jù)用戶檢索頻率排列。在顯示查詢結(jié)果的時候,搜索引擎會按其相關(guān)度計算法計算出目標文獻與用戶檢索詞的相關(guān)度,然后按照這個標準進行排列。這樣顯然大大減少了用戶二次手工篩選命中文獻的工作量。
3.2網(wǎng)絡(luò)分類法存在的不足
(1)缺乏系統(tǒng)性和完整性。一個完整的綜合分類法在劃分基本大類時應(yīng)該全面涵蓋所涉及到的知識領(lǐng)域,而目前的一些搜索引擎往往只從商業(yè)角度來吸引用戶,增加點擊率,缺乏從知識體系的角度來分類,許多重要的知識領(lǐng)域沒有涉及,使體系的系統(tǒng)性與完整性大受影響。如悠游未設(shè)置自然科學和政治大類;雅虎基本大類中沒有工業(yè)類和農(nóng)業(yè)類等基礎(chǔ)性類目,而作為二級、三級類目或分散到其他類目中,這就加劇了集中與分散的矛盾,也造成知識體系的混亂。
(2)類深度把握得不恰當。在目前的網(wǎng)絡(luò)帶寬和速度下,如果分類級別過深,雖然會使整個系統(tǒng)邏輯性更強,但是會浪費用戶大量的時間,可謂得不償失。減小分類深度必然是以擴大寬度為代價的。如果用戶查找一個主題到第5級子類目時仍沒有結(jié)果,就會放棄本次查找而轉(zhuǎn)向別的類目;如果類目劃分得過簡,則會在查找專業(yè)信息時感到茫然??紤]到大多數(shù)用戶的心理,網(wǎng)絡(luò)信息資源分類的深度以4級為宜,最多不超過5級。當然,解決網(wǎng)絡(luò)分類中的級別問題須視類目情況而有所不同。如醫(yī)學類經(jīng)過多年的發(fā)展,其學科分類已經(jīng)比較成熟,原則上可以沿用,而經(jīng)濟類和計算機類等處在高速發(fā)展時期,其類目分級不斷出現(xiàn)新情況,則應(yīng)更多地考慮到類目的擴充性。
(3)目歸屬存在不合理現(xiàn)象。主要表現(xiàn)在:類表在確定類目下位類時,相關(guān)類收錄范圍太寬,又沒有必要的解釋,用戶無法判斷其外延。如Infoseek中出現(xiàn)按“兒童和家庭-教育-圖書館-大學圖書館”展開的序列;有的類名不確切,不能概括類目的內(nèi)涵。
(4)類目劃分隨意性大。多重列類、重復(fù)反映是網(wǎng)絡(luò)信息資源揭示的特點,也是網(wǎng)絡(luò)分類體系的優(yōu)勢所在。但是目前的網(wǎng)絡(luò)分類法在類目的排列上缺乏適度控制,隨意性大。如在同位類排列時采用多重標準,而每一種標準使用時又不完整,有時還同時列出不同等級的類目。例如:雅虎大類中“藝術(shù)與人文”、“社會與文化”、“社會科學”三者并列;搜狐中將“動物醫(yī)學”重復(fù)反映在“衛(wèi)生與健康”類下。此外,單一的重復(fù)反映并不就能代替相關(guān)關(guān)系的揭示,將具有相關(guān)關(guān)系的類目過度集中在1個類下,雖然可以提高檢全率,但會大大影響檢準率。因此,如何借鑒傳統(tǒng)分類法的優(yōu)點,結(jié)合網(wǎng)絡(luò)信息資源的特點,對網(wǎng)絡(luò)信息資源進行有效組織,是值得深入探討的問題。
4參考文獻
[1] 馬費成,李綱,查先進,等.信息資源管理[M].武漢:武漢大學出版社,1997.
[2] 周帶娣.農(nóng)業(yè)科技創(chuàng)新與文獻信息開發(fā)利用的機制分析[J].湖南農(nóng)業(yè)大學學報(社會科學版),2003,4(1):88-90.
[3] 孟祥紅,孟祥云.河北省推進區(qū)域創(chuàng)新體系建設(shè)的思考[J].中國科技成果,2004(11):14-16.
[4] 梁春陽.中國西部地區(qū)信息服務(wù)業(yè)發(fā)展研究[M].銀川:寧夏人民出版社,2002.