戚紅一
摘 要: Tag作為一種自由而有序的信息分類技術(shù),對傳統(tǒng)的信息分類、檢索和傳播方法進行了革命式的顛覆,在Web2.0及Web3.0環(huán)境下,它以“人”為信息傳遞和交換的核心,實現(xiàn)了由“機器-人”到“人-人”的信息傳播方式的改變,迅速開創(chuàng)了互聯(lián)網(wǎng)信息分類、檢索和傳播的新階段。本文對Web環(huán)境下基于用戶行為的Tag分類法進行了系統(tǒng)的綜述,從Tag的基本概念出發(fā),介紹了Tag的興起及界定, Tag的形式、內(nèi)容、使用方式、價值及影響,Tag的典型應(yīng)用,并最終展望了Tag的發(fā)展未來。
關(guān)鍵詞: Tag; Tag標注; 分類法; 大眾分類法; 聚合
中圖分類號:TP399 文獻標志碼:A 文章編號:1006-8228(2018)02-26-03
Abstract: As a kind of free and orderly information classification technology, Tag has revolutionized the traditional methods of information classification, retrieval and dissemination. Under the environment of Web2.0 and Web3.0, Tag takes "human" as the core of transmission and exchange, and has changed the way of information transmission from 'machine to person' to 'person to person' and quickly opened up a new stage in the classification, retrieval and dissemination of Internet information. Based on the basic concept of Tag, this paper introduces the rise and definition of Tag, the form, content, usage, value and influence of Tag, the typical application of Tag, and finally looks forward to the future development of Tag.
Key words: Tag; tagging; taxonomy; folksonomy; aggregation
0 引言
Tag,一種由用戶自定義、用于描述信息的關(guān)鍵詞,是用戶在閱讀和使用資源時,由于各種原因留下的各種類型的批注,如標簽、評論、注釋等[1]。Tag標注現(xiàn)象自古就已有之,例如,批注一直是我國文學鑒賞與批評的重要形式和傳統(tǒng)的讀書方法之一。Tag標注現(xiàn)象已經(jīng)延續(xù)了數(shù)千年,傳統(tǒng)環(huán)境下的Tag標注基本上都是自標自用,雖然也有少量標注隨著原始資源傳遞到其他用戶手中,或者通過出版批注本等形式傳播,但是這種情況并不普遍,所覆蓋的資源群體和受眾群體都十分有限。
用戶的Tag標注行為給互聯(lián)網(wǎng)帶來一場充滿活力和巨大沖擊的革命,一方面,用戶有能力影響他們自己的在線經(jīng)驗,另一方面,有助于其他人獲得更好的用戶體驗。用戶添加元數(shù)據(jù)并且使用Tag來組織他們自己采集的數(shù)字化信息,為內(nèi)容分類,建立起自底向上的分類系統(tǒng)。這里Tag所體現(xiàn)的正是群體的智慧和大眾的心聲,集體智慧做著迄今為止只有目錄編制專家才可以做到的事情。信息發(fā)布者和網(wǎng)站作者,他們在組織互聯(lián)網(wǎng)上的信息并為其分類,這是決定用戶體驗的主要因素,同時,Tag的廣泛應(yīng)用使得用戶獲得授權(quán),他們可以選擇決定自己的分類需求,由此,元數(shù)據(jù)掌握在了普通人手中,專家將不再是這個領(lǐng)域的霸主。
1 Tag的概念
Tag是一種關(guān)鍵詞標注,是一種特殊的分類法,在中國并沒有統(tǒng)一的中文名稱,有人稱之為“標簽”,也有人稱之為“自由分類”、“大眾分類”或“開放分類”。Tag體現(xiàn)的群體的力量,使得網(wǎng)絡(luò)內(nèi)容之間的相關(guān)性和用戶之間的交互性大大增強。
Tag體現(xiàn)了信息與信息之間的相關(guān)性。一件事物有不同的屬性,而一個屬性能被標注在不同事物上。Tag是在Web2.0時代的背景下,由網(wǎng)絡(luò)受眾創(chuàng)造的一種自定義分類方式[2],這種分類的類目之間并不形成立體的空間結(jié)構(gòu),而是一種超鏈接的復雜平面網(wǎng)絡(luò),這個網(wǎng)絡(luò)融匯了人際傳播、群體傳播和大眾傳播的諸多特性,而Tag本身就是這些特性的元載體。
2 Tag的分類
Tag主要包括自由Tag和社會性Tag。社會性Tag是自由Tag的進一步延伸,它們只在使用范圍上有差異。自由Tag在使用中通過共同使用的Tag把其標注的對象關(guān)聯(lián)起來,就具有了社會意義,成為社會性Tag。一旦成為社會性Tag,就能夠從群體用戶分類中發(fā)現(xiàn)對應(yīng)每個Tag標注使用最多的分類,這種通過協(xié)同用戶單個行為產(chǎn)生的分類法,是在大眾用戶持續(xù)使用Tag的過程中被集體創(chuàng)造出來的,稱為大眾分類法(Floksonomy)[3-4]。
通過標注自由Tag的方式,社會性Tag在用戶和標注內(nèi)容對象之間建立起聯(lián)系,并為這個聯(lián)系賦予了一個或多個屬性。這樣在用戶集合、標注內(nèi)容對象集合和Tag集合間形成了一個三元網(wǎng)絡(luò)(用戶—Tag—內(nèi)容對象),也可以看作是三組關(guān)聯(lián)在一起的二元網(wǎng)絡(luò):(用戶—Tag,Tag—內(nèi)容對象,用戶—內(nèi)容對象)。由于這個三元網(wǎng)絡(luò)中的關(guān)系是公開的,所以每個用戶既可以看到自己所加注的Tag和內(nèi)容對象,也可以通過自己加注的Tag和對象直接發(fā)現(xiàn)在三元網(wǎng)絡(luò)上相鄰的其他用戶的Tag與內(nèi)容對象,通過在網(wǎng)絡(luò)上游走,實際上可以看到整個網(wǎng)絡(luò)上用戶、Tag和內(nèi)容對象之間的對應(yīng)關(guān)系。這樣,用戶的個人行為就成為社會集體行為中的一部分。每個人對互聯(lián)網(wǎng)中資源的分類從整體上優(yōu)化了互聯(lián)網(wǎng)的秩序。endprint
3 Tag的功能及特點
Tag的功能可以從用戶層面和系統(tǒng)層面兩個層次進行分析。
⑴ 從個人用戶層面來講,用戶可以是資源的擁有者和訪問者。作為資源的擁有者,Tag標注賦予了普通用戶組織網(wǎng)絡(luò)信息資源的能力,用戶能對資源的意義進行標注,以便于再次查找和使用,同時使個人資源能被其他用戶發(fā)現(xiàn)和分享。作為資源的訪問者,Tag能通過特定的Tag聚合整個信息空間中的相似內(nèi)容,為用戶提供基于Tag的檢索、瀏覽和定制功能。
⑵ 從系統(tǒng)層面來看,基于Tag的大眾分類法具有社群聚合的功能,能夠幫助用戶發(fā)現(xiàn)與自己關(guān)注相同內(nèi)容、具有相同思想的其他用戶,從而形成特定的社會群體。在此基礎(chǔ)上,Tag能夠反映不同社群對相同事物的不同認識,從而建立不同知識體系間的聯(lián)系。此外,通過熱門Tag和Tag的動態(tài)變化,還能及時反映熱點和趨勢。
4 影響Tag的因素
概括起來,影響Tag的因素主要來源于主觀因素和客觀因素兩個方面:
主觀因素指來自Tag標注者自身的因素。包括:①Tag標注者個人知識背景條件;②Tag標注者的個人能力;③Tag標注的目的和動機;④Tag標注時的心態(tài)。
客觀因素主要指外界環(huán)境對Tag標注者標注行為的影響。包括:①其他用戶標注的Tag及其易獲得性;②Tag標注環(huán)境的影響;③社會大環(huán)境的影響。
這兩方面的因素相互影響、相互作用。Tag標注的環(huán)境有時會影響到標注者的心態(tài),進而影響Tag標注的結(jié)果。
5 Tag、Tag標注及分類
Tag作為元數(shù)據(jù)的一種,是所謂描述數(shù)據(jù)的數(shù)據(jù)。Tag是一種用戶自創(chuàng)的元數(shù)據(jù),特點是無層次結(jié)構(gòu)、自定義。而Tag標注的過程,即Tagging,即構(gòu)成了大眾分類法(folksonomy),大眾自發(fā)利用Tag對信息進行描述、分類,構(gòu)成與信息架構(gòu)中傳統(tǒng)分類法(taxonomy)相對的信息組織。
分類和Tag都是為了尋找一種恰當?shù)姆椒?,對所涉及的?nèi)容對象進行組織,以便以后方便的檢索、查詢與運用。在傳統(tǒng)組織方式中,分類必須創(chuàng)建于內(nèi)容對象之前,而Tag則是創(chuàng)建于內(nèi)容對象之后。傳統(tǒng)分類和Tag的在于創(chuàng)建先后順序上存在根本不同。
在內(nèi)容對象信息組織的第一階段,只有分類信息,即內(nèi)容對象——分類,這里的分類往往限制在一個維度里,當樹狀結(jié)構(gòu)復雜到不可調(diào)和時,出現(xiàn)瓶頸是遲早的。傳統(tǒng)分類的問題在于,既不能完全滿足用戶需求,也不能完全表達創(chuàng)建者對內(nèi)容對象屬性的認知。
6 Tag的典型應(yīng)用
傳統(tǒng)環(huán)境下的Tag以自標自用為主,其應(yīng)用多是為方便自己日后的檢索或使用,有一種做備忘錄的性質(zhì)。在網(wǎng)絡(luò)環(huán)境下,Tag的應(yīng)用突破了這些局限,在更大的范圍內(nèi)得到了更廣泛的應(yīng)用。網(wǎng)絡(luò)環(huán)境下的Tag應(yīng)用主要分為以下幾種:
⑴ 利用Tag組織資源
用Tag作為元數(shù)據(jù)組織資源,代替關(guān)鍵詞的功能,這是目前Tag最普遍的應(yīng)用,網(wǎng)上流行的大眾標注(folksonomy)就是根據(jù)這一原理形成的。這種方法最初是隨著美味書簽的出現(xiàn)和發(fā)展而逐步發(fā)展起來的,它摒棄了傳統(tǒng)分類法事先分類、專家分類的原則,采用由資源使用者為資源提供關(guān)鍵詞,根據(jù)這些關(guān)鍵詞來聚類資源的方式。這種資源組織方法一方面方便了用戶,用戶無需了解專業(yè)的、自己不熟悉的分類體系;另一方面,它利用集體智慧組織資源,形成的分類結(jié)果更貼近用戶的使用習慣,對用戶更具有現(xiàn)實意義。
⑵ 利用Tag改進資源組織工具
Tag不僅僅可以直接用來組織資源,還可以用來改善現(xiàn)有的資源組織工具和組織方法。在這方面,最直接的應(yīng)用是將Tag與其他資源描述、組織工具或方法進行整合,共同完成對資源的組織和檢索。例如,將表達同一概念的不同形式的Tag關(guān)聯(lián)起來,作為對正規(guī)的主題詞的補充,以此來改善檢索效果。
⑶ 利用Tag實現(xiàn)異構(gòu)資源的整合
國外有專家嘗試使用Tag來實現(xiàn)異構(gòu)資源的整合[5],科研人員可以對資源進行Tag標注,通過標注將那些可以通過Web存取的數(shù)據(jù)在不同的細粒度上與相應(yīng)的概念鏈接。這樣,被標注數(shù)據(jù)成為這些概念的實例,為用戶提供了一種通過整合、透明方式來查詢分布數(shù)據(jù)的框架。
⑷ 利用Tag進行協(xié)同過濾和推薦
通過對大量Tag的聚類和內(nèi)容分析,可以劃分用戶(標注者)群體、資源群體,從而實現(xiàn)協(xié)同過濾和推薦。
當前,在許多支持標簽的Web網(wǎng)站上,都提供了利用Tag進行推薦的功能:一種是大眾式推薦,根據(jù)Tag的數(shù)量計算出熱門標簽,以Tag云圖的形式展現(xiàn)給用戶;另一種是專門式推薦,當用戶標注了一定的資源之后,系統(tǒng)會根據(jù)用戶給予資源的Tag計算出用戶的興趣領(lǐng)域,同時根據(jù)其他用戶的Tag標注行為計算出屬于該興趣領(lǐng)域的資源,將它推薦給特定的用戶。
7 結(jié)束語
Tag在國內(nèi)發(fā)展到現(xiàn)在,其發(fā)展軌跡與博客有相似之處。起初并沒有人把博客的商業(yè)價值提到議事日程,一直到“老徐的blog”成為全球第一博,似乎人們才將這一平臺和廣告結(jié)合了起來。而Tag的商業(yè)價值似乎在發(fā)展之初也并未受到人們的重視,但正因為Tag的相關(guān)網(wǎng)站,特別是被稱之為Tagger(典客)網(wǎng)站彌補了傳統(tǒng)搜索引擎無法克服的缺陷,提高了信息查找的效率,便引起了互聯(lián)網(wǎng)巨頭們的注意。亞馬遜(Amazon)宣布投資典客網(wǎng)站43things;同年3月,雅虎(Yahoo)投資照片共享網(wǎng)站Flickr,F(xiàn)lickr成立才一年,用戶數(shù)就達到42萬。典客網(wǎng)站的出現(xiàn),宣告了搜索引擎已不再是互聯(lián)網(wǎng)上發(fā)現(xiàn)信息的惟一途徑。
參考文獻(References):
[1] M. Ames and M. Naaman. Why we tag: motivations for annotation in mobile and online media. In CHI '07.
[2] C.-m. Au Yeung, N. Gibbins, and N. Shadbolt. Contextualising tags in collaborative tagging systems. In HYPERTEXT '09.
[3] K. Bischoff, C. S. Firan, W. Nejdl, and R. Paiu. Can all tags be used for search? In CIKM '08.
[4] S. Brin and L. Page. The anatomy of a large-scale hypertextual web search engine. In Computer Networks and ISDN Systems, 1998.
[5] C. Cattuto, D. Benz, A. Hotho, and G. Stumme. Semantic grounding of tag relatedness in social bookmarking systems. In ISWC '08.endprint