王賽賽 陳敏之
摘要: 服裝款式豐富多樣,服裝屬性語義復(fù)雜。針對(duì)關(guān)鍵詞難以表述消費(fèi)者檢索需求的問題,文章以款式復(fù)雜的連衣裙為例,提出了一種基于本體的連衣裙款式知識(shí)庫構(gòu)建方法,對(duì)其他類別服裝語義檢索具有普遍適用指導(dǎo)意義。通過匯總和歸納連衣裙款式概念及其關(guān)系,利用Protégé工具,建立款式關(guān)鍵詞的關(guān)聯(lián)性,構(gòu)建連衣裙款式本體模型。并結(jié)合本體語義擴(kuò)展方法,提出了基于語義信息的連衣裙款式檢索模型,實(shí)現(xiàn)基于語義的連衣裙款式智能搜索,提高款式檢索的查全率和查準(zhǔn)率。
關(guān)鍵詞: 本體知識(shí)庫;連衣裙款式;相似度;語義檢索;語義擴(kuò)展
中圖分類號(hào): TS941.717.82
文獻(xiàn)標(biāo)志碼: A
文章編號(hào): 1001-7003(2021)09-0067-06
引用頁碼: 091111
DOI: 10.3969/j.issn.1001-7003.2021.09.011(篇序)
Research on ontologybased retrieval of onepiece dress style
WANG Saisaia, CHEN Minzhia,b
(a.Fashion Design Academy; b.Institute of International Education, Zhejiang SciTch University, Hangzhou 310018, China)
Abstract: Garment styles are abundant and various, and the semantics of clothing attributes are complex. To solve the problem that keywords are difficult to indicate consumers retrieval needs, an ontologybased clothing style knowledge base construction method is proposed by taking onepiece dress with complicated style as the example, hoping to provide universally applicable guidance for semantic retrieval of other categories of clothing. After summarizing the concepts of onepiece dress styles and their relationships, the relevance of style keywords is established using Protégé tool and an ontology model of onepiece dress styles is constructed. The retrieval model of onepiece dressstyles based on semantic information is proposed through ontology semantic extension method, and semanticbased intelligent search of onepiece dressstyles is implemented, thereby enhancing the recall ratio and precision ratio of the retrieval.
Key words: ontology knowledge base; onepiece dress style; similarity; semantic retrieval; semantic extension
收稿日期: 20210107;
修回日期: 20210823
基金項(xiàng)目: 浙江省自然科學(xué)基金一般項(xiàng)目(LY17E060007)
作者簡(jiǎn)介: 王賽賽(1996),女,碩士研究生,研究方向?yàn)榉b智能化推薦。通信作者:陳敏之,副教授,cmz_m@163.com。
隨著服裝領(lǐng)域信息化的發(fā)展,消費(fèi)者通過網(wǎng)絡(luò)就能進(jìn)行服裝的查詢,服裝款式檢索成為服裝行業(yè)研究的重點(diǎn)。服裝款式具有服裝品類多、款式豐富、服裝屬性語義復(fù)雜等特征,但目前服裝領(lǐng)域的檢索引擎大多是基于關(guān)鍵詞檢索的方式,而簡(jiǎn)單的關(guān)鍵詞檢索無法在語義層面通過幾個(gè)關(guān)鍵詞完全理解用戶特定的需求[1],信息檢索結(jié)果通常廣泛而不精確,因此將信息檢索系統(tǒng)進(jìn)行細(xì)分,針對(duì)專業(yè)領(lǐng)域構(gòu)建信息檢索系統(tǒng)是近幾年的研究趨勢(shì)。
本體作為一種建模工具,提供了一種恰當(dāng)?shù)母拍畋硎痉绞?,通過構(gòu)建語義模型,充分地表達(dá)領(lǐng)域內(nèi)概念的層次結(jié)構(gòu)和概念間的關(guān)系,精確地描述領(lǐng)域內(nèi)的知識(shí)。本體在語義信息檢索系統(tǒng)的語義標(biāo)注、基于本體的索引、基于本體的查詢擴(kuò)展等多個(gè)方面都有很重要的作用。目前本體已廣泛分布于各個(gè)行業(yè),從早期在語義Web中的推理研究[2],到如今醫(yī)療領(lǐng)域[3]、家具個(gè)性化定制[4]等智能檢索方面的應(yīng)用。在服裝行業(yè)中如服裝智能制造[5]、服裝加工服務(wù)[6]、紡織服裝領(lǐng)域檢索[7]等也多有研究,但將本體引入款式領(lǐng)域的檢索尚未進(jìn)行深入研究。
連衣裙因春夏可單穿,秋冬可內(nèi)搭為四季常青類目,且連衣裙款式復(fù)雜,覆蓋多種廓形、領(lǐng)型等款式類型,具有廣泛代表性。因此本文以連衣裙為例,提出了基于語義層面上的連衣裙款式語義檢索模型,對(duì)其他類別服裝的語義檢索具有普遍適用指導(dǎo)意義。通過分析連衣裙款式知識(shí)及概念層次,利用連衣裙款式領(lǐng)域概念之間的語義關(guān)聯(lián),構(gòu)建連衣裙款式本體模型。并結(jié)合本體語義擴(kuò)展算法,將本體數(shù)據(jù)庫在連衣裙款式信息檢索中進(jìn)行語義推理應(yīng)用,實(shí)現(xiàn)連衣裙款式語義檢索。
1連衣裙款式領(lǐng)域本體設(shè)定原則及流程
連衣裙款式本體是定義連衣裙款式領(lǐng)域、可以被計(jì)算機(jī)理解且被該領(lǐng)域所共同接受的一些概念,通俗地說,是建立檢索連衣裙時(shí)所用的正式的詞匯表,包含了連衣裙款式領(lǐng)域內(nèi)的概念、實(shí)例、概念之間的關(guān)系及概念的屬性等。領(lǐng)域本體結(jié)構(gòu)如圖1所示。
連衣裙款式本體在“七步法”建模方法基礎(chǔ)上,結(jié)合服裝產(chǎn)品的特點(diǎn)及款式檢索的需求,形成的具體構(gòu)建過程如下:1) 確定連衣裙款式本體的領(lǐng)域和范圍,即本體構(gòu)建的應(yīng)用目標(biāo);2) 收集領(lǐng)域相關(guān)信息;3) 列舉領(lǐng)域內(nèi)最核心的概念,一般取自教科書或者專家知識(shí);4) 核心概念詞匯層次化;5) 核心概念同義詞擴(kuò)展;6) 確定概念之間的關(guān)系和屬性;7) 利用本體工具構(gòu)建連衣裙款式本體。
2連衣裙款式本體的構(gòu)建
本文構(gòu)建的連衣裙款式本體主要面向檢索應(yīng)用領(lǐng)域,一般在款式檢索時(shí)需要對(duì)款式進(jìn)行標(biāo)注,而標(biāo)注的過程就是獲得描述款式的語義概念的過程,因此構(gòu)建連衣裙款式領(lǐng)域本體最主要的任務(wù)是收集款式領(lǐng)域的概念詞匯。本文概念詞匯
的獲取方法如圖2所示。服裝款式領(lǐng)域本體概念一方面由文獻(xiàn)查閱和領(lǐng)域?qū)<以L談獲取款式知識(shí)的構(gòu)成及分類,形成連衣裙款式領(lǐng)域本體的核心層次概念;另一方面通過對(duì)消費(fèi)者問卷訪談進(jìn)行概念同義詞擴(kuò)展。
2.1連衣裙核心概念層次體系建立
本文通過查閱及整理相關(guān)文獻(xiàn)[8-10],整合了連衣裙款式領(lǐng)域內(nèi)所有基礎(chǔ)概念及其實(shí)例,選取影響款式造型較為明顯的廓形、領(lǐng)型、袖型、色調(diào)、面料、圖案、裙長(zhǎng)、袖長(zhǎng)、合體度等服裝款式因素來分析連衣裙款式。
按照常見的服裝款式分類,本文將連衣裙款式分為廓形、領(lǐng)型、袖型、面料、色調(diào)、圖案、袖長(zhǎng)、裙長(zhǎng)、合體度9類一級(jí)概念,其下又分為21個(gè)二級(jí)概念,三級(jí)為二級(jí)概念的實(shí)例,如圖3所示。如概念無領(lǐng)的實(shí)例有圓領(lǐng)、方領(lǐng)、V領(lǐng)等6個(gè)實(shí)例;概念光澤型面料的實(shí)例有綢、緞;概念柔軟型面料的實(shí)例有絲綢、麻紗等。本文共收集74個(gè)實(shí)例。
2.2連衣裙款式概念的同義詞獲取
服裝款式領(lǐng)域的一個(gè)檢索障礙是詞匯的多樣性,主要是連衣裙款式的廓形、領(lǐng)型、袖型,不同地區(qū)不同人的叫法不同,導(dǎo)致用戶的檢索詞匯與本體中的概念語義描述不盡相同。為了解決用戶檢索同義類型詞時(shí)信息不足的問題,需要對(duì)本體中的詞匯進(jìn)行同義詞擴(kuò)展。例如,“H形”的同義關(guān)系概念有“直身形、直筒形”,當(dāng)用戶在領(lǐng)域本體模型中檢索“H形”時(shí),通過本體語義擴(kuò)展,檢索詞將擴(kuò)展為檢索集“H形、直筒形、直身形”,以此提高用戶檢索的準(zhǔn)確性。
2.2.1問卷訪談數(shù)據(jù)采集
為了使問卷結(jié)果更具科學(xué)性和有效性,本文從淘寶、京東等常用購物網(wǎng)站收集了圖3中廓形、領(lǐng)型、袖型的20個(gè)概念實(shí)例的圖片進(jìn)行問卷訪談,如圖4所示。
經(jīng)查詢,25歲~35歲為連衣裙消費(fèi)主力軍,因此確定調(diào)查目標(biāo)人群為25~35歲。地區(qū)選擇石家莊、北京、鄭州等北方城市,杭州、南京等南方城市及成都、重慶等西南城市進(jìn)行調(diào)研,每個(gè)地區(qū)選擇5個(gè)訪談對(duì)象,每個(gè)款式類別分別讓各地區(qū)的訪談對(duì)象指認(rèn)類別名稱。
2.2.2問卷訪談結(jié)果統(tǒng)計(jì)
本次問卷調(diào)查共收集了750張問卷,通過對(duì)問卷調(diào)查得到的結(jié)果進(jìn)行統(tǒng)計(jì)分析整理,共得到225個(gè)同義概念,分別將之與層次概念中的概念對(duì)應(yīng),部分關(guān)鍵詞的同義擴(kuò)展匯總?cè)绫?所示。
2.3基于本體的連衣裙款式本體構(gòu)建
服裝款式概念劃分具有的結(jié)構(gòu)性和層次性特征,使得它可以建立知識(shí)本體模型。前文確定了連衣裙款式本體的概念,而概念在領(lǐng)域本體中是通過相互之間的關(guān)系連接起來的。本文利用Protégé工具構(gòu)建連衣裙款式本體,主要涉及的概念之間的基本關(guān)系如表2所示,主要有組成關(guān)系、繼承關(guān)系、實(shí)例關(guān)系、屬性關(guān)系、同義關(guān)系5種[11]。Partof表達(dá)概念之間部
分與整體的關(guān)系,例如“廓形”是“服裝款式”的一部分。Kindof表達(dá)概念之間的繼承關(guān)系,例如“廓形”繼承了“服裝款式”的所有屬性。Instanceof表達(dá)概念的實(shí)例和概念之間的關(guān)系,例如“H形”是“廓形”的一個(gè)實(shí)例。Attributeof表達(dá)概念之間的屬性關(guān)系,例如“裙長(zhǎng)”和“合體度”均是“連衣裙款式”的數(shù)據(jù)屬性;“袖長(zhǎng)”是“袖型”的數(shù)據(jù)屬性。另外,使用“owl:Equivalent to”這一特定屬性表達(dá)概念的同義關(guān)系,如“H形、直身形、直筒形”之間的關(guān)系。
至此,服裝款式領(lǐng)域本體中的概念、實(shí)例及其屬性在語義層面上建立了聯(lián)系,得到部分語義本體框架如圖5所示。
3基于本體的連衣裙款式檢索
3.1基于本體的連衣裙款式概念語義相似度計(jì)算
領(lǐng)域本體中概念之間的語義相似度是語義信息檢索研究的重點(diǎn)[12]。本體概念相似度計(jì)算是指在計(jì)算概念的相關(guān)度時(shí)參考了概念間的層次結(jié)構(gòu)信息,如節(jié)點(diǎn)關(guān)系、語義鄰居關(guān)系等。在款式檢索中使用語義相似度來代表這些關(guān)系,連衣裙款式領(lǐng)域本體可以看成一本體層次概念語義樹,如圖6所示。其中結(jié)點(diǎn)N1、N2、N3等表示本體中的概念詞,結(jié)點(diǎn)之間的邊表示本體中概念與概念之間的語義相似度,如S(N1,N2)。
本文采用概念語義相似度的計(jì)算方法,用S(x,y)表示兩個(gè)概念之間的相似程度。如果連衣裙款式本體中概念Ni和Nj是同義關(guān)系,則兩者的語義相似度為1,即S(Ci,Cj)=1;如果是兩個(gè)非同義的概念Ni和Nj,則兩者之間的語義相似度按下式計(jì)算。
S(Ni,Nj)=(Dist(Ni,Nj)+θ)×θ(d(Ni)-d(Nj))CE(Ni,Nj)×2×Dep×max(|d(Ni)-d(Nj)|)(1)
式中,d(Ni)和d(Nj)分別是概念Ni和Nj對(duì)應(yīng)的節(jié)點(diǎn)在概念樹中的層次,d(Ni)-d(Nj)表示概念Ni和概念Nj的層次差,Dist(Ni,Nj)表示從概念Ni結(jié)點(diǎn)到概念Nj結(jié)點(diǎn)所經(jīng)過的路徑上相似度的和。θ是一個(gè)可調(diào)節(jié)參數(shù),用于調(diào)節(jié)概念層次差對(duì)語義相似度的影響,一般大于等于0。CE(Ni,Nj)表示從概念Ni結(jié)點(diǎn)到概念Nj結(jié)點(diǎn)所經(jīng)過的路徑長(zhǎng)度,每條邊記數(shù)為1,當(dāng)Ni和Nj不連通時(shí),路徑長(zhǎng)度為∞。Dep為概念所在本體中的層次深度。
以此可以構(gòu)造表示連衣裙款式本體中的所有概念的語義相似度矩陣[13]。本文經(jīng)實(shí)驗(yàn)確定θ取值為0.2時(shí),語義相似度結(jié)果與領(lǐng)域?qū)<医?jīng)驗(yàn)值相吻合,實(shí)驗(yàn)結(jié)果如表3所示。
3.2基于本體的連衣裙款式檢索流程
將建立的連衣裙款式知識(shí)本體結(jié)構(gòu)連接到款式檢索的系統(tǒng)中?;诒倔w的連衣裙款式檢索流程如下:用戶發(fā)出語義檢索請(qǐng)求,首先關(guān)鍵詞進(jìn)入本體進(jìn)行關(guān)鍵詞擴(kuò)展,包括在領(lǐng)域本體的基礎(chǔ)上對(duì)用戶的檢索語言進(jìn)行同義和相似擴(kuò)展(如果是單關(guān)鍵詞也直接進(jìn)行語義相似度擴(kuò)展),生成新的語義檢索擴(kuò)展集合,然后在款式庫中檢索匹配的款式,最后將相似性款式檢索結(jié)果推薦給用戶?;诒倔w的連衣裙款式檢索系統(tǒng)流程如圖7所示。
3.3檢索效果分析
本文以檢索請(qǐng)求“q=H形、泡泡袖”為例,來驗(yàn)證基于本體檢索系統(tǒng)的優(yōu)越性。如果基于關(guān)鍵詞的檢索系統(tǒng)進(jìn)行檢索,結(jié)果只能是含有“H形、泡泡袖”這兩個(gè)關(guān)鍵詞的款式。而基于本體的檢索,參照連衣裙款式本體,“H形”與“直身形”“直筒形”為同義詞,相似度為1.0,“泡泡袖”與“公主袖”的相似度為10,與“燈籠袖”的相似度為0.811 0,這樣原始的檢索請(qǐng)求q經(jīng)本體推理后表示為:q=(H形〈1.0〉,直身形〈1.0〉,直筒形〈1.0〉,泡泡袖〈1.0〉,公主袖〈1.0〉,燈籠袖〈0.8〉)。
圖8為6個(gè)連衣裙款式,d1=(H形、泡泡袖),d2=(H形、公主袖),d3=(H形、燈籠袖),d4=(直筒形、泡泡袖),d5=(直筒形、公主袖),d6=(直筒形、燈籠袖)。
如果按照關(guān)鍵詞檢索,則與檢索請(qǐng)求相匹配的相似度S結(jié)果為S(q,d1)>S(q,d2)=S(q,d3)=S(q,d4),而d5和d6不會(huì)被檢索出來;如果按照基于連衣裙本體的檢索方式,則相似度結(jié)果為S(q,d1)=S(q,d2)=S(q,d4)=S(q,d5)>S(q,d3)=S(q,d6),顯然后者更符合檢索語義上的需求。
目前常用兩個(gè)指標(biāo)來檢驗(yàn)一個(gè)檢索系統(tǒng)的檢索效果,即查全率(Recall)和查準(zhǔn)率(Precision)。公式如下:
P/%=nN×100(2)
R/%=nM×100(3)
式中:n指查詢結(jié)果中與檢索請(qǐng)求標(biāo)注相同的款式數(shù)量,N指查詢結(jié)果中所有款式數(shù)量,M指系統(tǒng)中所有相關(guān)的款式數(shù)量。
為了驗(yàn)證基于本體的款式檢索模型的有效性,本文從淘寶、京東等常見購物網(wǎng)站選取80件已標(biāo)注產(chǎn)品關(guān)鍵詞的連衣裙款式,分別按傳統(tǒng)簡(jiǎn)單關(guān)鍵詞檢索方式和基于本體的語義檢索方式進(jìn)行檢索。通過結(jié)果比較分析,兩種檢索方式得到的查準(zhǔn)率和查全率兩項(xiàng)性能指標(biāo)對(duì)比如表4所示。
將表4的查準(zhǔn)率、查全率對(duì)比數(shù)據(jù)通過Excel轉(zhuǎn)換成折線圖,如圖9、圖10所示。
由表4、圖9和圖10可以看出,若待檢索關(guān)鍵詞無同義詞時(shí),如“圓領(lǐng)”“羊腿袖”,基于本體的檢索和基于關(guān)鍵詞的檢索查全率結(jié)果不相上下,而前者查準(zhǔn)率較高;但在檢索同義詞較多的關(guān)鍵詞時(shí),如“O形”“方領(lǐng)”等,基于本體的檢索模型明顯比基于關(guān)鍵詞的查準(zhǔn)率和查全率高。因此,基于本體的連衣裙款式檢索模型得到了更好的檢索效果,在查全率和查準(zhǔn)率上得到了明顯提高。
4結(jié)論
本文通過建立連衣裙款式領(lǐng)域本體,提出了基于語義層面的連衣裙款式檢索模型。通過建立連衣裙款式本體,將連衣裙款式方面的概念進(jìn)行匯總與整理,結(jié)合相似度算法,將用戶的檢索詞進(jìn)行同義擴(kuò)展與相似擴(kuò)展,有效提高了檢索的查準(zhǔn)率與查全率。與關(guān)鍵詞檢索方式相比,基于本體的連衣裙款式檢索模型能更好地理解用戶語義,為用戶提供更為精確的檢索結(jié)果,今后可與圖像識(shí)別、自動(dòng)添加標(biāo)簽等技術(shù)結(jié)合,實(shí)現(xiàn)更智能的服裝款式檢索。
參考文獻(xiàn):
[1]厲穎. 基于本體的服裝領(lǐng)域知識(shí)表示的建模研究[D]. 青島: 山東科技大學(xué), 2010.
LI Ying. Based on Ontology about Field Knowledge Representation of the Clothing Modeling Study[D]. Qingdao: Shandong University of Science and Technology, 2010.
[2]李永超, 羅鈞旻. 語義Web中的本體推理研究[J]. 計(jì)算機(jī)技術(shù)與發(fā)展, 2007(1): 101-103.
LI Yongchao, LUO Junmin. Research on reasoning on ontology in semantic Web[J]. Computer Technology and Development, 2007(1): 101-103.
[3]NASKAR D, DAS S. HNS ontology using faceted approach[J]. Knowledge Organization, 2019, 46(3): 187-198.
[4]李文靖, 胡書山, 余日季. 基于語義網(wǎng)的數(shù)字化家具模型本體設(shè)計(jì)與檢索[J]. 軟件導(dǎo)刊, 2019, 18(8): 136-139.
LI Wenjing, HU Shushan, YU Riji. Design and retrieval of digital furniture model ontology based on semantic web[ J ]. Software Guide, 2019, 18(8): 136-139.
[5]王倩. 基于本體的服裝制造過程信息上下文建模研究[J]. 軟件導(dǎo)刊, 2015, 14(12): 118-121.
WANG Qian. Research on ontologybased garment manufacturing process information context modeling[ J ]. Software Guide, 2015, 14(12): 118-121.
[6]伊恩弟. 面向云制造的服裝加工服務(wù)本體模型及其描述[J]. 硅谷, 2012, 5(23): 189-176.
YI Endi. Clothing processing service ontology model for cloud manufacturing and its description[J]. Silicon Valley, 2012, 5(23): 189-176.
[7]梁道雷, 姚亮, 陳鞏靜. 基于本體的紡織服裝主題搜索引擎系統(tǒng)研究[J]. 絲綢, 2014, 51(11): 28-31.
LIANG Daolei, YAO Liang, CHEN Gongjing. Research of ontologybased textile and clothing topic search engine system[J]. Journal of Silk, 2014, 51(11): 28-31.
[8]劉曉剛. 服裝設(shè)計(jì)元素論[J]. 東華大學(xué)學(xué)報(bào)(自然科學(xué)版), 2003(2): 23-26.
LIU Xiaogang. Theory of fashion design elements[J]. Journal of East China University(Natural Science Edition), 2003(2): 23-26.
[9]XAVIER A, SOPHIE G, JEREMY H. VetiVoc: a modular ontology for the fashion, textile and clothing domain[J]. Applied Ontology, 2015, 11(1): 128.
[10]張韓. 連衣裙的造型要素與感性意象關(guān)聯(lián)量化及款式推薦研究[D]. 杭州: 浙江理工大學(xué), 2017.
ZHANG Han. Research on the Correlation Quantification and Style Recommendation of Dress Modeling Elements and Perceptual Images[D]. Hangzhou: Zhejiang SciTech University, 2017.
[11]羅仕鑒, 董燁楠. 面向文化創(chuàng)意設(shè)計(jì)的器物知識(shí)集成與管理[J]. 計(jì)算機(jī)集成制造系統(tǒng), 2018, 24(4): 964-977.
LUO Shijian, DONG Yenan. Integration and management method of cultural artifacts knowledge for cultural creative design[J]. Computer Integrated Manufacturing System, 2018, 24(4): 964-977.
[12]張乃靜, 鞠洪波, 紀(jì)平. 基于本體的林業(yè)領(lǐng)域語義查詢擴(kuò)展模型[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用, 2016, 25(03): 151-156.
ZHANG Naijing, JU Hongbo, JI Ping. Modeling semantic query expansion of the foresty domain based on ontology[J]. Computer System Application, 2016, 25(3): 151-156.
[13]張志武. 基于本體的Web圖像語義標(biāo)注與檢索模型[J]. 情報(bào)科學(xué), 2015, 33(4): 121-124.
ZHANG Zhiwu. Web image semantic annotation and retrieval model based on ontology[J]. Informatics, 2015, 33(4): 121-124.