何 婕(重慶工商職業(yè)學(xué)院電子信息工程學(xué)院,重慶401520)
?
微信二維碼和語義檢索技術(shù)在茶葉包裝中的應(yīng)用
何婕
(重慶工商職業(yè)學(xué)院電子信息工程學(xué)院,重慶401520)
摘要:二維碼作為商品信息檢索的快捷方式在我國已經(jīng)有了較為廣泛的應(yīng)用,其中又以微信軟件作為二維碼掃描的主要方式,茶葉銷售作為一種傳統(tǒng)和現(xiàn)代并重的銷售產(chǎn)業(yè),使用二維碼能夠很好地實(shí)現(xiàn)商品防偽、溯源和價(jià)格查詢以及宣傳等多方面的功能。通過和語義檢索技術(shù)的結(jié)合,消費(fèi)者能通過二維碼快速地了解到各種信息。
關(guān)鍵詞:茶葉包裝;二維碼技術(shù);語義檢索
語義檢索技術(shù)和二維碼技術(shù)都是目前互聯(lián)網(wǎng)新興商業(yè)發(fā)展所用到的重要新技術(shù),語義檢索關(guān)系著商業(yè)信息的入口能夠被消費(fèi)者及時(shí)識(shí)別,而二維碼技術(shù)是吸引消費(fèi)者關(guān)注方向的重要引導(dǎo)方式,這兩者在商品銷售中的良好結(jié)合是商品在互聯(lián)網(wǎng)上能夠得到廣泛推廣的重要技術(shù)基礎(chǔ)。
二維碼是一種使用簡單的特定幾何圖形通過在二維平面上的排列,實(shí)現(xiàn)信息加密讀取的信息傳播技術(shù),它的編碼方式是二進(jìn)制編碼,所以不用相應(yīng)的軟硬件是無法解碼的。二維碼的讀取主要通過圖像采集軟件進(jìn)行,二維碼相對(duì)于上一代條形碼技術(shù)能夠在單位空間內(nèi)承載更多的信息,而且讀取也較為便利,圖形具有一定的容錯(cuò)率。
二維碼目前在我國的互聯(lián)網(wǎng)商業(yè)發(fā)展中有著較多的應(yīng)用,隨著二維碼技術(shù)的普及,人們可以很簡易地在網(wǎng)絡(luò)上生成相關(guān)信息的二維碼,而且二維碼只具有基本的形狀,其外觀和大小都可以調(diào)整,防偽程度也比較高,在各種領(lǐng)域都受到人們的歡迎。另外智能手機(jī)的發(fā)展也是二維碼能夠廣泛應(yīng)用于這些領(lǐng)域的重要基礎(chǔ)之一,微信作為二維碼采用較早的軟件,已經(jīng)和二維碼的流行密不可分。所以,在商業(yè)上二維碼的采用,尤其是商業(yè)和商品的宣傳方面,微信中的二維碼是最為常見的二維碼使用方式。
2.1語義檢索的定義
語義檢索是一種新型的搜索技術(shù),它立足于語言學(xué)和計(jì)算機(jī)信息科學(xué)雙重領(lǐng)域,是當(dāng)今各種搜索引擎還需要發(fā)展和已經(jīng)開始應(yīng)用的搜索技術(shù)。語義檢索基于一種和概念相關(guān)的搜索和匹配方法,其主要的方式是通過用戶所搜索的關(guān)鍵詞進(jìn)行分析和理解,使其上升到概念的高度。使用計(jì)算機(jī)智能的智能預(yù)料分析策略,不僅對(duì)關(guān)鍵詞所代表的概念進(jìn)行搜索,還要對(duì)語義檢索中的語義關(guān)系進(jìn)行檢索,從而更好地了解用戶的需求。
2.2語義檢索的應(yīng)用要點(diǎn)
語義檢索并不是簡單的搜索,它還要依靠一個(gè)智能的語義分析系統(tǒng)和一個(gè)強(qiáng)大的信息庫才能實(shí)現(xiàn)所有的功能。這其中信息庫不僅要保留信息的具體分析,還需要包括信息特征和關(guān)系的連接性描述,從而更好地實(shí)現(xiàn)概念性的搜索功能。數(shù)據(jù)庫相關(guān)的存取功能也是要點(diǎn)之一,語義檢索的過程相當(dāng)于計(jì)算機(jī)使用自身的智能進(jìn)行一個(gè)推理的過程,所以各種數(shù)據(jù)的及時(shí)存取十分重要。
3.1語義檢索技術(shù)下對(duì)于信息的處理
語義檢索有著較為重要的三方面優(yōu)勢(shì):一方面它可以消除在表達(dá)方面的差異,從而解決一些語義方面的問題,另一方面它能夠有效地剔除無用的信息,還有就是這種檢索的智能化程度比較高,這是語義檢索利用的理想情況。
語義表示的最簡單的方法就是采用文本表示,它的優(yōu)點(diǎn)是使得一些高層的抽象概念很直觀,處理起來也方便。缺點(diǎn)是自動(dòng)獲取難度較大,同時(shí)表達(dá)能力差,對(duì)于復(fù)雜的信息不能夠獨(dú)立進(jìn)行。為了更好地對(duì)茶葉包裝的微信二維碼圖像進(jìn)行識(shí)別,我們擬采取一種SVM分類器對(duì)圖像語義進(jìn)行識(shí)別分類。
圖1 圖像語義分類訓(xùn)練過程流程圖
其主要思想是:
將用來訓(xùn)練的樣本取出,計(jì)算這些樣本類別的類均值距離,選出最容易分離出來的樣本類別將其標(biāo)為正樣本,其余的所有訓(xùn)練樣本作為負(fù)樣本。此SVM為第一個(gè)分類器,記做SVM1,用來區(qū)分第一個(gè)樣本類別與其余的樣本類別。
將剩下的訓(xùn)練樣本作為輸入樣本,利用步驟(1)中的方法訓(xùn)練生成第二個(gè)SVM,記做SVM2,用來區(qū)分第二個(gè)樣本類別與剩下的樣本類別。
重復(fù)上述步驟,直到完成對(duì)所有的訓(xùn)練樣本分類,最后得到n個(gè)支持向量機(jī):SVM1,SVM2,…,SVMn。
在訓(xùn)練過程中,要經(jīng)過反復(fù)訓(xùn)練、試驗(yàn)對(duì)訓(xùn)練參數(shù)進(jìn)行選擇,以達(dá)到較高的識(shí)別率。
圖2 圖像語義分類識(shí)別流程圖
經(jīng)過訓(xùn)練得到的n個(gè)SVM二值分類器可以把樣本分成n個(gè)類別。當(dāng)輸入一個(gè)測(cè)試樣本被第i個(gè)SVM分為正樣本時(shí),此測(cè)試樣本為第i類樣本,若分為負(fù)樣本,則由第i+1個(gè)SVM繼續(xù)進(jìn)行分類。若輸入的測(cè)試樣本在每個(gè)SVM二值分類器都被分為負(fù)樣本,則錯(cuò)誤識(shí)別。
圖3 改進(jìn)的二叉樹多分類圖像語義分類器
目前語義檢索還有著一定的延時(shí)性,這就是當(dāng)前語義檢索的重要瓶頸。圖像語義的分類過程實(shí)際上就是一個(gè)映射過程。所以映射的準(zhǔn)確度和映射速度就標(biāo)志這一個(gè)圖像語義分類器的性能的指標(biāo)。本文對(duì)二叉樹分類進(jìn)行改進(jìn),提高其檢索的準(zhǔn)確度和速度。
3.2二維碼使用的Hash函數(shù)
二維碼技術(shù)的開發(fā)主要是在電腦平臺(tái)上利用Hash函數(shù)的運(yùn)算方式進(jìn)行二維碼的技術(shù)性生成,對(duì)于二維碼來說,信息的校驗(yàn)和信息的存取是同樣重要的部分,要實(shí)現(xiàn)二維碼信息的校驗(yàn),就必須及時(shí)進(jìn)行Hash函數(shù)的運(yùn)算。
Hash函數(shù)是指一個(gè)不可逆的函數(shù)關(guān)系,這種不可逆的特性是最重要的,也正是因?yàn)檫@個(gè)關(guān)系,Hash函數(shù)在密碼學(xué)中有重要的作用,也可以很好地應(yīng)用于二維碼的校驗(yàn),二維碼的設(shè)計(jì)要根據(jù)一定的數(shù)字簽名方案,從而對(duì)信息進(jìn)行驗(yàn)證,實(shí)現(xiàn)完整信息的傳送和展示。Hash函數(shù)是根據(jù)集合中元素之的分布情況進(jìn)行排列的,如果產(chǎn)生沖突有一定的沖突辦法進(jìn)行解決。在二維碼的設(shè)計(jì)中,要實(shí)現(xiàn)沖突可能性的降低從而進(jìn)行均勻地映射,使得二維碼的技術(shù)和當(dāng)前銷售的實(shí)踐相結(jié)合。
直接選定Hush地址法:直接選定Hush地址法要根據(jù)元素的關(guān)鍵字或者它的線性函數(shù)作為Hush地址的重要選定方式。
數(shù)字分析選定Hush地址法:使用數(shù)字分析的方法就是根據(jù)元素當(dāng)中的一些數(shù)字關(guān)鍵字進(jìn)行均勻地取之分析,以此實(shí)現(xiàn)Hush地址的取之,在具體的數(shù)據(jù)分析中,要避開可能重復(fù)和沖突的數(shù)據(jù)進(jìn)行數(shù)據(jù)取之,從而增強(qiáng)整體二維碼校驗(yàn)的穩(wěn)定性。
折疊選定Hush關(guān)鍵詞:將關(guān)鍵詞分成幾個(gè)相同的部分,將一些不同的部分進(jìn)行折疊處理,如在二維碼的設(shè)計(jì)當(dāng)中,采用一些標(biāo)準(zhǔn)的編號(hào)進(jìn)行工作,當(dāng)這種數(shù)據(jù)的標(biāo)準(zhǔn)編號(hào)不到某個(gè)數(shù)值時(shí),可以通過折疊進(jìn)行函數(shù)的低等級(jí)構(gòu)造。
使用Hush函數(shù)能夠很好地避免二維碼的使用過程中一些重復(fù)率和信息的問題,所以對(duì)于產(chǎn)品生產(chǎn)商來說十分重要,同時(shí)對(duì)于防偽這個(gè)算法也有很大的幫助。
3.3在微信平臺(tái)上建立二維碼服務(wù)的要點(diǎn)
可以說,微信帶動(dòng)了整個(gè)二維碼在中國的發(fā)展,所以使用二維碼肯定要考慮微信平臺(tái)的傳播,一方面需要利用微信提供的開發(fā)平臺(tái)開發(fā)一個(gè)實(shí)現(xiàn)溯源和各種信息查詢的工具,另一方面也要在相關(guān)的微信公眾號(hào)上加強(qiáng)相關(guān)設(shè)計(jì),以更好地宣傳產(chǎn)品和實(shí)現(xiàn)企業(yè)文化的傳播。
語義檢索技術(shù)能夠獲取大量的信息,這些信息對(duì)茶葉產(chǎn)品的設(shè)計(jì)與銷售有著極大的幫助,在這種信息的分析處理之下,茶葉生產(chǎn)商和經(jīng)銷商能夠建立更加合理的體系去更好地銷售茶葉。在茶葉包裝的二維碼上不僅要注重公眾號(hào)的設(shè)計(jì),更要保證完整信息的傳送和展示,使用Hash函數(shù)可以提高信息的映射。同時(shí)用一種改進(jìn)的二叉樹多分類圖像語義分類器對(duì)其二維碼進(jìn)行語義提取,提高其檢索的準(zhǔn)確度和速度。
參考文獻(xiàn)
[1]于英政. QR二維碼相關(guān)技術(shù)的研究[D].北京交通大學(xué),2014.
[2]胡秋玉. QRcode識(shí)別算法的研究與改進(jìn)[D].西南石油大學(xué),2014.
[3]朱燕妮.基于二維碼的黑茶產(chǎn)品溯源模式構(gòu)建與實(shí)現(xiàn)[D].湖南農(nóng)業(yè)大學(xué),2014.
[4]董慧,唐敏.語義檢索在Web2.0環(huán)境下的應(yīng)用探討[J].中國圖書館學(xué)報(bào),2011,02:115-119.
[5]湯煒.基于OWL的語義檢索系統(tǒng)的研究與應(yīng)用[D].武漢理工大學(xué),2009.
作者簡介:何婕(1984-),女,苗族,重慶人,碩士,講師,研究方向:機(jī)器學(xué)習(xí)與智能計(jì)算、圖形圖像處理、數(shù)據(jù)挖掘。
基金:重慶市教委科學(xué)技術(shù)研究項(xiàng)目(KJ1403805)