吳娜 劉超
摘要:專利信息智能輔助檢索系統(tǒng)中的自動檢索以語義檢索為特點,對所推選出的結果進行相關度排序,利用該模式下的文本檢索、干預檢索和推薦導航三個模塊,可對自動檢索結果進行人工干預,提升檢索效率。本文結合實際案例的檢索過程,探討了人工干預對自動檢索結果的影響,以及檢索中進行人工干預的具體策略。
關鍵詞:自動檢索;人工干預;文本檢索;干預檢索;推薦導航
中圖分類號:G354.2文獻標識碼:A 文章編號:1003-5168(2020)21-00087-03
1 引言
專利信息智能輔助檢索系統(tǒng)是國家知識產權局在人工智能信息檢索方面探索的重要成果[1],為堅決打贏這場提質增效攻堅戰(zhàn)起到了重要作用。
本文基于實際案例,旨在分享使用專利信息智能輔助檢索系統(tǒng)(以下簡稱“智能輔助檢索系統(tǒng)”)的相關經(jīng)驗。
2 智能輔助檢索系統(tǒng)中的自動檢索及人工干預
專利信息智能輔助檢索系統(tǒng)是基于專利信息智能語義檢索系統(tǒng)進行的智能化改造項目。目前系統(tǒng)提供了智能信息推送、導引檢索、智能檢索、自動檢索和相似度瀏覽五大功能模塊,實現(xiàn)了專利信息智能語義檢索系統(tǒng)從傳統(tǒng)檢索模式的工具性被動調用向智能化檢索模式的主動推送的轉變。
其中,自動檢索是指系統(tǒng)根據(jù)案卷信息,通過后臺算法自動檢索結果集,并將結果按照相似度進行排序。
自動檢索是一種全文語義檢索模式,其根據(jù)技術方案中詞條相互之間詞義上的關系,對詞條的集合進行處理,自動抽取語義形成關鍵詞[2],并加工成N維空間內的一個向量,檢索時計算各文獻所形成向量的向量內積得到語義相關度。這種檢索模式存在檢索范圍大、不能有效提取發(fā)明構思、無法使用精確分類[3]等缺陷,因此,僅僅采用基于申請?zhí)柕淖詣訖z索在某些情況下并不能快速高效地獲得最優(yōu)對比文件,此時往往需要適當?shù)娜斯じ深A,以改善上述不足。
人工干預是在系統(tǒng)中檢索時,將語義檢索命令與關鍵詞和/或分類號等,采用布爾算符構建成檢索式進行檢索,使用者可以自己調整關鍵詞或分類號等信息[2]。自動檢索模式下,還具有文本檢索、干預檢索和推薦導航三個模塊,其為人工干預提供了很好的途徑。
3 具體案例分析
基于申請?zhí)柕淖詣訖z索在某些情況下并不能快速高效的獲得最優(yōu)對比文件,而文本檢索可根據(jù)輸入的文本進行更有針對性的檢索,干預檢索可對基于申請?zhí)柕淖詣訖z索結果進行干預,推薦導航可進一步擴展分類號,那將文本檢索、干預檢索和推薦導航與自動檢索進行結合,又會對檢索結果帶來哪些影響呢,本文通過具體的案例進行展示。
3.1 人工干預提高檢索效率
發(fā)明名稱:氯氧鎂涂層鋼筋混凝土及其制備方法
常溫下,用改性環(huán)氧樹脂涂層均勻的涂覆在鋼筋表面。
當僅基于申請?zhí)枌υ搶@暾堖M行自動檢索時發(fā)現(xiàn):在沒有干擾,僅看現(xiàn)有技術的情況下,可作為對比文件1的目標文件排在第47位,相似度為57%。
當利用干預檢索進行干預時,在干預檢索中加入“防腐”這個關鍵詞,即用“防腐”這個關鍵詞去干預基于申請?zhí)柕淖詣訖z索結果集,同樣在僅看現(xiàn)有技術的情況下發(fā)現(xiàn),可作為對比文件1的目標文件排在第2位,相似度上升為92%。
當利用文本檢索模塊將權利要求1的內容導入文本檢索框后進行檢索,同樣在僅看現(xiàn)有技術的情況下,發(fā)現(xiàn)可作為對比文件1的目標文件排在第2位,相似度上升為88%。
通過利用干預檢索和文本檢索后發(fā)現(xiàn),目標文件的排序均向前提升,相較于僅僅基于申請?zhí)柕淖詣訖z索,能更快地獲得對比文件?;谏暾?zhí)柕淖詣訖z索是一種完全自動的檢索模式,可作為智能檢索的初探;而干預檢索通過其輸入的關鍵詞和/或分類號對自動檢索結果進行干預,在一定程度上可以理解為一種自動檢索+干預的檢索模式,在干預檢索時,添加有效的關鍵詞和/或分類號,會明顯提升檢索效率,同時其相對于傳統(tǒng)的檢索方式,不需用戶構建檢索式,更加快捷、簡便。相較于自動檢索和干預檢索,文本檢索是基于輸入的新的文本進行語義檢索,其可以理解為一種半自動的檢索模式,用戶可根據(jù)具體案情對技術方案、技術特征、技術問題和技術效果進行重點檢索,結合使用分類號,檢索結果更優(yōu)。
3.2 利用文本檢索可快速獲取準確分類號
經(jīng)前述介紹可知,推薦導航中的技術領域統(tǒng)計功能可幫助獲取分類號信息,同時其統(tǒng)計結果根據(jù)檢索對象的變化而變化。檢索實踐發(fā)現(xiàn),基于申請?zhí)柕淖詣訖z索存在領域擴展不足的問題。而相較于基于申請?zhí)柕淖詣訖z索,文本檢索可進行更有針對性的檢索,對領域擴展不足的問題進行彌補。
在上述案例中,其權利要求1技術方案中記載了“步驟三:常溫下,用改性環(huán)氧樹脂涂層均勻的涂覆在鋼筋表面”,而所檢索到的對比文件1所用的涂層材料為久美特涂層,且是高溫涂覆,現(xiàn)針對于上述內容,需要繼續(xù)檢索。
在沒有干擾,僅僅基于申請?zhí)枌υ搶@暾堖M行自動檢索的情況下,發(fā)現(xiàn)沒有可作為給出啟示的對比文件2的目標文件。而利用干預檢索加入關鍵詞“防腐”及“環(huán)氧樹脂”對基于申請?zhí)柕淖詣訖z索結果進行干預,也沒找到所需目標文件。通過分析發(fā)現(xiàn),基于申請?zhí)栕詣訖z索結果多側重于與主題名稱相關的文獻,這可能也是基于案卷信息自動檢索領域擴展不盡完美的地方。這就提醒使用者根據(jù)檢索結果以及發(fā)明點,適時調整檢索方向。
針對本案例,通過分析原始文件所給分類號以及自動檢索結果所涉及分類號可知,其檢索的領域側重于混凝土——C04B,與鋼筋防腐不直接相關,且未擴展到與改性環(huán)氧樹脂涂層相關的信息。干預檢索時雖加入了“環(huán)氧樹脂”這個關鍵詞,但是從所得文獻技術領域統(tǒng)計結果來看,其相較于自動檢索的結果,變化不大。這就進一步提醒用戶要根據(jù)技術領域統(tǒng)計結果,適時調整檢索方向。
基于此可知,獲取該案例對比文件2的關鍵是突破領域限制,獲取有效分類號。
而文本檢索是根據(jù)文本內容進行的檢索,其檢索對象是由輸入的文本內容確定的。此時,可借助文本檢索來擴展分類號,以彌補本案例自動檢索領域擴展不足的問題。
對于該案例,所尋找的目標文件其側重點在于用改性環(huán)氧樹脂涂層涂覆在鋼筋表面來防腐,因而,在利用文本檢索獲取分類號時,其輸入的文本應是涉及改性環(huán)氧樹脂的有效文本。在具體操作時,考慮到權利要求3的附加技術特征對改性環(huán)氧樹脂涂層的具體組分進行了重點描述,同時說明書技術方案中可準確提取所需目標文件的相關關鍵詞,因而采用在文本框中輸入“權利要求3的附加技術特征+干預關鍵詞:混凝土,鋼筋,防腐,腐蝕,室溫,常溫,固化”的方法,進行檢索后借助推薦導航中的技術領域統(tǒng)計功能確定與改性環(huán)氧樹脂相關的分類號。
通過上述方法找到了“C09D163/00”這個分類號,其表示基于環(huán)氧樹脂的涂料組合物,基于環(huán)氧樹脂衍生物的涂料組合物,是與改性環(huán)氧樹脂相關的準確分類號。分析發(fā)現(xiàn):相較于在專利信息智能語義檢索系統(tǒng)中通過/mems/ic命令統(tǒng)計分析來擴展分類號的方法,利用文本檢索與推薦導航相結合的方法來擴展分類號,不用通過布爾運算構建檢索式,更加方便、快捷。
隨后,通過利用干預檢索輸入分類號“C09D163/00”及關鍵詞“環(huán)氧樹脂、鋼筋、室溫、常溫”對基于原始案卷信息的自動檢索結果進行干預,在給出文獻的第4位便找到了給出啟示的目標文件,相似度為75%。
3.3 合理編輯文本,提高文本檢索效率
文本檢索利用其文本框中文本可編輯的特點結合分類號可進行更有針對性的檢索,合理編輯文本,對提高檢索效率,獲得更準確的目標文件起到了舉足輕重的作用。
本文針對該案例,通過在文本檢索的基礎上加入分類號“C09D163/00”進行檢索,以對文本編輯問題進行以下嘗試:
首先,由于該案例所尋找對比文件2其側重點應在于用改性環(huán)氧樹脂涂層涂覆在鋼筋表面來防腐,其申請文件的摘要從技術手段、技術問題、技術效果等方面對該關鍵技術手段進行了描述,能較準備表達所需目標文件信息。因而首先通過在文本框中輸入摘要及關鍵詞“混凝土,鋼筋,防腐,腐蝕,室溫,常溫,固化,環(huán)氧樹脂”,同時在分類號過濾欄中輸入分類號“C09D163/00”,但是,本文未找到給出結合啟示的目標文件。
隨后,考慮到智能檢索其實質是從文獻中提取關鍵詞并構成N維空間的向量,與其他文獻的N維空間向量計算向量內積得到語義相關度的模式,本文采取直接提取關鍵詞的方法在文本框中輸入“混凝土,鋼筋,防腐,腐蝕,室溫,常溫,固化,環(huán)氧樹脂”進行檢索,同時輸入分類號“C09D163/00”進行限定,本文在給出文獻列表的第29位找到了給出啟示的目標文件,相似度為68.65%。
通過上述的檢索過程,本文發(fā)現(xiàn),在利用文本檢索進行針對性檢索時,直接輸入能準確表達發(fā)明點的關鍵詞比輸入整段文本具有更高的效率。分析原因:直接提取關鍵詞輸入文本框中,相較于輸入相關語段,可避免在檢索過程中因關鍵詞提取不準確或者不適當而帶來的誤差,降低了無關信息對檢索結果的干擾。
4 結語
專利信息智能輔助檢索系統(tǒng)是提高檢索效率的有力武器,而自動檢索無疑是智能輔助檢索系統(tǒng)中最方便、最高效、最易上手的模塊。在利用自動檢索的同時,借助其文本檢索、干預檢索和推薦導航三個功能,可更快鎖定目標文件。其中,干預檢索可通過輸入分類號或關鍵詞對自動檢索結果進行干預,文本檢索可通過在文本框中輸入編輯后的文字,并配合分類號進行檢索,干預檢索和文本檢索均能更好的彌補自動檢索領域擴展不足的問題。而準確添加文本內容,可以提高文本檢索的效率;合理利用推薦導航中的技術領域統(tǒng)計功能,可幫助用戶進一步擴展分類號。
參考文獻:
[1] 楊宏章,付靜.利用專利文本結構化特征構建專利信息智能語義檢索系統(tǒng)的方法[J].情報理論與實踐,2015(4):98、136-138.
[2] 郭嘉,史凱.淺析在PATENTICS檢索系統(tǒng)中的專利檢索應用[J].審查實踐與研究,2017(8):123-127.
[3] 丁冉.PATENTICS的不同干預方式在電路領域中的檢索應用[J].科技創(chuàng)新與應用,2019(23):180-181、184.