丁春光,張馳,黃志華,梁安健,劉馨陽(yáng),李穎
(1.工業(yè)和信息化部電子第五研究所,廣東 廣州 511370;2.工業(yè)裝備質(zhì)量大數(shù)據(jù)工業(yè)和信息化部重點(diǎn)實(shí)驗(yàn)室,廣東 廣州 511370)
隨著人工智能和互聯(lián)網(wǎng)高速發(fā)展,產(chǎn)生了大量的數(shù)據(jù),社會(huì)從數(shù)據(jù)匱乏走向數(shù)據(jù)過(guò)載階段。如何在海量數(shù)據(jù)中快速精準(zhǔn)地找到數(shù)據(jù)消費(fèi)者(用戶)所關(guān)心數(shù)據(jù),成為數(shù)據(jù)生產(chǎn)者或者數(shù)據(jù)服務(wù)商關(guān)注的問(wèn)題。在元器件選用領(lǐng)域,同樣面臨海量的電子元器件產(chǎn)品信息,設(shè)計(jì)師或物資管理人員如何精準(zhǔn)找到合適元器件,快速完成產(chǎn)品的元器件選型,成為急需解決問(wèn)題。
面臨海量數(shù)據(jù),產(chǎn)生數(shù)據(jù)過(guò)載問(wèn)題,數(shù)據(jù)消費(fèi)者在海量數(shù)據(jù)中找到所需數(shù)據(jù)變得困難,特別從海量數(shù)據(jù)中獲得有價(jià)值的數(shù)據(jù),同時(shí)數(shù)據(jù)生產(chǎn)者或者數(shù)據(jù)服務(wù)商如何從海量數(shù)據(jù)中獲得有價(jià)值的消費(fèi)者成為問(wèn)題解決焦點(diǎn)。為了解決數(shù)據(jù)過(guò)載問(wèn)題,比較有代表性的解決方案是分類目錄和搜索引擎。雅虎是分類目錄方案的代表性公司,谷歌和百度是搜索引擎比較有代表性的公司。但隨著互聯(lián)網(wǎng)規(guī)模不斷擴(kuò)大,分類目錄的覆蓋性不強(qiáng),分類過(guò)于復(fù)雜,無(wú)法滿足用戶數(shù)據(jù)需求弊端日益明顯。搜索引擎是基于關(guān)鍵詞檢索數(shù)據(jù),需要用戶主動(dòng)提供準(zhǔn)確的關(guān)鍵詞,當(dāng)用戶無(wú)法主動(dòng)找到準(zhǔn)確地描述自己需求的關(guān)鍵字或提供關(guān)鍵字的信息量不足時(shí),檢索出來(lái)的結(jié)果很難反映用戶的潛在需求。分類目錄和搜索引擎只能解決用戶主動(dòng)查找信息的需求,即用戶知道自己想要什么,并不能解決用戶沒(méi)有明確需求的問(wèn)題。和分類目錄和搜索引擎一樣,推薦系統(tǒng)也是一種幫助用戶快速發(fā)現(xiàn)有用信息,解決數(shù)據(jù)過(guò)載問(wèn)題的解決方案之一。推薦系統(tǒng)不需要主動(dòng)提供明確的關(guān)鍵詞,而是通過(guò)分析用戶歷史行為給用戶建立畫像,從而主動(dòng)給用戶推薦其所關(guān)心的數(shù)據(jù)。
推薦系統(tǒng)是能找出用戶和物品之間聯(lián)系的信息過(guò)濾系統(tǒng)。推薦系統(tǒng)主要有以下兩個(gè)顯著的特征。
a)主動(dòng)性
從用戶角度考慮,不需要用戶提供明確的數(shù)據(jù)需求,能夠自主通過(guò)數(shù)據(jù)分析用戶與物品之間的關(guān)聯(lián)數(shù)據(jù)進(jìn)行建模,為用戶提供可能感興趣的信息。
b)個(gè)性化
能夠挖掘冷門但用戶感興趣的信息推薦給用戶。推薦系統(tǒng)已經(jīng)成為人工智能在電子商務(wù)(亞馬遜、淘寶和京東)和社交平臺(tái)(抖音和豆瓣)領(lǐng)域最成功的應(yīng)用之一。常見的推薦系統(tǒng)算法如表1 所示。
表1 常見的推薦系統(tǒng)算法 [1]
目前用戶在電子元器件產(chǎn)品目錄或者電子元器件選用平臺(tái)選型有兩種方式。一種方式為分類目錄,已經(jīng)知道想要的元器件分類和具體產(chǎn)品參數(shù)指標(biāo),按元器件分類樹進(jìn)行檢索,先選取一個(gè)分類,然后按照質(zhì)量等級(jí)、封裝形式、外形尺寸和電性能參數(shù)進(jìn)行多參聯(lián)合篩選找到所需要的元器件產(chǎn)品信息。另一種方式為搜索引擎,知道大體產(chǎn)品型號(hào)或者關(guān)鍵參數(shù),以關(guān)鍵詞形式依托搜索引擎進(jìn)行檢索。兩種選型方式都存在一定局限性,很難從定位、個(gè)性和衍生3 個(gè)角度滿足用戶需求。方式一需要用戶明確知道自己想要元器件的分類和技術(shù)指標(biāo),否則很難進(jìn)行精確選型。方式二需要用戶知道自己想要元器件產(chǎn)品型號(hào)或元器件產(chǎn)品屬性關(guān)鍵詞。但關(guān)鍵詞顆粒度和反映信息量會(huì)影響元器件選型結(jié)果,很難定位用戶的最終需求,需要用戶依托自身經(jīng)驗(yàn)進(jìn)行進(jìn)一步篩選以定位到用戶最終想要的產(chǎn)品。
基于推薦系統(tǒng)的元器件智慧選型是通過(guò)對(duì)元器件產(chǎn)品數(shù)據(jù)進(jìn)行特征提取建立滿足推薦系統(tǒng)算法要求的基礎(chǔ)特征數(shù)據(jù)庫(kù),依托機(jī)器學(xué)習(xí)相關(guān)算法對(duì)產(chǎn)品或廠家進(jìn)行過(guò)濾排序干預(yù),形成最終推薦結(jié)果。通過(guò)構(gòu)建元器件智慧選型推薦系統(tǒng),可以精準(zhǔn)推薦用戶所關(guān)心元器件產(chǎn)品,彌補(bǔ)分類目錄和搜索引擎在選型精度上的缺陷,提升用戶檢索體驗(yàn)。智能推薦系統(tǒng)可以從元器件產(chǎn)品定位、滿足個(gè)性化需求和滿足衍生需求3 個(gè)角度提升元器件選型精準(zhǔn)程度和效率。產(chǎn)品定位角度可以幫助用戶快速定位想要選用的元器件產(chǎn)品。滿足個(gè)性化需求角度推薦的產(chǎn)品符合用戶自身個(gè)性化預(yù)期和偏好,如經(jīng)常選用某生產(chǎn)廠家產(chǎn)品。滿足衍生需求角度能夠推薦與該產(chǎn)品相關(guān)配套產(chǎn)品信息,如元器件外圍配套電路信息、選用該產(chǎn)品的用戶還選用了什么產(chǎn)品,幫助用戶完成一體化設(shè)計(jì)和選用。元器件智慧選型系統(tǒng)框架圖如圖1 所示。
圖1 元器件智慧選型推薦系統(tǒng)框架圖
推薦系統(tǒng)基于用戶的基本信息、元器件選用信息、用戶對(duì)元器件產(chǎn)品偏好和用戶對(duì)廠家偏好,用戶對(duì)產(chǎn)品或廠家的評(píng)論信息、打分信息和用戶瀏覽記錄等行為數(shù)據(jù)進(jìn)行智能分析,獲取不同用戶選型習(xí)慣,形成用戶畫像,推送用戶關(guān)心關(guān)注的、與用戶檢索近似同類周邊的元器件產(chǎn)品,實(shí)現(xiàn)元器件的智能推送。標(biāo)簽化用戶元器件選型步驟和習(xí)慣,牽引用戶的科學(xué)選型,為用戶提供智能化的元器件選型導(dǎo)航。用戶在選用器件過(guò)程中,可根據(jù)器件實(shí)際應(yīng)用情況和使用方法等進(jìn)行評(píng)論反饋,評(píng)論信息不斷積累、共享,以供其他用戶選型參考[2]。也可以通過(guò)自然語(yǔ)言的情感分析,在用戶對(duì)該產(chǎn)品的問(wèn)題評(píng)論中獲取對(duì)該產(chǎn)品偏好程度。另外針對(duì)該產(chǎn)品評(píng)分評(píng)星也一定程度反映用戶偏好。通過(guò)研究用戶的興趣偏好,由智能算法進(jìn)行個(gè)性化計(jì)算,發(fā)現(xiàn)用戶關(guān)注點(diǎn),從而引導(dǎo)用戶發(fā)現(xiàn)需求。
基于設(shè)計(jì)需求主要是為了解決傳統(tǒng)“基于經(jīng)驗(yàn)器件選型” 單一檢索帶來(lái)的選型效率低下、效果不佳等問(wèn)題。通過(guò)對(duì)數(shù)據(jù)資源庫(kù)的數(shù)據(jù)挖掘、數(shù)據(jù)關(guān)聯(lián)和數(shù)據(jù)建模等技術(shù),建立面向設(shè)計(jì)需求的智慧選型模式,實(shí)現(xiàn)根據(jù)用戶輸入的器件性能指標(biāo)、質(zhì)量水平和廠商等需求,進(jìn)行器件的關(guān)聯(lián)性、相似性和符合性匹配,快速地確定選型方案,同時(shí)引入元器件產(chǎn)品畫像,綜合元器件的應(yīng)用歷史、質(zhì)量表現(xiàn)、物資狀態(tài)和使用評(píng)價(jià)等因素考慮,向用戶推送最優(yōu)元器件。通過(guò)數(shù)據(jù)應(yīng)用去指引設(shè)計(jì)選型,在選型源頭去幫助我們控制產(chǎn)品的質(zhì)量、成本,最大化規(guī)避后期的質(zhì)量和保障性風(fēng)險(xiǎn)[3]。
相似度算法主要是用于衡量對(duì)象之間的相似度,是推薦系統(tǒng)的基礎(chǔ)性算法。在元器件領(lǐng)域判斷一個(gè)產(chǎn)品相似性(替代性)主要從產(chǎn)品的基本功能、關(guān)鍵性能參數(shù)、封裝及外形尺寸、質(zhì)量可靠性與環(huán)境適應(yīng)性等幾個(gè)方面來(lái)綜合考慮[4]。因?yàn)樵骷a(chǎn)品分類較多,每個(gè)分類的技術(shù)指標(biāo)參數(shù)又不盡相同,不可能將所有參數(shù)都用于相似模型訓(xùn)練,選取確定每個(gè)分類的關(guān)鍵技術(shù)指標(biāo)參數(shù),通過(guò)運(yùn)用相似度算法,基于元器件技術(shù)參數(shù)建立元器件相似產(chǎn)品關(guān)系,通過(guò)模型判斷各元器件之間的相似關(guān)系,綜合計(jì)算關(guān)鍵性能參數(shù)重要度和參數(shù)值近似度,建立元器件的關(guān)鍵參數(shù)替代關(guān)系模型,將相關(guān)度從高到低的相似產(chǎn)品推薦給用戶,實(shí)現(xiàn)智能替代查找和推送。
關(guān)聯(lián)分析又稱為關(guān)聯(lián)挖掘,它是一種簡(jiǎn)單實(shí)用的分析技術(shù),用于發(fā)現(xiàn)存在于大量數(shù)據(jù)集中的關(guān)聯(lián)性或相關(guān)性,從而描述了一個(gè)事物中某些屬性同時(shí)出現(xiàn)的規(guī)律和模式。通過(guò)挖掘各生產(chǎn)廠家手冊(cè)建議的外圍電路配置,構(gòu)建常用的外圍電路數(shù)據(jù)庫(kù),基于常用外圍電路圖建立元器件的關(guān)聯(lián)關(guān)系。當(dāng)用戶選用某個(gè)元器件,應(yīng)用關(guān)聯(lián)分析法,從支持度、置信度和提升度,結(jié)合用戶行為考慮某種電路功能,系統(tǒng)智能推送配套元器件給用戶。通過(guò)關(guān)聯(lián)分析可以判斷元器件之間的關(guān)聯(lián)密度,用戶選用某個(gè)元器件后會(huì)自動(dòng)推薦與之關(guān)系最近的元器件及其配套的外圍電路。
受加劇的中美貿(mào)易戰(zhàn)和新冠疫情影響,各電子行業(yè)企業(yè)都在一段時(shí)間內(nèi)出現(xiàn)缺芯危機(jī)?;谕扑]系統(tǒng)的元器件智慧選型有助于幫助企業(yè)快速找到其產(chǎn)品所需電子元器件以及可替代的國(guó)產(chǎn)元器件方案,對(duì)于國(guó)家和行業(yè)維護(hù)產(chǎn)業(yè)鏈供應(yīng)鏈穩(wěn)定,具有非常重要的作用和意義。本文指出推薦系統(tǒng)在元器件智慧選型中起到重要作用、算法和典型應(yīng)用場(chǎng)景,為后續(xù)基于推薦系統(tǒng)的元器件智慧選型平臺(tái)搭建和算法研究奠定了基礎(chǔ)。