袁夢(mèng) 宗潔瓊 張正敏(上海市質(zhì)量和標(biāo)準(zhǔn)化研究院,上海 200000)
標(biāo)準(zhǔn)化工作對(duì)人工智能產(chǎn)業(yè)發(fā)展具有基礎(chǔ)性、支撐性、引領(lǐng)性的作用,既是推動(dòng)產(chǎn)業(yè)創(chuàng)新發(fā)展的關(guān)鍵抓手,也是產(chǎn)業(yè)競(jìng)爭(zhēng)的制高點(diǎn)。當(dāng)前,我國(guó)人工智能相關(guān)產(chǎn)品和服務(wù)不斷豐富的同時(shí),也出現(xiàn)了標(biāo)準(zhǔn)化程度不足的問題[1]。一方面,人工智能涉及眾多領(lǐng)域,現(xiàn)有標(biāo)準(zhǔn)化基礎(chǔ)及工作較為分散,不足以支持整個(gè)領(lǐng)域;另一方面,人工智能屬于新興領(lǐng)域,發(fā)展方興未艾,從世界范圍看標(biāo)準(zhǔn)化工作仍在起步過程中,標(biāo)準(zhǔn)制修訂相對(duì)滯后,尚未完成標(biāo)準(zhǔn)體系。另外,現(xiàn)有標(biāo)準(zhǔn)系統(tǒng)內(nèi)部關(guān)聯(lián)性及發(fā)展規(guī)律并不十分清晰。因此,迫切把握機(jī)遇,搶占標(biāo)準(zhǔn)創(chuàng)新制高點(diǎn),加快對(duì)人工智能技術(shù)及產(chǎn)業(yè)發(fā)展的研究,首先需要系統(tǒng)梳理人工智能領(lǐng)域相關(guān)的標(biāo)準(zhǔn),明確標(biāo)準(zhǔn)間的依存和制約關(guān)系,來推動(dòng)和完善標(biāo)準(zhǔn)體系,以標(biāo)準(zhǔn)手段促進(jìn)我國(guó)人工智能技術(shù)、產(chǎn)業(yè)蓬勃發(fā)展。
工業(yè)機(jī)器人是人工智能領(lǐng)域中發(fā)展較早的一支,我國(guó)工業(yè)機(jī)器人的研制雖然起步較晚,但憑借廣大的市場(chǎng)潛力和眾多的人才和資源基礎(chǔ),近年來迅猛發(fā)展。其中,從近幾年推出的機(jī)器人產(chǎn)品來看,工業(yè)機(jī)器人技術(shù)正在向智能化、模塊化和系統(tǒng)化的方向發(fā)展。隨著工業(yè)機(jī)器人向更深更廣方向的發(fā)展以及智能化水平的提高,其應(yīng)用版圖正在不斷擴(kuò)大,然相關(guān)標(biāo)準(zhǔn)體系不完善,標(biāo)準(zhǔn)制修訂滯后,缺乏自主創(chuàng)新等問題,制約著工業(yè)機(jī)器人產(chǎn)業(yè)的提質(zhì)升級(jí)。從標(biāo)準(zhǔn)層面來講,與發(fā)達(dá)國(guó)家的學(xué)者和專家對(duì)智能制造裝備的理解相比,我國(guó)尚處于起步階段。基礎(chǔ)共性標(biāo)準(zhǔn)、關(guān)鍵技術(shù)標(biāo)準(zhǔn)、產(chǎn)品標(biāo)準(zhǔn)和重點(diǎn)應(yīng)用標(biāo)準(zhǔn)亟待研究制定,以提升自主技術(shù)標(biāo)準(zhǔn)的國(guó)際話語權(quán)。
十九大報(bào)告中強(qiáng)調(diào)要堅(jiān)定實(shí)施創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略,網(wǎng)絡(luò)科學(xué)[2]在相對(duì)較為成熟的行業(yè)領(lǐng)域,從標(biāo)準(zhǔn)及其規(guī)范性引用文件入手,已經(jīng)開始了系統(tǒng)性探索。例如,標(biāo)準(zhǔn)間關(guān)聯(lián)規(guī)則地探索[3],利用規(guī)范性引用關(guān)系[4],利用語義相似度等[5],將標(biāo)準(zhǔn)系統(tǒng)轉(zhuǎn)化為網(wǎng)絡(luò)模型,并在日化等行業(yè)領(lǐng)域逐步開展系統(tǒng)性的探索和實(shí)證研究,挖掘內(nèi)在規(guī)律、定位關(guān)鍵標(biāo)準(zhǔn)[6-7]等。
本文以人工智能產(chǎn)業(yè)中工業(yè)機(jī)器人為研究領(lǐng)域,依托上海市質(zhì)量和標(biāo)準(zhǔn)化研究院標(biāo)準(zhǔn)文獻(xiàn)館百萬級(jí)的館藏標(biāo)準(zhǔn)數(shù)據(jù),結(jié)合產(chǎn)業(yè)鏈進(jìn)行數(shù)據(jù)檢索;對(duì)標(biāo)準(zhǔn)數(shù)據(jù)采集、梳理和預(yù)處理后得到基礎(chǔ)數(shù)據(jù)集;然后,對(duì)它們的規(guī)范性引用文件進(jìn)行梳理核查實(shí)施狀態(tài),刪除已作廢的標(biāo)準(zhǔn),并根據(jù)當(dāng)前的制修訂情況進(jìn)行數(shù)據(jù)調(diào)整,將符合條件的規(guī)范性引用文件中的標(biāo)準(zhǔn)擴(kuò)充到基礎(chǔ)標(biāo)準(zhǔn)集,作為本項(xiàng)目的標(biāo)準(zhǔn)數(shù)據(jù)集。
前期,研究小組結(jié)合標(biāo)準(zhǔn)間信息傳遞方向和規(guī)范性引用關(guān)系,在日化用品行業(yè)標(biāo)準(zhǔn)系統(tǒng)中制定了標(biāo)準(zhǔn)間的連邊規(guī)則,即標(biāo)準(zhǔn)與其規(guī)范性引用文件之間存在連邊,連邊的方向遵循信息流動(dòng)方向,由規(guī)范性引用文件指向引用它們的標(biāo)準(zhǔn),并假設(shè)它們之間的信息流量完全相同,以此在標(biāo)準(zhǔn)集中搭建有向連邊,而不存在規(guī)范性引用關(guān)系的標(biāo)準(zhǔn)件不存在連邊,以此規(guī)則建立標(biāo)準(zhǔn)有向網(wǎng)絡(luò)。然而,工業(yè)機(jī)器人行業(yè)相對(duì)日化行業(yè)起步較晚,發(fā)展尚未成熟,處于高速發(fā)展期,市場(chǎng)上廣泛流通的標(biāo)準(zhǔn)數(shù)據(jù)量有限。因而,考慮到標(biāo)準(zhǔn)的連通性,標(biāo)準(zhǔn)間信息傳遞不具有衰減性,以及信息傳遞非間接性等問題,本項(xiàng)目研究的工業(yè)機(jī)器人相關(guān)標(biāo)準(zhǔn)及規(guī)范性引用轉(zhuǎn)化的數(shù)學(xué)模型忽略信息流傳播方向,建立無向標(biāo)準(zhǔn)網(wǎng)絡(luò)。
工業(yè)機(jī)器人領(lǐng)域起步較晚,標(biāo)準(zhǔn)體系尚未成熟,本文從研究標(biāo)準(zhǔn)規(guī)范性引用系統(tǒng)的網(wǎng)絡(luò)基本拓?fù)湫再|(zhì)等問題入手,探索性地對(duì)發(fā)展相對(duì)不成熟的領(lǐng)域嘗試梳理規(guī)范性引用關(guān)系,轉(zhuǎn)化為復(fù)雜網(wǎng)絡(luò)模型,探究該網(wǎng)絡(luò)的基本拓?fù)湫再|(zhì),分析其生成機(jī)理。
如果一個(gè)網(wǎng)絡(luò)中節(jié)點(diǎn)的度值都集中在某個(gè)值附近,那么該網(wǎng)絡(luò)稱為均勻網(wǎng)絡(luò);相反地,如果網(wǎng)絡(luò)中節(jié)點(diǎn)的度值很不均等,既存在度相對(duì)較小的節(jié)點(diǎn),也存在度非常大的節(jié)點(diǎn),那么該網(wǎng)絡(luò)被稱為非均勻網(wǎng)絡(luò)。
節(jié)點(diǎn)的連邊數(shù)量記為該節(jié)點(diǎn)的度。將網(wǎng)絡(luò)中節(jié)點(diǎn)的度按從小到大排序,統(tǒng)計(jì)得到度為k的節(jié)點(diǎn)占整個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)的比例記為pk,意為網(wǎng)絡(luò)中隨機(jī)選擇一個(gè)節(jié)點(diǎn)的度為k的概率,其分布情況即為該網(wǎng)絡(luò)的度分布。
在各類分布中,冪律分布是唯一一種具有無標(biāo)度特性[8]的長(zhǎng)尾分布,且度分布服從冪律分布的網(wǎng)絡(luò)稱為冪律網(wǎng)絡(luò)。當(dāng)度分布服從冪律分布的網(wǎng)絡(luò),其冪指數(shù)從小變大時(shí),被認(rèn)為是從高度非均勻網(wǎng)絡(luò)變化為高度均勻網(wǎng)絡(luò),一般認(rèn)為只有冪指數(shù)較小(γ≤3)的才是非均勻網(wǎng)絡(luò)[9-10]。
一個(gè)包含N個(gè)節(jié)點(diǎn)的網(wǎng)絡(luò)的密度ρ定義為網(wǎng)絡(luò)中實(shí)際存在的邊數(shù)M與最大可能的邊數(shù)之比,記為式(1)
實(shí)際網(wǎng)絡(luò)的規(guī)模隨時(shí)間而演化,其中節(jié)點(diǎn)和連邊總體上呈現(xiàn)增加趨勢(shì),但網(wǎng)絡(luò)是變得越稠密,還是越稀疏有待于實(shí)踐認(rèn)證。當(dāng)N→∞時(shí),密度趨向于非零常數(shù),則表明網(wǎng)絡(luò)中實(shí)際存在的邊數(shù)與N2同階,網(wǎng)絡(luò)是稠密的;若N→∞時(shí),密度趨近于0或者網(wǎng)絡(luò)平均度趨近于一常數(shù),則表明實(shí)際存在邊數(shù)比N2低階,網(wǎng)絡(luò)是稀疏的。
如果一個(gè)網(wǎng)絡(luò)具有短的平均路徑長(zhǎng)度和高的聚集系數(shù),則該網(wǎng)絡(luò)具有小世界特性[11]。
網(wǎng)絡(luò)的平均路徑長(zhǎng)度L定義為任意2個(gè)節(jié)點(diǎn)之間的距離的平均值,如式(2)所示,即
聚集系數(shù)是指一個(gè)節(jié)點(diǎn)的2個(gè)直接鄰居節(jié)點(diǎn)也具有連邊的概率。網(wǎng)絡(luò)中一個(gè)度為ki的節(jié)點(diǎn)i的聚集系數(shù)Ci,且網(wǎng)絡(luò)聚集系數(shù)C定義為式(3)
其中,Ei是節(jié)點(diǎn)i的ki個(gè)鄰居節(jié)點(diǎn)之間實(shí)際存在的邊數(shù)。聚集系數(shù)的取值范圍為[0,1],其中,當(dāng)聚集系數(shù)為1時(shí),該網(wǎng)絡(luò)時(shí)全局耦合的,即網(wǎng)絡(luò)中任意2個(gè)節(jié)點(diǎn)直接相連。
在發(fā)展較為成熟的日化用品行業(yè)領(lǐng)域,相關(guān)標(biāo)準(zhǔn)數(shù)量相對(duì)豐富,因而根據(jù)規(guī)范性引用關(guān)系的存在性和信息傳播的流動(dòng)性制定連邊規(guī)則,建立了有向標(biāo)準(zhǔn)網(wǎng)絡(luò),并結(jié)合網(wǎng)絡(luò)的基本拓?fù)浣Y(jié)構(gòu)性和節(jié)點(diǎn)的重要性等,發(fā)現(xiàn)標(biāo)準(zhǔn)被引用的頻次、局部和全局影響力對(duì)它在系統(tǒng)中的重要性影響更為明顯[5-7]。相比之下,工業(yè)機(jī)器人行業(yè)起步較晚、發(fā)展不成熟,相關(guān)標(biāo)準(zhǔn)數(shù)量較少,標(biāo)準(zhǔn)體系有待豐富,且標(biāo)準(zhǔn)間信息傳遞不具有明顯衰減性。因此,僅依據(jù)標(biāo)準(zhǔn)間的規(guī)范性引用存在性,對(duì)工業(yè)機(jī)器人領(lǐng)域標(biāo)準(zhǔn)系統(tǒng)制定連邊規(guī)則,建立標(biāo)準(zhǔn)網(wǎng)絡(luò)。
館藏系統(tǒng)中,工業(yè)機(jī)器人應(yīng)用領(lǐng)域的標(biāo)準(zhǔn)200多份,在采集并梳理標(biāo)準(zhǔn)的規(guī)范性引用文件后,核查標(biāo)準(zhǔn)的使用狀態(tài),刪除廢止標(biāo)準(zhǔn),標(biāo)準(zhǔn)與其規(guī)范性引用文件間存在連邊,與其他標(biāo)準(zhǔn)無連邊,以此為連接規(guī)則,忽略引用與被引用的方向性,并假設(shè)所用引用關(guān)系是等價(jià)的,轉(zhuǎn)化為以標(biāo)準(zhǔn)為節(jié)點(diǎn),規(guī)范性引用關(guān)系為連邊,建立無權(quán)無向的標(biāo)準(zhǔn)引用網(wǎng)。
本項(xiàng)目研究小組為探索新興高科技領(lǐng)域標(biāo)準(zhǔn)的發(fā)展趨勢(shì),建立工業(yè)機(jī)器人應(yīng)用領(lǐng)域的標(biāo)準(zhǔn)引用復(fù)雜系統(tǒng),轉(zhuǎn)化為網(wǎng)絡(luò)模型,得到一個(gè)規(guī)模G1(532,1080)的網(wǎng)絡(luò)圖,如圖1(a)、(b)所示,其中最大的連通子圖G2(475,1012),占據(jù)網(wǎng)絡(luò)中89.29%的節(jié)點(diǎn),93.7%的連邊。孤立的碎片中,部分標(biāo)準(zhǔn)制定年限較早,部分被廣泛應(yīng)用卻未在規(guī)范性引用文件中體現(xiàn),也有面向?qū)I(yè)應(yīng)用領(lǐng)域的部分,有待于發(fā)掘與連通子圖之間的關(guān)聯(lián)性,完善標(biāo)準(zhǔn)數(shù)據(jù)。例如QJ 1352-1988《機(jī)器人產(chǎn)品型號(hào)命名方法》屬于早期航天工業(yè)部批準(zhǔn)發(fā)表的基礎(chǔ)性標(biāo)準(zhǔn),內(nèi)容中包含多種機(jī)器人的命名方法,除工業(yè)機(jī)器人外還包含服務(wù)、航天、軍用機(jī)器人等,但未能從形式上被多個(gè)標(biāo)準(zhǔn)規(guī)范性引用,尚不能體現(xiàn)它在基礎(chǔ)性標(biāo)準(zhǔn)領(lǐng)域的重要性。
圖1 標(biāo)準(zhǔn)網(wǎng)絡(luò)及最大連通圖
經(jīng)初步統(tǒng)計(jì)分析,該網(wǎng)絡(luò)中節(jié)點(diǎn)的度分布,經(jīng)最小二乘直線擬合,網(wǎng)絡(luò)圖近似擬合為,最大連通子圖近似擬合為的冪律分布,如圖2(a)、(b)所示,分別為和且冪指數(shù)均小于3,且平均度密度和度分布、密度以及平均度等基本拓?fù)湫再|(zhì)指標(biāo)表明,該網(wǎng)絡(luò)及最大連通子圖各指標(biāo)值近似,均為稀疏的,符合冪律分布的,非均勻網(wǎng)絡(luò)。
圖2 標(biāo)準(zhǔn)網(wǎng)絡(luò)及最大連通子圖的度分布
在許多實(shí)際的復(fù)雜網(wǎng)絡(luò)中,節(jié)點(diǎn)數(shù)巨大,網(wǎng)絡(luò)的平均路徑長(zhǎng)度小得驚人,即為小世界現(xiàn)象。網(wǎng)絡(luò)的平均距離嚴(yán)格來說只有對(duì)連通圖才是有限值,因此提取網(wǎng)絡(luò)中的最大連通子圖,利用廣度優(yōu)先算法,得出該網(wǎng)絡(luò)的平均路徑長(zhǎng)度 ,表明連接該網(wǎng)絡(luò)中任意2個(gè)節(jié)點(diǎn),最短路徑途中不超過5個(gè)節(jié)點(diǎn)。網(wǎng)絡(luò)中包含500多個(gè)節(jié)點(diǎn),但平均路徑長(zhǎng)度不足5,表明該網(wǎng)絡(luò)表現(xiàn)出小世界現(xiàn)象。
但是,網(wǎng)絡(luò)的聚集系數(shù)約為0.183,分布情況如圖3所示,最大連通子圖的聚集系數(shù)為0.192。許多現(xiàn)實(shí)網(wǎng)絡(luò)中具有小世界現(xiàn)象,往往表現(xiàn)出很高的聚集系數(shù),但工業(yè)機(jī)器人標(biāo)準(zhǔn)引用網(wǎng)的聚集系數(shù)并不高。一是因?yàn)榫W(wǎng)絡(luò)在構(gòu)建過程中,是通過“工業(yè)機(jī)器人”在標(biāo)準(zhǔn)館藏庫(kù)中以“工業(yè)機(jī)器人”為關(guān)鍵詞借助全文搜索得到的核心標(biāo)準(zhǔn)集,然后對(duì)其規(guī)范性引用文件完成第一層的標(biāo)準(zhǔn)集和規(guī)范性引用的擴(kuò)充,在館藏庫(kù)中該領(lǐng)域的相關(guān)標(biāo)準(zhǔn)數(shù)量有待豐富。另一方面,在圖中3中,C(k)與k之間已經(jīng)出現(xiàn)了冪律形式,存在部分節(jié)點(diǎn)度值不小,但聚集系數(shù)值非常小的現(xiàn)象,這表明該網(wǎng)絡(luò)有社團(tuán)聚集發(fā)展趨勢(shì),但因?yàn)楣I(yè)機(jī)器人行業(yè)標(biāo)準(zhǔn)發(fā)展不成熟,部分標(biāo)準(zhǔn)的引用關(guān)系較為零散,產(chǎn)學(xué)研結(jié)合不到位,不同領(lǐng)域?qū)<医M織間的合作交流不暢,使得各板塊領(lǐng)域間的關(guān)系缺乏深入研究。另外,機(jī)器人整體制造工藝復(fù)雜,涉及眾多行業(yè)領(lǐng)域,如應(yīng)急響應(yīng)機(jī)器人、醫(yī)用電器設(shè)備以及電磁兼容相關(guān)部分的標(biāo)準(zhǔn),涉及機(jī)器人的本體、應(yīng)用場(chǎng)景以及核心零部件等領(lǐng)域,縱跨工業(yè)機(jī)器人產(chǎn)業(yè)鏈上中下游,在高速發(fā)展階段,各組織百家爭(zhēng)鳴,將關(guān)鍵技術(shù)協(xié)商一致轉(zhuǎn)化為標(biāo)準(zhǔn)文本,難度非常大。
圖3 網(wǎng)絡(luò)的聚集系數(shù)
標(biāo)準(zhǔn)在社會(huì)經(jīng)濟(jì)發(fā)展中具有重要作用,是產(chǎn)品質(zhì)量提質(zhì)升級(jí)、城市管理水平提高的重要基礎(chǔ)。智能機(jī)器人重點(diǎn)布局立足國(guó)家安全與裝備、服務(wù)于國(guó)家民生科技、服務(wù)于未來引領(lǐng)科技平臺(tái)。我國(guó)工業(yè)機(jī)器人憑借廣大的市場(chǎng)潛力和眾多資源基礎(chǔ),近年來迅猛發(fā)展。隨著人類社會(huì)的日益網(wǎng)絡(luò)化,科學(xué)研究的網(wǎng)絡(luò)化日趨明顯,標(biāo)準(zhǔn)作為市場(chǎng)經(jīng)濟(jì)與科學(xué)研究結(jié)合的成果表現(xiàn),是否也呈現(xiàn)出相同的趨勢(shì),在工業(yè)機(jī)器人這個(gè)處于高速發(fā)展階段且標(biāo)準(zhǔn)化工作不成熟的領(lǐng)域,其系統(tǒng)內(nèi)部的發(fā)展規(guī)律和趨勢(shì)又反映出標(biāo)準(zhǔn)系統(tǒng)存在哪些問題。
本文通過關(guān)鍵詞在上海市質(zhì)量和標(biāo)準(zhǔn)化研究院館藏系統(tǒng)中搜索工業(yè)機(jī)器人領(lǐng)域的相關(guān)標(biāo)準(zhǔn),并通過規(guī)范性引用文件及引用關(guān)系,拓展標(biāo)準(zhǔn)集、制定連邊規(guī)則、建立網(wǎng)絡(luò)模型。利用網(wǎng)絡(luò)科學(xué)相關(guān)理論和技術(shù),對(duì)網(wǎng)絡(luò)的稀疏性、度分布情況、小世界現(xiàn)象等基本拓?fù)湫再|(zhì)展開計(jì)算和研究分析。經(jīng)實(shí)驗(yàn)分析證明,不僅在發(fā)展較為成熟的日化用品行業(yè)領(lǐng)域的標(biāo)準(zhǔn)系統(tǒng)中,利用標(biāo)準(zhǔn)間的規(guī)范性引用關(guān)系建立的引用網(wǎng)絡(luò)符合冪律分布,且在機(jī)器人這個(gè)新興產(chǎn)業(yè)中,工業(yè)機(jī)器人領(lǐng)域的規(guī)范性引用網(wǎng)絡(luò)也符合冪律分布和稀疏、非均勻的特點(diǎn);小世界現(xiàn)象不僅存在于較為成熟的行業(yè)領(lǐng)域復(fù)雜系統(tǒng)中(如日化領(lǐng)域),也存在高速發(fā)展的行業(yè)領(lǐng)域(如工業(yè)機(jī)器人領(lǐng)域)中;處于發(fā)展不成熟階段的工業(yè)機(jī)器人領(lǐng)域,反映出標(biāo)準(zhǔn)制修訂相對(duì)滯后,標(biāo)準(zhǔn)間雖呈現(xiàn)聚集趨勢(shì),但部分標(biāo)準(zhǔn)的引用關(guān)系較為零散,產(chǎn)學(xué)研結(jié)合不到位,不同領(lǐng)域?qū)<医M織間的合作交流不暢,使得各板塊領(lǐng)域間的關(guān)系缺乏深入研究等問題。