張忠元, 齊 霽, 齊 雯
(1.中央財經(jīng)大學 統(tǒng)計與數(shù)學學院,北京 102206; 2.中央財經(jīng)大學 金融學院,北京 102206)
隨著企業(yè)的生產(chǎn)鏈遍布世界,跨國貿(mào)易一體化程度增大,全球性的產(chǎn)業(yè)內(nèi)分工網(wǎng)絡已基本形成.從國家的政策走向來看,我國當前經(jīng)濟發(fā)展的重點主要是產(chǎn)業(yè)升級與結(jié)構(gòu)調(diào)整,盡管轉(zhuǎn)型目標已經(jīng)非常明確,但是仍然面臨著升級方向選擇、幅度調(diào)整和中斷風險規(guī)避三大問題[1].傳統(tǒng)的產(chǎn)業(yè)升級理論由于對產(chǎn)品網(wǎng)絡空間所施加的連續(xù)性和同質(zhì)性等極強假設,一定程度上缺乏對現(xiàn)實的解釋力,并不能解決上述問題.對此,Hausmann和Klinger(2007)[2]從產(chǎn)出和能力視角創(chuàng)造性地提出全球產(chǎn)品網(wǎng)絡(the Product Network)與比較優(yōu)勢演化理論,研究一個國家或者企業(yè)如何通過跨越產(chǎn)品之間的技術距離,實現(xiàn)生產(chǎn)能力稟賦向網(wǎng)絡核心區(qū)域的躍遷.作為復雜網(wǎng)絡科學應用于經(jīng)濟學領域的創(chuàng)造性成果,我國當前對這一理論的研究還處于援引和介紹階段,對其涉及的深層次結(jié)構(gòu)問題缺乏進一步研究.本文正是對此進行的一種嘗試,即通過將復雜網(wǎng)絡在幾何結(jié)構(gòu)方面的前沿研究——雙曲空間理論,應用到全球產(chǎn)品網(wǎng)絡中,探索產(chǎn)品網(wǎng)絡是否能嵌入雙曲空間中以及其嵌入結(jié)果的經(jīng)濟學解釋.
雙曲空間理論是將歐氏空間中的復雜網(wǎng)絡拓撲結(jié)構(gòu)嵌入曲率為負常數(shù)的雙曲空間中,能夠以更低維的度量空間對網(wǎng)絡結(jié)構(gòu)進行表征[3].雙曲空間模型目前已經(jīng)成功應用到社交網(wǎng)絡、信息網(wǎng)絡、文獻網(wǎng)絡和生物網(wǎng)絡中,但和經(jīng)濟領域的復雜網(wǎng)絡結(jié)合比較少.為了回答“產(chǎn)品網(wǎng)絡是否具有雙曲結(jié)構(gòu)”這一問題,需要對產(chǎn)品網(wǎng)絡進行準確的嵌入表示.一方面,選擇合適的“雙曲模型”對產(chǎn)品網(wǎng)絡進行嵌入.常見的“雙曲映射模型”有洛倫茲模型(Lorentz model)[4]、龐加萊圓盤模型[5]等.本文選擇龐加萊圓盤,并使用Hydra[6]和Mercator[7]兩個雙曲算法進行嵌入.另一方面,本文選擇另外兩個非雙曲的網(wǎng)絡表示算法進行對比分析,即多維尺度變換MDS[8]和基于度校正的隨機圖模型dSBM[9].為了評價不同算法的嵌入質(zhì)量,分別使用“Stress”和“AUPR”兩個指標衡量嵌入效果.結(jié)果表示,雙曲空間模型對產(chǎn)品網(wǎng)絡的嵌入效果最佳,驗證了其是一個雙曲結(jié)構(gòu)的猜想.進一步地,為了揭示產(chǎn)品網(wǎng)絡在雙曲空間中的分布具有經(jīng)濟學意義,通過方差分析(ANOVA)產(chǎn)品節(jié)點的徑向坐標和產(chǎn)品質(zhì)量、角度坐標和產(chǎn)品類別之間的相關性.計算結(jié)果的P值均顯著,再次檢驗了“產(chǎn)品網(wǎng)絡是雙曲結(jié)構(gòu)”的假設.
本文余下結(jié)構(gòu)安排如下:第一部分介紹產(chǎn)品網(wǎng)絡的構(gòu)建過程和結(jié)構(gòu)分析,第二部分對產(chǎn)品網(wǎng)絡進行潛在幾何分析和網(wǎng)絡嵌入表示,第三部分給出了產(chǎn)品網(wǎng)絡嵌入結(jié)果的經(jīng)濟學解釋,最后是研究結(jié)論與總結(jié).
本文參考Hidalgo等人(2007)[10]的研究,基于以結(jié)果為導向的度量方法構(gòu)建全球產(chǎn)品網(wǎng)絡,即以產(chǎn)品的“出口結(jié)果”代替產(chǎn)品的“生產(chǎn)過程”,這種計算方法不僅數(shù)據(jù)可得,而且有更嚴格的市場檢驗基礎[11].進一步提出假設:如果越多的國家可以同時出口某兩種商品,則認為這兩種產(chǎn)品越具有相似的生產(chǎn)過程、生產(chǎn)能力,那么在兩者之間進行升級的“跳躍距離”越小.換言之,產(chǎn)品能力越相似,企業(yè)在老產(chǎn)品上積累的知識和資源越能用于新產(chǎn)品的生產(chǎn),越容易進行產(chǎn)品的升級,由此獲得更高的經(jīng)濟收益[12].以“產(chǎn)品密度”描述產(chǎn)品之間的能力相似程度,以此構(gòu)建產(chǎn)品相關矩陣和產(chǎn)品網(wǎng)絡:
ρi,j=min{P(RCAxi|RCAxj),P(RCAxj|RCAxi)}.
(1)
其中,P(X|Y)為出口商品i的同時出口商品j的條件概率,RCA為顯示比較優(yōu)勢(Revealed Comparative Advantage):
(2)
其中,x(c,i)表示國家c關于產(chǎn)品i的出口額.如果RCA>1,則認為國家出口該產(chǎn)品的份額超過了全球出口該產(chǎn)品的份額.由此可對各國的出口產(chǎn)品進行限制,即只有當某產(chǎn)品的RCA>1時,國家才會出口該產(chǎn)品,反之則為無效出口.
本文構(gòu)建產(chǎn)品網(wǎng)絡的數(shù)據(jù)來源于Feenstra等人(2005)[13]和National Bureau of Economic Research(NBER)統(tǒng)計整理的1991—2000年國際貿(mào)易數(shù)據(jù),其根據(jù)國際貿(mào)易標準分類(SITC)四位碼對產(chǎn)品進行分類,如表1.參考馬海燕和于孟雨(2018)[11]的數(shù)據(jù)處理方法,按照如下步驟進行數(shù)據(jù)清洗:①剔除未始終存在于數(shù)據(jù)集中的國家和產(chǎn)品;②剔除商品編碼尾數(shù)為“A”和“X”序號不清楚的商品.最終形成包含141個國家1 288種商品的10 a國際貿(mào)易數(shù)據(jù)集.
表1 國際貿(mào)易標準分類
利用上述數(shù)據(jù),根據(jù)公式(1)和公式(2)構(gòu)建了1 288×1 288的產(chǎn)品鄰接矩陣.矩陣中每一行、列各代表一種產(chǎn)品,每一非對角線元素表示一對產(chǎn)品間的“能力相似度”.圖1(左)為產(chǎn)品相關矩陣的熱圖,圖1(右)為經(jīng)過平均聯(lián)動層次聚類的相關矩陣熱圖,在一定程度上揭示產(chǎn)品網(wǎng)絡存在相似產(chǎn)品聚集的社團結(jié)構(gòu).另外,可發(fā)現(xiàn)圖中存在許多空行、空列,表明有部分產(chǎn)品不是任何一個國家的有效出口商品(RCA<1),最終能夠有效出口的產(chǎn)品數(shù)只有769種,構(gòu)成769×769的有效產(chǎn)品網(wǎng)絡.
圖1 2000年產(chǎn)品相關矩陣熱圖(右圖經(jīng)過層次聚類處理)
根據(jù)產(chǎn)品相關矩陣可以構(gòu)建產(chǎn)品網(wǎng)絡,其節(jié)點為每一個產(chǎn)品,邊為產(chǎn)品之間的“能力距離”.圖2(A)的圖中圖為產(chǎn)品網(wǎng)絡及其網(wǎng)絡密度ρ(Network Density)隨時間的變化情況.由于大部分產(chǎn)品為有效出口商品,所生成的產(chǎn)品網(wǎng)絡比較稠密但隨時間略有下降(ρ1991=0.87,ρ2000=0.58).但圖2(A)中的連邊權重呈現(xiàn)高度左偏分布,即大多數(shù)連邊的權重都非常小,表明多數(shù)產(chǎn)品之間的相似性非常小.這也側(cè)面反映了產(chǎn)品網(wǎng)絡中可能存在一些強連接、稀疏的“網(wǎng)絡骨架”,這代表了產(chǎn)品潛在升級的主要方向.為了提取產(chǎn)品網(wǎng)絡中更顯著的連邊信息,抽取產(chǎn)品空間的“p%-網(wǎng)絡骨架”進行分析.將產(chǎn)品相似性降序排列后計算前p%分位數(shù)(p=10,20,25),以此構(gòu)建10%、20%和25%的網(wǎng)絡骨架.圖2(B)展示了1991—2000年間產(chǎn)品網(wǎng)絡的“10%”網(wǎng)絡骨架的累計度分布,嵌入子圖為其局部聚類系數(shù)隨節(jié)點度的變化情況.結(jié)果發(fā)現(xiàn),產(chǎn)品節(jié)點的度值呈冪律分布,表現(xiàn)出無標度網(wǎng)絡的特征(擬合優(yōu)度R2=0.833 8).
圖2 網(wǎng)絡密度和連邊權重(A)、累計度分布和局部聚類系數(shù)(B)
雙曲幾何(Hyperbolic Geometry)是非歐幾何的重要分支,可以描述為曲率為負常數(shù)的空間上的幾何學,而更熟悉的歐氏幾何則是“平直”空間上的幾何,即空間曲率為0的歐氏空間.兩種幾何學最基本的區(qū)別在于“平行公設”不同,即在雙曲空間中過直線外一點有無數(shù)條直線與之平行,而歐氏空間中有且只有一條平行線.從直觀上看,雙曲空間比歐氏空間“容積更大”“增長更快”,因此,一個只能嵌入高維歐氏空間中的網(wǎng)絡拓撲,可以很簡單地映射到一個低維的雙曲空間中[14].
為了更方便地描述雙曲空間,提出了多個映射到歐氏空間中的雙曲模型,如洛倫茲模型、龐加萊圓盤模型等.每個模型代表雙曲幾何不同方面的性質(zhì),其中,最常用的是龐加萊圓盤模型.其將雙曲平面2映射在一個二維歐氏空間2中的單位圓中,即其中,z1=tanh(r/2)cosθ和z2=tanh(r/2)sinθ是雙曲極坐標,可通過對雙曲平面中的點x=(x0,x1,x2)進行球極投影(Stereographic Projection)得到,如式(3):
(3)
由此可以求得雙曲平面上兩點之間的雙曲距離:
d((r1,θ1),(r2,θ2))=arcosh(coshr1coshr2-sinhr1sinhr2cos(θ1-θ2)),
(4)
且雙曲空間中的直線可用歐氏圓盤上的弧長表示.
為了揭示產(chǎn)品空間網(wǎng)絡的隱藏幾何結(jié)構(gòu),本文采取4種網(wǎng)絡表示方法對產(chǎn)品空間及其“p%-網(wǎng)絡骨架”進行低維空間嵌入或表示,分別為二維歐氏空間2嵌入算法多維尺度變換(Multidimensional Scaling,MDS)[8]、二維雙曲空間2嵌入算法的Hydra[6]和Mercator算法[7],以及非幾何的網(wǎng)絡表示方法的基于度校正的隨機圖模型dSBM[9].
4種算法中,MDS和Hydra兩個算法的原理相似,即保障原始空間和低維嵌入空間中的樣本間距離盡可能一致.目標函數(shù)如式(5):
(5)
Mercator算法同樣可以將網(wǎng)絡嵌入雙曲空間中并為節(jié)點找到合適的坐標,但與Hydra的原理不同,其是一種基于連接關系而忽略連接權重的算法,并將最大似然估計法和機器學習結(jié)合,更高效地推斷雙曲幾何“流行度-相似度”模型中的節(jié)點潛在坐標,詳情見文獻[7]. 除了將網(wǎng)絡嵌入某一幾何空間中進行表示以外,還可以通過推斷網(wǎng)絡中的社團結(jié)構(gòu)和連接概率對網(wǎng)絡進行表示,如基于度校正的隨機區(qū)塊模型(dSBM),也是基于網(wǎng)絡連接關系的算法.注意,Mercator和dSBM兩種方法只適用于對網(wǎng)絡的“p%-網(wǎng)絡骨架”進行表示.
對于完整的產(chǎn)品空間網(wǎng)絡的嵌入結(jié)果,本文根據(jù)式(5)計算Stress值作為衡量網(wǎng)絡嵌入質(zhì)量的評價指標,Stress值越小表明嵌入結(jié)果越好.針對網(wǎng)絡骨架的嵌入結(jié)果,首先,基于4種算法的嵌入結(jié)果反過來對網(wǎng)絡進行重構(gòu),即預測兩節(jié)點之間的連邊是否存在,因而可建立一個二分類任務;其次,對于此分類學習,通過計算AUPR(Precision-Recall曲線下面積)[15]來評價4個“分類器”的預測性能,AUPR越接近1表明其預測效果越好.
將1991—2000年10 a的產(chǎn)品空間的完整網(wǎng)絡、25%、20%和10%的網(wǎng)絡骨架進行嵌入和表示(圖3).其中,圖A為完整的產(chǎn)品空間網(wǎng)絡進行Hydra和MDS嵌入的Stress值,圖B為4種算法分別對產(chǎn)品空間的“25%-網(wǎng)絡骨架”進行網(wǎng)絡重構(gòu)的AUPR值,其他網(wǎng)絡骨架的嵌入結(jié)果類似.可知,基于雙曲幾何的網(wǎng)絡嵌入算法Mercator的AUPR值始終最高,即其對網(wǎng)絡的重構(gòu)效果最好,且與網(wǎng)絡骨架的提取程度無關.第二個雙曲嵌入算法Hydra算法表現(xiàn)也較好,無論是針對完整的產(chǎn)品網(wǎng)絡(Hydra的Stress值 < MDS的Stress值),還是任意的網(wǎng)絡骨架的嵌入,都大幅超過了MDS和dSBM兩種非雙曲的網(wǎng)絡表示算法.歐氏空間的網(wǎng)絡嵌入算法MDS和非幾何表示算法dSBM表現(xiàn)均較差.
圖3 產(chǎn)品空間網(wǎng)絡嵌入結(jié)果評價:Stress和AUPR
總的來說,可以觀察到產(chǎn)品空間網(wǎng)絡潛在度量空間,更適合用曲率為負的雙曲幾何而非曲率為0的歐氏幾何表示.此外,雙曲空間在網(wǎng)絡重構(gòu)的質(zhì)量方面甚至優(yōu)于非幾何的隨機圖模型.
Papadopoulos等人(2012)[16]的“流行度-相似度”模型和Serrano等人的1模型[17],可用來直接解釋龐加萊盤中潛在的雙曲網(wǎng)絡坐標的意義:徑向坐標r代表節(jié)點的“流行度”,角度坐標θ代表節(jié)點的“相似度”.另外,Hydra嵌入算法給出了將r解釋為流行度、將θ解釋為相似度的理論基礎.因此,在產(chǎn)品網(wǎng)絡的背景下,提出兩個假設證明雙曲坐標的經(jīng)濟可解釋性:假定一個給定產(chǎn)品的流行度與其產(chǎn)品質(zhì)量一致,且在雙曲空間中的分布與產(chǎn)品的類別劃分有關:(H1)產(chǎn)品質(zhì)量與產(chǎn)品在雙曲空間中的徑向坐標分布相關;(H2)產(chǎn)品類別與產(chǎn)品在雙曲空間中的角度坐標分布相關.
為了驗證第一個假設H1,即產(chǎn)品網(wǎng)絡的雙曲徑向坐標與產(chǎn)品的質(zhì)量有關,本文根據(jù)Lall(2000)[18]的研究對產(chǎn)品質(zhì)量進行劃分,共分成5大類:初級產(chǎn)品(PP)、資源型產(chǎn)品(RB)、低技術產(chǎn)品(LT)、中技術產(chǎn)品(MT)和高技術產(chǎn)品(HT).通過ANOVA檢驗,可以發(fā)現(xiàn)節(jié)點的徑坐標與產(chǎn)品質(zhì)量之間始終存在顯著的相關性,無論是Hydra還是Mercator的P值均小于0.000 1.進一步地,通過產(chǎn)品網(wǎng)絡的雙曲空間可視化也同樣驗證了假設1(圖4),其描述了1991年、1994年、1997年和2000年產(chǎn)品網(wǎng)絡的Mercator雙曲嵌入結(jié)果,由此可以看到一個全球產(chǎn)品分布的發(fā)展歷程.產(chǎn)品空間網(wǎng)絡表現(xiàn)出異質(zhì)性和一個“核心-邊緣”結(jié)構(gòu):網(wǎng)絡的核心由金屬產(chǎn)品、機械產(chǎn)品和化學品等高、中技術產(chǎn)品(HT、LT)組成,而外圍則由農(nóng)林牧礦等初級產(chǎn)品(PP)或低技術產(chǎn)品(LT)組成.隨著世界各產(chǎn)品的貿(mào)易量逐漸擴大(用節(jié)點的大小表示),初級產(chǎn)品(PP)和資源型產(chǎn)品(RB)最初在產(chǎn)品空間的“森林”中位于邊緣地帶,逐漸“移居”到了核心地帶,但高技術產(chǎn)品(HT)則逐漸擴散到邊緣,但這并不表明其重要性的下降,相反高新技術產(chǎn)品的逐漸聚集成團(圖4第4張圖的右下角部分).這在一定程度上表明,在全球分工“一體化”背景下,大量低端制造業(yè)或低級產(chǎn)品的生產(chǎn)逐漸從發(fā)達國家轉(zhuǎn)移到發(fā)展中國家,從而加強了這類產(chǎn)品的全球關聯(lián)性.但發(fā)達國家所掌握核心高端技術在全球的輻射擴散程度減小同時壟斷現(xiàn)象加強,由此促使全球產(chǎn)品網(wǎng)絡形成圖示的分布現(xiàn)象.
圖4 產(chǎn)品空間網(wǎng)絡雙曲嵌入結(jié)果(Mercator嵌入:1991年、1994年、1997年和2000年)
根據(jù)假設二,認為產(chǎn)品空間網(wǎng)絡在雙曲空間中將按照產(chǎn)品類別表現(xiàn)出角度的聚集現(xiàn)象,即產(chǎn)品類別會影響產(chǎn)品節(jié)點在雙曲空間中角坐標的分布.按照國家貿(mào)易標準SITC4可將產(chǎn)品分成10大類(表1).因此,根據(jù)同樣的思路,本文采用適用于圓形數(shù)據(jù)(Circular Data)的ANOVA檢驗[19],驗證每一類產(chǎn)品在雙曲空間中的角坐標是否存在顯著差異.
(6)
結(jié)果表明,在1991—2000年期間,角坐標θ和產(chǎn)品類別之間存在顯著聯(lián)系(Hydra和Mercator兩種方法的P值 <0.000 1).這表明,產(chǎn)品空間網(wǎng)絡的邊緣社團結(jié)構(gòu)(非網(wǎng)絡核心的部分)確實與產(chǎn)品的類別劃分保持一致,驗證了假設H2.
本文基于國際貿(mào)易標準SITC4的1991—2000年產(chǎn)品貿(mào)易數(shù)據(jù),結(jié)合顯示比較優(yōu)勢RCA指標,構(gòu)建了全球141個國家769×769的產(chǎn)品空間網(wǎng)絡,并明確檢驗了其潛在度量空間可以很好地用負曲率的雙曲幾何表示.通過將產(chǎn)品網(wǎng)絡嵌入龐加萊圓盤中對網(wǎng)絡進行可視化,并根據(jù)Papadopoulos等(2012)的“流行度-相似度”模型思想和ANOVA分析方法,發(fā)現(xiàn)產(chǎn)品網(wǎng)絡中產(chǎn)品節(jié)點的徑坐標(“流行度”)和產(chǎn)品質(zhì)量高度相關,角坐標(“相似度”)則與產(chǎn)品的SITC4分類標準顯著關聯(lián).從時序角度看,發(fā)現(xiàn)低端制造業(yè)或低級產(chǎn)品的全球關聯(lián)性加強,高端技術產(chǎn)品則擴散程度減小同時壟斷現(xiàn)象加強,促使全球產(chǎn)業(yè)格局發(fā)生明顯變化.