馮 赟
(同濟(jì)大學(xué)經(jīng)濟(jì)與管理學(xué)院,上海 201804)
黨的二十大報(bào)告指出,高質(zhì)量發(fā)展是全面建設(shè)社會主義現(xiàn)代化國家的首要任務(wù)。區(qū)域創(chuàng)新在高質(zhì)量發(fā)展中扮演著關(guān)鍵角色。隨著各地區(qū)域創(chuàng)新步伐的加快,知識、技術(shù)、人才等創(chuàng)新要素的集聚,推動(dòng)了區(qū)域創(chuàng)新型科技園區(qū)和高新技術(shù)產(chǎn)業(yè)的發(fā)展,為構(gòu)建現(xiàn)代產(chǎn)業(yè)體系提供了重要支撐。區(qū)域創(chuàng)新發(fā)展增強(qiáng)了國內(nèi)大循環(huán)的內(nèi)生動(dòng)力和可靠性,成為推動(dòng)高質(zhì)量發(fā)展的“倍增器”[1]。
城市創(chuàng)新能力在區(qū)域創(chuàng)新能力中具有重要作用。城市具備資源集中和主體多元的優(yōu)勢,使其創(chuàng)新能力具有獨(dú)特性。盡管存在關(guān)于城市創(chuàng)新是側(cè)重于文化等軟創(chuàng)新還是技術(shù)等硬創(chuàng)新的爭議,但普遍認(rèn)為城市是創(chuàng)新的重要單元,城市創(chuàng)新能力是國家創(chuàng)新能力的重要組成部分[2]。
城市創(chuàng)新能力的評價(jià)方法主要包括綜合指數(shù)法、灰色聚類法、因子分析法和熵權(quán)TOPSIS法,其能夠針對不同評價(jià)目標(biāo)、主體和標(biāo)準(zhǔn)來確定評價(jià)指標(biāo)權(quán)重,并對數(shù)據(jù)進(jìn)行處理和計(jì)算,最終得出評價(jià)結(jié)果。然而,這些評價(jià)方法在處理非線性問題時(shí)可能不夠準(zhǔn)確和靈活,并在處理大量數(shù)據(jù)時(shí)還可能存在計(jì)算量大、效率低的問題,且需要事先確定指標(biāo)權(quán)重和參數(shù)。
因此,本文提出了基于人工神經(jīng)網(wǎng)絡(luò)的評價(jià)方法。這種方法模仿人腦神經(jīng)元工作機(jī)制,能處理復(fù)雜的非線性關(guān)系,適應(yīng)數(shù)據(jù)變化,并能夠通過自適應(yīng)學(xué)習(xí)來優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)。對于城市創(chuàng)新能力的研究,涉及到由多個(gè)子系統(tǒng)的多個(gè)指標(biāo)項(xiàng)組成的復(fù)雜系統(tǒng)。因此,將人工神經(jīng)網(wǎng)絡(luò)應(yīng)用到城市創(chuàng)新能力的研究中具有得天獨(dú)厚的優(yōu)勢。
(1)體現(xiàn)內(nèi)涵,突出目標(biāo):城市創(chuàng)新能力反映了科技、經(jīng)濟(jì)、社會等領(lǐng)域的創(chuàng)新活動(dòng)能力和效果,而評價(jià)指標(biāo)體系需要以統(tǒng)計(jì)核算體系為基礎(chǔ),再加上綜合性指標(biāo)體現(xiàn)城市創(chuàng)新能力的新概念和內(nèi)容[3-4]。
(2)全面但不涵蓋所有可能性:指標(biāo)體系應(yīng)反映科技、經(jīng)濟(jì)、社會發(fā)展的各個(gè)方面,但并非涵蓋所有可能的指標(biāo)。無法量化或數(shù)據(jù)不易獲得的指標(biāo)可暫不列入。
(3)繼承性和創(chuàng)新性相結(jié)合:指標(biāo)體系既不能簡單地復(fù)制現(xiàn)有的城市創(chuàng)新能力統(tǒng)計(jì)指標(biāo)體系,也不能完全脫離該體系。應(yīng)在充分利用現(xiàn)有統(tǒng)計(jì)體系的基礎(chǔ)上有進(jìn)行發(fā)展和創(chuàng)新,以反映城市創(chuàng)新能力的實(shí)際情況。
(4)普遍性和特殊性的統(tǒng)一:由于各城市的特殊性,建立通用指標(biāo)體系困難。由于評價(jià)者的知識水平、背景、認(rèn)識問題的角度、價(jià)值觀念和對目標(biāo)的理解存在差異,因此會構(gòu)建出不同的城市創(chuàng)新能力指標(biāo)體系。
(5)科學(xué)性與現(xiàn)實(shí)性的統(tǒng)一:評價(jià)指標(biāo)設(shè)計(jì)需考慮研究任務(wù)與客觀現(xiàn)象特性,實(shí)現(xiàn)科學(xué)性原則,即要求主觀要求與客觀實(shí)際相統(tǒng)一,使評價(jià)指標(biāo)成為反映客觀現(xiàn)象的有效工具。為了確保評價(jià)指標(biāo)的科學(xué)性和客觀性,應(yīng)遵循“實(shí)事求是”的原則,使其定量描述以定性認(rèn)識為前提。在具體的設(shè)計(jì)過程中,應(yīng)注重指標(biāo)的規(guī)范化、標(biāo)準(zhǔn)化和科學(xué)化,避免解釋的重復(fù)和遺漏,確保評價(jià)指標(biāo)的準(zhǔn)確性和完整性。
(6)實(shí)用性與可操作性:城市創(chuàng)新能力評價(jià)指標(biāo)體系需考慮實(shí)用性和可操作性,以便決策者使用。一個(gè)實(shí)用的指標(biāo)體系應(yīng)具備以下特點(diǎn):易于理解、易于接受、數(shù)據(jù)易于收集和量化,同時(shí)具有評價(jià)性和比較性。在反映基本內(nèi)涵的前提下,選取的指標(biāo)應(yīng)盡可能少、避免重復(fù)、含義明確,具有現(xiàn)實(shí)統(tǒng)計(jì)基礎(chǔ),便于使用。
本文以長三角地區(qū)城市為樣本,查閱2012—2021年《中國統(tǒng)計(jì)年鑒》《中國城市統(tǒng)計(jì)年鑒》與國家知識產(chǎn)權(quán)局專利數(shù)據(jù)庫,獲取27個(gè)城市10年的面板數(shù)據(jù),共計(jì)270個(gè)觀測樣本。遵循重要性、必要性、科學(xué)性等原則,在對《中國區(qū)域科技創(chuàng)新評價(jià)報(bào)告》等相關(guān)文獻(xiàn)以及相關(guān)政策進(jìn)行分析的基礎(chǔ)上,構(gòu)建了城市創(chuàng)新能力評價(jià)指標(biāo)體系。指標(biāo)體系內(nèi)容如表1所示。
表1 城市創(chuàng)新能力評價(jià)指標(biāo)體系內(nèi)容
表2 指標(biāo)數(shù)值優(yōu)劣程度與所處區(qū)間的關(guān)系
創(chuàng)新環(huán)境是城市創(chuàng)新能力的基礎(chǔ),其涉及到城市的教育、醫(yī)療、社會等方面的條件,影響著城市的創(chuàng)新氛圍和創(chuàng)新文化。創(chuàng)新資源是城市創(chuàng)新能力的保障,其涉及到城市的科技、資金、人才等方面的投入,影響著城市的創(chuàng)新能力和創(chuàng)新效率。創(chuàng)新產(chǎn)出是城市創(chuàng)新能力的表現(xiàn),其涉及到城市的專利、產(chǎn)業(yè)、經(jīng)濟(jì)等方面的成果,影響著城市的創(chuàng)新水平和創(chuàng)新競爭力。
RBF神經(jīng)元模型如圖1所示。圖1中,‖dist‖為歐氏距離,用函數(shù)式可以表示為:
圖1 RBF神經(jīng)元模型
式(1)中,w為權(quán)值矩陣,x為輸入向量,權(quán)值矩陣元素w1,i的第一個(gè)下標(biāo)參數(shù)表示的是權(quán)值連接后一層接收目標(biāo)神經(jīng)元的編號,第二個(gè)下標(biāo)參數(shù)表示權(quán)值連接前一層輸出源神經(jīng)元的編號。例如,w1,2表示該元素是從前一層第二個(gè)神經(jīng)元到后一層第一個(gè)輸入神經(jīng)元的連接權(quán)值。
另外,凈運(yùn)算值n為RBF神經(jīng)元的中間運(yùn)算結(jié)果,可由式(2)表示為:
RBF神經(jīng)元模型的輸出y為:
式(3)中,,rbf(x)為徑向基函數(shù),常見的形式有:
多項(xiàng)式高斯徑向基函數(shù)或廣義徑向基函數(shù):
RBF神經(jīng)網(wǎng)絡(luò)由輸入層、單層隱含層、輸出層三層組成,其結(jié)構(gòu)如圖2所示。
圖2 RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)原理圖
圖2中,n1為RBF神經(jīng)網(wǎng)絡(luò)隱含層的中間運(yùn)算結(jié)果,可由式(7)表示為:
式(7)中,,diag(x)表示取矩陣向量主對角線上的元素組成的列向量,b1代表第1層神經(jīng)元的偏置值信息,ones(N,1)指一個(gè)N行1列的全1矩陣。RBF神經(jīng)網(wǎng)絡(luò)隱含層的輸出y1為:
n2為RBF輸出層的中間運(yùn)算結(jié)果,可由式(9)表示為:
RBF神經(jīng)網(wǎng)絡(luò)的輸出y2為:
RBF神經(jīng)網(wǎng)絡(luò)中,隱含層節(jié)點(diǎn)利用徑向基函數(shù)對輸入信號進(jìn)行局部響應(yīng)。當(dāng)輸入信號接近函數(shù)中心時(shí),隱含層節(jié)點(diǎn)會產(chǎn)生較大的輸出,顯示出其局部逼近能力。因此,RBF神經(jīng)網(wǎng)絡(luò)也被稱為局部感知場網(wǎng)絡(luò)。RBF神經(jīng)網(wǎng)絡(luò)的核心是利用徑向基函數(shù)作為隱含層單元的基,將低維輸入數(shù)據(jù)映射到高維空間,實(shí)現(xiàn)低維空間線性不可分問題在高維空間的線性可分。
假設(shè)RBF神經(jīng)網(wǎng)絡(luò)的輸入向量x為R維,輸出向量y2為S2維,輸入和輸出樣本的數(shù)量為N。該網(wǎng)絡(luò)的隱含層傳遞函數(shù)由徑向基函數(shù)構(gòu)成,通常選用式(4)所示的高斯函數(shù)。輸入層節(jié)點(diǎn)將輸入信號傳遞給隱含層,實(shí)現(xiàn)了x →y1(x)的非線性映射,即:
輸出層的傳遞函數(shù)采用線性函數(shù),實(shí)現(xiàn)了從隱含層到輸出層的信號傳遞的線性映射,即:
假設(shè)RBF神經(jīng)網(wǎng)絡(luò)有N個(gè)訓(xùn)練樣本,則系統(tǒng)對N個(gè)訓(xùn)練樣本的總誤差函數(shù)為:
式(13)中,N為輸入輸出樣本數(shù),S2為RBF神經(jīng)網(wǎng)絡(luò)輸出節(jié)點(diǎn)數(shù),表示在樣本p作用下的第個(gè)神經(jīng)元的期望輸出,表示在樣本p作用下的第k個(gè)神經(jīng)元的實(shí)際輸出[5]。
RBF神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程分為兩個(gè)階段:無監(jiān)督學(xué)習(xí)和有監(jiān)督學(xué)習(xí)。在無監(jiān)督學(xué)習(xí)階段,主要目標(biāo)是根據(jù)所有輸入樣本確定隱含層節(jié)點(diǎn)的徑向基函數(shù)的中心向量和標(biāo)準(zhǔn)化常數(shù)。這個(gè)階段通過使用均值聚類算法對所有樣本輸入進(jìn)行聚類,訓(xùn)練樣本集的輸入向量被劃分為若干個(gè)族群,并在每個(gè)族群內(nèi)部找出一個(gè)徑向基函數(shù)的中心向量。選擇這個(gè)中心向量的依據(jù)是它能使該族群內(nèi)各樣本向量與該族群中心的距離最小化。具體步驟如下:
1)初始化各隱含層節(jié)點(diǎn)的中心向量,并設(shè)定停止計(jì)算的誤差閾值。
2)計(jì)算輸入樣本與各中心向量的歐氏距離,并找出歐式距離最小的節(jié)點(diǎn):
式(14)中,p為樣本序號,r為中心向量ci(p-1)‖與輸入樣本‖x(p)距離最近的隱含層節(jié)點(diǎn)序號。
3)調(diào)整RBF神經(jīng)網(wǎng)絡(luò)隱含層徑向基函數(shù)的中心向量:
式(15)中,η(p)是學(xué)習(xí)速率,,0 <η(p)<1。η(p)=,int (x) 表示對x進(jìn)行取證運(yùn)算。式(15)表明經(jīng)過S1個(gè)樣本之后,學(xué)習(xí)速率逐漸減小至零。
4)評估聚類質(zhì)量。當(dāng)滿足式(16)時(shí),聚類結(jié)束,否則轉(zhuǎn)到第2)步。
在隱含層的參數(shù)確定后,利用最小二乘法的原則來計(jì)算隱含層到輸出層的連接權(quán)值。當(dāng)確定后,開始訓(xùn)練隱含層到輸出層之間的連接權(quán)值。由于輸出層的傳遞函數(shù)是線性函數(shù),求解連接權(quán)值的問題就轉(zhuǎn)化為線性優(yōu)化問題。因此,與線性網(wǎng)絡(luò)相類似,RBF神經(jīng)網(wǎng)絡(luò)隱含層到輸出層連接權(quán)值ωki(k=1,2,…,S2;i=1,2,…,S1)的學(xué)習(xí)算法為:
由于向量y1中僅有少數(shù)元素為1,其余均為0,因此在進(jìn)行一次數(shù)據(jù)訓(xùn)練時(shí),僅有少量的連接權(quán)值需要調(diào)整。這一特點(diǎn)使得RBF神經(jīng)網(wǎng)絡(luò)能夠快速地學(xué)習(xí)。此外,當(dāng)輸入向量x遠(yuǎn)離ci時(shí),會變得非常小,近似為0。實(shí)際上僅當(dāng))大于某一閾值(例如0.05)時(shí),才會對相應(yīng)的權(quán)值wk i進(jìn)行修改。經(jīng)過這樣的處理,RBF神經(jīng)網(wǎng)絡(luò)同樣具備局部逼近網(wǎng)絡(luò)學(xué)習(xí)收斂快的優(yōu)點(diǎn)。
RBF神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法的關(guān)鍵在于確定隱含層節(jié)點(diǎn)中心參數(shù)。常用方法包括直接選取或聚類方法,以下是幾種常見的學(xué)習(xí)算法。
(1)直接計(jì)算法:隱含層節(jié)點(diǎn)中心在輸入樣本中隨機(jī)選取并固定。隱含層輸出確定后,求解隱含層到輸出層的連接權(quán)值,相當(dāng)于求解線性方程組。
(2)自組織學(xué)習(xí)選取法:通過自組織學(xué)習(xí)確定隱含層節(jié)點(diǎn)中心,再通過有監(jiān)督學(xué)習(xí)確定隱含層到輸出層的連接權(quán)值。此法采用均值聚類法選擇RBF神經(jīng)網(wǎng)絡(luò)的中心,屬于無監(jiān)督學(xué)習(xí)方法。通過學(xué)習(xí)使隱含層節(jié)點(diǎn)中心位于輸入空間重要區(qū)域。
(3)正交最小二乘法法:其源于線性回歸模型。RBF神經(jīng)網(wǎng)絡(luò)輸出為隱含層神經(jīng)元的響應(yīng)參數(shù)和隱含層到輸出層連接權(quán)值的線性組合。所有隱含層神經(jīng)元的回歸因子構(gòu)成回歸向量,因此,RBF神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程主要是回歸向量的正交化過程。
在許多實(shí)際問題中,需要通過學(xué)習(xí)獲得RBF神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點(diǎn)中心,以更好地反應(yīng)訓(xùn)練集數(shù)據(jù)所包含的信息。
本文涉及神經(jīng)網(wǎng)絡(luò)訓(xùn)練集由仿真模擬得出。在模擬前,需對各項(xiàng)指標(biāo)數(shù)據(jù)進(jìn)行模糊化處理。數(shù)據(jù)年份為2012—2021年,涵蓋27個(gè)城市,每個(gè)指標(biāo)有270條數(shù)據(jù)。計(jì)算各指標(biāo)數(shù)據(jù)的最小/最大值、第60/70/80/90個(gè)百分位數(shù);并將指標(biāo)數(shù)據(jù)分為5個(gè)區(qū)間,用1~5表示指標(biāo)數(shù)值的優(yōu)劣程度,即數(shù)字越大、指標(biāo)數(shù)值越優(yōu)。對于每一指標(biāo)的每一區(qū)間,隨機(jī)生成2 000條訓(xùn)練集數(shù)據(jù),總共10 000條,將使用這些數(shù)據(jù)作為訓(xùn)練集。采用MATLAB進(jìn)行編程,對訓(xùn)練集進(jìn)行模擬,搭建并訓(xùn)練RBF神經(jīng)網(wǎng)絡(luò)。
選擇高斯徑向基函數(shù)作為單一RBF神經(jīng)網(wǎng)絡(luò)隱含層神經(jīng)元的激勵(lì)函數(shù),并利用newrb函數(shù)進(jìn)行學(xué)習(xí)。其調(diào)用格式為net=newrb (X,T,GOAL,SPREAD,MN,DF)。其中,X為輸入數(shù)據(jù),T為期望輸出數(shù)據(jù),GOAL為訓(xùn)練目標(biāo),設(shè)為0.01;SPREAD為函數(shù)寬度,設(shè)為2 000;MN為隱含層神經(jīng)元的最大個(gè)數(shù),設(shè)為5 000;DF為兩次顯示之間所增加的神經(jīng)元數(shù)目,設(shè)為1。
生成訓(xùn)練集時(shí),各條數(shù)據(jù)中不同指標(biāo)的值均隨機(jī)處于同一優(yōu)劣程度的區(qū)間范圍內(nèi),如所有指標(biāo)數(shù)值均為“4(良)”。如果一條數(shù)據(jù)的所有指標(biāo)數(shù)值都處于同一優(yōu)劣程度區(qū)間,那么該數(shù)據(jù)的綜合優(yōu)劣程度即為各指標(biāo)數(shù)值的優(yōu)劣程度。
測試集則采用1.2節(jié)指標(biāo)體系所對應(yīng)的270個(gè)樣本。使用訓(xùn)練完成的神經(jīng)網(wǎng)絡(luò)模型對測試集進(jìn)行評估,得到對應(yīng)的評估結(jié)果,如表3所示。
表3 長三角各城市創(chuàng)新水平得分
由表3得到以下幾點(diǎn)結(jié)論。
(1)長三角地區(qū)的城市創(chuàng)新能力總體上呈現(xiàn)上升趨勢,但各城市之間的差異較大,存在明顯的空間分異。從評價(jià)結(jié)果來看,上海市、杭州市、蘇州市、南京市等城市的創(chuàng)新能力較高,屬于創(chuàng)新型城市;而安慶市、泰州市、鹽城市、揚(yáng)州市等城市的創(chuàng)新能力較低,屬于創(chuàng)新能力待提升的城市。這些差異主要受到城市的經(jīng)濟(jì)發(fā)展水平、科技投入水平、人才資源水平、政策支持水平等因素的影響。
(2)長三角地區(qū)的城市創(chuàng)新能力與城市的規(guī)模、地理位置、行政級別等因素有一定的相關(guān)性。一般來說,城市規(guī)模越大、創(chuàng)新能力越強(qiáng),這是因?yàn)榇蟪鞘芯哂懈嗟娜丝?、資本、信息、技術(shù)等創(chuàng)新要素,也具有更強(qiáng)的創(chuàng)新需求和創(chuàng)新動(dòng)力。城市的地理位置也會影響城市的創(chuàng)新能力,沿?;蜓亟某鞘型ǔ>哂懈玫慕煌?、通訊、貿(mào)易等條件,有利于創(chuàng)新資源的流動(dòng)和交流。城市的行政級別也會影響城市的創(chuàng)新能力,省會城市或直轄市通常享有更多的政策優(yōu)惠和財(cái)政支持,有利于創(chuàng)新環(huán)境的優(yōu)化和創(chuàng)新活動(dòng)的開展。
本研究文基于人工神經(jīng)網(wǎng)絡(luò),構(gòu)建城市創(chuàng)新能力評價(jià)模型,以長三角地區(qū)的27個(gè)城市為例,評價(jià)2012—2021年城市創(chuàng)新能力。通過模擬訓(xùn)練集和測試集數(shù)據(jù),得到準(zhǔn)確、合理的評價(jià)結(jié)果,反映長三角城市創(chuàng)新能力差異和變化。本研究結(jié)果可為政府和企業(yè)創(chuàng)新決策提供依據(jù),幫助其制定創(chuàng)新戰(zhàn)略、優(yōu)化創(chuàng)新資源配置、改善創(chuàng)新環(huán)境、提高創(chuàng)新效率和效果,推動(dòng)城市經(jīng)濟(jì)可持續(xù)發(fā)展,增強(qiáng)城市競爭力。