姚佳偉 YAO Jiawei 黃辰宇 HUANG Chenyu 劉鵬坤 LIU Pengkun 張永明 ZHANG Yongming
數(shù)字化技術(shù)在城市規(guī)劃領(lǐng)域的應(yīng)用最早可追溯到20 世紀(jì)七八十年代,至今已有40 多年歷史,研究人員希望利用計(jì)算機(jī)的計(jì)算力輔助決策,期望借助計(jì)算機(jī)實(shí)現(xiàn)尋找最優(yōu)項(xiàng)目選址、提出建筑空間布局等建議[1]。自2016年圍棋界人工智能棋手AlphaGO 戰(zhàn)勝人類世界冠軍,深度學(xué)習(xí)和機(jī)器學(xué)習(xí)進(jìn)入了全行業(yè)的視野。深度學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)以及圖像語義分割識(shí)別在計(jì)算機(jī)視覺領(lǐng)域取得了令人矚目的成就,尤其是圖像識(shí)別技術(shù)已經(jīng)被廣泛地應(yīng)用于各行業(yè),智能技術(shù)已經(jīng)成為國家經(jīng)濟(jì)結(jié)構(gòu)轉(zhuǎn)型和尋找新一輪增長點(diǎn)的創(chuàng)新驅(qū)動(dòng)力。城市走向“智能化”的政策導(dǎo)向以及智慧城市的發(fā)展趨勢提出了創(chuàng)造性應(yīng)用人工智能和深度學(xué)習(xí)技術(shù)需求[2],同時(shí),建筑規(guī)劃領(lǐng)域龐大的圖像數(shù)據(jù)量和復(fù)雜的設(shè)計(jì)參數(shù)也與深度學(xué)習(xí)有著天然的結(jié)合點(diǎn)。到目前為止,人工智能技術(shù)在城市規(guī)劃領(lǐng)域的應(yīng)用主要集中在建筑和街道圖像的識(shí)別和分析研究方面。2017 年,吳志強(qiáng)院士提出了“人工智能的城市規(guī)劃”,指出了人工智能在城市規(guī)劃領(lǐng)域的應(yīng)用場景和潛力[3]。小庫科技實(shí)現(xiàn)了利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行建筑風(fēng)格識(shí)別,并可以利用生成式對抗網(wǎng) 絡(luò)(GAN,Generative Adversarial Networks )生成數(shù)個(gè)現(xiàn)代風(fēng)格的建筑物外觀,在方案設(shè)計(jì)階段為建筑師提供了極大地幫助[4]。城室科技利用深度學(xué)習(xí)識(shí)別上海市建筑立面色彩情況,結(jié)合上海發(fā)展歷史和建筑風(fēng)格,為上海市人居環(huán)境的建設(shè)提出改善建議[5]。麻省理工大學(xué)的李小江利用深度學(xué)習(xí)對街道圖像進(jìn)行識(shí)別和語義分割,對街谷開闊度進(jìn)行量化分析,建立了街道圖像和環(huán)境指標(biāo)的聯(lián)系[6]。但眾多研究均未提及如何從城市角度做出系統(tǒng)評價(jià)。結(jié)合我國的城市決策,如何基于以政治、經(jīng)濟(jì)、文化、環(huán)境、衛(wèi)生、科教等為基礎(chǔ)的現(xiàn)代城市評價(jià)指標(biāo),深入挖掘城市規(guī)劃布局內(nèi)涵,開展探尋城市物質(zhì)空間和形態(tài)與現(xiàn)代城市評價(jià)指標(biāo)耦合關(guān)系的研究,對于未來的智能城市規(guī)劃有著重要意義。
本文以城市肌理數(shù)據(jù)為對象,討論通過深度學(xué)習(xí)識(shí)別城市的可能性,并期望通過機(jī)器學(xué)習(xí),找到建筑規(guī)劃與現(xiàn)代城市評價(jià)指標(biāo)的內(nèi)在關(guān)系,以進(jìn)一步優(yōu)化建筑布局。
本文以北京、上海、廣州、深圳、西安、吉林、金華、臨沂、洛陽、臺(tái)州等10 個(gè)城市的肌理數(shù)據(jù)為例,利用python 爬取百度地圖開放平臺(tái)的地圖數(shù)據(jù)(比例尺1 ∶500 000),通過修改json 文件實(shí)現(xiàn)圖底關(guān)系的表達(dá)(圖1)。
1.2.1 感知哈希算法實(shí)現(xiàn)圖像降維
區(qū)分城市中的地塊屬性和空間是城市識(shí)別的首要工作,在數(shù)據(jù)收集完畢后,首先對數(shù)據(jù)進(jìn)行預(yù)處理與標(biāo)注,將原始數(shù)據(jù)(1 800×800×N)裁切為5 458 張尺寸為200×200 的元地塊圖像,每個(gè)元地塊被視為單一的地塊屬性或布局。
“感知哈希算法”(Perceptual hash algorithm)是Google 與Baidu引擎實(shí)現(xiàn)相似圖片搜素的關(guān)鍵技術(shù),它的作用是對每張圖片生成一個(gè)“指紋”(fingerprint)字符串,即對圖像進(jìn)行降維,然后比較不同圖片的指紋,結(jié)果越接近,則視為圖片越相似。利用感知哈希算法對圖片進(jìn)行降維,對每張圖片生成特征值,即“指紋”,以便下一步進(jìn)行圖像聚類。
本文在降維算法的選擇過程中同時(shí)比較了三種感知哈希算法,基于低頻的均值哈希算法(aHash)、增強(qiáng)哈希算法(pHash)和差值哈希算法(dHash),分別進(jìn)行實(shí)驗(yàn)。得出的結(jié)論是:平均值哈希算法的速度最快,但精度較差;增強(qiáng)哈希算法精確度較高,速度較慢;差值哈希算法速度快、精度高,但對圖像變換不具有魯棒性??紤]到本文的數(shù)據(jù)樣本量不需要作額外的圖像變換以擴(kuò)大數(shù)據(jù)量,所以選擇差值哈希算法進(jìn)行圖像降維。
差值哈希算法的主要步驟如下:①縮小圖片:縮小圖片至9×8 像素尺寸,此時(shí)有72 位像素點(diǎn);②轉(zhuǎn)化為灰度圖:把縮放后的圖片轉(zhuǎn)化為256 階的灰度圖(具體算法見平均哈希算法步驟);③計(jì)算差異值:dHash 算法工作在相鄰像素之間,這樣每行9 個(gè)像素之間產(chǎn)生了8 個(gè)不同的差異,一共8 行,則產(chǎn)生了64 個(gè)差異值;④獲得指紋:如果左邊的像素比右邊的更亮,則記錄為1,否則為0。
利用python 結(jié)合openCV 進(jìn)行編程,計(jì)算每行像素的相似情況進(jìn)行可視化,并計(jì)算圖像的哈希算法指紋得出相似程度,以兩張?jiān)貕K圖片為例,計(jì)算結(jié)果如圖2 所示。
計(jì)算所有裁切后的元地塊的指紋,準(zhǔn)備下一步進(jìn)行圖像聚類。
1.2.2 K-means 聚類
獲得了各個(gè)元地塊的指紋后,應(yīng)用一種無監(jiān)督高維聚類算法K-means,將所有元地塊分為五類地塊屬性。
圖1 城市肌理圖像樣式
圖2 差值哈希算法實(shí)現(xiàn)圖形相似度計(jì)算
K-means 算法是一種簡單的迭代型聚類算法,采用距離作為相似性指標(biāo),從而發(fā)現(xiàn)給定數(shù)據(jù)集中的K個(gè)類,且每個(gè)類的中心是根據(jù)類中所有值的均值得到,每個(gè)類用聚類中心來描述。對于給定的一個(gè)包含n個(gè)d 維數(shù)據(jù)點(diǎn)的數(shù)據(jù)集x以及要分得的類別k,選取歐式距離作為相似度指標(biāo),聚類目標(biāo)是使得各類的聚類平方和最小,即最小化:
結(jié)合最小二乘法和拉格朗日原理,聚類中心為對應(yīng)類別中各數(shù)據(jù)點(diǎn)的平均值。
經(jīng)過算法參數(shù)調(diào)整和去除噪聲,聚類的結(jié)果大致分為五類(表1)。
至此,完成了原始數(shù)據(jù)的處理和圖像標(biāo)注,以便下一步進(jìn)行架構(gòu)深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)的分類識(shí)別器。
表1 五類地塊聚類結(jié)果
深度學(xué)習(xí)(Deep Learning,DL)從狹義上理解,是一種具有一定的結(jié)構(gòu)和訓(xùn)練方法且含有多個(gè)隱含層的神經(jīng)網(wǎng)絡(luò)(圖3);從廣義上理解,可以把具有任何層次結(jié)構(gòu)的機(jī)器學(xué)習(xí)方法稱為深度學(xué)習(xí)。在深度學(xué)習(xí)過程中,從輸入圖像,經(jīng)過無監(jiān)督的逐層訓(xùn)練和學(xué)習(xí)圖像特征,通過有監(jiān)督的訓(xùn)練更新整個(gè)網(wǎng)絡(luò)參數(shù),最小化損失函數(shù),在輸出層實(shí)現(xiàn)正確的分類。卷積神經(jīng)網(wǎng)絡(luò)(CNN )是深度學(xué)習(xí)最受歡迎也是識(shí)別準(zhǔn)確率最高的網(wǎng)絡(luò)結(jié)構(gòu)之一,已經(jīng)被廣泛地應(yīng)用在手寫字體識(shí)別、人臉識(shí)別、自然圖像識(shí)別等有監(jiān)督圖像的識(shí)別領(lǐng)域,在本文的研究中有很強(qiáng)的適用性。
前文對圖像特征值的提取只能判斷圖像機(jī)械相似度,加入K-means的聚類結(jié)果存在較大噪聲和離群值,需要人工剔除,這對于少量數(shù)據(jù)標(biāo)注來說并非難事,但一旦數(shù)據(jù)量增多,聚類的可信度就會(huì)下降。卷積神經(jīng)網(wǎng)絡(luò)對圖像的識(shí)別并不是計(jì)算一張復(fù)雜的圖片特征值進(jìn)行整體判斷,而是將一個(gè)完整的圖片分割成許多個(gè)部分,對每個(gè)部分進(jìn)行卷積處理提取出特征,再將這些小部分具有的特征匯總,通過數(shù)學(xué)運(yùn)算實(shí)現(xiàn)機(jī)器識(shí)別圖像的過程。本文基于python Keras 架構(gòu)了如圖4 所示的網(wǎng)絡(luò)結(jié)構(gòu)。
以某張?jiān)貕K的肌理圖像為例,卷積神經(jīng)網(wǎng)絡(luò)的特征提取分為以下三步。
(1)在卷積神經(jīng)網(wǎng)絡(luò)(CNN)中,首先通過輸入層讀取數(shù)據(jù)集,進(jìn)入第一個(gè)卷積層。卷積運(yùn)算的性質(zhì)保留了原圖中像素與像素間的關(guān)系,卷積層通過不同尺寸的卷積核對城市肌理數(shù)據(jù)進(jìn)行不同尺度的特征提取,帶有不同尺寸的卷積核實(shí)現(xiàn)了對圖像的多種操作,例如邊緣檢測、升維、降維以及非線性變換等。以達(dá)到從不同的尺寸對肌理圖片進(jìn)行識(shí)別,經(jīng)過多次的卷積和池化操作,數(shù)據(jù)到達(dá)最后的全連接層。以中密度城區(qū)肌理為例子,如圖5 所示,首先卷積神經(jīng)網(wǎng)絡(luò)第一層特征提取的是圖片的整體輪廓信息,第二層以及第三層逐層深入提取圖片的局部特征信息。
(2)將樣本數(shù)據(jù)的80%設(shè)置為訓(xùn)練集,20%設(shè)置為驗(yàn)證集進(jìn)行交叉驗(yàn)證,經(jīng)過參數(shù)調(diào)整,訓(xùn)練出準(zhǔn)確率較好的城市地塊屬性分類器,訓(xùn)練集準(zhǔn)確率(Accuracy)可達(dá)97.3%,訓(xùn)練集的損失(Loss)為0.1017,驗(yàn)證集的準(zhǔn)確率稍低為91.0%,驗(yàn)證集損失為0.489,收斂情況較好。卷積神經(jīng)網(wǎng)絡(luò)中輸出層的上游通常是全連接層,因此,其結(jié)構(gòu)和工作原理與傳統(tǒng)前饋神經(jīng)網(wǎng)絡(luò)中的輸出層相同。對于圖像分類問題,輸出層使用邏輯函數(shù)或歸一化指數(shù)函數(shù)(softmax function)輸出分類標(biāo)簽,并映射到三維空間。如圖6 所示,可以看出,在三維空間中,卷積神經(jīng)網(wǎng)絡(luò)可以清晰地辨認(rèn)出五種城市肌理。
圖3 深度學(xué)習(xí)網(wǎng)絡(luò)示意圖
(3)對分類器進(jìn)行驗(yàn)證,用訓(xùn)練好的分類器讀取某張中密度城區(qū)圖,測試分類效果,結(jié)果見圖7,分類器對輸入圖像的識(shí)別效果較好,該圖片被認(rèn)為有98%的概率為中密度城區(qū),與標(biāo)注相符。驗(yàn)證證明分類器能較好分清五類地塊,可以投入后續(xù)城市識(shí)別過程使用。
訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)分類器已經(jīng)能夠識(shí)別特定的地塊類型,面臨的問題是如何識(shí)別城市整體。受限于數(shù)據(jù)源平臺(tái)以及比例尺,為了最大化城市建筑細(xì)節(jié),原始數(shù)據(jù)的尺寸被確定為1 800×800 像素,每個(gè)城市都由若干圖像組成。首先對每張圖像單獨(dú)處理,將1 800×800 的圖像分割,把每張切片分別讀入地塊分類器,得到分類結(jié)果,返回位置組成矩陣(A:高密度城區(qū);B:中密度城區(qū);C:低密度城區(qū);D:交通干道和立體交通;E:公共建筑和工廠):
圖4 卷積神經(jīng)網(wǎng)絡(luò)分類器結(jié)構(gòu)
圖5 卷積神經(jīng)網(wǎng)絡(luò)提取局部特征信息
統(tǒng)計(jì)每類地塊在矩陣中的個(gè)數(shù)除以總數(shù),即為城市中每類地塊的分布比例,高密度城區(qū)土地面積占比CountIF(A) 計(jì)算如下:
式中,CountIF(A) —矩陣中A 統(tǒng)計(jì)個(gè)數(shù),即高密度地塊出現(xiàn)的次數(shù);
M—單張1 800 ×800 的總切片數(shù);
N—某城市1 800×800 肌理圖像個(gè)數(shù)。
本文將圖像分別分割為200×200、100×100 以 及50×50的切片(圖8),討論切片大小對結(jié)果準(zhǔn)確度的敏感性,100×100 像素的識(shí)別表現(xiàn)最優(yōu)。
以上海黃浦區(qū)局部城市肌理圖像為例,機(jī)器識(shí)別的結(jié)果見圖9。
將切片的圖片數(shù)據(jù)合并為原始衛(wèi)星圖并進(jìn)行判別結(jié)果的可視化。從圖中可以看到,對于黃浦區(qū)局部城市肌理,機(jī)器識(shí)別的結(jié)果基本與人工認(rèn)知評價(jià)相符。
對于上海市以及其他城市的識(shí)別計(jì)算結(jié)果見表2。
面對城市肌理圖像中豐富多維的數(shù)據(jù)信息,機(jī)器學(xué)習(xí)技術(shù)在挖掘其內(nèi)部隱藏價(jià)值方面具有巨大潛力。諸如經(jīng)濟(jì)、文化、健康等城市評價(jià)指標(biāo)的研究往往建立在政府政策和城市POI 數(shù)據(jù)的基礎(chǔ)上進(jìn)行,下文將通過機(jī)器學(xué)習(xí)挖掘出城市肌理圖像,反映出的城市建筑規(guī)劃與城市評價(jià)指標(biāo)的隱藏聯(lián)系,以指導(dǎo)未來規(guī)劃和政府決策。
根據(jù)《中國城市統(tǒng)計(jì)年鑒》和華頓經(jīng)濟(jì)研究院編制的“2018 中國百強(qiáng)城市排行榜”給出的數(shù)據(jù),可以得到表3 數(shù)據(jù)[7]。
基于MATLAB R2018b 數(shù)據(jù)分析和機(jī)器學(xué)習(xí)工具箱(Statistics and Machine Learning Toolbox),對比不同的機(jī)器學(xué)習(xí)算法,對于上述數(shù)據(jù)分別進(jìn)行擬合的均方根誤差(RMSE)見表4,RMSE 是觀測值與真值偏差的平方和與觀測次數(shù)m 比值的平方根,用來衡量觀測值與真值的偏差情況。RMSE 越小說明回歸結(jié)果越好,圖像識(shí)別與城市指標(biāo)的相關(guān)性越強(qiáng)。
圖6 模型訓(xùn)練過程及降維可視化結(jié)果
圖7 分類器準(zhǔn)確性測試
圖8 不同尺度城市肌理圖像分割
圖9 上海黃浦區(qū)局部城市肌理識(shí)別結(jié)果
表2 10 個(gè)城市的識(shí)別結(jié)果即各類地塊比例構(gòu)成
表3 “2018 中國百強(qiáng)城市排行榜”中各城市的指標(biāo)得分
表4 不同機(jī)器學(xué)習(xí)算法對城市肌理與指標(biāo)得分的回歸分析結(jié)果
根據(jù)表3 中的RMSE 計(jì)算結(jié)果可以得出結(jié)論,經(jīng)濟(jì)總分值、軟經(jīng)濟(jì)總分值、環(huán)境分值以及衛(wèi)生分值與城市肌理的識(shí)別結(jié)果相關(guān)性最大。其中,環(huán)境分值與衛(wèi)生分值的相關(guān)性符合城市研究學(xué)者的通常認(rèn)知,而經(jīng)濟(jì)總分值與軟經(jīng)濟(jì)總分值的計(jì)算結(jié)果則說明城市建筑規(guī)劃及布局與城市的經(jīng)濟(jì)情況存在隱藏的相關(guān)性,也證明了從圖像識(shí)別城市挖掘城市信息并評價(jià)的必要性。
從算法角度分析,四種算法在多維回歸的過程中均有不同的表現(xiàn),其中,支持向量機(jī)算法(Support Vector Machines,SVM)的表現(xiàn)出眾,在多種目標(biāo)值的情況都取得了最小誤差和最優(yōu)的回歸結(jié)果。
首先,本文利用圖像降維、聚類以及卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了城市肌理的識(shí)別,并能精準(zhǔn)地識(shí)別出五類地塊屬性,證明了深度學(xué)習(xí)技術(shù)在城市圖像識(shí)別中的可能性,其技術(shù)方法在城市圖像識(shí)別中有很強(qiáng)的通用性。其次,本文利用機(jī)器學(xué)習(xí)算法,將當(dāng)代城市評價(jià)指標(biāo)與城市肌理圖像做了關(guān)聯(lián)性分析,以北京、上海、廣州等10 個(gè)城市為例,最終得出,在現(xiàn)有評價(jià)體系內(nèi)經(jīng)濟(jì)總分值、軟經(jīng)濟(jì)總分值、環(huán)境分值以及衛(wèi)生分值與城市肌理的識(shí)別結(jié)果相關(guān)性最大,其中,環(huán)境分值和衛(wèi)生分值的相關(guān)性符合城市研究學(xué)者的通常認(rèn)知,而經(jīng)濟(jì)總分值和軟經(jīng)濟(jì)總分值的計(jì)算結(jié)果則說明,城市建筑規(guī)劃和布局與城市的經(jīng)濟(jì)情況存在隱藏的相關(guān)性,也證明了從圖像識(shí)別城市挖據(jù)城市信息并評價(jià)的必要性。