陳陽(yáng)
[內(nèi)容提要]社會(huì)經(jīng)濟(jì)發(fā)展帶來(lái)了頻繁的社會(huì)流動(dòng),以及與流動(dòng)人口相關(guān)的社會(huì)治理問(wèn)題。而隨著大數(shù)據(jù)時(shí)代的到來(lái),流動(dòng)人口在社會(huì)治理研究的方法和方式上也必然發(fā)生改變。因此,有必要從大數(shù)據(jù)本身的數(shù)據(jù)特質(zhì)出發(fā),討論其對(duì)流動(dòng)人口社會(huì)治理的影響及其拓展。
[關(guān)鍵詞] 大數(shù)據(jù) 流動(dòng)人口 社會(huì)治理研究
一、大數(shù)據(jù)對(duì)流動(dòng)人口社會(huì)治理的影響
自1989年KDD(數(shù)據(jù)庫(kù)的知識(shí)發(fā)現(xiàn))概念被提出以來(lái),大數(shù)據(jù)概念便成為了科學(xué)界追捧的寵兒。作為一種區(qū)別于傳統(tǒng)小型數(shù)據(jù)類(lèi)型的數(shù)據(jù)集合體,大數(shù)據(jù)在概念的內(nèi)涵和外延上都對(duì)傳統(tǒng)數(shù)據(jù)有所拓展和延伸。區(qū)別于傳統(tǒng)抽樣調(diào)查獲得的數(shù)據(jù),大數(shù)據(jù)具有公認(rèn)的SV特性。即Volumn(大量)、Velocity(高速)、Variety(多樣)、Value(價(jià)值)、Veracity(真實(shí))。這五個(gè)特點(diǎn)在與流動(dòng)人口的社會(huì)治理關(guān)聯(lián)時(shí),也顯著地影響了流動(dòng)人口的社會(huì)治理,使新時(shí)代流動(dòng)人口的社會(huì)治理發(fā)生三方面的改變。
1.能夠獲取更大規(guī)模的數(shù)據(jù),使研究者不再依靠樣本參數(shù)來(lái)推斷總體特征。傳統(tǒng)流動(dòng)人口社會(huì)治理較多使用抽樣調(diào)查獲得數(shù)據(jù),并以此推斷總體的特征分市,但獲得的數(shù)據(jù)量非常有限。而大數(shù)據(jù)在數(shù)據(jù)收集的渠道上則更加多元和現(xiàn)代。除了國(guó)家數(shù)據(jù)庫(kù)之外,企業(yè)數(shù)據(jù)、物聯(lián)網(wǎng)數(shù)據(jù)以及個(gè)人數(shù)據(jù)等都能成為大數(shù)據(jù)的來(lái)源。特別是隨著手機(jī)等智能終端設(shè)備的流行,越來(lái)越多的和流動(dòng)人口治理相關(guān)的數(shù)據(jù),開(kāi)始基于云計(jì)算平臺(tái)進(jìn)行匯總,成為超越所有傳統(tǒng)流動(dòng)人口社會(huì)治理模式中的數(shù)據(jù)集合體。而大規(guī)模數(shù)據(jù)的集合,將使研究者不再僅通過(guò)樣本參數(shù)來(lái)推斷總體特征。用一個(gè)比喻來(lái)形容就是大數(shù)據(jù)的使用可以使研究者不再“只見(jiàn)樹(shù)木,不見(jiàn)森林”,而是直接從洞悉森林的整體局勢(shì)進(jìn)行統(tǒng)籌規(guī)劃。同時(shí),大數(shù)據(jù)也使得研究者能夠隨時(shí)從全局視角出發(fā),審視某些特殊地區(qū)或個(gè)體所面臨的問(wèn)題。
2.能使研究者的反應(yīng)更迅捷,并協(xié)助研究者對(duì)數(shù)據(jù)進(jìn)行更智能的分析與判斷。如在運(yùn)用智能手機(jī)進(jìn)行流動(dòng)人口的數(shù)據(jù)收集時(shí),可以通過(guò)移動(dòng)網(wǎng)絡(luò)即時(shí)地將數(shù)據(jù)上傳到“云端”。只要移動(dòng)網(wǎng)絡(luò)暢通,數(shù)據(jù)便可以立刻完成從獲取到保存的全過(guò)程。同時(shí),在云端還可以部署數(shù)據(jù)處理代碼,在保存完畢之后立刻調(diào)用程序?qū)?shù)據(jù)計(jì)算分析。如在收集流動(dòng)人口的收入時(shí),為了收集方便,將直接以“元”作為單位,對(duì)流動(dòng)人口的具體收入進(jìn)行輸入。這種數(shù)據(jù)收集方法雖然精確,但是卻不利于整理。而利用強(qiáng)大的云平臺(tái)計(jì)算能力,將可以即時(shí)地根據(jù)輸入的具體收入數(shù)據(jù)進(jìn)行分類(lèi)。如將月收入3000元以下的設(shè)定為第一檔,將3001- 5000元設(shè)定為第二檔,將5001- 8000元設(shè)為第三檔,將8000元及以上的設(shè)定為第四檔。通過(guò)這樣的方式將加快流動(dòng)人群社會(huì)治理相關(guān)數(shù)據(jù)的收集和轉(zhuǎn)換。
3.能容納多元的數(shù)據(jù)格式于一體,進(jìn)而對(duì)流動(dòng)人口社會(huì)治理相關(guān)問(wèn)題的分析更加立體、真實(shí)。傳統(tǒng)流動(dòng)人口社會(huì)治理多使用定量化的數(shù)值數(shù)據(jù),并運(yùn)用統(tǒng)計(jì)學(xué)進(jìn)行推斷分析。而流動(dòng)人口社會(huì)治理所涉及到的大數(shù)據(jù)不僅在容量層面上有所拓展,其格式也更是“有容納大,百花齊放”。除了傳統(tǒng)的數(shù)值型數(shù)據(jù)和文本型數(shù)據(jù)之外,流動(dòng)人口社會(huì)治理相關(guān)的大數(shù)據(jù)還包含了諸如GPS位置、語(yǔ)音視頻多媒體文件等多元格式的數(shù)據(jù)或文件。這些多元格式的文件使得流動(dòng)人口的社會(huì)治理問(wèn)題研究變得更加真實(shí)和立體,在研究過(guò)程中可以隨時(shí)根據(jù)數(shù)據(jù)、聲音和影像更加真實(shí)地還原問(wèn)題的本源特質(zhì),進(jìn)而得出更加具體和翔實(shí)的結(jié)論及解決方案。
二、大數(shù)據(jù)對(duì)流動(dòng)人口社會(huì)治理研究的拓展
1.大數(shù)據(jù)拓展流動(dòng)人口社會(huì)治理的理論框架。隨著時(shí)代進(jìn)步,越來(lái)越多的知識(shí)開(kāi)始交叉并融。借助大數(shù)據(jù),流動(dòng)人口的社會(huì)治理將能夠完成對(duì)群體社會(huì)組織等資訊信息的收集,并充分地利用計(jì)算機(jī)模擬“演化科學(xué)解決現(xiàn)實(shí)世界的問(wèn)題”。計(jì)算數(shù)據(jù)科學(xué)將在“機(jī)器學(xué)習(xí)”的幫助上,進(jìn)一步拓展流動(dòng)人口社會(huì)治理的研究范疇和疆域。此外,隨著云計(jì)算技術(shù)的日漸流行,流動(dòng)人口社會(huì)治理也必然將采用全新的數(shù)據(jù)收集、整合及處理邏輯。而隨著人工智能熱度的日漸高漲,流動(dòng)人口的社會(huì)治理也必然與其融合,凝集人類(lèi)經(jīng)驗(yàn)和人工智能雙效能量。從目前發(fā)展的態(tài)勢(shì)來(lái)看,最可能實(shí)現(xiàn)的便是基于集人工專(zhuān)家經(jīng)驗(yàn)理論和人工智能迅捷判斷于一身的全新智庫(kù)系統(tǒng)。其可以有效地利用人工智能收集和流動(dòng)人口社會(huì)治理相關(guān)的任何數(shù)據(jù),并針對(duì)特定社會(huì)情境或問(wèn)題進(jìn)行趨勢(shì)分析與判斷,協(xié)助決策者作出有效的判斷,并及時(shí)地提出問(wèn)題的解決方案。
2.大數(shù)據(jù)成為傳統(tǒng)流動(dòng)人口社會(huì)治理問(wèn)題的有效補(bǔ)充,提升了傳統(tǒng)研究的生命力。雖然大數(shù)據(jù)拓展了傳統(tǒng)流動(dòng)人口社會(huì)治理的研究范疇和疆域,但是不能忽視大數(shù)據(jù)因其天生的缺陷很難以完全取代傳統(tǒng)的流動(dòng)人口社會(huì)治理研究。一是大數(shù)據(jù)的數(shù)據(jù)收集方式使其對(duì)普通研究者并不是很友好。由于大數(shù)據(jù)收集起來(lái)既費(fèi)時(shí)又費(fèi)事,很難讓個(gè)人研究者或團(tuán)隊(duì)執(zhí)行,因此現(xiàn)在的大數(shù)據(jù)收集工作往往由政府或較大的科技公司主導(dǎo),導(dǎo)致了個(gè)人研究者難以直接獲取到所需要的大數(shù)據(jù)。二是大數(shù)據(jù)涉及的方面較廣泛,很有可能會(huì)觸及個(gè)人隱私。當(dāng)個(gè)人隱私和學(xué)術(shù)研究沖突的時(shí)候,將涉及學(xué)術(shù)倫理道德問(wèn)題。對(duì)于何時(shí)使用大數(shù)據(jù)進(jìn)行研究不違反倫理道德,目前還沒(méi)有明確的標(biāo)準(zhǔn)界限。所以,這必然為實(shí)際操作帶來(lái)困難。三是大數(shù)據(jù)存在“噪音”問(wèn)題,這將使基于大數(shù)據(jù)研究的信效度受到質(zhì)疑。由此可見(jiàn),大數(shù)據(jù)雖然明顯提升了流動(dòng)人群社會(huì)治理研究的范式和疆域,但不可否認(rèn)它現(xiàn)在仍不能夠完全地取代傳統(tǒng)調(diào)研方法。只有將傳統(tǒng)研究方法和大數(shù)據(jù)研究方法合二為一時(shí),才能有效地保證流動(dòng)人口社會(huì)治理呈現(xiàn)出更強(qiáng)悍的生命力。
3.大數(shù)據(jù)拓展了流動(dòng)人口社會(huì)治理的研究工具集合。大數(shù)據(jù)對(duì)流動(dòng)人口社會(huì)治理的影響,不僅促使研究疆域和研究領(lǐng)域發(fā)生改變。同時(shí),也在研究工具的層面有所豐富。原來(lái),流動(dòng)人口的社會(huì)治理研究更多使用單機(jī)版的SPSS作為主要的數(shù)據(jù)分析工具進(jìn)行統(tǒng)計(jì)分析。但是,這類(lèi)統(tǒng)計(jì)軟件往往適用于抽樣調(diào)查所獲得的不多于10萬(wàn)條左右的數(shù)據(jù)集合。而當(dāng)該類(lèi)軟件一旦遭遇到超過(guò)10萬(wàn)條以上的數(shù)據(jù)時(shí),便會(huì)捉襟見(jiàn)肘,無(wú)法順暢地運(yùn)行。于是,一些基于計(jì)算機(jī)分布式理念設(shè)計(jì)的大數(shù)據(jù)處理框架自然地被引入到了流動(dòng)人口的社會(huì)治理研究中來(lái)。如廣為人知的Python語(yǔ)言在處理大數(shù)據(jù)時(shí)便會(huì)讓研究者更得心應(yīng)手,并在很多方面有取代SPSS成為學(xué)術(shù)統(tǒng)計(jì)標(biāo)準(zhǔn)的可能。同時(shí),隨著使用大數(shù)據(jù)工具人數(shù)的增多,一些python的開(kāi)源包也應(yīng)運(yùn)而生。這些開(kāi)源包由于目標(biāo)是解決諸如流動(dòng)人口社會(huì)治理等特定社會(huì)問(wèn)題,因此它們?cè)诰帉?xiě)的過(guò)程中必然由計(jì)算機(jī)專(zhuān)家和社會(huì)學(xué)家通力合作完成,隨著大數(shù)據(jù)技術(shù)不斷地進(jìn)入流動(dòng)人口的社會(huì)治理中,社會(huì)科學(xué)的研究者也必將為開(kāi)源作出貢獻(xiàn)。