丁愛波
大數(shù)據(jù)來源于現(xiàn)實。
人類的許多想法卻并非如此,創(chuàng)造性的思維與想象往往是非理性的,“創(chuàng)意和想象,用大數(shù)據(jù)是‘算不出來的”,因《大數(shù)據(jù)時代》走紅的牛津大學互聯(lián)網(wǎng)研究院教授維克托·邁爾·舍恩伯格直言。
今天,人們用數(shù)據(jù)來記錄這個世界,再通過研究數(shù)據(jù)去發(fā)現(xiàn)這個世界。但這個世界的生活、生意都需要創(chuàng)意和想象,大數(shù)據(jù)只能是一種參考。
全球新增的數(shù)據(jù)有95%是數(shù)字化信息,很容易被搜索查詢、引用或轉(zhuǎn)載,但是這其中有不少是無效信息,甚至是當事人不愿意記憶的信息。維克托指出:“隨著廉價數(shù)字存儲設備的普及,記憶成為數(shù)字時代的常態(tài)。但是互聯(lián)網(wǎng)如果記住了我們想要忘記的東西,就很容易毀了我們的生活?!?/p>
大數(shù)據(jù)時代,人們的一舉一動都會“被搜集”,再加以資料整合與加總。網(wǎng)絡通過大數(shù)據(jù)的搜集,會擁有比你更好的記憶力和分析能力,可能比你更懂你。當一些互聯(lián)網(wǎng)公司擁有了“讀心術(shù)”般的營銷能力之后,人們就感到害怕了。的確,數(shù)字技術(shù)賦予人們前所未有的權(quán)利,可它也會產(chǎn)生意想不到的可怕后果。英國社會學者保羅·杜吉德也認為,“無止境的積累,會讓人們迷失在記憶細節(jié)之中”。
維克托在《刪除:數(shù)字時代遺忘的美德》一書中指出:“數(shù)字技術(shù)和全球網(wǎng)絡壓倒一切,使我們忘記自己的自然能力,我們必須重新恢復忘記。”
數(shù)據(jù)無處不在,但數(shù)據(jù)并不是全部。人類的真實內(nèi)心、思想并不能通過大數(shù)據(jù)完全測算出來?;蛟S,網(wǎng)絡科學家可以測量出我們在76%的時間里與6名同事的社交互動情況,但是,他們不可能捕捉到我們隱藏在心底對那些一年或許也見不了一次的兒時玩伴的感情。
人類的思維、決策鑲嵌在時間序列和背景之中。人們往往擅長講述交織了多重原因和多重背景的故事。但數(shù)據(jù)是不懂得這些背景的,數(shù)據(jù)分析不懂得如何敘事,也不懂得思維的浮現(xiàn)過程。
數(shù)據(jù)能告訴你很多,但總歸有些事情,無法通過冰冷的數(shù)據(jù)來預測。人們所眼見的大數(shù)據(jù)分析的結(jié)果看似客觀公正,但其實價值選擇貫穿了從構(gòu)建到解讀的全過程。從這個意義上講,大數(shù)據(jù)也不能成為人們決策的精準標尺。真正的“黑天鵝”隱藏于無形之中,是很難被發(fā)現(xiàn)的。
著名商業(yè)思想家、《黑天鵝:如何應對不可知的未來》一書的作者納西姆·塔勒布指出,隨著我們掌握的數(shù)據(jù)越來越多,可以發(fā)現(xiàn)統(tǒng)計上顯著的相關(guān)關(guān)系也就越來越多。這些相關(guān)關(guān)系中,有很多都是沒有實際意義的,在真正解決問題時很可能將人引入歧途。
“這種欺騙性會隨著數(shù)據(jù)的增多而呈指數(shù)級地增長。在這個龐大的‘干草垛里,我們要找的那根針被越埋越深?!奔{西姆說。
因此,人們不但不能把大數(shù)據(jù)一股腦地當作寶庫,反而要冷靜審視數(shù)據(jù)的兩面性。預知未來的高科技“水晶球”也有不為人知的一面,拋棄有害和無用的信息至關(guān)重要。
和任何一種偉大的工具一樣,大數(shù)據(jù)有其拿手強項,也有不擅長的領(lǐng)域。要想用大數(shù)據(jù),先知其短板。機器儲存和分析難以囊括幾十億兆數(shù)據(jù),即使儲存了這些數(shù)據(jù),專業(yè)人員也無法全部調(diào)閱,刪除和忘掉無價值的、不相關(guān)的信息是處理大數(shù)據(jù)的重要原則。
正如維克托的建議,人類應采取的措施是“數(shù)字化節(jié)制、保護信息隱私權(quán)、建設數(shù)字隱私權(quán)基礎(chǔ)設施、調(diào)整人類的現(xiàn)有認知、打造良性的信息生態(tài)、完全語境化”。endprint