隋林華
1980年,著名未來學家阿爾文·托夫勒在《第三次浪潮》一書中,將大數據贊頌為“第三次浪潮的華彩樂章”,到2009年,“大數據”成為互聯(lián)網信息技術行業(yè)的流行詞匯,2012年,“大數據”逐步影響了眾多行業(yè),大數據時代真正來臨。大數據是什么?
最早提出“大數據”時代已經到來的機構是全球知名咨詢公司麥肯錫,麥肯錫認為,數據已經逐漸滲透到每一個行業(yè)和業(yè)務職能領域,逐漸成為重要的生產因素?!按髷祿钡母拍钍紫仁侵笖祿w量大,其次是指數據類別大,種類格式豐富,再次是指數據處理速度快,最后是指數據真實性高。它的特點被概括為4V,即:Volume、Velocity、Variety、Veracity。當然“大數據”絕不僅僅限于這4V,它涵蓋了人們在大規(guī)模數據上可以去做的很多事情,而這些事情是只有在大數據基礎上才可以進行的,這是大數據的“唯一性”大數據讓我們以一種前所未有的方式,通過對海量數據進行分析,獲得有巨大價值的產品和服務,或深刻的洞見,最終形成變革之力。對于大數據,可以進行分析的五個方面,包含了:可視化分析、數據挖掘算法、預測性分析能力、語義引擎、數據質量和數據管理。
2012年12月,英國人維克托·達爾-舍恩伯格所著的《大數據時代》在中國翻譯出版,2015年,他在中國的一次演講上說:“過去我們是希望利用數據來回答問題,首先假設問題,然后收集數據,最后進行分析。現(xiàn)在隨著數據收集的成本越來越低,越來越方便,我們可以先從數據收集著手,然后分析數據,通過分析提出一些非常棒的問題。這更有助于企業(yè)為用戶提供個性化的服務。”他還舉了一個生動的例子,比如說大家最喜歡的口味的派是什么,是蘋果還是桃味的?最后我們拿到了問題的答案,可能就是蘋果派,最后我們就覺得蘋果派是最受歡迎的,但是反而我們得到了這個問題的答案是錯誤的。那么現(xiàn)在我們其實可以做一些改變,改變一下我們的方式,我們不是從問題開始著手,因為有可能我們的問題本身就是錯誤的。我們先從數據著手,然后從開始搜集數據,進行分析。然后通過分析,我們可以提出一些非常棒的問題。比如說這個派的尺寸,最合適的尺寸是什么,這是正確的問題。根據這個分析,我們可以獲得這樣的一個假設。最后我們可以得到問題的答案,就是我們需要一個尺寸合適大小合適的派。
大數據給藝術市場帶來了什么?
大數據給各行各業(yè)帶來了全新的機遇,那么對于藝術品市場而言,它帶來的又是什么?
傳統(tǒng)意義上,藝術品投資者對于藝術品數據的關注并不多,他們更在意藝術品的歷史背景以及背后所蘊含的深層意義。藝術品具體的品類及這些品類的漲跌幅度,更能引起他們的注意。但其實在藝術品交易的鏈條中,每一個環(huán)節(jié)都隱藏著大量的數據,無論是數據的采集、存儲還是數據的管理與應用,都交雜其中。藝術品行業(yè)高速發(fā)展的這幾年,為了能夠更精確地把握藝術品的具體成交量和價值的增長點,人們逐漸意識到藝術品收藏投資需要數據思維的加入。如何刺激與延續(xù)市場的繁榮,初級投資者與資深人士如何選擇適合他們的投資品類,數據都能給到很好的參考作用。這期間所產生的數據無疑讓我們對藝術品市場的火熱程度的衡量與如何帶動藝術投資產生了巨大的推動作用。
藝術品行業(yè)的大數據主要包括3個方面:用戶大數據、內容大數據和渠道大數據。在大數據時代下,用戶即數據,數據即價值,想要挖掘大數據的價值,必須要擁有數據,擁有數據之后才能擁有用戶,擁有用戶之后,才能獲得價值。在藝術品行業(yè),根據已有平臺積累的“巨量”用戶信息,通過分析大量用戶的消費行為信息,挖掘出用戶群體感興趣的產品需求,在此大數據分析的基礎上,進行調整。內容大數據的整合,渠道大數據的分析與開拓,同時將藝術品市場推向了一個嶄新的領域。
2013年,雅昌藝術市場監(jiān)測中心與中國人民大學藝術品金融研究所達成合作意向,雙方共同研發(fā)符合中國藝術品市場特征的藝術品指數體系,開始打造藝術品行業(yè)的“大數據”。2015年3月18日,胡潤藝術榜在北京發(fā)布,胡潤藝術榜根據100位中國在世藝術家過去一年在公開拍賣市場上的作品總成交額進行排名,用大數據來衡量市場,本身是一件極具客觀性的衡量方式,但榜單公布后卻引起很多人對于榜單的質疑,以及對于新鮮事物“大數據”的質疑。
對于藝術市場大數據的態(tài)度形成了兩方態(tài)度鮮明的陣營。一方認為,中國需要藝術品數據作為觀察市場的工具,藝術品大數據可以把藝術家作為金融市場的“個股”來進行分析,從這個角度觀察藝術品和藝術家成長的軌跡,也可以借助這些數據去分析藝術品的走向,為這個市場提供研究方法,使藝術品市場成為更透明、更有效的藝術市場。而且大數據能夠自動辨別數據的真假,因此最后的分析結果不存在造假問題。
我們先了解一下,大數據和以前的數據分析3個明顯的區(qū)別:一是原來的數據分析針對部分樣本,大數據是所有的數據都要參與計算;二是大數據中,相關關系重于因果關系;三是大數據允許混雜數據甚至錯誤數據。大數據允許混雜數據甚至錯誤數據這是因為,大數據能夠通過造假數據的特征將其辨識出來。造假的數據和平常的數據不一樣,可以通過環(huán)比、同比、類比,發(fā)現(xiàn)數據中的異動,判斷是否存在數據造假行為。
另一方的態(tài)度則趨向于中國藝術大數據可信度不高。數據時代已經來臨,但大數據并非無所不能。它蘊含的是計算和思維方式的轉變,過于樂觀和簡單的理解,都可能在使用時適得其反。此方態(tài)度的支撐點還在于現(xiàn)階段國內藝術品數據存在的諸多問題,首先,國內的藝術品交易并沒有規(guī)定具體特定的地點,藝術家交易途徑較多,很多交易數據是無從考究的,因此這方面的數據的真實性有待考證。其次,作為二級市場的拍賣行雖然在每次成交時會有據可循,但拍賣行業(yè)由于假拍、贗品等問題使得數據的質量非?;祀s,要獲取精確、具有市場代表性的數據分析,研究者往往要進行大量的數據整理清洗、剔除工作,然而在這個過程中一旦存在任何采樣偏差,分析結果就會相去甚遠,而且小數據的樣本分析往往只能對預設的問題做出判斷,而不具有延展性,恰好,這些問題又是拍賣行業(yè)數據的復雜性所不能規(guī)避的。第三,藝術品不同于其他的產品,沒有標準化的衡量標準,因此交易也難以進行標準化的衡量,在進行數據分析時就存在著很大的難度。另外,數據編制機構本身的商業(yè)性質也從一定程度上影響著數據的客觀性、公正性和專業(yè)性,這也是在藝術大數據中不可回避的問題。
對于大數據能否造假,很多學者也持懷疑態(tài)度。他們認為,首先,數據一旦涉及到利益,就有極大的造假可能性。數據背后的細節(jié),數據來源的真實性、處理過程中的全面性及科學性,是大數據走向權威和可信的重要保障,這些也是影響到大數據真實性的重要因素,差之毫厘謬以千里。
另外大數據在進行計算時,很容易忽略數據之間真實的關聯(lián)性。如數據統(tǒng)計證實了網頁數和網絡形象存在一般的正相關,但忽略了負面事件帶來的網頁量爆發(fā)等,結論也就存在著誤差。這種相關性體現(xiàn)的渠道必須是數據之間、數據與真實事件映射的現(xiàn)象之間、真實事件的客觀聯(lián)系上。該如何看待中國藝術品數據
根據以上所述,藝術品大數據存在著諸多的不確定性和可變性,但對于這種不確定性,我們應持理性的態(tài)度,通過這些有爭議的數據,我們依然可以去研究出某一時段市場交易的概況,以及某一位藝術家在現(xiàn)階段的行情,某一幅作品的當今市場價值……事實上,在當下這樣一個共識性引導市場的時代背景下,即便是數據存在不真實性,只要能夠保證數據體量的足夠龐大,以量補質,再用足夠科學的測算方法輔助,我們依然能夠捕捉到市場中的“共識性”。然后根據這種“共識性”,做出正確的投資決策。誠然,精確度高、真實性更強的客觀數據,對于大數據而言,最后得出的結果將更準確更優(yōu)質。
對于藝術品大數據如何走向規(guī)范化,減少誤差率,實現(xiàn)真正的大數據功能,更好地為市場服務,很多專家認為,首先要從藝術市場本身人手。一級市場、二級市場的弊病存在已久,市場泡沫化去除也在進行中,這些問題對于大數據的影響顯而易見,如果不從根本祛除“病根”,大數據自身很難去擯棄這些負面干擾。另外,對于藝術行業(yè)而言,如果想準確地預測到下一步,須從整個行業(yè)發(fā)展狀況、國家相關政策、消費人群的關注方向、藝術家從業(yè)分布、行業(yè)收藏熱度分布、各大拍賣行春秋拍概況、一級市場銷售情況、市場容量等很多角度去研究分析,且需要專業(yè)人士來配合才能保證采集數據的客觀性和準確性。
雖然路漫漫,但在大數據不斷前行的今天,某一天,也許我們就會通過大數據的顯示,很清晰明了地知道,當代市場情況如何,未來幾年藝術品收藏投資熱門是哪些品類,哪位藝術家的作品更具升值潛力……