/北京航天發(fā)射技術(shù)研究所
大數(shù)據(jù)浪潮洶涌而來,這不僅僅是信息技術(shù)領(lǐng)域的革命,更是全球范圍內(nèi)加速企業(yè)創(chuàng)新的利器,不少公司已經(jīng)意識到這是一個難得的機遇,都開始采取積極的行動。近年來,中國運載火箭技術(shù)研究院通過以戰(zhàn)略綱要為依據(jù),以課題研究為牽引,以知識梳理為核心,以系統(tǒng)建設(shè)為支撐,以標準制度為保障,推進知識管理工程,取得了較好的實施效果。那么,如何將大數(shù)據(jù)與知識管理工作相結(jié)合,提升知識管理系統(tǒng)的效用,促進研究院的發(fā)展,成為當前必須正視和思考的問題。
數(shù)據(jù)的歷史極為漫長。戰(zhàn)國時期,著名的《商君書·畫策》中將全國總?cè)丝诎磯涯?、壯女、官吏、商人、讀書人、殘疾人等13類分別統(tǒng)計,這就是中國歷史上的“強國知十三數(shù)”。古埃及在公元前3000年已經(jīng)有人口、居民財產(chǎn)統(tǒng)計,尤其是每次修建金字塔之前都會進行全國性的人口普查,以計算可征調(diào)的勞動力。
隨著社會的發(fā)展進步,人類的數(shù)據(jù)量不斷增多。與此同時,數(shù)據(jù)的價值也得到更為廣泛的認可。從20世紀開始到如今,美國政府對于數(shù)據(jù)的收集、發(fā)布、使用和管理,已經(jīng)形成了一個比較成熟的框架和體系。著名華人歷史學(xué)家黃仁宇先生說:“資本主義社會,是一種現(xiàn)代化的社會,它能夠?qū)⒄麄€的社會以數(shù)目字管理?!?011年,麥肯錫公司以2010年度各國新增的存儲器為基準,對全世界大數(shù)據(jù)的分布做了一個研究和統(tǒng)計,結(jié)果表明:2010年美國新增的數(shù)據(jù)量為3500拍,歐洲為2000拍,日本400拍,而我國僅為250拍。
所有的信息都以數(shù)據(jù)的形式保存在物理存儲器上。由于數(shù)據(jù)量不斷增多,一些新的名詞也被相應(yīng)定義,如“太”(Terabyte),代表2的40次方。數(shù)據(jù)的存儲單位見表1。
目前,一首普通MP3格式的流行歌曲大約4兆字節(jié),一部電影大約1吉字節(jié)。而1艾字節(jié),相當于13億中國人人手一本500頁書籍的信息量。截至2010年,人類擁有的信息總量大概是1.2澤字節(jié)。
大數(shù)據(jù)指那些大小已經(jīng)超出了傳統(tǒng)意義上的尺度,一般的軟件工具難以捕捉、管理和分析的大容量數(shù)據(jù)。一般定義為:需要新處理模式才能處理,具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn),通常以“太字節(jié)”為單位;麥肯錫全球研究所給出的定義是:一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價值密度低四大特征;在《大數(shù)據(jù)時代》中,大數(shù)據(jù)指不用隨機分析法(抽樣調(diào)查),而采用所有數(shù)據(jù)進行分析處理。
一是數(shù)據(jù)的爆炸式增長。
2001年,著名的高德納咨詢公司在研究報告中指出,數(shù)據(jù)的爆炸是三維的、立體的(見圖1),這3個維度主要表現(xiàn)在:同一類型的數(shù)據(jù)量在快速增大;數(shù)據(jù)增長的速度在加快;數(shù)據(jù)的多樣性,即新的數(shù)據(jù)來源和新的數(shù)據(jù)種類在不斷增加。據(jù)估計,2000年人類新產(chǎn)生的數(shù)據(jù)量為1000~2000拍;而2020年僅全球企業(yè)一年新存儲的數(shù)據(jù)量就超過7000拍,全球消費者新存儲的數(shù)據(jù)量約為6000拍。圖2為麥肯錫全球研究所對美國各行業(yè)2009年擁有的數(shù)據(jù)量估算。
表1 數(shù)據(jù)的存儲單位
圖1 數(shù)據(jù)的三維增長
圖2 美國各行業(yè)數(shù)據(jù)存儲量
二是大數(shù)據(jù)帶來的挑戰(zhàn)與機遇。
經(jīng)由量變到質(zhì)變,大數(shù)據(jù)呈現(xiàn)出許多新的特質(zhì)。通過對海量數(shù)據(jù)的交換、整合和分析,發(fā)現(xiàn)新的知識并創(chuàng)造新的價值,帶來“大知識、大科技、大利潤和大發(fā)展”。麥肯錫在其2011年的報告中指出:“大數(shù)據(jù),將成為全世界下一個創(chuàng)新、競爭和生產(chǎn)率提高的前沿”,“已經(jīng)有越來越多令人信服的證據(jù)表明:只要實施正確的政策和激勵,大數(shù)據(jù)將成為競爭的關(guān)鍵性基礎(chǔ),并成為下一波提高生產(chǎn)率、創(chuàng)新和為消費者創(chuàng)造價值的支柱?!?/p>
但是,大數(shù)據(jù)存在多源異構(gòu)、分布廣泛、動態(tài)增長,先有數(shù)據(jù)后有模式等特點,這些與傳統(tǒng)數(shù)據(jù)的不同,使得大數(shù)據(jù)時代的管理面臨新的挑戰(zhàn)。2010年,美國政府部門向奧巴馬和國會提交了《規(guī)劃數(shù)字化未來》報告,該報告列舉了5個貫穿各個科技領(lǐng)域的共同挑戰(zhàn),第一個挑戰(zhàn)就是“數(shù)據(jù)”問題。報告說:“如何收集、保存、維護、管理、分析、共享正在呈指數(shù)級增長的數(shù)據(jù),是我們必須面對的一個重要挑戰(zhàn)?!?011年,新加坡成立了德勤數(shù)據(jù)分析研究所,目的是引領(lǐng)政府和企業(yè)對于數(shù)據(jù)的研究和應(yīng)用。
三是小數(shù)據(jù)和最小數(shù)據(jù)集。
與大數(shù)據(jù)概念相對應(yīng),誕生了小數(shù)據(jù)和最小數(shù)據(jù)集的概念。
小數(shù)據(jù)的定義尚不統(tǒng)一,有人認為以前采用調(diào)查方法獲得的抽樣數(shù)據(jù),或者是結(jié)構(gòu)化的海量數(shù)據(jù)是小數(shù)據(jù);也有人認為需要新的應(yīng)用方式才能體現(xiàn)出具有高價值的、個體的、高效率的、個性化的信息資產(chǎn)是小數(shù)據(jù)。
最小數(shù)據(jù)集的概念起源于美國的醫(yī)療系統(tǒng),由于其實用性在美國已經(jīng)演化成一般性的概念,指代國家的管理層面針對某個業(yè)務(wù)管理領(lǐng)域強制收集的數(shù)據(jù)指標,其實質(zhì)是一個業(yè)務(wù)管理過程當中最重要的數(shù)據(jù)指標。它在各個公共領(lǐng)域的定義和推廣,成為這些部門在開發(fā)設(shè)計信息系統(tǒng)時最重要的一個參考,一旦核心的數(shù)據(jù)收集指標被確定,數(shù)據(jù)庫的結(jié)構(gòu)設(shè)計就成為一個水到渠成的過程。有些最小數(shù)據(jù)集,甚至直接就被引用并成為信息管理系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)。
數(shù)據(jù)的開放。在數(shù)據(jù)浪潮中,很多人認為無論是代碼還是數(shù)據(jù),只有開放,才能集聚群體的智慧、激發(fā)創(chuàng)新的力量、放射出更大的價值,真正推動社會的進步;同時,人民有權(quán)向政府索取各式各樣的數(shù)據(jù)。由此,美國和英國先后興起了數(shù)據(jù)開放運動,并得到時任美國總統(tǒng)奧巴馬和英國首相戈登·布朗的大力支持和推動,美國政府數(shù)據(jù)開放門戶網(wǎng)站與英國政府數(shù)據(jù)開放網(wǎng)站先后建立。2011年,美、英等國政府發(fā)起成立“開放政府聯(lián)盟”這一致力于數(shù)據(jù)開放和創(chuàng)新的國際組織,其會員迅速增加到50個。
數(shù)據(jù)可視化。大數(shù)據(jù)的出現(xiàn)使得數(shù)據(jù)價值得到了空前的重視,各行各業(yè)都在對大數(shù)據(jù)分析提出需求,數(shù)據(jù)的分析結(jié)果也需要得到更多形式的展示從而被大眾理解。數(shù)據(jù)可視化技術(shù),可以通過圖像在邏輯思維的基礎(chǔ)上進一步激發(fā)人的形象思維和空間想象能力,以吸引并幫助用戶洞察數(shù)據(jù)之間隱藏的關(guān)系和規(guī)律,大數(shù)據(jù)可視化分析逐漸成為潮流和趨勢,乃至出現(xiàn)新一類的專業(yè)人才:數(shù)據(jù)科學(xué)家。
云計算和移動云處理。1997年,南加州大學(xué)的一位印度裔教授切諾柏正式提出“云計算”的概念。這種通過網(wǎng)絡(luò)將計算能力組織起來的做法,可以實現(xiàn)經(jīng)濟學(xué)意義上的“規(guī)?;焙汀皩I(yè)化”,引發(fā)企業(yè)界前赴后繼的嘗試,并得到大規(guī)模的商業(yè)應(yīng)用。2011年,美國政府通過云計算的應(yīng)用,將全國的數(shù)據(jù)中心合并了137所,并將繼續(xù)精簡。隨著4G網(wǎng)絡(luò)的興起及手機、平板電腦等移動終端的使用,移動云處理的概念應(yīng)運而生,未來關(guān)于移動數(shù)據(jù)和移動云處理的研究將會不斷處于熱潮當中。
人工智能與深度學(xué)習(xí)。傳統(tǒng)的數(shù)據(jù)表達模型和方法過于簡單與淺層,而大數(shù)據(jù)能夠支持更為復(fù)雜的模型。深度學(xué)習(xí)在計算機視覺、語音識別和圖片識別上已取得巨大成功,未來深度學(xué)習(xí)和大數(shù)據(jù)結(jié)合仍會有長足的發(fā)展。
知識管理簡言之是企業(yè)內(nèi)知識資產(chǎn)的管理,包括知識獲取、知識交流、知識應(yīng)用和知識創(chuàng)新等過程。知識管理系統(tǒng)的任務(wù)就是對企業(yè)的顯性知識和隱性知識進行處理,并把這些知識用一種適合于用戶及商業(yè)環(huán)境的方式表示出來,以提供給企業(yè)員工共享、吸收、利用。它以知識為核心,通過IT等輔助技術(shù)協(xié)助企業(yè)有效地獲取、傳播、共享、利用和創(chuàng)造知識,并為企業(yè)創(chuàng)造價值。
時代性。知識管理是在知識經(jīng)濟時代提出的關(guān)于對知識共享問題的管理,具有鮮明的時代性。知識創(chuàng)新是知識管理的目的,知識管理是知識創(chuàng)新的基礎(chǔ)和手段,知識管理理念體現(xiàn)了社會經(jīng)濟發(fā)展向依靠科技進步和提高勞動者素質(zhì)水平轉(zhuǎn)移的趨勢。
快速化。資料顯示,20世紀末至21世紀初的十幾年之間,人類所創(chuàng)造的知識總量比人類五千年歷史創(chuàng)造的總量還要大。當知識更新的速度越來越快時,必須讓知識管理的水平跟上知識更新的速度。
人本性。知識是由人創(chuàng)造出來的,習(xí)慣、經(jīng)驗、技術(shù)等隱性知識是由廣大員工長期的工作實踐積累下來的,而貢獻知識、共享知識和貢獻出知識的價值更與員工的意愿息息相關(guān)。員工對企業(yè)有良好的認同感和歸屬感,會不斷主動提高自身的創(chuàng)新能力和創(chuàng)新動力,并將知識無私貢獻給企業(yè)。從心理學(xué)以及企業(yè)文化的角度,關(guān)注個體構(gòu)建開放共享型的文化,有助于企業(yè)知識管理。
中國航天事業(yè)的發(fā)展過程也是一個持續(xù)累積知識、推動創(chuàng)新的過程。研究院成立初期,各分院的設(shè)計部、研究室組織技術(shù)人員學(xué)習(xí)型號資料,下廠配合生產(chǎn),選派技術(shù)人員跟隨蘇聯(lián)專家學(xué)習(xí),并把專家的講解整理匯編、印發(fā)相關(guān)人員學(xué)習(xí),大量的隱性知識通過蘇聯(lián)專家外溢給了中國本土的專家和技術(shù)人員。
1992年載人航天立項時,明確“長征”二號F火箭在“長征”二號E火箭的基礎(chǔ)上進一步研制和完善?!伴L征”二號E火箭共進行了8次發(fā)射,經(jīng)歷了成功與失敗的考驗,但有了火箭關(guān)鍵領(lǐng)域的技術(shù)突破作基礎(chǔ),“長征”二號F火箭在進行1次零高度試驗和4次無人飛船試驗后,實現(xiàn)了“神舟”五號飛船首次載人航天飛行的成功。
大數(shù)據(jù)和知識管理是2個相對獨立的領(lǐng)域,但數(shù)據(jù)是知識的源頭,大數(shù)據(jù)的最終目的是提取知識,二者自誕生之日起就有著千絲萬縷的聯(lián)系。大數(shù)據(jù)背景下的知識管理,有著很多新的特點,這是知識管理本身更新?lián)Q代的體現(xiàn),也是大數(shù)據(jù)技術(shù)催生的知識管理革命。
知識管理和大數(shù)據(jù)都通過提升技術(shù)以整合資源,前者著眼于在隱性知識向顯性知識轉(zhuǎn)化的過程中實現(xiàn)知識創(chuàng)新,后者憑借大數(shù)據(jù)的處理技術(shù)充分挖掘潛在規(guī)律。研究表明,數(shù)據(jù)資產(chǎn)管理效率與主營業(yè)務(wù)收入增長率、銷售收入增長率顯著正相關(guān);對于具有互聯(lián)網(wǎng)思維的企業(yè)而言,數(shù)據(jù)資產(chǎn)競爭力所占比重為36.8%。數(shù)據(jù)逐漸成為企業(yè)的核心資產(chǎn),并關(guān)系到企業(yè)核心競爭力。同樣,知識已成為企業(yè)有效運作所需的基礎(chǔ)性資源,以及企業(yè)運營管理中最有價值的資產(chǎn)。知識管理可以在一定程度上輔助決策,提升企業(yè)的創(chuàng)新能力。數(shù)據(jù)、信息和知識的區(qū)別與聯(lián)系,如圖3所示。
大數(shù)據(jù)帶來種種便利的同時,也逐漸暴露出數(shù)據(jù)泄露的危害。資料顯示,未來幾年數(shù)據(jù)泄露的增長率也許會達到100%,每個財富500強企業(yè)都會面臨數(shù)據(jù)攻擊。數(shù)據(jù)開放過程中,個人隱私數(shù)據(jù)的保護和“信息過度窄化”等問題也浮出水面。知識管理雖然是企業(yè)發(fā)展的利器,但相當多的企業(yè)投入大量資金運作的知識管理系統(tǒng)并不成功,數(shù)據(jù)表明,僅有15%企業(yè)的知識管理運營成功。在研究和應(yīng)用過程中,二者都需要摒棄誤區(qū),選擇正確的應(yīng)用策略。
圖3 數(shù)據(jù)、信息和知識的區(qū)別與聯(lián)系
早期企業(yè)的知識管理,是以郵件及文檔數(shù)據(jù)庫為核心的辦公業(yè)務(wù)自動化管理,其重點在文檔管理,所面臨的信息量和數(shù)據(jù)量并不多。同時,信息和數(shù)據(jù)結(jié)構(gòu)多以結(jié)構(gòu)化數(shù)據(jù)為主。
隨著數(shù)據(jù)生產(chǎn)和存儲技術(shù)的進步,企業(yè)產(chǎn)生和存儲的數(shù)據(jù)激增且有加速增長的趨勢。其中,迅猛增長的圖像與視頻等豐富格式的數(shù)據(jù)和信息大量涌現(xiàn)??偭看蟆⒘髁看?、格式多樣及處理的及時性,要求企業(yè)的知識管理系統(tǒng)具備大容量、極高的運行速度和基于大數(shù)據(jù)思維的業(yè)務(wù)流程思考。
被匯總的海量數(shù)據(jù),其大部分都是機器自動搜集和組織的,且與傳統(tǒng)人工進行的搜集相比,價值密度會降低。但因數(shù)據(jù)和信息量呈幾何級數(shù)增長,海量數(shù)據(jù)中所蘊含的價值非常巨大,遠超價值密度低所帶來的負面影響。2014年,谷歌公司公布了在建的“知識庫”,其通過算法自動搜集網(wǎng)上信息,并利用機器學(xué)習(xí)把數(shù)據(jù)變成可用知識。
大數(shù)據(jù)時代的知識管理,不僅能夠替代人們自動地建設(shè)知識庫,還能像人類一樣具有智慧去思考和推理,并生產(chǎn)和組織知識。知識管理系統(tǒng)的智能化發(fā)展,將把人類從知識管理流程的低端階段中解放出來,從而更專注于高級知識的生產(chǎn)和應(yīng)用。
《孫子兵法》強調(diào)“不可勝在己,可勝在敵”。要做到“低成本、高效率”的運營以及決策正確,企業(yè)必須廣泛推行以事實為基礎(chǔ)的決策方法、大量使用數(shù)據(jù)分析來優(yōu)化企業(yè)的各個運營環(huán)節(jié)。這種競爭,就是一種基于數(shù)據(jù)的競爭。數(shù)據(jù)是信息的載體、知識的源泉,基于知識的競爭,也將集中表現(xiàn)為基于數(shù)據(jù)的競爭。
按照研究院年度工作要點進行“兩化”融合,加快構(gòu)建數(shù)字化、智能化制造能力體系。未來研究院科研生產(chǎn)將從傳統(tǒng)向“數(shù)據(jù)驅(qū)動”轉(zhuǎn)型升級,建立從總裝測試到零部組件制造全過程的容差分配體系;實現(xiàn)覆蓋產(chǎn)品設(shè)計、生產(chǎn)、試驗、測試全過程數(shù)據(jù)采集與管控;滿足型號產(chǎn)品質(zhì)量預(yù)判、問題快速定位、質(zhì)量優(yōu)化改進等需求。
從數(shù)據(jù)到知識。數(shù)據(jù)是對客觀世界的記錄,當我們對數(shù)據(jù)賦予背景時,它就成為信息;信息是知識的來源,當把信息提煉出規(guī)律的時候,它就上升為知識;知識是智能的基礎(chǔ),當電腦、網(wǎng)絡(luò)能夠利用某種知識作出自動識別,采取行動為人類服務(wù)時,機器智能就誕生了。
如何將數(shù)據(jù)、信息轉(zhuǎn)化為知識。數(shù)據(jù)變成知識一般需要4個轉(zhuǎn)化過程,如圖4所示。
一是構(gòu)建數(shù)據(jù)倉庫,這是決策支持系統(tǒng)面臨的一個“瓶頸”問題——多個不同運營信息系統(tǒng)產(chǎn)生的數(shù)據(jù)如何有機整合。通過專門的ETL(Extraction,Transformation,Load)工具,可以將來自企業(yè)內(nèi)外的不同運行平臺、編制語言、物理位置的系統(tǒng),如財務(wù)、人力、客戶管理系統(tǒng)等數(shù)據(jù)按照統(tǒng)一的格式提取出來,再進行清洗、轉(zhuǎn)換、集成,加載進入數(shù)據(jù)倉庫。
圖4 數(shù)據(jù)的轉(zhuǎn)化
二是聯(lián)機分析,也稱多維分析,是指把分立的數(shù)據(jù)庫“相聯(lián)”,進行多維度的分析。
三是數(shù)據(jù)挖掘,發(fā)現(xiàn)潛藏在數(shù)據(jù)表面之下的歷史規(guī)律并對未來進行預(yù)測。數(shù)據(jù)挖掘把數(shù)據(jù)分析的范圍從“已知”擴大到“未知”,從“過去”推向“將來”。
四是數(shù)據(jù)可視化,把海量數(shù)據(jù)中隱藏的知識展示出來,把復(fù)雜的數(shù)據(jù)轉(zhuǎn)化為直觀的圖形,呈現(xiàn)給最普通的用戶。
技術(shù)變革推動了社會變革,大數(shù)據(jù)在很大程度上改變了商業(yè)領(lǐng)域和體育運動領(lǐng)域的決策過程,但其它領(lǐng)域的應(yīng)用還處在一個開始的階段。
企業(yè)要實施數(shù)據(jù)驅(qū)動的決策方法,不僅需要新的技術(shù),還要改變目前的決策過程并施行制度創(chuàng)新。在大數(shù)據(jù)時代,傳統(tǒng)層層授權(quán)的縱向分級制與環(huán)環(huán)相扣的流程管理,基于層級的社會控制手段將不再適用,基于流程的管理方法也有很大的局限性。開放的數(shù)據(jù)和每一位員工之間都是等距的,而且中間沒有層級的過濾。數(shù)據(jù)的開放和流動,意味著知識的開放和流動、代表著權(quán)力的開放和流動,是多中心的、多水平的。用數(shù)據(jù)來決策、管理與創(chuàng)新,是一種進步,也是一種挑戰(zhàn)。
大數(shù)據(jù)是知識管理繞不開的時代主題,基于大數(shù)據(jù)技術(shù),需要重新定位知識管理的業(yè)務(wù)流程。積極應(yīng)用大數(shù)據(jù)的各類實用技術(shù),將推動知識管理提高綜合集成水平,提升運行水平和效率。大數(shù)據(jù)與知識管理系統(tǒng)的協(xié)同,如圖5所示。
1947年,卡內(nèi)基梅隆大學(xué)的赫伯特·西蒙教授出版了《行政組織的決策過程》。他指出人類的理性都是有限的,因此所有的決策都是有限理性的結(jié)果。這位天才科學(xué)家繼而提出,如果能利用存儲在計算機里的信息來輔助決策,人類理性的范圍將會擴大,決策的質(zhì)量就能提高。
圖5 大數(shù)據(jù)與知識管理系統(tǒng)的協(xié)同
質(zhì)量管理專家戴明說:“除了上帝,任何人都必須用數(shù)據(jù)來說話?!爆F(xiàn)代管理學(xué)之父德魯克說:“預(yù)測未來最好的辦法,就是去創(chuàng)造未來?!贝髷?shù)據(jù)的時代,意味著更精準、更高效、更智能的管理革命。未來,數(shù)據(jù)興則企業(yè)興,數(shù)據(jù)強則企業(yè)強?!?/p>