• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    當(dāng)前我國大數(shù)據(jù)與數(shù)據(jù)分析發(fā)展的研究

    2015-04-16 19:30:18徐達(dá)
    關(guān)鍵詞:輿情分析

    徐達(dá)

    (西南科技大學(xué)制造科學(xué)與工程學(xué)院,四川 綿陽 621000)

    當(dāng)前我國大數(shù)據(jù)與數(shù)據(jù)分析發(fā)展的研究

    徐達(dá)

    (西南科技大學(xué)制造科學(xué)與工程學(xué)院,四川綿陽621000)

    大數(shù)據(jù)是國內(nèi)外最熱門的研究方向之一。在大數(shù)據(jù)時(shí)代,人們身處的世界正在悄然改變。目前,我國大數(shù)據(jù)與數(shù)據(jù)分析已經(jīng)走出了初步理論探索階段,形成了初具規(guī)模的產(chǎn)業(yè)鏈。首先舉例分析近年來我國大數(shù)據(jù)分析在商業(yè)、輿情分析和醫(yī)療領(lǐng)域的發(fā)展以及已取得的成就,在此基礎(chǔ)上,總結(jié)了我國在大數(shù)據(jù)與數(shù)據(jù)分析行業(yè),在產(chǎn)業(yè)鏈、軟硬件條件、專業(yè)人才、數(shù)據(jù)資源和相關(guān)法律法規(guī)等方面所面臨的挑戰(zhàn)和機(jī)遇。

    大數(shù)據(jù) 大數(shù)據(jù)分析 發(fā)展現(xiàn)狀

    1 引言

    人類一直熱衷于對世界的探索,分析事物已知的形態(tài),發(fā)現(xiàn)其內(nèi)在規(guī)律,然后利用這一規(guī)律預(yù)測事物的未來發(fā)展。當(dāng)今互聯(lián)網(wǎng),信息爆炸,人們越來越難以獲取有效的關(guān)聯(lián)信息。大數(shù)據(jù)與數(shù)據(jù)分析幫助人類從海量和復(fù)雜的數(shù)據(jù)中提取互相關(guān)聯(lián)的信息。

    2011年著名調(diào)查公司麥肯錫在《大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)率的下一個(gè)前線》的研究報(bào)告中提出“大數(shù)據(jù)時(shí)代已經(jīng)到來”;2013年被業(yè)界人士稱為大數(shù)據(jù)元年。盡管人們對“大數(shù)據(jù)”的認(rèn)識千差萬別[1],但是其基礎(chǔ)技術(shù)架構(gòu)已經(jīng)形成,其發(fā)展成果已廣泛應(yīng)用于各個(gè)行業(yè)。

    2 大數(shù)據(jù)與數(shù)據(jù)分析應(yīng)用現(xiàn)狀

    2.1大數(shù)據(jù)成為企業(yè)的新資本

    “大數(shù)據(jù)為新財(cái)富,價(jià)值堪比石油”[2],數(shù)據(jù)日漸成為企業(yè)一項(xiàng)重要的資產(chǎn),大數(shù)據(jù)戰(zhàn)略已經(jīng)進(jìn)入到企業(yè)戰(zhàn)略層面。據(jù)IBM在2012年對全球95個(gè)國家,26個(gè)不同行業(yè)領(lǐng)域的1144名企業(yè)高管和專業(yè)人士的一項(xiàng)調(diào)查顯示,超過四分之一正在進(jìn)行大數(shù)據(jù)試驗(yàn)或已經(jīng)實(shí)施具體措施,全數(shù)意識到他們應(yīng)更多地利用大數(shù)據(jù)[3]。

    大數(shù)據(jù)時(shí)代的企業(yè)主要分為兩類:①數(shù)據(jù)服務(wù)的提供者:以英特爾、IBM和orcal為代表的數(shù)據(jù)分析服務(wù)提供商。他們有良好的軟硬件開發(fā)基礎(chǔ),為企業(yè)提供解決方案;②大數(shù)據(jù)服務(wù)的使用者:大數(shù)據(jù)分析具有實(shí)時(shí)和全面的特點(diǎn),分析結(jié)果往往極具價(jià)值,為企業(yè)決策、拓展市場和創(chuàng)新提供參考,其中最具代表性的是阿里金融,專為小微企業(yè)和初創(chuàng)業(yè)者提供小額信貸融資服務(wù)。自2010年6月成立,截至2014年2月,已經(jīng)有70余萬家小微企業(yè)通過阿里金融獲得融資。阿里金融使用大數(shù)據(jù)思維確認(rèn)客戶信息的真實(shí)性:對阿里集團(tuán)積累的客戶信用數(shù)據(jù)和行為數(shù)據(jù),以及稅務(wù)、海關(guān)和電力等第三方數(shù)據(jù)進(jìn)行分析。在此過程中,阿里金融建立了大量模型,通過云計(jì)算來篩查所得數(shù)據(jù)的有效性,給出客戶信用評價(jià)結(jié)果,并以此結(jié)果為依據(jù),向其提供貸款。在貸款過程中,阿里會持續(xù)監(jiān)控客戶數(shù)據(jù),明確貸款流向和產(chǎn)生的效益。如發(fā)現(xiàn)異常,就會啟動扣款機(jī)制。當(dāng)客戶出現(xiàn)壞賬時(shí),只要其信用評價(jià)是正面的,阿里還會提供補(bǔ)充幫助。

    這一在信貸評估方法的創(chuàng)新,改變了銀行業(yè)的游戲規(guī)則,為其自身和客戶創(chuàng)造了巨大利益。相較于傳統(tǒng)銀行的抵押擔(dān)保模式,阿里金融利大數(shù)據(jù)分析技術(shù),將貸款風(fēng)險(xiǎn)分散到貸款前、中、后三階段,有效地控制風(fēng)險(xiǎn),極大地提升了服務(wù)效率。金融業(yè)包括銀行業(yè)一項(xiàng)重視數(shù)據(jù)分析,但是傳統(tǒng)銀行業(yè)以自身的運(yùn)營數(shù)據(jù)為依托,這些數(shù)據(jù)往往不夠全面,跟不上時(shí)代變化,無法為決策提供更具說服力的支撐。

    2.2大數(shù)據(jù)分析技術(shù)提升輿情分析能力

    輿情分析是根據(jù)特定問題的需要,對針對這個(gè)問題的輿情進(jìn)行深層次的思維加工和分析研究,得到相關(guān)結(jié)論的過程。公共部門通過輿情分析掌握社會輿論走向,企業(yè)可以通過輿情分析獲取負(fù)面信息預(yù)警和競爭者情報(bào)等。

    如今,網(wǎng)絡(luò)成為輿情分析的主戰(zhàn)場,傳統(tǒng)媒體正在被互聯(lián)網(wǎng)所取代。據(jù)中國社會輿情與危機(jī)管理報(bào)告(2012),2011年微博首報(bào)輿情案例比例占比達(dá)到五分之一以上,連年遞增。截止2014年6月,我國網(wǎng)民規(guī)模已達(dá)6.32億,其中手機(jī)網(wǎng)民5.27億[4]。微博、微信和QQ等網(wǎng)絡(luò)社交平臺是網(wǎng)絡(luò)輿情重要檢測對象,所有的輿情分析平臺都有對微博、QQ群的檢測分析。

    目前應(yīng)用于網(wǎng)絡(luò)輿情分析主要有電子問卷調(diào)查、非結(jié)構(gòu)文本數(shù)據(jù)分析、語義識別和基于網(wǎng)絡(luò)日志的隱性輿情分析等基于大數(shù)據(jù)的技術(shù)[5]。電子問卷調(diào)查是基于互聯(lián)網(wǎng)的抽樣調(diào)查,所得結(jié)果簡單明了,適用于公眾對已知熱點(diǎn)事件的態(tài)度調(diào)查。非結(jié)構(gòu)文本數(shù)據(jù)分析針對網(wǎng)絡(luò)輿情數(shù)據(jù)中圖片和音視頻數(shù)據(jù)。語義識別是指計(jì)算機(jī)對自然語言的理解和生成,計(jì)算機(jī)需要語義識別系統(tǒng)才能對自然語言做出響應(yīng)?,F(xiàn)階段對自然語言處理尚無成熟系統(tǒng),但是特定用途的語義識別系統(tǒng)已經(jīng)出現(xiàn),部分輿情分析軟件已經(jīng)具備面向中文和少數(shù)外文的語義識別功能。非結(jié)構(gòu)文本數(shù)據(jù)分析和語義識別技術(shù)可以實(shí)時(shí)監(jiān)測,發(fā)現(xiàn)熱點(diǎn),分析一段時(shí)間內(nèi)輿論走向。隱性輿情分析技術(shù)提高分析結(jié)果的精確度和正確度。網(wǎng)民在瀏覽網(wǎng)站時(shí)會在服務(wù)器留上不僅會留下點(diǎn)擊量數(shù)據(jù),還會留下IP、鼠標(biāo)停駐時(shí)間、鼠標(biāo)點(diǎn)擊的集中區(qū)域和瀏覽時(shí)間點(diǎn)等數(shù)據(jù)。他們來自于實(shí)時(shí)且海量的數(shù)據(jù)源,能夠真實(shí)地反映了信息到達(dá)率和吸引力大小、受眾興趣點(diǎn)和受眾人群特征等信息。

    2.3醫(yī)療

    我國醫(yī)療健康領(lǐng)域已經(jīng)意識到了大數(shù)據(jù)分析帶來的巨大機(jī)遇??傮w來說,其發(fā)展水平尚停留在擴(kuò)大數(shù)據(jù)采集渠道和體系構(gòu)架建立階段,我國三大互聯(lián)網(wǎng)公司BAT均在2014試水互聯(lián)網(wǎng)醫(yī)療領(lǐng)域。百度與北京市政府聯(lián)合推出的北京健康云,主打個(gè)性化的健康服務(wù)。將個(gè)人健康數(shù)據(jù)與百度的大數(shù)據(jù)資源結(jié)合,為用戶量身定制健康服務(wù)。阿里健康與中信21世紀(jì)合作,開拓藥品電商市場,欲借此建立中國最大最精準(zhǔn)的藥品數(shù)據(jù)庫。微信智慧醫(yī)療利用其在即時(shí)通信市場的優(yōu)勢,主打醫(yī)療資源整合,其解決方案貫穿整個(gè)患者就醫(yī)過程。截至2015年1月,全國已有近100家醫(yī)院通過微信公眾號實(shí)現(xiàn)移動化的就診服務(wù)和快捷支付,累計(jì)超過1 200家醫(yī)院支持通過微信掛號。

    數(shù)據(jù)分析在健康醫(yī)療領(lǐng)域的利用,對于提高醫(yī)療水平有著重要的意義。我國醫(yī)療領(lǐng)域長期資源分配不均,醫(yī)患關(guān)系緊張。大數(shù)據(jù)的應(yīng)用將會對現(xiàn)有醫(yī)療資源進(jìn)行有效整合,盤活醫(yī)院沉淀大量電子病歷,在提高就診效率、減少患者負(fù)擔(dān)和避免過度醫(yī)療方面有其重要意義。從長期來看,以大數(shù)據(jù)分析為基礎(chǔ)的醫(yī)療研究將為國民健康做出巨大貢獻(xiàn)。

    3 大數(shù)據(jù)行業(yè)發(fā)展的機(jī)遇與挑戰(zhàn)

    3.1大數(shù)據(jù)產(chǎn)業(yè)鏈初步形成

    大數(shù)據(jù)產(chǎn)業(yè)鏈可分為4個(gè)層級:數(shù)據(jù)產(chǎn)生與數(shù)據(jù)聚集、數(shù)據(jù)組織與管理層、數(shù)據(jù)分析層和數(shù)據(jù)應(yīng)用層[6]。經(jīng)過數(shù)年發(fā)展,我國大數(shù)據(jù)產(chǎn)業(yè)鏈基本形成。2012年,中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟成立,在實(shí)現(xiàn)產(chǎn)學(xué)研合作、標(biāo)準(zhǔn)制定和技術(shù)創(chuàng)新,產(chǎn)業(yè)的跨越式發(fā)展,推動培植世界領(lǐng)先的大數(shù)據(jù)技術(shù)、產(chǎn)品、產(chǎn)業(yè)和市場等方面有重要推動作用。全國首家大數(shù)據(jù)交易所,也將于2015 年5月在貴陽成立,這標(biāo)志著產(chǎn)業(yè)鏈基本形成。

    大數(shù)據(jù)產(chǎn)業(yè)鏈的形成可以提升數(shù)據(jù)價(jià)值,優(yōu)化資源分配,可以有效化解有數(shù)據(jù)的公司無法處理,需要數(shù)據(jù)的公司又沒有足夠的數(shù)據(jù)來源,具備分析數(shù)據(jù)能力的公司無處一展身手的怪圈。產(chǎn)業(yè)鏈發(fā)展初期由三大互聯(lián)網(wǎng)公司主導(dǎo);隨著行業(yè)規(guī)模擴(kuò)大的成熟,不斷有初創(chuàng)公司和轉(zhuǎn)型公司加入,產(chǎn)業(yè)鏈內(nèi)的分工會越來越細(xì)化。

    3.2軟硬件基礎(chǔ)技術(shù)助推大數(shù)據(jù)產(chǎn)業(yè)發(fā)展

    大數(shù)據(jù)得益于國內(nèi)基礎(chǔ)網(wǎng)絡(luò)全面發(fā)展,以及計(jì)算機(jī)技術(shù)全面發(fā)展,使得大數(shù)據(jù)運(yùn)算成為可能。諸如Hadoop和mapcover等能夠?qū)Υ罅糠墙Y(jié)構(gòu)化數(shù)據(jù)進(jìn)行高速處理的軟件技術(shù)均采用開源模式。技術(shù)壁壘少,國內(nèi)相關(guān)研究起步較快,商業(yè)應(yīng)用上取得了很大成果;但起步時(shí)間較晚,在基礎(chǔ)研究領(lǐng)域還是處于落后地位。

    大數(shù)據(jù)重要來源——感知數(shù)據(jù),大部分來自于物聯(lián)網(wǎng)中各種傳感器等自動化設(shè)備。在物聯(lián)網(wǎng)中,物與物和物與人,通過物聯(lián)網(wǎng)相互連互通,這使得更加數(shù)據(jù)資源面廣泛。大數(shù)據(jù)分析需要進(jìn)行大量運(yùn)算,只有少數(shù)公司具備這樣的實(shí)力。隨著云計(jì)算技術(shù)的興起,使沒有計(jì)算環(huán)境的企業(yè),也可以通過云計(jì)算技術(shù)獲得強(qiáng)大的運(yùn)算能力。如此既避免了硬件資源閑置,也使更多公司可以進(jìn)行大數(shù)據(jù)的分析。

    3.3專業(yè)從業(yè)人員缺乏

    人才缺乏是全球大數(shù)據(jù)與數(shù)據(jù)分析行業(yè)面臨的共同挑戰(zhàn)之一。自2013年開始,英美等過開始培養(yǎng)大數(shù)據(jù)人才,國內(nèi)高校也相繼開始大數(shù)據(jù)人才培養(yǎng)。2014年,復(fù)旦大學(xué)開設(shè)數(shù)據(jù)科學(xué)工程碩士和博士學(xué)位;人民大學(xué)、北京大學(xué)等高校開設(shè)大數(shù)據(jù)分析碩士學(xué)位;2015年,清華大學(xué)開設(shè)大數(shù)據(jù)碩士學(xué)位。大數(shù)據(jù)人才的培養(yǎng)受制于培養(yǎng)周期限制,而人才短板制約著技術(shù)進(jìn)步與應(yīng)用,所以人才儲備缺乏制約著我國大數(shù)據(jù)產(chǎn)業(yè)初期的發(fā)展[7]。

    3.4政府?dāng)?shù)據(jù)源仍然缺乏共享

    豐富的數(shù)據(jù)源是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的基礎(chǔ)。政府部門掌握大量優(yōu)質(zhì)數(shù)據(jù)資源,理應(yīng)在數(shù)據(jù)資源開放中作出表率。美國政府早在2009年《透明和開放政府備忘錄》中就明確提出“聯(lián)邦信息就是全民的信息”,要求各級政府應(yīng)用現(xiàn)代技術(shù)開放政府信息,而我國數(shù)字化的數(shù)據(jù)資源總量遠(yuǎn)遠(yuǎn)低于美歐,而且沒有相關(guān)法律法規(guī)的實(shí)施細(xì)則明確政府?dāng)?shù)據(jù)開放責(zé)任,導(dǎo)致政府?dāng)?shù)據(jù)整體開放程度較低。

    這一現(xiàn)狀正在改變,在全國性的產(chǎn)業(yè)結(jié)構(gòu)轉(zhuǎn)型浪潮中,數(shù)據(jù)資源的的價(jià)值被放大,各級政府逐步將數(shù)據(jù)開放納入發(fā)展規(guī)劃。上海市走在全國政府?dāng)?shù)據(jù)對外開放的前列,根據(jù)《2014年度上海市政府?dāng)?shù)據(jù)資源向社會開放工作計(jì)劃》,上海已開放190項(xiàng)數(shù)據(jù)內(nèi)容,涉及交通、教育、金融和環(huán)境等11個(gè)領(lǐng)域。

    3.5相關(guān)法律法規(guī)缺失

    我國相關(guān)法律法規(guī)缺失表現(xiàn)在兩方面,一方面欠缺推動數(shù)據(jù)公開的動力,另一方面公眾對隱私保護(hù)的擔(dān)憂。2個(gè)方面相互牽制,任何一方失調(diào)都會連帶影響另一方。現(xiàn)有的文獻(xiàn)對大數(shù)據(jù)時(shí)代政策法規(guī)層面做過一些研究,也提出過解決方案,但是基本停留在隱私保護(hù)和數(shù)據(jù)主權(quán)等理論方面,并沒有就大數(shù)據(jù)時(shí)代數(shù)據(jù)分析技術(shù)發(fā)展相結(jié)合。

    以網(wǎng)絡(luò)爬蟲技術(shù)為例,這是一種可以自動抓取網(wǎng)頁信息的技術(shù)。網(wǎng)站通過“網(wǎng)絡(luò)爬蟲排除標(biāo)準(zhǔn)”這一協(xié)議,聲明站點(diǎn)中哪些數(shù)據(jù)可以被自動抓取,哪些數(shù)據(jù)受到保護(hù)不希望被抓取。自動收集受保護(hù)的文件則是侵權(quán)行為,這種協(xié)議是機(jī)器與機(jī)器的約定,而人設(shè)定機(jī)器是否突破這一約定。這一情況在數(shù)據(jù)分析技術(shù)中廣泛存在,這就要求在獲取篩選數(shù)據(jù)階段要受到監(jiān)管和限制,如此方能有效保護(hù)各方利益。

    為了獲得大數(shù)據(jù)服務(wù)帶來的好處,我們不可避免地分享個(gè)人數(shù)據(jù),例如前文提到的“在服務(wù)器日志上留下的瀏覽數(shù)據(jù)”。對于大眾來說,很難追蹤到自己的某一瀏覽數(shù)據(jù)儲存在哪里,被分享給誰,用于何種用途,他們對這類數(shù)據(jù)喪失了控制權(quán),這樣的數(shù)據(jù)交易方式是否合法我國尚無明確界定。因此對處于大數(shù)據(jù)產(chǎn)業(yè)鏈下游各方,比如數(shù)據(jù)分析者和數(shù)據(jù)利用者的規(guī)范也有待加強(qiáng)。

    4 結(jié)束語

    本文介紹大數(shù)據(jù)與數(shù)據(jù)分析近幾年在商業(yè)、輿情分析和醫(yī)療健康方面的發(fā)展現(xiàn)狀,并以此為基礎(chǔ),分析了我國大數(shù)據(jù)行業(yè)目前面臨的機(jī)遇與挑戰(zhàn)。可以看出,我國大數(shù)據(jù)的發(fā)展之快超越了之前每一次計(jì)算機(jī)技術(shù)革新,全行業(yè)面臨的機(jī)遇和挑戰(zhàn)也從發(fā)展初期單純的技術(shù)架構(gòu)層面變得更加廣泛而多變。

    [1]鐘瑛,張恒山.大數(shù)據(jù)的緣起、沖擊及其應(yīng)對[J].現(xiàn)代傳播(中國傳媒大學(xué)學(xué)報(bào)),2013,35(7):104-109.

    [2]鄔賀銓.大數(shù)據(jù)時(shí)代的機(jī)遇與挑戰(zhàn)[J].求是,2013(4):47-49.

    [3]張平.大數(shù)據(jù)如何在企業(yè)落地生根—訪IBM大中華區(qū)全球企業(yè)咨詢部謝國忠[J].企業(yè)管理,2013(7):106-110.

    [4]中國互聯(lián)網(wǎng)絡(luò)信息中心.第34次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告[J].互聯(lián)網(wǎng)天地,2014(7):71-89.

    [5]唐濤.基于大數(shù)據(jù)的網(wǎng)絡(luò)輿情分析方法研究[J].現(xiàn)代情報(bào),2014,34(3),3-11.

    [6]迪莉婭.我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展研究[J].科技進(jìn)步與對策,2014 (4):56-60.

    [7]吳薛.產(chǎn)業(yè)生態(tài)圈視角下大數(shù)據(jù)產(chǎn)業(yè)集群培育的研究-以蘇州為例[J].常州大學(xué)學(xué)報(bào):社會科學(xué)版,2015,16(1):57-62.

    Research on Latest Development of Big Data and Big Data Analysis in China

    XU Da
    (College of Manufacturing Science and Engineering,Southwest University of Science and Technology,Mianyang Sichuan 621000,China)

    Big data is one of the most popular research directions at home and abroad.At present,in China,big data and big data analysis have moved out of the preliminary theoretical exploration stage,and formed a close industrial chain.The paper introduces what big data analytics achieved in business,public opinion analysis and medical field.Based on it,the paper summarizes challenges and opportunities of big data industry development in terms of the industrial chain,software and hardware conditions,professional workers,data resources,laws and regulations.

    big data;big data analysis;development

    TP274

    A

    1008-1739(2015)17-68-3

    定稿日期:2015-08-12

    猜你喜歡
    輿情分析
    隱蔽失效適航要求符合性驗(yàn)證分析
    電力系統(tǒng)不平衡分析
    電子制作(2018年18期)2018-11-14 01:48:24
    數(shù)字輿情
    電力系統(tǒng)及其自動化發(fā)展趨勢分析
    輿情
    中國民政(2016年16期)2016-09-19 02:16:48
    輿情
    中國民政(2016年10期)2016-06-05 09:04:16
    輿情
    中國民政(2016年24期)2016-02-11 03:34:38
    每周消費(fèi)輿情
    中西醫(yī)結(jié)合治療抑郁癥100例分析
    在線教育與MOOC的比較分析
    渑池县| 吕梁市| 宣恩县| 仪征市| 柏乡县| 四子王旗| 横山县| 鲁山县| 屏边| 板桥市| 阿鲁科尔沁旗| 红原县| 秭归县| 普宁市| 襄城县| 兴义市| 二连浩特市| 韩城市| 招远市| 大荔县| 镶黄旗| 甘泉县| 含山县| 盐源县| 吉木乃县| 正阳县| 谢通门县| 巴彦县| 永安市| 石狮市| 道真| 抚远县| 普兰县| 新蔡县| 蒙城县| 句容市| 长丰县| 临猗县| 长岭县| 扬州市| 杭锦后旗|