韋達(dá)韜
“這部電視劇會火。”
看到美劇《紙牌屋》發(fā)布的導(dǎo)演和主演名單時(shí),美劇擁躉李小偉作出了這個(gè)論斷。
不出所料,《紙牌屋》火了。
后來,李小偉認(rèn)識了《紙牌屋》熱映的幕后推手。
美國視頻網(wǎng)站Netflix擁有2700萬訂閱用戶,每天在網(wǎng)站產(chǎn)生3000多萬個(gè)網(wǎng)絡(luò)點(diǎn)擊量。在投資拍攝《紙牌屋》前,Netflix對這些海量數(shù)據(jù)進(jìn)行了分析,發(fā)現(xiàn)資深男星凱文·史派西和鬼才導(dǎo)演大衛(wèi)·芬奇點(diǎn)擊率頗高。于是,Netflix就將兩人納入《紙牌屋》的核心陣營。
“大數(shù)據(jù)成就了《紙牌屋》?!崩钚ン@嘆道。
他并不知道,大數(shù)據(jù)的光芒也正在照進(jìn)他的生活。
李小偉的堂弟今年高考,分?jǐn)?shù)有些尷尬,高不成低不就。
“志愿怎么填?”面對這個(gè)分?jǐn)?shù),堂弟開始撓頭。
統(tǒng)計(jì)數(shù)據(jù)顯示,每年落榜的考生中,有46%是由于填報(bào)志愿失誤導(dǎo)致——因此,填志愿也被人們比喻為“買彩票”。
無奈之下,堂弟找到李小偉,希望這個(gè)“過來人”給自己支支招。
李小偉第一個(gè)想法就是“百度”——當(dāng)年他填報(bào)高考志愿時(shí)就“百度”了不少信息,包括學(xué)校排名、概況、環(huán)境、住宿條件等。
點(diǎn)開百度,一個(gè)名叫“高校熱力圖”的高考志愿填報(bào)“神器”吸引了李小偉。
那是一幅建立在中國版圖上的虛擬高校分布圖,頁面上方布置有搜索引擎。
抱著試一試的心態(tài),李小偉啟動(dòng)了“神器”。
他在搜索框內(nèi)鍵入堂弟分?jǐn)?shù),選擇“文/理科”——電腦顯示器上出現(xiàn)了一系列推薦學(xué)校名稱。
他又點(diǎn)擊進(jìn)入了推薦學(xué)校子頁面,查看學(xué)校的報(bào)考熱度、競爭激烈程度等詳情。
查看良久,李小偉向堂弟推薦了一所競爭預(yù)測度為“弱”的學(xué)校。
“我不想上這個(gè)學(xué)校?!碧玫苡行┎粷M意,說出了自己傾心的一所學(xué)校。
輸入這所學(xué)校名稱,“神器”上立即顯示出“競爭激烈”,而且附上了詳細(xì)統(tǒng)計(jì)數(shù)據(jù)——堂弟的分?jǐn)?shù)絲毫不占優(yōu)勢。
“這個(gè)軟件靠譜么?”堂弟有些不甘心。
這個(gè)疑問也是李小偉的。于是,他去查詢了百度對這款產(chǎn)品的介紹。
“原來這就是‘大數(shù)據(jù)應(yīng)用啊?!崩钚タ戳T介紹,才知道這款產(chǎn)品為什么被考生們譽(yù)為“神器”。
原來,驅(qū)動(dòng)“神器”運(yùn)轉(zhuǎn)的,是兩個(gè)大數(shù)據(jù)模型——
一是難度預(yù)測模型,即主要結(jié)合年內(nèi)的搜索熱度、分?jǐn)?shù)線、往年的分?jǐn)?shù)線、往年的搜索熱度、今年考生的分?jǐn)?shù)分布等數(shù)據(jù)分布情況,預(yù)測不同院校的報(bào)考難度。
二是“臟數(shù)據(jù)”處理模型,即去除收集到的假數(shù)據(jù),避免對考生和家長造成誤導(dǎo),從而產(chǎn)生靠譜的預(yù)測。
面對大數(shù)據(jù)的“權(quán)威”,兩人服氣了。
現(xiàn)在,李小偉已經(jīng)能熟練運(yùn)用一些大數(shù)據(jù)產(chǎn)品了。有一次,他計(jì)劃到九寨溝旅游。但是通過百度的景區(qū)舒適度預(yù)測,他發(fā)現(xiàn)九寨溝景區(qū)的擁擠度為“高”,于是就選擇前往廣西,成功避開了人潮高峰。
“數(shù)據(jù)比直覺可靠?!睂τ诖髷?shù)據(jù)對生活的幫助,李小偉這樣形容。