米飆
2016年3月,打開今日頭條客戶端的用戶會看到這樣的頁面提示:“4億用戶的選擇,你關(guān)心的才是頭條?!?/p>
“每一屏五條新聞中會有兩三條我感興趣的內(nèi)容,就像定制的報紙一樣。別的客戶端新聞經(jīng)常不是自己感興趣的,得不停地翻屏找自己關(guān)心的東西,效率差。”像周帆這樣的互聯(lián)網(wǎng)從業(yè)者,瀏覽行業(yè)新聞是每天必做的功課,“今日頭條”就是他最常用的新聞客戶端,其他新聞客戶端都不會把他關(guān)心的事放到首頁。
憑借為用戶“定制”移動報紙,早在2012 年12 月31 日時,“今日頭條”的用戶總量就已經(jīng)接近1000萬,在新浪微博的日分享信息超過10 萬條。按照第三方網(wǎng)站App Annie 統(tǒng)計,在App store2012 年三季度的媒體類客戶端中,“今日頭條”排名第二,僅次于蘋果官方的“iBooks”,超越了“騰訊新聞”“搜狐新聞”等互聯(lián)網(wǎng)大佬。
其開發(fā)商北京字節(jié)跳動科技有限公司(以下簡稱“字節(jié)跳動”)創(chuàng)立不到一年就獲得了來自海納亞洲(SIG)以及華爾街著名經(jīng)濟學(xué)家、投資銀行家的首輪風(fēng)險投資,融資額達到500 萬美元。
今年29 歲的張一鳴,就是字節(jié)跳動的創(chuàng)始人。
從牛仔褲上的油漬上你很容易看出他是一個典型的技術(shù)宅男。出生于福建龍巖的張一鳴從高中時代起就酷愛計算機,2001 年進入南開大學(xué)先后就讀于微電子和軟件工程專業(yè)。他在大四時編寫的電路板自動化加工軟件PCBS 曾獲得過“挑戰(zhàn)杯”二等獎。
大學(xué)畢業(yè)后,張一鳴在一次短暫而失敗的創(chuàng)業(yè)后進入旅游搜索網(wǎng)站——酷訊。作為酷訊的第一個工程師,他全面負責(zé)酷訊的搜索研發(fā),一年后成為高級經(jīng)理,最終擔(dān)任技術(shù)委員會主席。2008 年張一鳴離開酷訊加入微軟,終因受不了低效率的工作方式離職。
2009 年初,國內(nèi)第一個微博網(wǎng)站飯否吸引了他,他開始擔(dān)任技術(shù)合伙人,負責(zé)飯否的搜索、消息分發(fā)、熱詞挖掘、防作弊、用戶排名等后臺系統(tǒng)方向的工作,為社交分析儲備了大量技術(shù)。
當(dāng)飯否被關(guān)閉之后,海納亞洲找上門來,希望出資由張一鳴創(chuàng)立一家房產(chǎn)信息網(wǎng)站,張一鳴由此創(chuàng)立九九房。在九九房,張一鳴開始涉足移動開發(fā),6 個月間推出掌上租房、掌上買房等5 款移動應(yīng)用,在當(dāng)時的移動互聯(lián)網(wǎng)環(huán)境下實現(xiàn)150 萬用戶,是房產(chǎn)類應(yīng)用的第一名。
“當(dāng)時覺得自己這么好的技術(shù)用在房產(chǎn)行業(yè)上太小了,就想做一家移動互聯(lián)網(wǎng)公司。”張一鳴由此辭去九九房CEO 職位創(chuàng)立了北京字節(jié)跳動。
移動互聯(lián)網(wǎng)的爭奪是流量的爭奪,而在用戶的主要入口中,瀏覽器、搜索、輸入法、社會化媒體、即時通訊工具等領(lǐng)域格局已經(jīng)基本確定。新聞客戶端是僅存的依然能誕生巨頭的戰(zhàn)場,也就成了移動互聯(lián)網(wǎng)的下一個必爭之地。
按照易觀國際《2012 年上半年新聞客戶端市場研究報告》,截至2012 年一季度,移動互聯(lián)網(wǎng)的4.5 億用戶中移動閱讀的活躍用戶就已經(jīng)達到3.45 億。而在移動閱讀使用者中,52.5% 的人經(jīng)常閱讀報紙類,39.8% 經(jīng)常閱讀資訊,新聞客戶端是他們獲取這兩類信息的主要入口。
在張一鳴看來,同其他基礎(chǔ)入口相比,新聞客戶端用戶滲透率高,無論國內(nèi)外,基本是App 第一應(yīng)用;使用頻率高,用戶甚至只有半分鐘空閑時間都會打開;留存度高,某款游戲會玩膩了,但資訊是長期需要,不會刪除的;有很高的可附加性,可以附加商業(yè)信息、生活信息、廣告,相比之下,鬧鐘等應(yīng)用雖然常用、留存度高但是沒有可附加性。
“今日頭條”新聞的有效性是其特點,哪怕只能用半分鐘等候電梯、只能打開客戶端首頁也能找到自己感興趣的新聞,而且同一天不同時間打開首頁新聞都會各不相同?!拔覀冎唤o你最想看的新聞,而不是那些你不關(guān)心的新聞?!?/p>
相比于新聞客戶端,張一鳴更愿意把“今日頭條”稱為是興趣媒體。當(dāng)搜狐、網(wǎng)易等新聞客戶端將門戶新聞直接搬到手機上,推送給用戶千篇一律的新聞時,“今日頭條”會甄別用戶的獨特需求,只推送那些單個用戶感興趣的新聞?!熬W(wǎng)站上都會講奧巴馬如何如何,實際上用戶更感興趣的可能是自己家門口的地鐵站發(fā)生了哪些事情?!?h3>“定制”你喜歡的
“今日頭條”這份移動報紙的“定制”可不是通過人工編輯出來的,而是通過一整套機器算法的資訊流水線來實現(xiàn)的?!氨举|(zhì)上我們跟搜狐新聞、網(wǎng)易新聞是兩碼事,他們更像是門戶新聞網(wǎng)站在移動端的延伸,更偏向于用傳統(tǒng)的方式做媒體,而我們是以技術(shù)實現(xiàn)一切,沒有人工編輯?!睆堃圾Q說。
“定制”的基礎(chǔ)是基于對用戶社交興趣的數(shù)據(jù)挖掘。當(dāng)用戶用新浪微博賬號初次登錄“今日頭條”時,他的興趣和閱讀偏好在5 秒之內(nèi)被分析出來,最感興趣的新聞隨即被推送到眼前。此后,隨著他在“今日頭條”頁面每一次的點擊閱讀、頂、踩、評論等閱讀動作,他的興趣被更精準(zhǔn)地分析出來,變得越來越懂他?!敖袢疹^條”不需要用戶自己思考“我喜歡什么”,而是主動去理解用戶“你的喜歡”。
對于“你的喜歡”的判斷來自三個層次:大家都喜歡的新聞(即通常意義的社會熱點)、興趣相近的好友喜歡的新聞和你會喜歡的新聞。而對于每條新聞評論的排序也很酷,優(yōu)先展示社交好友的評論,其次是社交網(wǎng)絡(luò)的意見領(lǐng)袖,而不是那些不加篩選的路人甲的評論。
“定制”背后的技術(shù)壁壘頗為復(fù)雜。來自于酷訊的搜索技術(shù)、來自于飯否的社交分析技術(shù)、來自于九九房的移動互聯(lián)網(wǎng)技術(shù)被張一鳴結(jié)合在了“今日頭條”之中。
用戶分析、搜索、推薦是“今日頭條”的技術(shù)三部曲。用戶分析的背后是大規(guī)模的數(shù)據(jù)挖掘和機器學(xué)習(xí)。“常見的用戶類型分析是手機型號,還有就是位置,在哪個城市。但是這個分析維度太低了。”張一鳴基于社交數(shù)據(jù)和用戶行為挖掘?qū)⑷朔譃樯先f個緯度,建立不同的模型。“這樣我們可以發(fā)現(xiàn)你歷史上的所有行為是‘小清新+ 科技還是‘三俗+ 古典。你最近從宅男變潮了,我們也會發(fā)現(xiàn)。我們都需要及時地進行大量的運算?!睆堃圾Q笑著說。這些用戶分析模型和維度也是由計算機自動搭建和計算的。基于社交數(shù)據(jù)和用戶行為挖掘技術(shù)來實現(xiàn)產(chǎn)品的公司,目前在國外做得比較好的有Zite、Prismatic等公司。
“在搜索技術(shù)上,國內(nèi)具有獨立研發(fā)搜索引擎的公司并不多,不超過5 家?!痹谒阉饕娼嗄甑膹堃圾Q說。同時,手機搜索同互聯(lián)網(wǎng)搜索相比有著不同的特點。通常用戶常常對使用電腦搜索精度要求不高,每頁20 條,結(jié)果不滿意就翻頁。而在使用手機時,由于時間短暫就要求高效,三條之內(nèi)必須有一個有用的結(jié)果。信息分析精度要求大大提高,需要盡量提取網(wǎng)頁內(nèi)容正文,去除網(wǎng)頁冗余信息,甄別同一內(nèi)容不同主題的文章,去掉重復(fù)。
在信息推薦上,使用互聯(lián)網(wǎng)搜索引擎時,不同用戶搜同一關(guān)鍵詞的展示結(jié)果一樣。而“今日頭條”則是每個用戶的每次請求都會更新?!斑@導(dǎo)致計算量很大,用戶一個小時前瀏覽了哪些內(nèi)容,在一小時后的搜索中就要考慮進去,并呈現(xiàn)出不同的結(jié)果?!睆堃圾Q說。
在新聞中會插入大量的圖片和視頻等多媒體信息,相應(yīng)會需要強大的多媒體搜索、去重技術(shù)。這是字節(jié)跳動的另一強項?!皣鴥?nèi)擁有多媒體處理技術(shù)的公司少于三家,已發(fā)布產(chǎn)品的只有兩家。同一個人同一個場景稍微動一下,對機器而言就意味著完全不同的圖片,怎么識別、去重很難?!睆堃圾Q很是自豪,字節(jié)跳動的圖片檢索精度能夠達到98% 以上。
從機器識別的角度看,張一鳴把信息歸納為五種,短文本、長文本、圖片、視頻和結(jié)構(gòu)化信息(例如商品,對它的描述需要同時包括文本、圖片等多維度信息)。實際上,張一鳴通過“今日頭條”搭建的并非只是一個新聞客戶端,而是一個可以全面處理這五種信息的“用戶分析+ 搜索+ 推薦”的技術(shù)平臺。
字節(jié)跳動已經(jīng)基本完成了這五種信息處理的技術(shù)儲備,并開始用產(chǎn)品的形態(tài)呈現(xiàn)出來。除去“今日頭條”之外,字節(jié)跳動旗下還有“內(nèi)涵段子”“搞笑囧圖”“內(nèi)涵漫畫”“好看圖片”“今晚必看視頻”等12 款應(yīng)用??傮w表現(xiàn)不俗,其中的“內(nèi)涵段子”在娛樂類排名一度超過唱吧。
截至2015年5月,與今日頭條合作的各類媒體、機構(gòu)總計約5000家,其中簽約合作的傳統(tǒng)媒體近千家,包括新華社、人民網(wǎng)、環(huán)球網(wǎng)、京華時報、新京報、參考消息、第一財經(jīng)日報、北京商報網(wǎng)、廣州日報、法制晚報、財經(jīng)網(wǎng)、VOGUE時尚網(wǎng)、南都娛樂周刊等。
“這個平臺無所謂搭載什么信息都可以。將來商業(yè)信息、生活信息、折扣信息都可以搭載。這會是一個商業(yè)價值介于門戶和搜索之間的巨大市場?!睆堃圾Q的野心不小,他相信當(dāng)“定制”折扣、“定制”吃貨等一系列定制信息出現(xiàn)時,一個巨大的商業(yè)市場由此呈現(xiàn)。