本刊記者|石菲
2011年,我們通過Watson知道了認知計算。當時人們還不知道這項吸引眼球的新奇技術能做些什么,而隨著大數(shù)據(jù)和云計算時代的到來,認知計算的商業(yè)化轉化越來越值得期待。但非結構化數(shù)據(jù)的分析難度和中文語言的博大精深,讓認知計算在中國的應用變得難上加難。
女王范、實際、欣賞美、有條理,喜歡在人群當中處于支配地位,這是喜歡梅西的球迷的性格分析。這些數(shù)據(jù)來自于2014年世界杯期間社交平臺上的球迷討論。IBM和騰訊根據(jù)網(wǎng)絡媒體平臺及社交網(wǎng)絡上發(fā)布的海量公開信息及數(shù)據(jù),進行精準的大數(shù)據(jù)分析,獲得關于球迷話題、球迷類型、球迷個性分析等一系列洞察。
在和騰訊的合作中,為深度挖掘社交平臺上形式豐富的非結構化信息,提取有指導意義的洞察,IBM構建了社交大數(shù)據(jù)分析系統(tǒng),利用機器自學習方法和自然語言分析技術來傾聽網(wǎng)民的“心聲”。
其中用到四點關鍵技術。命名實體識別是指在處理非結構化數(shù)據(jù)時,不管球迷通過任何設備錄入信息,都有一些文字沒有標點符號,不同的短語在中文里有著不同的含義,需要IBM利用技術把人名、球隊名等識別出來,以便進一步的分析;話題檢測則用于幫助識別網(wǎng)友討論的話題;在理解球迷討論的話題后,利用語義情感分析可以判斷球迷的立場是支持還是否定,從而獲得球迷情感上的傾向;最后,社交平臺上聚集了眾多球迷,討論各種類型的話題,利用網(wǎng)絡關系抽取技術,對球迷集中討論的眾多話題進行綜合分析,從而將話題間真正有價值、有分析意義的內容關聯(lián)出來。
IBM大中華區(qū)全球信息服務部云計算服務總經(jīng)理余忠寧表示,“這個項目的技術熱點有兩方面,一方面是IT基礎架構的支持,SoftLayer可以為大數(shù)據(jù)的抓取提供最直接和最有力的支持,保證了實時、靈活、穩(wěn)固、可擴展的計算力支持。另一方面是認知層面的計算能力。只有讓計算機理解人類的語言,理解人類的行為,才能幫助客戶找到價值亮點和洞察未來的方向。IBM目前已經(jīng)可以讓機器像人一樣了解語言表面和語言底下的信息?!?/p>
近幾年社交媒體和移動互聯(lián)網(wǎng)的火爆使得人人都可以很方便地發(fā)表觀點,這些數(shù)據(jù)蘊藏著巨大的商業(yè)價值。社交媒體上的討論不僅體現(xiàn)了球迷對球隊和球員的關注,在深入挖掘后也可以為商家?guī)硇碌纳虣C。比如根據(jù)喜歡不同球星的球迷分類,精準定位哪位球星適合某一類商品的廣告代言。
就在前些日子,IBM收購了人工智能創(chuàng)業(yè)公司Cognea。Cognea開發(fā)了一個基于認知計算和對話的人工智能平臺,致力于為銀行呼叫中心等企業(yè)客戶提供能夠個性化對話的虛擬助手。在IBM提供的虛擬展示中,沃森只借助一份內部備忘錄就可以總結出一份虛構的公司戰(zhàn)略和決策算法,同時它還具備了語音控制功能。經(jīng)過與虛擬高管的多次對話,沃森不斷地縮小相關結果的內容,并最終得出一個結論。
認知計算的商業(yè)化應用也許會在不久后為我們帶來不可思議的變化。