人工智能從1956年第一次提出來,已經(jīng)發(fā)展了63年多,最初的第一代人工智能是用計算機來解決問題,第二代是以AlphaGo為標(biāo)志的深度學(xué)習(xí),但是深度學(xué)習(xí)是基于真正的大數(shù)據(jù),在目前似乎也遇到了瓶頸,于是,科學(xué)家們提出了第三代人工智能,但是目前來看,還沒有人真正明確第三代人工智能是什么,但是其趨勢是清晰的。
人工智能的四大基礎(chǔ)是:知識、數(shù)據(jù)、算法和算力,回顧歷史,這四個因素都在不斷地發(fā)揮作用。第一代人工智能也叫符號人工智能,比較強調(diào)知識對智能的作用,因為那時算法和算力都還沒有跟上。
進入新世紀(jì)后,深度學(xué)習(xí)把大家的目標(biāo)凝聚到了數(shù)據(jù)上,這時大數(shù)據(jù)的出現(xiàn),再加上很好的算法,就形成了基于概念的深度學(xué)習(xí),再加上云計算等手段,使以數(shù)據(jù)為基礎(chǔ)的連接主義模型得到了極大推廣和應(yīng)用。
數(shù)據(jù)主義喊了許多口號,按照大數(shù)據(jù)建起來的人工智能系統(tǒng)似乎不可信、不可靠、不安全、不易推廣,這都是目前用深度學(xué)習(xí)進行人工智能研究帶來的問題。唯一的辦法,就是重新引入知識,把數(shù)據(jù)驅(qū)動和知識驅(qū)動結(jié)合起來,達(dá)成可信安全的第三代人工智能。
自然語言理解是人工智能領(lǐng)域最核心的問題。不管做機器翻譯也好,做自然語言應(yīng)用也好,都試圖通過分析符號序列來理解相關(guān)內(nèi)容,這是第一代人工智能所謂符號主義的核心做法。到了第二代人工智能,又走上深度學(xué)習(xí)的道路,這條路充滿希望,但又非常危險,因為解決不了可信安全的問題。
比如機器翻譯現(xiàn)在只能翻譯不重要的東西,因為翻錯了也沒有關(guān)系,真正重要的場合還需要人力同聲翻譯。機器最大的問題,就在于它缺乏常識,根本不知道自己不知道,這是一個很大的問題。
所以常識是必要的,簡單翻譯幾句話也需要大量常識積淀,“說你行,不行也行”,機器沒有常識,就很難理解這句話,人反而覺得很簡單,這就是常識的重要性。但常識庫的建立非常之難,現(xiàn)在沒法從數(shù)據(jù)中去建立常識庫,因為常識往往不表示在數(shù)據(jù)之中。
建立常識,必須下功夫去做,只有這個問題解決了,自然語言的理解才能達(dá)到目標(biāo)。而自然語言理解,則是第三代人工智能的終極目標(biāo),這是一個艱巨的任務(wù)。如果這個問題解決了,人工智能的其他問題將會迎刃而解。