賀文
“激活”隱藏于民間的“名師經(jīng)驗”,變成被系統(tǒng)算法理解的語言,讓數(shù)據(jù)工程師實現(xiàn)“所有的知識點都可以被算法理解”等,這是論答正在做的人和機器的整合。
傳統(tǒng)教育模式嚴重依賴老師。論答的創(chuàng)始人兼CEO王楓博士認為,傳統(tǒng)模式下的優(yōu)秀教育機構,有一個好老師開一個班,從經(jīng)營的角度來講非常值得尊重。但優(yōu)質的教育資源總是稀缺的,好老師不是一蹴而就能培育出來的。這種供需之間的強烈反差,使得在線教育領域在2013年、2014年時成為資本眼里的寵兒,一批創(chuàng)業(yè)公司獲得資本青睞。
到2016年時,教育科技市場的創(chuàng)投整體趨冷,全球在線教育投資明顯放緩,資本的流向也更為謹慎和理性,在中國少有繼續(xù)保持高熱度的領域是在線英語口語學習。王楓認為,這個垂直領域正好踩在在線教育的三大優(yōu)勢的交集上——可獲得性、靈活性、價格優(yōu)勢,并且將其發(fā)揮到極致。
即便是這種持續(xù)“高能”的在線教育領域,王楓認為,短板依然明顯,沒有好的互動和反饋。而這正是傳統(tǒng)概念上的“好老師”最寶貴的地方——盡可能快的找到不同學生的學習問題,針對性地進行教學。
在回國創(chuàng)業(yè)之前,王楓已經(jīng)在美國從事在線教育研究與管理工作12年有余。2016年,歸國后的王楓和搭檔馬鎮(zhèn)筠博士一起創(chuàng)立“論答”,他們希望找到一種方式,能從根本上解決教育領域“依賴老師”的難題,他們相信,論答這套自適應學習系統(tǒng)能夠在未來創(chuàng)造成百上千萬個好老師。
高下之分
王楓喜歡從“論答”的名字說起,“Learnta”,Learn是學習、t是Technology技術、a是Analytics數(shù)據(jù)分析。公司的名字很好地傳遞了他們創(chuàng)業(yè)的使命和目標,專注于學習技術與大數(shù)據(jù),讓每一個孩子學習得更有效。
自適應學習是人工智能在教育領域的垂直應用。自適應學習系統(tǒng)的概念,在中國在線教育領域不算新鮮。教育行業(yè)有很多人都在說做自適應學習,“但其實這里面也是分層級的?!蓖鯒髡J為,如果是預先制定的規(guī)則的話,這其實是非常初期的自適應。
他介紹,論答的自適應系統(tǒng)與其他自適應系統(tǒng)最大的差別是,系統(tǒng)做出判斷是基于非常強大的數(shù)據(jù)運算,而不是按照預先制定的規(guī)則,“論答的自適應學習系統(tǒng)后臺是基于復雜的人工智能算法?!庇悬c兒像AlphaGo下圍棋,它不斷在推算在哪個格子里落子最終能夠贏棋的概率最高。論答的學習推薦系統(tǒng)不斷分析下一步學習什么知識點和內(nèi)容,可以讓每位學生能最高效地掌握所有相關知識。
以論答已經(jīng)完成產(chǎn)品化的初中數(shù)學為例,在初中數(shù)學應試教育的應用場景上,論答團隊把整個初中數(shù)學的知識圖譜總共分拆為181個大的知識點和超過1000個細分知識點。每個知識點有2種可能的情況,掌握、沒掌握;對于181個知識點來講,所有掌握與沒掌握的可能狀態(tài)是2的181次方種。這是什么概念?世界上不可能有任何機器在沒有算法的情況下把這所有的可能都算出來。
論答的自適應學習引擎要精準地定位每位學生在初中數(shù)學的每一個知識點上到底掌握得好或不好,不能靠預先設定幾個規(guī)則來解決,這后面一定要通過算法進行優(yōu)化,包括知識空間理論、貝葉斯理論等。論答的自適應學習系統(tǒng)已經(jīng)可以做到在24分鐘內(nèi)精準判斷每一位學生在中考代數(shù)所有知識點的掌握程度,而如果是通過傳統(tǒng)在線系統(tǒng)學習的話,要達到同樣的判斷精準度,則至少需要11個小時。
王楓進一步舉例,初中數(shù)學里“一元一次方程”和“二元一次方程”這兩個知識點是強關系型的,但初中英語里“不定冠詞”和“名詞的單復數(shù)”這兩個知識點就不是強關系型,在算法上數(shù)學學習系統(tǒng)和英語學習系統(tǒng)是有差別的。
王楓一直強調(diào)一個觀點,對于人工智能學習引擎來說,光有引擎是不夠的,還要有應用?!八惴ㄒ到y(tǒng)結合起來,要跟內(nèi)容(包括知識圖譜、題目、視頻等)匹配”,引擎兩端“輸入和輸出之間有很多的變量在影響?!?/p>
這也是為什么王楓他們認為,將美國已經(jīng)成熟的大數(shù)據(jù)人工智能應用于教育領域的ALEKS測評系統(tǒng)直接照搬到中國來,非常不適宜。它沒有對中國市場優(yōu)化的內(nèi)容;國外的一些系統(tǒng)在中國能不能運用起來,還需要實踐檢驗,更需要在應用的過程中不斷優(yōu)化。
“以數(shù)學為例,我們的系統(tǒng)里用了大量的知識圖譜,由我們的內(nèi)容專家名師團隊花很長時間跟著數(shù)據(jù)科學團隊一起做出來,中間不斷調(diào)試,一般要花兩到三月才能做出一個學科的知識圖譜。”王楓介紹,論答的做法是由聯(lián)合創(chuàng)始人、首席數(shù)據(jù)科學家馬鎮(zhèn)筠帶領數(shù)學科學團隊,和論答的內(nèi)容專家一起花很長時間打磨知識圖譜和相關的算法,這里面有大量復雜的幕后工作。
馬鎮(zhèn)筠介紹,直接把國外自適應算法或產(chǎn)品搬到中國十分不妥,不只是中美教育的差異,僅在中國,各個學科之間的差異性也很大,比如數(shù)學和英語所適用的算法差異比較大,再比如英語閱讀、詞匯和語法所用的算法又不一樣。
機器老師的“教感”
最好的算法其實沒有開發(fā)出來的。這是王楓他們所信奉的。他們認為:對系統(tǒng)算法來說,大的數(shù)據(jù)量確實有可能帶來價值,但初期系統(tǒng)算法的數(shù)據(jù)量不夠大的時候,可以把名師經(jīng)驗整合進去,這樣對系統(tǒng)、對用戶同樣很有價值。就像AlphaGo學習名師棋譜獲得“棋感”一樣,論答的自適應學習系統(tǒng)通過學習名師的知識圖譜,獲得“教感”。更專業(yè)的解釋是:通過算法做到系統(tǒng)的“運算量可控,同時把信息的損失降到最低”。
美國孟菲斯大學心理系、計算機科學系、計算機工程系終身教授,華中師范大學心理學院院長胡祥恩曾經(jīng)分享過一個觀點:到目前為止我們想象的大數(shù)據(jù)是以計算機的形式存儲處理的,中國的教育歷史悠久,這樣的數(shù)據(jù)其實存在于民間,中國有多少名師,看看那些奧數(shù)比賽的輔導書,里面就隱含了非常多的經(jīng)驗,它事實上就是某種數(shù)據(jù),只是存在形式不一樣而已。
“激活”這些隱藏于民間的“名師經(jīng)驗”,變成能夠被系統(tǒng)算法理解的語言;讓內(nèi)容專家深刻地理解算法;讓數(shù)據(jù)工程師實現(xiàn)“所有的知識點都可以被算法理解”,這是王楓他們正在做的人和機器的有機整合。
在大數(shù)據(jù)、人工智能應用到產(chǎn)業(yè)這樣的交集領域,王楓認為最終較量的是誰能真正擁有一支強大的,包括學習技術專家、數(shù)據(jù)科學家、數(shù)據(jù)工程師、課程內(nèi)容專家在內(nèi)的研發(fā)團隊一起協(xié)作,有效地、有目的地去收集、處理、維護和應用海量的學習數(shù)據(jù),這才是教育大數(shù)據(jù)的根本。
他自信的是,論答團隊的核心成員均是各個領域的專家型人才。王楓也慶幸,現(xiàn)在回國在大數(shù)據(jù)、人工智能領域創(chuàng)業(yè),正遇上了好時機,“資本和人才已經(jīng)開始進入這個行業(yè)。”
2016年7月,王楓博士和弗吉尼亞大學校友馬鎮(zhèn)筠,在上海和紐約共同創(chuàng)辦論答(Learnta),專注于“人工智能 + 教育”,為中小學生提供優(yōu)質高效的在線輔導服務。同年9月獲得青松基金等數(shù)百萬元的天使輪投資,同年12月獲得東方富海領投的千萬級Pre-A輪融資,目前正在準備新一輪融資。
目前,論答已經(jīng)完成了初期的產(chǎn)品化,正在產(chǎn)品開始大規(guī)模商用之前。接下來,算法、內(nèi)容和系統(tǒng)之間將不斷的迭代、反饋和優(yōu)化。論答今年4月已經(jīng)推出兩大產(chǎn)品:“論答課堂”人工智能學習網(wǎng)站,為中小學生免費提供優(yōu)質教學視頻、精準測評和學習數(shù)據(jù)分析報告,以及高度互動的在線學習社區(qū);論答輔導,主要針對中小學生初中數(shù)學、英語進行個性化在線輔導,依托論答公司人工智能學習系統(tǒng),通過極速精準測評、學習內(nèi)容推薦和老師互動教學,達到快速提分的目的。
按照王楓的介紹,現(xiàn)在論答的自適應學習系統(tǒng)能夠完成優(yōu)秀老師30%~50%的工作。他同時也強調(diào),如果我們相信機器不能替代人,老師也不會被系統(tǒng)替代,比如監(jiān)督學生學習、有針對性的教學,組織分組學習和討論等工作,目前老師會做得更好。
“人工智能能夠做到什么?解決效率問題,對于論答這樣的自適應學習系統(tǒng)來說,它能夠在短時間內(nèi)精準地定位學生的問題出在哪兒,對癥下藥,比如通過學習路徑推薦算法,有針對性地引導學生怎么學,怎么解決問題?!蓖鯒髡J為,人工智能算法、大數(shù)據(jù)針對“有明確的學習目標”的領域最為有效,“但如果是想學成馬友友那樣的音樂家,這個比較困難,技術有它的局限性,尤其在創(chuàng)新和創(chuàng)造層面?!?/p>
他一直堅信:讓機器去做它擅長的事情,即它的運算能力、儲存能力和信息采集能力,針對有明確目標的任務;人的大腦不是硬件,人應該去做相對來說更模糊的,對學習來說是更高級的事情,像創(chuàng)造力、更高層次的思維能力、交流能力、領導能力,這些更應該讓人,而不是機器去做。