記者/韓東起
時(shí)間記錄了夢(mèng)想的足跡,探索鐫刻了奮斗的崢嶸。在逐夢(mèng)的道路上,無(wú)論是急風(fēng)驟雨,還是孤夜寂寥,科研人總是披荊斬棘,埋首前行。在軟件工程國(guó)際頂級(jí)會(huì)議ASE 2021中斬獲最有影響力論文獎(jiǎng)的謝濤,對(duì)此深有感觸。
有人說(shuō),選擇了,就是一輩子。所以,謝濤前沿的研究想法和獨(dú)立的思考模式都圍繞著軟件工程徐徐展開(kāi)。他相信,唯有厚積薄發(fā),才能找到“真相”。
為了開(kāi)拓軟件工程科研探索的思路,謝濤選擇走出舒適區(qū),去美國(guó)學(xué)習(xí)深造?!奥袷滋剿?,是科研的日常,無(wú)論走到哪里,這一點(diǎn)都不會(huì)改變。”尋找課題,反復(fù)實(shí)驗(yàn),獲取反饋,主動(dòng)調(diào)整,在這樣的厚積薄發(fā)中,謝濤找到了科研探索的正確路徑,同時(shí),也積累了豐富的探索經(jīng)驗(yàn),“在未知中前行,需要可以依靠的工具,而知識(shí)和經(jīng)驗(yàn),就是這樣的工具?!?/p>
2005 年,謝濤提出用機(jī)器學(xué)習(xí)提高軟件質(zhì)量的方法和工具,并成為最早開(kāi)展智能化軟件工程研究的學(xué)者之一,十余年匆匆而過(guò),謝濤也已經(jīng)在軟件自動(dòng)化領(lǐng)域取得了不斐的成績(jī)。
作為科研人,謝濤是謙虛且低調(diào)的。自認(rèn)為天賦并非出類拔萃的他,把勤奮,動(dòng)腦,上進(jìn)心視為不停進(jìn)步的主要因素。通過(guò)不停的知識(shí)積累,不停的科研探索,不停的主動(dòng)思考,再加之不斷地追求卓越,各種因素的集合,成就了今天的謝濤。而其影響力主要體現(xiàn)在對(duì)學(xué)術(shù)和產(chǎn)業(yè)兩個(gè)方面。
一篇論文,能夠廣泛影響、啟發(fā)到學(xué)界業(yè)界同行的研究想法,那么,這篇論文就是一篇極具有學(xué)術(shù)影響力的論文。而謝濤第一時(shí)間想到的就是他在ASE 2007國(guó)際軟件工程頂會(huì)上發(fā)表的一篇論文《PARSEWeb: A Programmer Assistant for Reusing Open Source Code on the Web》,即,前面提到的獲得了ASE 2021 最有影響力論文獎(jiǎng)的論文。
謝濤
提起這篇論文,謝濤的眼中是滿滿的驕傲與自豪。他清楚的記得,論文的工作起源于2006年初。那時(shí)的他,開(kāi)始意識(shí)到把互聯(lián)網(wǎng)上的大規(guī)模開(kāi)源代碼充分利用起來(lái),能夠更好的完成工作。當(dāng)時(shí)“大數(shù)據(jù)”、“大代碼”等詞匯還沒(méi)有受到大眾的關(guān)注,人工智能、機(jī)器學(xué)習(xí)在軟件工程領(lǐng)域的應(yīng)用也很少,但作為軟件工程領(lǐng)域的前沿探索者,謝濤有著極為超前的敏感度。那篇論文就是一次很早期的引領(lǐng)性探索,創(chuàng)新總是格外備受關(guān)注,謝濤也因這篇論文及其后續(xù)工作,受到了學(xué)界的高度認(rèn)可。
眾所周知,科研是在探索中前行的,謝濤對(duì)軟件工程的研究也是連續(xù)性的。謝濤更早一點(diǎn)的相關(guān)成果是在MSR 2006 論文《MAPO: Mining API Usages from Open Source Repositories》中提出的MAPO 工具,并且后續(xù)與北大團(tuán)隊(duì)合作將它完善并發(fā)表在ECOOP 2009 國(guó)際會(huì)議上,其主要內(nèi)容是怎么用數(shù)據(jù)挖掘的方式來(lái)挖掘海量的開(kāi)源代碼,這兩篇MAPO論文的引用率也較高。
與學(xué)術(shù)相比,產(chǎn)業(yè)影響,更令謝濤關(guān)注。“實(shí)戰(zhàn),通常才是軟件工程科研工作中最終的檢驗(yàn)方式?!敝x濤在產(chǎn)業(yè)影響上,主要有兩個(gè)代表性科研成果。
2007 年起,謝濤和微軟雷德蒙德研究院(位于西雅圖)的兩位工程師合作研發(fā)的自動(dòng)化測(cè)試工具Pex,經(jīng)過(guò)深度研究和完善,2015 年,Pex 工具被微軟命名為IntelliTest(意指智能化測(cè)試)來(lái)進(jìn)行商用發(fā)布,成為微軟Visual Studio企業(yè)版的主要賣點(diǎn)之一。
成績(jī)屬于過(guò)去,探索才是未來(lái)。因此,謝濤的探索從未停歇。2011年,他與張冬梅博士(現(xiàn)微軟亞洲研究院常務(wù)副院長(zhǎng))領(lǐng)導(dǎo)的研究組合作開(kāi)展的軟件解析學(xué)(Software Analytics)研究,合作產(chǎn)出了一系列有高產(chǎn)業(yè)影響力的軟件解析學(xué)成果,并應(yīng)用到微軟內(nèi)部以及廣大軟件產(chǎn)業(yè)的實(shí)踐。值得關(guān)注的是,在2011年他們合作發(fā)表的《Software Analytics as a Learning Case in Practice: Approaches and Experiences》論文中,首次闡述了軟件解析學(xué)的定義,并用具體成果系統(tǒng)來(lái)示例如何開(kāi)展高影響力的軟件解析學(xué)研究。在國(guó)際上,他們的成果引起了極大的反響,目前,許多科研工作者都在該領(lǐng)域進(jìn)行探索。謝濤和張冬梅也因此獲得了2022年度軟件倉(cāng)庫(kù)挖掘奠基性貢獻(xiàn)獎(jiǎng)。
在延續(xù)的基礎(chǔ)上,創(chuàng)新。這就是現(xiàn)代科研的探索之路。在美國(guó)成績(jī)斐然的謝濤,一直關(guān)注著中國(guó)計(jì)算機(jī)的發(fā)展,“我要參與到祖國(guó)計(jì)算機(jī)的發(fā)展大潮中?!庇谑?,在2019年,謝濤載譽(yù)歸國(guó)。
回國(guó)后的他,還是延續(xù)之前的兩大方向,即軟件測(cè)試與軟件解析學(xué)。但他深知,科研要與社會(huì)發(fā)展相結(jié)合,與時(shí)代需求相結(jié)合。智能化軟件工程的研究,應(yīng)運(yùn)而生。
在探索過(guò)程中,謝濤十分注重推動(dòng)一些長(zhǎng)遠(yuǎn)、有較大挑戰(zhàn)的問(wèn)題,比如軟件自動(dòng)化,即自動(dòng)生成滿足給定軟件需求的代碼。而“面向智構(gòu)件的軟件開(kāi)發(fā)”就是他在朝著最終軟件自動(dòng)化目標(biāo)行進(jìn)途中推動(dòng)的創(chuàng)新研發(fā)方向。謝濤稱這個(gè)開(kāi)發(fā)過(guò)程為“搭積木”,即,用復(fù)用、組裝、集成“積木”(即軟件構(gòu)件)來(lái)進(jìn)一步提高軟件開(kāi)發(fā)效率。只是,很大一部分“積木”是由軟件自動(dòng)化去創(chuàng)建,不需要投入人力。但如何人機(jī)協(xié)作去做好“搭積木”,則需要謝濤團(tuán)隊(duì)進(jìn)一步深耕探索。
與此同時(shí),可信軟件工程是謝濤團(tuán)隊(duì)的另一個(gè)研究課題。比如,基礎(chǔ)軟件包括操作系統(tǒng)、編譯器、數(shù)據(jù)庫(kù)等在軟件系統(tǒng)里是極其關(guān)鍵的,如何保障它們的可信度?當(dāng)人機(jī)物融合的新型計(jì)算環(huán)境和應(yīng)用場(chǎng)景中包含有AI賦能系統(tǒng),如自動(dòng)駕駛、無(wú)人機(jī)等,怎么去保障系統(tǒng)整體的可信性?要解決這些問(wèn)題,不僅需要軟件測(cè)試,還需要形式化驗(yàn)證等技術(shù),而這些在大規(guī)模軟件上還未被突破的技術(shù),都需要謝濤團(tuán)隊(duì)深入研究后給出答案。
這就是謝濤,一位高瞻遠(yuǎn)矚的科研人。未來(lái)的他,將繼續(xù)埋首計(jì)算機(jī)領(lǐng)域,開(kāi)拓前行;將用更多的科研成果,為計(jì)算機(jī)科學(xué)的發(fā)展,添磚加瓦,貢獻(xiàn)力量。