張?zhí)锟?/p>
人工智能(AI)是人類進(jìn)入信息文明時(shí)代的標(biāo)配之一。2019年,在美國紐約大學(xué)現(xiàn)代人工智能研究所舉辦的第四屆年度AI Now研討會(huì)上,AI科學(xué)家總結(jié)了2019年的AI五大主題和內(nèi)容:面部和情感識(shí)別;從“AI偏見”到公正運(yùn)動(dòng);城市、監(jiān)控、邊境;勞動(dòng)力、工人組織與AI;人工智能對(duì)氣候的影響。其實(shí),對(duì)于監(jiān)控而言,AI不僅能監(jiān)控各種不法行為并打擊犯罪,它還有一種重要功能—參與學(xué)術(shù)打假。
2019年11月29日,首都醫(yī)科大學(xué)校長饒毅,寫信給國家自然科學(xué)基金委員會(huì)(NSFC)主任李靜海,對(duì)中國幾所高校和科研院所的教授和研究員論文造假進(jìn)行舉報(bào)。在此之前,美國斯坦福大學(xué)博士伊麗莎白·比克在國外學(xué)術(shù)交流在線平臺(tái)PubPeer上,質(zhì)疑南開大學(xué)校長的多篇論文存在圖像造假問題。學(xué)術(shù)不端行為是全球?qū)W術(shù)界和社會(huì)的一顆毒瘤,要清除這顆毒瘤需要各界共同行動(dòng)并采取各種有效手段。目前,學(xué)術(shù)打假之路充滿崎嶇和風(fēng)險(xiǎn),除了各國的法律和行政規(guī)定無法統(tǒng)一,且處罰輕重不一,對(duì)造假者形成不了有效阻遏外,還由于打假手段的技術(shù)局限,對(duì)學(xué)術(shù)造假的打擊非常有限。
對(duì)于學(xué)術(shù)不端行為,除了在法律和行政規(guī)定上對(duì)造假進(jìn)行更嚴(yán)厲的懲處,讓造假的成本大得足以震懾造假者外,還需要在打假的技術(shù)上有所作為,如讓AI參與學(xué)術(shù)打假,在事前進(jìn)行論文和科研資金的審核并協(xié)助事后的查處,建立起一個(gè)全面、立體的“學(xué)術(shù)高壓線”,或許能有效減少學(xué)術(shù)不端行為。
人工打假當(dāng)然是最重要的學(xué)術(shù)監(jiān)管,但是,人工打假也面臨以下問題:一是效率較低;二是打假者會(huì)受到報(bào)復(fù),可能會(huì)遇到人身安全問題。伊麗莎白·比克的打假就面臨這樣的問題。2016年,比克與另外兩位美國學(xué)者費(fèi)雷克·方和阿圖羅·卡薩德沃爾組成了打假團(tuán)隊(duì),審閱了自1995年以來在40種國際期刊上發(fā)表的2萬多篇帶圖生物醫(yī)學(xué)論文,其中有700多篇(約3.8%)涉嫌圖像復(fù)用或造假。比克以實(shí)名方式舉報(bào)或在網(wǎng)站上公布有問題的論文后,遭到了威脅。有些論文的作者在網(wǎng)上公布比克的家庭住址;有些被揭露有問題的論文作者會(huì)對(duì)打假者的雇主和資助者進(jìn)行“地毯式轟炸”,不斷發(fā)郵件,以恐嚇和勸阻打假者進(jìn)行下一步的打假;有些有問題的論文作者還會(huì)對(duì)打假者提起訴訟。在實(shí)際打假中,比克意識(shí)到,有些造假手段高超,難以識(shí)別,因此特別希望有精確識(shí)別功能的AI軟件給予幫助,以獲得明確答案。如果用AI圖片識(shí)別軟件打假,效率更高,效果會(huì)更好。如果AI鑒定出造假,再結(jié)合人工鑒定確認(rèn),就可以AI的鑒定為準(zhǔn),使得造假者無法遷怒于他人。
其實(shí),在饒毅提交舉報(bào)信之前,NSFC就考慮到采用AI來進(jìn)行評(píng)審和監(jiān)控學(xué)術(shù)不端行為,尤其是在科研基金申請(qǐng)上的造假。據(jù)NSFC的數(shù)據(jù),僅在2018年就評(píng)審了22.5萬份基金申請(qǐng),這個(gè)數(shù)量幾乎是美國國家科學(xué)基金會(huì)申請(qǐng)量的6倍,而且中國的基金申請(qǐng)數(shù)量還在不斷增加。在過去5年里,NSFC收到的科研基金申請(qǐng)數(shù)量以每年約10%的速度增長,但合格的審核(稿)人又極為欠缺。因此,NSFC被迫進(jìn)行創(chuàng)新,提出創(chuàng)建一個(gè)新的綜合性更強(qiáng)、更全面的AI系統(tǒng)來幫助審核科研基金的申請(qǐng)材料。這個(gè)AI系統(tǒng)將利用自然語言處理技術(shù)抓取在線科學(xué)文獻(xiàn)數(shù)據(jù)庫和科學(xué)家的個(gè)人網(wǎng)頁,收集申請(qǐng)者和潛在申請(qǐng)者的出版物或研究項(xiàng)目的詳細(xì)信息,再綜合人工審核,以判斷申請(qǐng)人是否造假,是否為某一科研基金的最佳申請(qǐng)者。
李靜海表示,希望這個(gè)工具能夠減少評(píng)審人評(píng)審時(shí)的偏見,因?yàn)樵谥袊胁簧倏茖W(xué)家試圖利用人脈關(guān)系來推動(dòng)他們的項(xiàng)目。這一問題在全球也普遍存在。瑞士國家科學(xué)基金會(huì)發(fā)現(xiàn),與基金會(huì)所推薦的審核者相比,申請(qǐng)人推薦的審核人認(rèn)可項(xiàng)目的可能性更大。但是,如果用AI審定,是不會(huì)被賄賂收買的。同時(shí),AI參與評(píng)審也很難受到造假者和利益方的威脅和報(bào)復(fù)。同樣,AI系統(tǒng)也可以用于論文的造假和作弊審查?,F(xiàn)在,知網(wǎng)的查重軟件就是中國人熟悉的監(jiān)控學(xué)術(shù)不端行為的AI軟件,可以說這是一個(gè)相當(dāng)有效的AI學(xué)術(shù)打假工具。2019年“演員翟天臨學(xué)術(shù)造假”風(fēng)波之后,教育部提出,將會(huì)投入800萬元來抽查當(dāng)年畢業(yè)的博士生和碩士生的畢業(yè)論文,其中博士論文的抽檢率約為10%,碩士論文的抽檢率約為5%。這其中,查重軟件的標(biāo)準(zhǔn)提升了,使用該軟件的檢查也增多了,說明AI參與學(xué)術(shù)打假開始顯露出成效。
世界著名學(xué)術(shù)出版商愛思唯爾也特別注重學(xué)術(shù)成果的打假,并積極研發(fā)、利用AI軟件來打假。早在2017年,愛思唯爾就研發(fā)了一套名為Evise的軟件來進(jìn)行論文的同行評(píng)審??偛课挥谌鹗柯迳5穆迳G把刂暎‵rontiers Media,是一個(gè)科學(xué)技術(shù)和醫(yī)學(xué)領(lǐng)域的學(xué)術(shù)出版商)也推出了AI軟件AIRA進(jìn)行審稿,并希望AI審稿能提升同行評(píng)審質(zhì)量。洛桑前沿之聲的做法是,先用AI軟件標(biāo)記有潛在問題的稿件,并告知下一步人工審核需要重點(diǎn)審核的內(nèi)容,從而使審查更加準(zhǔn)確。實(shí)踐表明,AI在抄襲檢查方面比人工檢查更高效。
AI參與打假和文件審查也并非僅限于科研領(lǐng)域,在其他領(lǐng)域,如法律方面也有廣泛應(yīng)用。LawGeex是美國一家利用AI進(jìn)行合同審查的公司,2018年3月,該公司與斯坦福大學(xué)、杜克大學(xué)等院校的法學(xué)教授合作,舉辦了一場(chǎng)AI與20名律師之間的業(yè)務(wù)競賽。競賽內(nèi)容是對(duì)5項(xiàng)保密協(xié)議進(jìn)行審查,并確定30個(gè)法律問題。結(jié)果AI的正確率為94%,律師的平均正確率為85%,而且AI效率極高,在26秒內(nèi)就能完成任務(wù),但律師平均需要花費(fèi)92分鐘才能完成任務(wù)。
當(dāng)然,也有人質(zhì)疑AI打假的準(zhǔn)確性,擔(dān)心其既傷害無辜,又放走了真兇。其中,最大的質(zhì)疑是:AI連自然語言的處理都還無法過關(guān),又如何能審核學(xué)術(shù)期刊和論文呢?另外,也有人懷疑AI系統(tǒng)會(huì)很快學(xué)習(xí)和復(fù)制人類思維和推理中根深蒂固的偏見,這對(duì)于論文審核是極其不公正的。不過,這些疑問都可以通過AI與人工審查相結(jié)合來解決,AI只是第一道關(guān)口,會(huì)大大加快和改善論文審查并發(fā)現(xiàn)問題,而且AI只是幫助人工查處和判斷造假,最終的結(jié)論還需要人工審核來做出。因此,未來AI打假與人工打假或?qū)徍讼嘟Y(jié)合,是一種必然的趨勢(shì)。
從現(xiàn)實(shí)需要看,科研領(lǐng)域的打假任重道遠(yuǎn),技術(shù)的創(chuàng)新和投入勢(shì)在必行,也大有可為。未來,無論是對(duì)于文字、數(shù)據(jù),還是圖片的篩查軟件都會(huì)有大量需求,這對(duì)于科研領(lǐng)域、出版商和獨(dú)立期刊有重大意義。人工和AI結(jié)合,會(huì)有力地阻遏科研不端行為,對(duì)于全社會(huì)都是一件幸事。