解本遠(yuǎn)
21世紀(jì)是大數(shù)據(jù)的時(shí)代。大數(shù)據(jù)給社會(huì)各個(gè)領(lǐng)域帶來(lái)了機(jī)遇和挑戰(zhàn),如何應(yīng)對(duì)這些機(jī)遇和挑戰(zhàn),這是理論界和實(shí)踐界必須思考的問(wèn)題。就科研誠(chéng)信建設(shè)而言,大數(shù)據(jù)使得科研不端治理呈現(xiàn)出與小數(shù)據(jù)時(shí)代不同的特點(diǎn),它既給科研不端治理提供了新的手段,也增加了對(duì)科研不端行為的治理難度。分析大數(shù)據(jù)在科研不端治理中的利弊影響,并提出有效的對(duì)策,這應(yīng)當(dāng)成為我國(guó)科研誠(chéng)信建設(shè)的一項(xiàng)重要任務(wù)。
20世紀(jì)80年代以來(lái),隨著科學(xué)研究與社會(huì)經(jīng)濟(jì)發(fā)展等因素的聯(lián)系日益密切,國(guó)內(nèi)外科研不端事件日益增多,涉及科學(xué)研究的各個(gè)領(lǐng)域和環(huán)節(jié)。進(jìn)入二十一世紀(jì),隨著信息化進(jìn)程的加快,科研不端事件呈積聚式增長(zhǎng),給科研誠(chéng)信建設(shè)帶來(lái)極大困難。而大數(shù)據(jù)技術(shù)的出現(xiàn)為科研不端的治理提供了更為有效的途徑。
科研信息的數(shù)據(jù)化為科研不端行為的識(shí)別提供了捷徑。在《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》一書中,作者舍恩伯格指出,大數(shù)據(jù)不是要實(shí)現(xiàn)數(shù)字化即可(“把模擬數(shù)據(jù)轉(zhuǎn)換成用0和1表示的二進(jìn)制碼”)①[英]維克托·邁爾·舍恩伯格、肯尼思·庫(kù)克耶:《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》,盛楊燕、周濤譯,浙江人民出版社2013年版,第104頁(yè)。,而是要實(shí)現(xiàn)數(shù)據(jù)化,即“把現(xiàn)象轉(zhuǎn)變?yōu)榭芍票矸治龅牧炕问降倪^(guò)程”,②[英]維克托·邁爾·舍恩伯格、肯尼思·庫(kù)克耶:《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》,盛楊燕、周濤譯,浙江人民出版社2013年版,第104頁(yè)。而數(shù)據(jù)化的核心就是要“量化一切”。③[英]維克托·邁爾·舍恩伯格、肯尼思·庫(kù)克耶:《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》,盛楊燕、周濤譯,浙江人民出版社2013年版,第105頁(yè)。如果科研信息沒(méi)有實(shí)現(xiàn)數(shù)據(jù)化,那么對(duì)科研不端行為的認(rèn)定需要耗費(fèi)大量的人財(cái)物,在科研不端行為較少的小數(shù)據(jù)時(shí)代,科研管理部門尚能承擔(dān)這一任務(wù),而在信息時(shí)代,需要進(jìn)行鑒定的科研行為呈幾何式增長(zhǎng),即使一篇科研論文也往往包含大量的數(shù)據(jù)和文字引用,如果沒(méi)有實(shí)現(xiàn)科研信息的數(shù)據(jù)化,對(duì)科研論文是否包含科研不端的認(rèn)定是困難的。而科研信息的數(shù)據(jù)化意味著大量的科研信息已經(jīng)被轉(zhuǎn)化為量化了的數(shù)據(jù),例如,一本書被錄入到某個(gè)數(shù)據(jù)庫(kù)中,這本書不僅實(shí)現(xiàn)了數(shù)字化,即讀者能夠閱讀這本書的電子版,而且實(shí)現(xiàn)了數(shù)據(jù)化,即讀者能夠用“識(shí)別數(shù)字圖像的光學(xué)字符軟件來(lái)識(shí)別文字的字、詞、句和段落”。④[英]維克托·邁爾·舍恩伯格、肯尼思·庫(kù)克耶:《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》,盛楊燕、周濤譯,浙江人民出版社2013年版,第110頁(yè)。這樣,與傳統(tǒng)時(shí)代要通過(guò)閱讀相關(guān)的文獻(xiàn)才能認(rèn)定某篇科研論文是否有抄襲行為相比,通過(guò)相應(yīng)的數(shù)據(jù)庫(kù)軟件來(lái)識(shí)別抄襲就成為一件簡(jiǎn)單得多的事情。英國(guó)諾丁漢特倫特大學(xué)的犯罪學(xué)家邁克·薩頓(Mike Sutton)教授于2014年出版《勿輕信人言:達(dá)爾文的重大秘密》一書,指出達(dá)爾文及華萊士在創(chuàng)立進(jìn)化理論的時(shí)候極有可能剽竊了另一位早期的博物學(xué)家帕特里克·馬修的自然選擇理論,卻聲稱之前并不知道這位學(xué)者的著作。邁克·薩頓的結(jié)論正是建立在大數(shù)據(jù)分析的基礎(chǔ)之上:通過(guò)分析谷歌圖書館、達(dá)爾文在線、達(dá)爾文通信項(xiàng)目等數(shù)據(jù)庫(kù)提供的相關(guān)信息,邁克·薩頓首先確定了在1831年帕特里克·馬修出版《造船木材及植樹(shù)》一書之后到1858年達(dá)爾文與華萊士共同發(fā)表關(guān)于物種起源的論文之前,一共有25人引用了馬修的著作,而在這25人中,有7個(gè)人是博物學(xué)者,而且其中的3個(gè)人(魯?shù)?、錢伯斯和塞爾比)為達(dá)爾文和華萊士所熟知,并知道他們正在從事物種起源問(wèn)題的研究。特別是“魯?shù)鞘聦?shí)上在1832年使用‘物種起源’一詞指稱馬修的原創(chuàng)性發(fā)現(xiàn),而‘物種起源’后來(lái)成為達(dá)爾文1859年同名著作的核心內(nèi)容”,⑤Mike Sutton:“The hi-tech detection of Darwin’s and Wallace’s possible science fraud”,the British Criminology Conference,Vol.14,p.54.這表明達(dá)爾文在1860年的《自然選擇》一文中所說(shuō)的話是不成立的:“我認(rèn)為沒(méi)有人會(huì)感到吃驚,我和其他的博物學(xué)者很明顯都沒(méi)有聽(tīng)說(shuō)過(guò)馬修先生的觀點(diǎn)”。⑥Mike Sutton:“The hi-tech detection of Darwin’s and Wallace’s possible science fraud”,the British Criminology Conference,Vol.14,P.50.因此,薩頓認(rèn)為,馬修極有可能通過(guò)魯?shù)堑炔┪飳W(xué)者影響了達(dá)爾文和華萊士,而當(dāng)達(dá)爾文和華萊士宣稱他們?cè)趧?chuàng)立自然選擇理論時(shí)并不知道馬修的觀點(diǎn)時(shí),他們極有可能實(shí)施了“科學(xué)欺詐”。⑦M(jìn)ike Sutton:“The hi-tech detection of Darwin’s and Wallace’s possible science fraud”,the British Criminology Conference,Vol.14,P.49.目前,通過(guò)數(shù)據(jù)庫(kù)軟件來(lái)鑒定科研不端中的抄襲行為已經(jīng)成為一種共識(shí)。在國(guó)內(nèi)知名的論文檢索網(wǎng)站,如知網(wǎng)、萬(wàn)方和維普都已經(jīng)建立了自己的論文檢測(cè)系統(tǒng)。而在國(guó)外,高校及科研組織通常使用PaperTest和Turnitin等檢測(cè)系統(tǒng)來(lái)識(shí)別論文的抄襲。
大數(shù)據(jù)技術(shù)確保了科研數(shù)據(jù)處理的全面性。在小數(shù)據(jù)時(shí)代,特別是在大規(guī)模數(shù)據(jù)庫(kù)尚未建立之前,人們的信息處理能力有限,對(duì)抄襲、剽竊、偽造等科研不端行為的發(fā)現(xiàn)主要依賴于相關(guān)領(lǐng)域的專家對(duì)科研文本的人工閱讀,這對(duì)科研不端行為的識(shí)別提出了很高要求:只有那些熟悉這一領(lǐng)域的專家才有可能、有資格對(duì)科研不端行為進(jìn)行鑒定??蒲泄芾聿块T很難對(duì)所有的科研成果進(jìn)行有效監(jiān)督,科研誠(chéng)信更多地需要依靠科研人員對(duì)科研規(guī)范的自覺(jué)遵守??蒲泄餐w往往將科研誠(chéng)信建設(shè)特別是科研不端行為的治理視為是科研共同體的內(nèi)部事務(wù),認(rèn)為共同體對(duì)科研人員的不端行為能夠?qū)崿F(xiàn)“自我糾錯(cuò)”,①[英]達(dá)里爾·E·楚賓、愛(ài)德華·J·哈克特:《難有同行的科學(xué):同行評(píng)議與美國(guó)科學(xué)政策》,譚文華、曾國(guó)屏譯,北京大學(xué)出版社2011年版,第132頁(yè)。進(jìn)而排斥來(lái)自科研共同體外部對(duì)科研不端行為的監(jiān)督。有學(xué)者甚至反對(duì)公開(kāi)討論科研不端事件,認(rèn)為這會(huì)損害科學(xué)在公眾中的形象。②中國(guó)科學(xué)院編:《科學(xué)與誠(chéng)信:發(fā)人深省的科研不端行為案例》,科學(xué)出版社2013年版,第11頁(yè)。因此,科研不端行為被發(fā)現(xiàn)的幾率并不高。而在大數(shù)據(jù)背景下,對(duì)科研不端行為的治理呈現(xiàn)出全面性的特點(diǎn)。一方面,治理科研不端行為已經(jīng)不再僅僅寄希望于科研共同體的自我監(jiān)督,國(guó)內(nèi)外大規(guī)??蒲行畔?shù)據(jù)庫(kù)的建立為科研不端行為的監(jiān)督提供了強(qiáng)大的數(shù)據(jù)支撐。這些數(shù)據(jù)庫(kù)較為全面地收入了國(guó)內(nèi)外各種科研成果,包括論著、論文和專利等,為治理科研不端提供了全面的數(shù)據(jù)支持。以中國(guó)知網(wǎng)為例,到2013年,知網(wǎng)已經(jīng)擁有各類文獻(xiàn)2億篇,題錄3億條,統(tǒng)計(jì)數(shù)據(jù)2.6億條,在知網(wǎng)平臺(tái)上每天有500多萬(wàn)次的檢索和300多萬(wàn)次的下載,數(shù)據(jù)量非常龐大。③張宏偉:《大數(shù)據(jù)出版“中國(guó)知網(wǎng)”的探索與實(shí)踐》,中國(guó)出版網(wǎng),2013年07月10日,http://www.chuban.cc/hw/rdjj/szcb5/zlttp/201307/t20130710_143284.html另一方面,這些龐大的數(shù)據(jù)庫(kù)不僅能夠?qū)σ呀?jīng)發(fā)表的科研成果進(jìn)行科研不端的鑒別,而且對(duì)尚未發(fā)表的科研成果也能夠進(jìn)行前期檢測(cè),進(jìn)而有效地減少科研不端事件的發(fā)生。以高校對(duì)大學(xué)生畢業(yè)論文的檢查為例,目前國(guó)內(nèi)高校已經(jīng)普遍要求研究生畢業(yè)論文須經(jīng)過(guò)防止科研不端行為的軟件的檢測(cè),論文符合規(guī)定后方能參加答辯。④例如,天津師范大學(xué)已經(jīng)于2012年3月專門出臺(tái)了《關(guān)于研究生學(xué)位論文查重工作的暫行規(guī)定》,對(duì)查重的依據(jù)、對(duì)象和程序進(jìn)行了明確規(guī)定。http://tjnufaxueyuan.blog.163.com/blog/static/1318322642013211102825979/因此,建立在大規(guī)模科研信息數(shù)據(jù)庫(kù)基礎(chǔ)上的檢測(cè)對(duì)科研不端行為的發(fā)生起到了有效的遏制作用。如全球第一個(gè)論文檢測(cè)網(wǎng)站Turnitin在高峰期每天能收到2萬(wàn)篇論文,成功阻止了600萬(wàn)學(xué)生和科研人員的抄襲。⑤凌冰、李渝:《反剽竊”在路上》,《中國(guó)新聞周刊》2009年第21期,第68頁(yè)。
大數(shù)據(jù)技術(shù)使得科研不端治理更有針對(duì)性。大數(shù)據(jù)時(shí)代,數(shù)據(jù)已經(jīng)越來(lái)越成為各行各業(yè)關(guān)注的焦點(diǎn)。無(wú)論是作為搜索巨頭的谷歌、電子商務(wù)領(lǐng)軍者的亞馬遜,還是作為軟件霸主的微軟,都力圖通過(guò)挖掘數(shù)據(jù)自身的價(jià)值,實(shí)現(xiàn)數(shù)據(jù)創(chuàng)新,從而在激烈的行業(yè)競(jìng)爭(zhēng)中立于不敗之地。舍恩伯格認(rèn)為,大數(shù)據(jù)的一個(gè)重要特點(diǎn)在于它重視數(shù)據(jù)的相關(guān)性,對(duì)相關(guān)性數(shù)據(jù)的獲取要比獲取事物的原因更為容易,當(dāng)很難分析造成某一現(xiàn)狀的原因或者在時(shí)間上不允許時(shí),分析相關(guān)性因素就顯得尤為重要?!按髷?shù)據(jù)的相關(guān)關(guān)系分析法更準(zhǔn)確、更快,而且不易受偏見(jiàn)的影響”,⑥[英]維克托·邁爾·舍恩伯格、肯尼思·庫(kù)克耶:《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》,盛楊燕、周濤譯,浙江人民出版社2013年版,第75頁(yè)。例如,在治理科研不端行為時(shí),如果造成科研不端行為的原因很復(fù)雜,大數(shù)據(jù)專家建議科研誠(chéng)信監(jiān)督者轉(zhuǎn)而去尋找與科研不端行為相關(guān)的因素,通過(guò)對(duì)相關(guān)因素的分析進(jìn)而找到治理科研不端的有效途徑。舍恩伯格認(rèn)為,大數(shù)據(jù)的核心就是基于相關(guān)關(guān)系的預(yù)測(cè),⑦[英]維克托·邁爾·舍恩伯格、肯尼思·庫(kù)克耶:《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》,盛楊燕、周濤譯,浙江人民出版社2013年版,第16頁(yè)。即通過(guò)分析相關(guān)數(shù)據(jù),對(duì)事物未來(lái)的發(fā)展趨勢(shì)做出相應(yīng)的預(yù)測(cè),從而使得相關(guān)組織的工作更有針對(duì)性和富有成效。大數(shù)據(jù)的預(yù)測(cè)功能對(duì)商業(yè)組織發(fā)展非常重要,對(duì)科研不端的治理同樣能夠發(fā)揮重要作用。如知網(wǎng)、萬(wàn)方、維普等中文期刊數(shù)據(jù)庫(kù)每天都會(huì)有為數(shù)眾多的數(shù)據(jù)庫(kù)用戶從網(wǎng)站上下載相關(guān)的科研文獻(xiàn),同時(shí)也會(huì)接受大量對(duì)科研論文(包括大學(xué)生的碩士和博士論文)進(jìn)行科研誠(chéng)信規(guī)范檢測(cè)的要求。用戶對(duì)數(shù)據(jù)庫(kù)的使用在網(wǎng)站上留下了大量信息,數(shù)據(jù)庫(kù)工作人員通過(guò)處理相關(guān)數(shù)據(jù),能夠獲取多方面與科研不端相關(guān)的信息:一是數(shù)據(jù)庫(kù)中被下載科研文獻(xiàn)的下載量、引用率及其所屬研究領(lǐng)域;二是進(jìn)行科研誠(chéng)信規(guī)范檢測(cè)的論文文本、作者及研究領(lǐng)域;三是涉嫌科研不端的科研論文的相關(guān)信息??蒲姓\(chéng)信管理部門可以依據(jù)這些信息對(duì)未來(lái)科研不端行為可能發(fā)生的熱點(diǎn)領(lǐng)域及重點(diǎn)人群進(jìn)行預(yù)測(cè),在進(jìn)行科研不端治理時(shí)就可以在資金投入方面向相應(yīng)的科研領(lǐng)域和科研人員進(jìn)行傾斜,以保證科研不端治理的投入能夠?qū)崿F(xiàn)有效產(chǎn)出。
毋庸置疑,大數(shù)據(jù)在科研誠(chéng)信建設(shè)中已經(jīng)越來(lái)越受到重視,大數(shù)據(jù)技術(shù)在治理科研不端方面的作用也日漸凸顯。但是大數(shù)據(jù)時(shí)代的科研不端治理難度也在加大,科研不端行為比以前更加隱蔽,基于大數(shù)據(jù)而產(chǎn)生的隱私問(wèn)題缺少制度監(jiān)管,同時(shí)大數(shù)據(jù)技術(shù)本身尚不完善,這些因素都對(duì)科研不端治理提出了新的挑戰(zhàn)。
大數(shù)據(jù)時(shí)代的科研不端行為更加隱蔽。大數(shù)據(jù)時(shí)代,信息量呈急劇增長(zhǎng)的態(tài)勢(shì)。根據(jù)美國(guó)政府發(fā)布的2014年全球大數(shù)據(jù)“白皮書”《抓住機(jī)遇,保存價(jià)值》,2011年,全球新生成的和復(fù)制的信息量估計(jì)超過(guò)了1.8 ZB(澤字節(jié));而在2013年,這一數(shù)字估計(jì)可達(dá)4 ZB。①美國(guó)白宮:2014年全球“大數(shù)據(jù)”白皮書,http://www.bairun.cc/News/Detail/256而科研信息量的增長(zhǎng)同樣令人矚目。在科研論文方面,以收集過(guò)刊論文的科研數(shù)據(jù)庫(kù)JSTOR(Journal Storage的簡(jiǎn)稱)為例,在1995剛創(chuàng)立時(shí),其數(shù)據(jù)化的科研論文數(shù)量?jī)H為75萬(wàn)頁(yè),②郭依群:《過(guò)刊全文數(shù)據(jù)庫(kù)JSTOR及其特色分析》,《情報(bào)理論與實(shí)踐》2003年第5期,第277頁(yè)。而在2012年,這一數(shù)量已經(jīng)超過(guò)4600萬(wàn)頁(yè)。③“Annual Summary”(PDF),JSTOR,http://about.jstor.org/sites/default/files/misc/JSTOR-Annual-Summary_2012_v6.pdf科研信息量的激增在為科研人員及高校大學(xué)生提供豐富科研資源的同時(shí),也為那些試圖通過(guò)實(shí)行科研不端行為而獲取個(gè)人利益的人提供了便捷,使得科研不端行為的發(fā)生率呈現(xiàn)上升趨勢(shì)。而在科研不端行為呈上升趨勢(shì)的同時(shí),科研不端行為也更加隱蔽。各種科研不端檢測(cè)軟件在阻止明顯的文字、數(shù)據(jù)抄襲的同時(shí),也使得那些意圖實(shí)施科研不端的人能夠通過(guò)檢測(cè)軟件對(duì)其科研成果中涉嫌科研不端的部分進(jìn)行修正,使其科研不端行為更加隱蔽,從而逃過(guò)科研不端檢測(cè),也增加了科研不端的檢測(cè)難度。
大數(shù)據(jù)技術(shù)尚不完善。大數(shù)據(jù)所帶來(lái)的挑戰(zhàn)一方面源于大數(shù)據(jù)本身的特點(diǎn),即大數(shù)據(jù)具有復(fù)雜性、不確定性和涌現(xiàn)性,使得“大數(shù)據(jù)的研究需要一套全新的理論和方法來(lái)進(jìn)行方向性的指導(dǎo)”。④王元卓、靳小龍、程學(xué)旗:《網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望》,《計(jì)算機(jī)學(xué)報(bào)》2013年第6期,第1127-1129頁(yè)。另一方面,在大數(shù)據(jù)挖掘的四個(gè)環(huán)節(jié),即數(shù)據(jù)收集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理和結(jié)果的可視化呈現(xiàn)中,大數(shù)據(jù)技術(shù)的運(yùn)用仍存在困難和挑戰(zhàn)。⑤鄔賀銓:《大數(shù)據(jù)時(shí)代的機(jī)遇與挑戰(zhàn)》,《求實(shí)》2013年第4期,第48頁(yè)。就科研不端的治理而言,大數(shù)據(jù)技術(shù)至少存在如下不足:目前基于大數(shù)據(jù)技術(shù)的科研不端檢測(cè)軟件往往局限于同一語(yǔ)言之間的不同文本是否存在科研不端問(wèn)題,而對(duì)于跨語(yǔ)言的科研不端行為往往束手無(wú)策。事實(shí)上,在已經(jīng)發(fā)生的諸多科研不端事件中,有不少是因?yàn)樵谑褂猛馕奈墨I(xiàn)上出現(xiàn)問(wèn)題而引起。馬丁·波特哈斯特等人在《跨語(yǔ)言的剽竊檢測(cè)》一文中探討了英語(yǔ)、德語(yǔ)、西班牙語(yǔ)、法語(yǔ)、荷蘭語(yǔ)和波蘭語(yǔ)等六種語(yǔ)言之間的跨語(yǔ)言剽竊檢測(cè)問(wèn)題。⑥Martin Potthast,Alberto Barrón-Cede?o,Benno Stein and Paolo Rosso:Cross-language plagiarism detection,Language Resources and Evaluation,Vol.45,No.1,Plagiarism and Authorship Analysis(Winter 2011),pp.45-62.但是針對(duì)中西不同語(yǔ)言之間的文本剽竊檢測(cè)尚未有實(shí)質(zhì)性進(jìn)展。2014年在學(xué)術(shù)界引起爭(zhēng)議的“北大博士于艷茹涉嫌抄襲被取消博士學(xué)位”事件中,于艷茹的論文“1775年法國(guó)大眾新聞業(yè)的‘投石黨運(yùn)動(dòng)’”涉嫌抄襲國(guó)外學(xué)者吉爾伯托的論文,⑦《國(guó)際新聞界》編輯部:《關(guān)于本刊作者于艷茹論文抄襲的公告》,2014年8月21日,http://www.acriticism.org/article.asp?Newsid=15961 & type=1000如果能夠?qū)崿F(xiàn)跨語(yǔ)言的科研不端檢測(cè),這一論文的抄襲行為就有可能被提前檢測(cè)出來(lái)。
基于大數(shù)據(jù)而產(chǎn)生的隱私問(wèn)題缺少制度監(jiān)管。自互聯(lián)網(wǎng)誕生以來(lái),隨著互聯(lián)網(wǎng)巨頭對(duì)海量信息的收集、儲(chǔ)存和使用,人們的隱私不可避免地受到威脅。為了保護(hù)人們的合法隱私,法律通常會(huì)要求數(shù)據(jù)收集者履行告知與許可義務(wù),也即是收集和使用數(shù)據(jù)時(shí)要征得個(gè)人同意,使其知曉數(shù)據(jù)的用途。但在大數(shù)據(jù)時(shí)代,“大數(shù)據(jù)的價(jià)值不再單純來(lái)源于它的基本用途,而更多源于它的二次利用”。①[英]維克托·邁爾·舍恩伯格、肯尼思·庫(kù)克耶:《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》,盛楊燕、周濤譯,浙江人民出版社2013年版,第197頁(yè)。在此背景之下,通過(guò)告知與許可、信息的模糊化與信息的匿名化等限制措施已經(jīng)不能夠有效地保護(hù)用戶的隱私。②[英]維克托·邁爾·舍恩伯格、肯尼思·庫(kù)克耶:《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》,盛楊燕、周濤譯,浙江人民出版社2013年版,第197-200頁(yè)。大數(shù)據(jù)時(shí)代的科研誠(chéng)信領(lǐng)域同樣存在個(gè)人隱私保護(hù)問(wèn)題。一方面,與美國(guó)等科研誠(chéng)信制度相對(duì)完善的國(guó)家相比,我國(guó)在治理科研不端方面尚未建立起完善的隱私權(quán)保護(hù)制度,特別是對(duì)科研不端嫌疑人的隱私權(quán)保護(hù)不夠,這極有可能使那些遭到科研不端指控但最終證明是清白的科研人員的科研生涯受到損害。③董興佩:《中美科研不端嫌疑人隱私權(quán)保護(hù)制度之比較》,《科學(xué)學(xué)研究》2012年第5期,第667頁(yè)。另一方面,即使科研誠(chéng)信制度特別是科研隱私保護(hù)制度相對(duì)完善的發(fā)達(dá)國(guó)家,其已有制度也無(wú)法適用大數(shù)據(jù)時(shí)代的科研隱私權(quán)保護(hù)。大數(shù)據(jù)的特點(diǎn)乃至優(yōu)點(diǎn)就在于大數(shù)據(jù)的再利用,如果數(shù)據(jù)不能夠二次利用,那么其價(jià)值將會(huì)大打折扣。但是對(duì)科研數(shù)據(jù)的再次利用應(yīng)當(dāng)制定什么樣的制度,才能確保既能充分實(shí)現(xiàn)大數(shù)據(jù)的價(jià)值,又能夠保護(hù)合理的科研隱私權(quán),這對(duì)科研誠(chéng)信建設(shè)而言尤為重要。
如前所述,大數(shù)據(jù)時(shí)代的科研不端治理呈現(xiàn)出明顯不同的特點(diǎn),大數(shù)據(jù)技術(shù)既為科研不端的治理提供了極大的便利,同時(shí)也提出了新的挑戰(zhàn),我們需要在科研不端治理中充分利用這一新技術(shù),同時(shí)對(duì)其進(jìn)行合理規(guī)約,以保護(hù)科研誠(chéng)信利益相關(guān)者的合法權(quán)益,有效遏制科研不端行為。具言之,大數(shù)據(jù)時(shí)代的科研不端治理需要以外在的科研誠(chéng)信法律制度為保障,以科研誠(chéng)信教育作為基礎(chǔ),以大數(shù)據(jù)技術(shù)作為支撐,形成制度、教育和技術(shù)三為一體的科研不端治理模式。
建立和完善科研大數(shù)據(jù)的相關(guān)制度。制度是科研不端治理的保障。鑒于大數(shù)據(jù)的重要價(jià)值,對(duì)大數(shù)據(jù)進(jìn)行立法顯得尤為迫切。發(fā)達(dá)國(guó)家已經(jīng)開(kāi)始探討大數(shù)據(jù)的立法問(wèn)題,如美國(guó)政府發(fā)布的2014年全球大數(shù)據(jù)“白皮書”中已經(jīng)明確提出要改進(jìn)消費(fèi)者隱私權(quán)利法案、通過(guò)關(guān)于國(guó)家數(shù)據(jù)外泄的立法、修正電子通信隱私法等,為大數(shù)據(jù)技術(shù)的發(fā)展提供法律依據(jù),通過(guò)大數(shù)據(jù)提供技術(shù)創(chuàng)新。④美國(guó)白宮:《2014年全球“大數(shù)據(jù)”白皮書》,http://www.bairun.cc/News/Detail/256歐盟也于2012年通過(guò)科技資源共享的決定,加速公共科研數(shù)據(jù)公開(kāi)。⑤科技部網(wǎng)站:《歐委會(huì)積極推動(dòng)公共科研數(shù)據(jù)的公開(kāi)》,http://www.most.gov.cn/gnwkjdt/201304/t20130425_101090.htm就我國(guó)的科研誠(chéng)信建設(shè)而言,在建立和完善科研大數(shù)據(jù)制度的過(guò)程中應(yīng)當(dāng)重點(diǎn)建設(shè)四個(gè)方面的制度:一是要建立科研大數(shù)據(jù)的收集、存儲(chǔ)和使用制度。應(yīng)當(dāng)明確規(guī)定數(shù)據(jù)公司及科研人員可以收集和存儲(chǔ)哪些科研信息,以及通過(guò)后期加工而形成的數(shù)據(jù)信息的使用途徑。二是要建立科研大數(shù)據(jù)的信息公開(kāi)和共享制度。2015年1月16日,國(guó)務(wù)院印發(fā)《關(guān)于促進(jìn)云計(jì)算創(chuàng)新發(fā)展培育信息產(chǎn)業(yè)新業(yè)態(tài)的意見(jiàn)》,提出“要在保障信息安全和個(gè)人隱私的前提下,積極探索地理、人口、知識(shí)產(chǎn)權(quán)及其他有關(guān)管理機(jī)構(gòu)數(shù)據(jù)資源向社會(huì)開(kāi)放,推動(dòng)政府部門間數(shù)據(jù)共享”。⑥國(guó)務(wù)院網(wǎng)站:《國(guó)務(wù)院關(guān)于促進(jìn)云計(jì)算創(chuàng)新發(fā)展培育信息產(chǎn)業(yè)新業(yè)態(tài)的意見(jiàn)》,http://www.gov.cn/zhengce/content/2015-01/30/content_9440.htm大數(shù)據(jù)的公開(kāi)程度將直接影響其價(jià)值的實(shí)現(xiàn)。而不同科研數(shù)據(jù)庫(kù)之間的資源共享與合作將為科研不端監(jiān)督提供更強(qiáng)大的技術(shù)支持。三是要建立科研大數(shù)據(jù)的保護(hù)制度。2013年美國(guó)“棱鏡門”事件引發(fā)了人們對(duì)大數(shù)據(jù)下網(wǎng)絡(luò)安全的關(guān)注。據(jù)中國(guó)國(guó)家信息中心等部門報(bào)告顯示,2013年,中國(guó)有多個(gè)網(wǎng)站被境外通過(guò)植入后門實(shí)施控制,其中政府網(wǎng)站2452個(gè),由此凸顯大數(shù)據(jù)對(duì)網(wǎng)絡(luò)安全乃至國(guó)家安全戰(zhàn)略的重要性。⑦孟威:《大數(shù)據(jù)下的國(guó)家網(wǎng)絡(luò)安全戰(zhàn)略博弈》,《當(dāng)代世界》2014年第8期,第68頁(yè)。大數(shù)據(jù)安全問(wèn)題同樣也是科研誠(chéng)信建設(shè)的重要內(nèi)容,科研人員、數(shù)據(jù)公司在使用、共享科研大數(shù)據(jù)時(shí)應(yīng)當(dāng)以維護(hù)網(wǎng)絡(luò)安全和國(guó)家戰(zhàn)略為前提。四是要建立個(gè)人隱私保護(hù)制度。大數(shù)據(jù)不僅事關(guān)國(guó)家安全,也與個(gè)人隱私密切相關(guān)。鑒于在大數(shù)據(jù)時(shí)代,僅僅通過(guò)告知與許可已經(jīng)無(wú)法對(duì)個(gè)人隱私構(gòu)成有效保護(hù),舍恩伯格建議應(yīng)當(dāng)改變隱私保護(hù)模式,“這個(gè)模式應(yīng)當(dāng)更著重于數(shù)據(jù)使用者為其行為承擔(dān)責(zé)任,而不是將重心放在收集數(shù)據(jù)之初取得個(gè)人同意上”①[英]維克托·邁爾·舍恩伯格、肯尼思·庫(kù)克耶:《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》,盛楊燕、周濤譯,浙江人民出版社2013年版,第220頁(yè)。。由此,在科研誠(chéng)信立法中,應(yīng)當(dāng)明確規(guī)定包括科研人員在內(nèi)的數(shù)據(jù)使用者的相應(yīng)責(zé)任。
加快與科研誠(chéng)信相關(guān)的大數(shù)據(jù)技術(shù)平臺(tái)建設(shè)步伐。技術(shù)是科研不端治理的支撐。治理科研不端不僅需要制度規(guī)約,同時(shí)需要采用先進(jìn)的技術(shù)支持。在科研誠(chéng)信的數(shù)據(jù)平臺(tái)建設(shè)方面,目前我國(guó)知網(wǎng)、萬(wàn)方和維普等科研數(shù)據(jù)庫(kù)在其發(fā)展過(guò)程中,已經(jīng)注重了發(fā)展的多元化,能夠?yàn)橛脩籼峁└骶咛厣姆?wù),但是一個(gè)明顯的問(wèn)題是各數(shù)據(jù)庫(kù)對(duì)外文文獻(xiàn)的收錄不足,使其在科研不端檢測(cè)中出現(xiàn)短板。因此,應(yīng)當(dāng)在繼續(xù)完善已有的科研數(shù)據(jù)庫(kù)基礎(chǔ)上,加強(qiáng)數(shù)據(jù)庫(kù)的國(guó)內(nèi)合作甚至國(guó)際合作。此外,還應(yīng)當(dāng)完善科研人員信息數(shù)據(jù)庫(kù),為科研人員建立誠(chéng)信檔案。目前我國(guó)已經(jīng)建成“中國(guó)高層次科技人才數(shù)據(jù)庫(kù)”,收錄了包括兩院院士、國(guó)家級(jí)人才計(jì)劃入選者、國(guó)家科技獎(jiǎng)勵(lì)獲得者等高等次人才,共計(jì)11000條信息,收錄了高層次人才的基本情況、獲獎(jiǎng)與榮譽(yù)以及科研產(chǎn)出。②相關(guān)數(shù)據(jù)和內(nèi)容請(qǐng)參見(jiàn)中國(guó)科學(xué)信息研究所國(guó)家工程技術(shù)數(shù)字圖書館主頁(yè):http://www.istic.ac.cn/Portals/_default/Skins/NewStyle/ServiceList.htm而根據(jù)科技部首次編寫的《中國(guó)科技人才發(fā)展報(bào)告(2014)》,我國(guó)2013年科技人力資源總量已達(dá)7105萬(wàn)人,其中研究與發(fā)展人員501.8萬(wàn)人。③陳海波:《我國(guó)科技研發(fā)人員總量世界第一》,《光明日?qǐng)?bào)》2015年6月26日。因此,建設(shè)大規(guī)模科研人才信息數(shù)據(jù)庫(kù)已經(jīng)非常迫切。除了科研誠(chéng)信數(shù)據(jù)平臺(tái)的建設(shè)外,科研不端檢測(cè)軟件的開(kāi)發(fā)完善也需要引起重視。已有學(xué)者指出我國(guó)目前科研不端檢測(cè)軟件存在的問(wèn)題,如系統(tǒng)命名內(nèi)容欠妥、誤判公共領(lǐng)域內(nèi)容表述、未注意不同學(xué)科特點(diǎn)等。④陳燕、丁嵐:《學(xué)術(shù)不端檢測(cè)系統(tǒng)缺陷分析》,《中國(guó)出版》2014年8月下,第12-14頁(yè)。除此,鑒于目前科研不端檢測(cè)軟件只能對(duì)同語(yǔ)言的文本進(jìn)行檢測(cè),今后,針對(duì)不同語(yǔ)言文本的跨語(yǔ)言檢測(cè)應(yīng)當(dāng)成為科研不端檢測(cè)的新突破。
加強(qiáng)科研誠(chéng)信教育??蒲姓\(chéng)信教育是科研不端治理的基礎(chǔ)。目前關(guān)于德治與法治的討論已經(jīng)在社會(huì)各個(gè)領(lǐng)域展開(kāi),德法共治已經(jīng)成為一項(xiàng)共識(shí),對(duì)于科研誠(chéng)信建設(shè)而言,我們需要通過(guò)外在的法律制度和基于大數(shù)據(jù)技術(shù)的科研不端檢測(cè)手段將已經(jīng)發(fā)生的科研不端行為檢測(cè)出來(lái),并對(duì)科研不端人員進(jìn)行相應(yīng)的制裁。但是科研誠(chéng)信建設(shè)的目的并不在于懲罰,而是要通過(guò)科研誠(chéng)信建設(shè),創(chuàng)造科學(xué)研究的良好環(huán)境,從而為科研創(chuàng)新提供保障。在此意義上,通過(guò)科研誠(chéng)信教育,提高科研人員的科研誠(chéng)信素養(yǎng),使其自覺(jué)遵守科研誠(chéng)信規(guī)范和法律制度,從而避免科研不端行為,就顯得更為重要??蒲姓\(chéng)信教育應(yīng)當(dāng)包括三個(gè)方面:一是科研誠(chéng)信的規(guī)范教育。對(duì)科研人員(包括高校大學(xué)生)進(jìn)行基本的科研規(guī)范教育,使其掌握正確的科研規(guī)范,避免在科研工作中因?yàn)椴皇煜は嚓P(guān)的科研規(guī)范而陷入科研不端。二是科研誠(chéng)信的素養(yǎng)教育。應(yīng)當(dāng)對(duì)科研人員進(jìn)行以提高其科研道德素養(yǎng)為核心的教育,使其形成正確的科學(xué)信念:誠(chéng)信研究是實(shí)現(xiàn)科研創(chuàng)新的唯一途徑,科研不端行為即使能夠幫助科研人員獲取暫時(shí)的個(gè)人名譽(yù),也最終會(huì)被揭露。三是與科研誠(chéng)信相關(guān)的大數(shù)據(jù)技術(shù)教育。面對(duì)積聚式增長(zhǎng)的科研信息,科研人員應(yīng)當(dāng)學(xué)會(huì)運(yùn)用國(guó)內(nèi)外主要的科研數(shù)據(jù)庫(kù),知曉國(guó)內(nèi)外相關(guān)領(lǐng)域的最新研究成果,避免重復(fù)性研究,同時(shí)通過(guò)運(yùn)用科研檢測(cè)系統(tǒng),確保自己科研成果的規(guī)范性。