◆王劭方
信息時(shí)代的數(shù)據(jù)安全研究與分析
◆王劭方
(國(guó)家計(jì)算機(jī)網(wǎng)絡(luò)應(yīng)急技術(shù)處理協(xié)調(diào)中心甘肅分中心 甘肅 730030)
由于近些年來(lái)的科學(xué)技術(shù),電子信息技術(shù)已經(jīng)將人類(lèi)文明推進(jìn)到了信息化新時(shí)代。現(xiàn)階段社會(huì)的高速智慧城市建設(shè)、工業(yè)化的人工智能化生產(chǎn)以及人們的日常生活?yuàn)蕵?lè)都已經(jīng)與信息數(shù)據(jù)緊密相連,在體驗(yàn)到信息化數(shù)據(jù)提供的便捷、高效、精準(zhǔn)服務(wù)的同時(shí),也需要做好各方面的信息數(shù)據(jù)安全防范工作。本文通過(guò)對(duì)人工智能信息化平臺(tái)進(jìn)行調(diào)研評(píng)估,分析人工智能信息數(shù)據(jù)中可能出現(xiàn)的安全隱患,研究針對(duì)這些隱患所提出的合理化建議,有效地提高了人工智能信息數(shù)據(jù)的安全性和可靠性。
電子信息技術(shù);人工智能;數(shù)據(jù);安全防范
人工智能系統(tǒng)是以IaaS系統(tǒng)平臺(tái)為基礎(chǔ)開(kāi)發(fā),在其上搭建如docker、Kubernetes等的各類(lèi)容器,且具備機(jī)器學(xué)習(xí)模型、算法、功能以及TensorFlow、MXNet等接口,能夠根據(jù)機(jī)器學(xué)習(xí)模型產(chǎn)生應(yīng)用,然后通過(guò)從處理數(shù)據(jù)、搭建模型、對(duì)模型分別進(jìn)行訓(xùn)練與評(píng)估等相關(guān)的系統(tǒng)功能為客戶(hù)提供開(kāi)發(fā)設(shè)計(jì)的全流程服務(wù)。
人工智能系統(tǒng)平臺(tái)一般按技術(shù)和應(yīng)用兩個(gè)方面進(jìn)行劃分。技術(shù)系統(tǒng)方面可分為:視覺(jué)與語(yǔ)音的功能識(shí)別技術(shù)、機(jī)器學(xué)習(xí)技術(shù)、語(yǔ)言處理技術(shù)以及知識(shí)圖譜等。在應(yīng)用技術(shù)方面又可以分為:自主無(wú)人控制技術(shù)、人工智能交通技術(shù)、人工智能教育技術(shù)、人工智能醫(yī)療技術(shù)、人工智能工業(yè)化生產(chǎn)技術(shù)以及人工智能互聯(lián)網(wǎng)技術(shù)等。
人工智能系統(tǒng)平臺(tái)通過(guò)基于分布式計(jì)算云系統(tǒng)IaaS平臺(tái),將包括人工智能的學(xué)習(xí)、算法、接口等功能通過(guò)云端,為客戶(hù)提供信息數(shù)據(jù)存儲(chǔ)、分析及軟件應(yīng)用等服務(wù)。加快了客戶(hù)通信息數(shù)據(jù)的處理分析能力,并計(jì)算出更加精準(zhǔn)的結(jié)果,便于客戶(hù)對(duì)信息數(shù)據(jù)的判斷與決策。
信息數(shù)據(jù)中毒一般是指人工智能信息數(shù)據(jù)被非法修改或者篡改,導(dǎo)致人工智能決策層對(duì)數(shù)據(jù)信息的判斷出現(xiàn)問(wèn)題,并給出了錯(cuò)誤的決策方案指令。其工作原理是通過(guò)在給人工智能訓(xùn)練數(shù)據(jù)中添加進(jìn)去惡意樣本或者是虛假偽造數(shù)據(jù),然后對(duì)原有的數(shù)據(jù)信息進(jìn)行攻擊破壞,造成完整性缺失,使訓(xùn)練算法模型運(yùn)算判斷出錯(cuò),導(dǎo)致決策層的決策出現(xiàn)偏離。一般導(dǎo)致信息數(shù)據(jù)中毒的方式有如下兩種:
第一、信息數(shù)據(jù)中毒的攻擊方式是偏斜方式,主要是通過(guò)對(duì)訓(xùn)練數(shù)據(jù)的原始數(shù)據(jù)進(jìn)行篡改,修改分類(lèi)模塊的范圍值,達(dá)到使訓(xùn)練數(shù)據(jù)的運(yùn)算分析方向出現(xiàn)偏移的目的;
第二、使用反饋信息的誤導(dǎo)牽引模式,主要是把人工智能的自身機(jī)器學(xué)習(xí)模型作為攻擊對(duì)象,將篡改好的信息數(shù)據(jù)反饋至需要接受客戶(hù)反饋信息的機(jī)器學(xué)習(xí)模型,利用修改后的數(shù)據(jù)信息對(duì)人工智能的運(yùn)算進(jìn)行誤導(dǎo),使其決策層給出錯(cuò)誤的決策。
信息數(shù)據(jù)中毒具有較大的安全風(fēng)險(xiǎn),比如,現(xiàn)在比較火熱的自動(dòng)駕駛汽車(chē)領(lǐng)域,當(dāng)自動(dòng)駕駛控制接收到的信息數(shù)據(jù)是被污染后的信息數(shù)據(jù),其就是根據(jù)這些錯(cuò)誤的信息做出相應(yīng)的判斷,輕者會(huì)造成自動(dòng)駕駛車(chē)輛對(duì)路況信息誤判,做出違反道路交通規(guī)則的行為,重者就有可能使自動(dòng)駕駛車(chē)輛發(fā)生嚴(yán)重的交通安全事故。
數(shù)據(jù)異常會(huì)出現(xiàn)致使人工智能系統(tǒng)在運(yùn)算過(guò)程中,識(shí)別判斷運(yùn)算出現(xiàn)偏差或錯(cuò)誤,也會(huì)將自身模型暴露出來(lái),遭受黑客的惡意攻擊。另外,因開(kāi)源學(xué)習(xí)框架本身存在一定的安全風(fēng)險(xiǎn),其數(shù)據(jù)異常也表現(xiàn)出在開(kāi)源學(xué)習(xí)框架的人工智能系統(tǒng)出現(xiàn)了數(shù)據(jù)泄漏的情況。
人工智能技術(shù)已經(jīng)成功地應(yīng)用到了很多領(lǐng)域中,就會(huì)出現(xiàn)數(shù)據(jù)信息收集過(guò)剩的現(xiàn)象,導(dǎo)致這些過(guò)剩的數(shù)據(jù)信息存在泄漏的風(fēng)險(xiǎn)。比如,現(xiàn)在比較流行的人工智能手環(huán)等智能設(shè)備,以及醫(yī)療智能系統(tǒng)或生物識(shí)別系統(tǒng)等,這些智能設(shè)備或智能系統(tǒng)就會(huì)對(duì)個(gè)人信息進(jìn)行全方面的收集,如個(gè)人的臉部特征、心跳、虹膜以及指紋等個(gè)人信息數(shù)據(jù),而這些個(gè)人信息都是具有唯一性和不變形的,當(dāng)這些個(gè)人信息數(shù)據(jù)沒(méi)有得到很好的保護(hù)時(shí),出現(xiàn)泄漏或被收集個(gè)人信息的企業(yè)誤用,就會(huì)給這些信息的所屬者造成嚴(yán)重的后果。
隨著人工智能技術(shù)的提升,也變相提升了黑客對(duì)智能化的網(wǎng)絡(luò)攻擊能力,導(dǎo)致出現(xiàn)信息數(shù)據(jù)被智能化竊取行為的出現(xiàn)。通過(guò)使用人工智能系統(tǒng)就可以自動(dòng)鎖定需求目標(biāo),并開(kāi)始對(duì)數(shù)據(jù)進(jìn)攻擊和盜取,而且因?yàn)槿斯ぶ悄芸梢酝ㄟ^(guò)機(jī)器學(xué)習(xí)的方式,進(jìn)行掃描和發(fā)現(xiàn)系統(tǒng)的漏洞,并有效地提高了對(duì)關(guān)鍵目標(biāo)的識(shí)別能力,從而提升了對(duì)關(guān)鍵目標(biāo)的攻擊效率。然后,人工智能可以自動(dòng)編輯或生產(chǎn)海量的虛假威脅信息,來(lái)迷惑和攻擊系統(tǒng);人工智能因其具有機(jī)器學(xué)習(xí)技術(shù)、自然語(yǔ)言處理技術(shù)以及數(shù)據(jù)挖掘技術(shù)等能力,可以在有效且安全的大數(shù)據(jù)中,對(duì)其自動(dòng)生產(chǎn)各種虛假、錯(cuò)誤以及威脅的信息,使系統(tǒng)無(wú)法正常判別信息的真?zhèn)巍H斯ぶ悄墁F(xiàn)在還具有自動(dòng)識(shí)別圖像和驗(yàn)證碼功能的能力,使其竊取系統(tǒng)數(shù)據(jù)信息更加容易。
由于人工智能技術(shù)的快速普及發(fā)展,人工智能人臉識(shí)別等新技術(shù)也帶來(lái)的新風(fēng)險(xiǎn),如出現(xiàn)了人臉“隔空盜刷”等個(gè)人信息數(shù)據(jù)安全隱患,因?yàn)槿说哪樖情L(zhǎng)時(shí)間裸露在外,現(xiàn)在人工智能技術(shù)就可以通過(guò)在三公里之外對(duì)人臉進(jìn)行識(shí)別,用戶(hù)根本沒(méi)有表達(dá)出主觀(guān)意愿去刷臉,就可以將個(gè)人賬戶(hù)的現(xiàn)金進(jìn)行轉(zhuǎn)移,帶來(lái)了巨大的風(fēng)險(xiǎn)。
現(xiàn)在眾多人工智能技術(shù)軟件平臺(tái)都沒(méi)有相關(guān)的技術(shù)數(shù)據(jù)備案信息,并且平臺(tái)內(nèi)部對(duì)個(gè)人的相關(guān)身份數(shù)據(jù)信息也沒(méi)有做好安全防護(hù)工作,出現(xiàn)客戶(hù)可以任意替換、合成、生成新的信息數(shù)據(jù),就會(huì)嚴(yán)重影響了個(gè)人信息數(shù)據(jù)安全,并為個(gè)人信息安全埋下隱患,也為不法分子帶來(lái)可乘之機(jī)。
2018年上半年,國(guó)外就有媒體報(bào)道出美國(guó)的臉書(shū)公司,私自將臉書(shū)的近五千多萬(wàn)的個(gè)人用戶(hù)信息交給第三方公司,用作大數(shù)據(jù)信息分析這些客戶(hù)的潛在利用價(jià)值,如通過(guò)對(duì)這些客戶(hù)個(gè)人信息中的興趣愛(ài)好等特點(diǎn)進(jìn)行分析,根據(jù)其愛(ài)好準(zhǔn)確投放相應(yīng)的廣告或資訊內(nèi)容等,報(bào)道上稱(chēng)其有可能利用大數(shù)據(jù)進(jìn)行預(yù)測(cè)客戶(hù)的政治意向,造成可能影響美國(guó)總統(tǒng)大選的不利因素。已經(jīng)嚴(yán)重?fù)p害了網(wǎng)絡(luò)領(lǐng)域消費(fèi)者的合法權(quán)益,針對(duì)上述事件,如何規(guī)范人工智能信息數(shù)據(jù)的使用,保護(hù)個(gè)人信息數(shù)據(jù)安全,成為社會(huì)所關(guān)注的重點(diǎn)。
由于人工智能系統(tǒng)的開(kāi)發(fā)和利用,其產(chǎn)生的數(shù)據(jù)安全已經(jīng)覆蓋方方面面,小到個(gè)人信息安全、企業(yè)信息、企業(yè)秘密以及大到國(guó)家信息安全等。所以,人工智能領(lǐng)域中的數(shù)據(jù)安全保護(hù)問(wèn)題需要涵蓋整個(gè)環(huán)節(jié),這些環(huán)節(jié)就包括了對(duì)信息數(shù)據(jù)的收集、存儲(chǔ)、傳輸和使用等方面。
數(shù)據(jù)收集風(fēng)險(xiǎn):主要是體現(xiàn)在數(shù)據(jù)采集的安全風(fēng)險(xiǎn)是否合規(guī)管控方面。如數(shù)據(jù)傳輸環(huán)節(jié)是否存在數(shù)據(jù)泄露、數(shù)據(jù)篡改等安全隱患。
數(shù)據(jù)存儲(chǔ)風(fēng)險(xiǎn):數(shù)據(jù)存儲(chǔ)又可以分為本地現(xiàn)場(chǎng)前端存儲(chǔ)、后端數(shù)據(jù)存儲(chǔ)和云存儲(chǔ)等三個(gè)方面。其中在前端和后端的設(shè)備存儲(chǔ),有較大的安全風(fēng)險(xiǎn),具有數(shù)據(jù)存儲(chǔ)的安全隱患。由于云數(shù)據(jù)庫(kù)的硬件技術(shù)能力不一,數(shù)據(jù)存儲(chǔ)具有不小的泄漏可能。
數(shù)據(jù)使用風(fēng)險(xiǎn):在人工智能的開(kāi)發(fā)和應(yīng)用中對(duì)數(shù)據(jù)預(yù)處理、數(shù)據(jù)標(biāo)注、模型訓(xùn)練、模型測(cè)試、實(shí)際數(shù)據(jù)處理都涉及到數(shù)據(jù)的使用中,也會(huì)存在諸多安全問(wèn)題。
數(shù)據(jù)傳輸風(fēng)險(xiǎn):數(shù)據(jù)收集和標(biāo)注是人工智能模型訓(xùn)練前的重要步驟。在數(shù)據(jù)采集和標(biāo)注環(huán)節(jié),數(shù)據(jù)鏈中出現(xiàn)對(duì)數(shù)據(jù)保護(hù)能力不一致。當(dāng)涉及敏感數(shù)據(jù)的處理和多方之間的數(shù)據(jù)流動(dòng)時(shí),會(huì)面臨數(shù)據(jù)泄露等安全風(fēng)險(xiǎn)。
首先,要加強(qiáng)加快立法,細(xì)化法律規(guī)范,進(jìn)一步落實(shí)到企業(yè)責(zé)任、個(gè)人行為等社會(huì)化日常行為當(dāng)中。主要是針對(duì)當(dāng)前人工智能數(shù)據(jù)信息安全使用和保護(hù)問(wèn)題進(jìn)行操作。
第二,組織形成網(wǎng)絡(luò)安全新技術(shù)新應(yīng)用的評(píng)估隊(duì)伍,對(duì)企業(yè)、個(gè)人凡是要在平臺(tái)上發(fā)布應(yīng)用程序的,均需通過(guò)評(píng)估、整改、再評(píng)估后,符合信息安全各項(xiàng)要求后再上線(xiàn)。
第三,針對(duì)各領(lǐng)域的企業(yè),需要控制企業(yè)收集個(gè)人信息數(shù)據(jù)的界限,并規(guī)定企業(yè)對(duì)個(gè)人信息數(shù)據(jù)的使用范圍,行政部門(mén)定期對(duì)其收集的信息進(jìn)行規(guī)范性核查。
第四,進(jìn)行內(nèi)容安全標(biāo)注工作,將內(nèi)容進(jìn)行分級(jí)、分類(lèi),尤其是使用AI合成技術(shù)創(chuàng)造的內(nèi)容,要嚴(yán)格進(jìn)行審核、標(biāo)注,對(duì)于侵犯隱私、違反著作權(quán)、肖像權(quán)、隱私權(quán)、專(zhuān)利權(quán)的行為進(jìn)行打擊。
第五,加強(qiáng)對(duì)個(gè)人信息數(shù)據(jù)安全保護(hù)的技術(shù)能力,如對(duì)個(gè)人信息數(shù)據(jù)進(jìn)行隱私的同步狀態(tài)加密保護(hù)技術(shù)、機(jī)器學(xué)習(xí)、差分隱私的個(gè)人隱私保護(hù)技術(shù)等技術(shù)能力的開(kāi)發(fā)或能力的提升,并利用數(shù)據(jù)偏移監(jiān)督監(jiān)測(cè)技術(shù)來(lái)防止人工智能系統(tǒng)在訓(xùn)練數(shù)據(jù)中出現(xiàn)的偏差或偏移現(xiàn)象。
第六,開(kāi)發(fā)新的模型,減少數(shù)據(jù)需求,使用遷移學(xué)習(xí)、小數(shù)據(jù)等優(yōu)化各類(lèi)算法。
第七,大力開(kāi)發(fā)數(shù)據(jù)投毒的防御技術(shù)。
數(shù)據(jù)污染防范訓(xùn)練技術(shù)主要有兩種,分別是抗訓(xùn)練數(shù)據(jù)污染和抗對(duì)抗樣本攻擊。
抗訓(xùn)練數(shù)據(jù)污染主要是通過(guò)監(jiān)測(cè)和過(guò)濾來(lái)防止數(shù)據(jù)的污染或被植入惡性數(shù)據(jù)作為預(yù)防措施??箤?duì)抗樣本攻擊主要是通過(guò)提高人工智能模型的對(duì)抗防御能力,利用監(jiān)測(cè)模型對(duì)其進(jìn)行提升自身防御能力或消除對(duì)抗樣本的不良影響。
本文從人工智能信息數(shù)據(jù)安全方面進(jìn)行了研究,針對(duì)人工智能平臺(tái)數(shù)據(jù)管理中,可能出現(xiàn)或者會(huì)面臨的安全隱患進(jìn)行了分析,如數(shù)據(jù)中毒、數(shù)據(jù)異常、數(shù)據(jù)泄漏以及網(wǎng)絡(luò)攻擊等幾個(gè)方面深入化的分析。就上述的安全隱患風(fēng)險(xiǎn)進(jìn)行安全風(fēng)險(xiǎn)分析其可能或?qū)⒃斐傻膰?yán)重后果,提出相應(yīng)的合理化建議,如加強(qiáng)法律方面保障效應(yīng)以及開(kāi)發(fā)信息數(shù)據(jù)安全防范技術(shù)等,從法律和技術(shù)雙方面進(jìn)行保護(hù)信息化的數(shù)據(jù)安全。
[1]何文君.影響數(shù)據(jù)通信網(wǎng)絡(luò)穩(wěn)定性和安全性的因素研究[J].山西青年,2017(20):10-11.
[2]袁鵬達(dá).數(shù)據(jù)加密技術(shù)在計(jì)算機(jī)網(wǎng)絡(luò)通信安全中的應(yīng)用[J].中國(guó)管理信息化,2017,20(3):129-130.
[3]李觀(guān)發(fā).試論計(jì)算機(jī)網(wǎng)絡(luò)通信安全中數(shù)據(jù)加密技術(shù)的應(yīng)用[J].信息記錄材料,2019(7):25-26.
[4]孫洪玉,牛保疆.數(shù)據(jù)通信網(wǎng)絡(luò)維護(hù)與網(wǎng)絡(luò)安全問(wèn)題的探討[J].數(shù)字通信世界,2019(2):14-15.
[5]龔德旭.大數(shù)據(jù)背景下信息通信網(wǎng)絡(luò)安全管理策略研究[J].數(shù)字通信世界,2018(1):13-14.
網(wǎng)絡(luò)安全技術(shù)與應(yīng)用2022年1期