□ 盧大安 杭州市食品藥品檢驗(yàn)研究院
隨著我國(guó)社會(huì)主義市場(chǎng)經(jīng)濟(jì)的繁榮發(fā)展,互聯(lián)網(wǎng)也滲入到社會(huì)的方方面面,并成為人們生活及工作的重要工具。計(jì)算機(jī)及互聯(lián)網(wǎng)的長(zhǎng)時(shí)間運(yùn)用,幫助各個(gè)領(lǐng)域搜集存儲(chǔ)了大量數(shù)據(jù),這些數(shù)據(jù)都蘊(yùn)含著極高的利用價(jià)值,為了充分發(fā)揮這些數(shù)據(jù)的最大使用價(jià)值,使這些來(lái)自于各個(gè)行業(yè)的數(shù)據(jù)在經(jīng)過(guò)整合處理后,再應(yīng)用于推動(dòng)行業(yè)進(jìn)步,大數(shù)據(jù)技術(shù)應(yīng)運(yùn)而生。近些年來(lái),食品安全問(wèn)題屢次發(fā)生,每次事件的曝光都意味著大批消費(fèi)者已經(jīng)深受其害,食品安全直接關(guān)系到民生安全,食品安全風(fēng)險(xiǎn)預(yù)警也逐漸成為社會(huì)關(guān)注的焦點(diǎn)。若要減少食品安全事件,必須建立完善的食品安全風(fēng)險(xiǎn)預(yù)警制度。大數(shù)據(jù)技術(shù)在各個(gè)領(lǐng)域獲得的成就,也使食品安全預(yù)警領(lǐng)域關(guān)注到這一技術(shù)[1]。
大數(shù)據(jù),從字面意思來(lái)看就是多種數(shù)據(jù),百科將其定義為需要新處理模式才能具有更強(qiáng)的決策力、洞察力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。通俗來(lái)講,即在采取一系列處理措施之后,可以實(shí)現(xiàn)優(yōu)化工作流程、提高決策能力及洞察能力的大量相關(guān)數(shù)據(jù),其特征有5個(gè),分別為大量、高速、多樣、低價(jià)值密度以及真實(shí)性。大數(shù)據(jù)最初被使用于Nutch這一開(kāi)源項(xiàng)目中,彼時(shí)大數(shù)據(jù)的定義較為簡(jiǎn)單,被稱(chēng)為為實(shí)現(xiàn)網(wǎng)絡(luò)搜索更新而進(jìn)行的分析或者批量處理的大量數(shù)據(jù)。發(fā)展到現(xiàn)在,大數(shù)據(jù)已經(jīng)被廣泛應(yīng)用于各個(gè)行業(yè)領(lǐng)域,市場(chǎng)競(jìng)爭(zhēng)的趨勢(shì)也逐漸向信息數(shù)據(jù)競(jìng)爭(zhēng)發(fā)展。大數(shù)據(jù)經(jīng)過(guò)長(zhǎng)期積累與發(fā)展,已經(jīng)成為一種蘊(yùn)含多種潛在價(jià)值的重要資產(chǎn)。
經(jīng)過(guò)近幾年來(lái)各種計(jì)算機(jī)硬件設(shè)備的發(fā)展,其所儲(chǔ)存的各種數(shù)據(jù)信息已經(jīng)形成一個(gè)巨大的數(shù)據(jù)庫(kù),如何將這些沉積的數(shù)據(jù)靈活運(yùn)用起來(lái),使其轉(zhuǎn)變?yōu)橛行У臄?shù)據(jù)資源,成為了人們研究的重要課題。大數(shù)據(jù)挖掘技術(shù)就產(chǎn)生于此種背景下,它能夠?qū)⒍逊e的數(shù)據(jù)轉(zhuǎn)變?yōu)榭捎玫闹R(shí)資源。大數(shù)據(jù)挖掘就是運(yùn)用計(jì)算機(jī)技術(shù)自動(dòng)挖掘數(shù)據(jù)庫(kù)中的潛在有效信息,并歸納總結(jié)其發(fā)展趨勢(shì)的一種方法[2]。
貝葉斯圖代表的是一種不確定因素的挖掘模式,它的每個(gè)節(jié)點(diǎn)都是一個(gè)變量,貝葉斯圖就是按照這些變量之間的聯(lián)系來(lái)測(cè)算出下一變量可能出現(xiàn)的概率,它所反映的是所有數(shù)據(jù)之間的概率規(guī)律,所以其一般用來(lái)發(fā)現(xiàn)數(shù)據(jù)之間的概率相關(guān)關(guān)系。它的原理是根據(jù)行為結(jié)果以及它們之間的原因結(jié)果關(guān)系,來(lái)推測(cè)這種結(jié)果未來(lái)可能發(fā)生的概率。它在食品安全風(fēng)險(xiǎn)預(yù)警領(lǐng)域主要運(yùn)用于食品產(chǎn)品設(shè)計(jì),例如已知行為結(jié)果是人們愛(ài)吃甜食,那么貝葉斯圖中的各個(gè)節(jié)點(diǎn)便是人們愛(ài)吃的各種甜食,通過(guò)建模推測(cè),可以得出食品的顏色會(huì)改變?nèi)藗儗?duì)事物的喜歡程度。結(jié)合貝葉斯圖的特征,設(shè)定有關(guān)的風(fēng)險(xiǎn)節(jié)點(diǎn),并對(duì)其進(jìn)行多次模型測(cè)試,發(fā)現(xiàn)其在不同情況下發(fā)生的變化、具體變化過(guò)程及最終結(jié)果,從中得到各個(gè)節(jié)點(diǎn)上變量發(fā)生改變的概率,推測(cè)出食品安全風(fēng)險(xiǎn)發(fā)生概率值。
決策樹(shù)側(cè)重于使用邏輯推測(cè)方法選擇出最優(yōu)方案來(lái)解決疑難問(wèn)題,將它應(yīng)用到食品安全風(fēng)險(xiǎn)預(yù)警領(lǐng)域中,有助于食品安全的研究創(chuàng)新。決策樹(shù)采取降維方法事先進(jìn)行數(shù)據(jù)分析處理,從中發(fā)現(xiàn)能夠影響農(nóng)產(chǎn)品質(zhì)量的相關(guān)特征值,之后再建立決策樹(shù)模型進(jìn)行組合優(yōu)化分析,來(lái)判定農(nóng)產(chǎn)品的質(zhì)量情況。在決策樹(shù)建模分析過(guò)程中,選擇土壤情況、該區(qū)域水質(zhì)情況等要素構(gòu)成決策樹(shù)的基本因素,采取相關(guān)數(shù)據(jù)測(cè)試的方式得出對(duì)應(yīng)的準(zhǔn)確率,以此作為評(píng)測(cè)農(nóng)產(chǎn)品質(zhì)量安全風(fēng)險(xiǎn)預(yù)警的工具。
人工神經(jīng)網(wǎng)絡(luò)的建模方式借鑒了生物學(xué)概念中的神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu),并進(jìn)行多次的測(cè)試及調(diào)整,發(fā)現(xiàn)數(shù)據(jù)中存在的錯(cuò)誤并對(duì)其進(jìn)行精準(zhǔn)學(xué)習(xí),此種數(shù)據(jù)挖掘方式具有高學(xué)習(xí)精度特征。現(xiàn)今存在的網(wǎng)絡(luò)模型有數(shù)十種,使用最為頻繁的是反響傳播神經(jīng)網(wǎng)絡(luò),它的評(píng)測(cè)原理是讓數(shù)據(jù)在各個(gè)層級(jí)中的不同神經(jīng)元中進(jìn)行正向傳播,然后調(diào)整權(quán)值,以及反向傳播,對(duì)數(shù)據(jù)集進(jìn)行研習(xí)了解,從而調(diào)試好相關(guān)模型。在今后的食品安全風(fēng)險(xiǎn)預(yù)警領(lǐng)域中,可以根據(jù)該原理尋找不合格食品的主要結(jié)構(gòu)成分,或者直接根據(jù)結(jié)構(gòu)要素挑出不安全產(chǎn)品。
目前食品市場(chǎng)中的產(chǎn)品種類(lèi)紛繁復(fù)雜,其生產(chǎn)加工過(guò)程也千差萬(wàn)別,在利用大數(shù)據(jù)技術(shù)進(jìn)行食品安全風(fēng)險(xiǎn)預(yù)警的過(guò)程中應(yīng)該采用多種模型,以提升預(yù)警的準(zhǔn)確率,食品安全問(wèn)題直接關(guān)系到人們的身體安全,所以必須運(yùn)用大數(shù)據(jù)技術(shù)進(jìn)行分析預(yù)警。除此之外,還要注意提升食品制造產(chǎn)業(yè)人員的社會(huì)責(zé)任意識(shí),從根源杜絕食品安全事故。