• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種基于云存儲的自組織增量類腦記憶模型

      2018-07-19 11:41:16劉義紅
      關(guān)鍵詞:結(jié)點文檔神經(jīng)元

      劉義紅

      (淮南師范學(xué)院計算機學(xué)院, 安徽 淮南 232038)

      在日常生活和工作中,記憶對人類來說是非常重要,它可以幫助人們完成日常的事務(wù),回憶過去的往事,通過分享記憶來維持社會關(guān)系,表達自己的情感。隨著計算機和智能終端技術(shù)的快速發(fā)展,越來越多的用戶將自己的個人數(shù)據(jù)存儲在網(wǎng)絡(luò)服務(wù)商的云端存儲設(shè)備上,這些數(shù)據(jù)隨時間呈指數(shù)級增長,并且隱含著豐富的記憶信息。如何利用云存儲和機器學(xué)習(xí)技術(shù),將這些數(shù)據(jù)中隱含的記憶信息挖掘出來是十分有意義的課題,有著廣闊的應(yīng)用前景。

      本文提出一種基于云存儲的自組織增量類腦記憶模型(Brain Memory Model of Cloud Storage,BMMoCS)。試圖通過信息采集設(shè)備將用戶行為記憶數(shù)據(jù)存儲到云端服務(wù)器,利用自組織增量網(wǎng)絡(luò)學(xué)習(xí)算法,對記憶數(shù)據(jù)特征信息進行提取和分析,從而發(fā)現(xiàn)記憶知識,然后利用這些知識輔助人類記憶,以此來構(gòu)建一個記憶服務(wù)系統(tǒng)。最后,在真實數(shù)據(jù)集上對模型進行了仿真實驗,實驗結(jié)果表明模型能夠模擬大腦的記憶功能。

      本文第1節(jié)介紹與本研究內(nèi)容相關(guān)的工作;第2節(jié)介紹云存儲的記憶系統(tǒng)服務(wù)架構(gòu);第3節(jié)詳細介紹一種基于云存儲的自組織增量類腦記憶模型;第4節(jié)給出該方法的仿真實驗結(jié)果及分析,最后進行總結(jié)并對下一步工作進行展望。

      1 相關(guān)工作

      Google首席執(zhí)行官Eric Schmidt首次提出了“云計算”的概念后,掀起了一股“云存儲”風(fēng)暴,國內(nèi)外人云存儲服務(wù)產(chǎn)品相繼出現(xiàn),如谷歌云、百度云盤、360云盤、微云、天翼云等等。根據(jù)艾瑞咨詢公司發(fā)布《2016年中國個人云盤行業(yè)研究報告》和《2016年中國企業(yè)云服務(wù)行業(yè)研究報告》顯示,2016年中國個人云存儲用戶規(guī)模預(yù)計將達到3.96億人。個人云存儲產(chǎn)品具有跨平臺存儲、同步更新、文件分享等功能,較好的滿足了用戶使用需求。而對于這些云存儲數(shù)據(jù),目前研究主要集中在記憶特征信息提取、記憶計算和記憶服務(wù)等方面。

      在記憶特征提取方面。研究者主要聚焦在與時間、位置和物體相關(guān)的記憶信息特征抽取上。文獻[1-2]使用時空情境和交互歷史信息來快速提取聯(lián)系人姓名。文獻[3-4]通過獲取用戶位置信息,當(dāng)用戶進入或離開某個地點時,將該地點發(fā)生的故事發(fā)送給用戶。文獻[5]提出了一個面向位置的個性化視頻通信和分享系統(tǒng),家庭成員之間可以通過系統(tǒng)分享記憶,增進成員之間情感。文獻[6-7]使用RFID(Radio Frequency Identification)和移動標記技術(shù),將人的記憶與物品聯(lián)系起來,以增強用戶的回憶,同時支持基于情境的記憶分享。

      在記憶計算方面。研究者主要聚焦在生物學(xué)、認知理論、神經(jīng)網(wǎng)絡(luò)上。文獻[8]把記憶機制引入傳統(tǒng)蟻群算法,提出了一種基于生物記憶原理的蟻群智能體記憶模型,螞蟻智能體通過記憶不斷搜索、更新自身記憶庫和蟻群記憶庫,優(yōu)化自己當(dāng)前路徑。文獻[9]采用冪函數(shù)量化艾賓浩斯生物記憶曲線,提出一種智能詞匯記憶模型,當(dāng)單詞臨近遺忘時提醒用戶及時復(fù)習(xí),動態(tài)調(diào)整生物記憶曲線。文獻[10]提出一種雙向認知計算的p階正態(tài)云模型,模擬智能認知過程。文獻[11]將輸入、記憶、聯(lián)想三種模式分別至于不同網(wǎng)絡(luò)層,提出了一種基于神經(jīng)網(wǎng)絡(luò)的通用聯(lián)想記憶模型。文獻[12]將遞歸神經(jīng)網(wǎng)絡(luò)應(yīng)用到聯(lián)想記憶中,提出了一種基于憶阻激活函數(shù)的遞歸神經(jīng)網(wǎng)絡(luò),實現(xiàn)動態(tài)圖像的聯(lián)想記憶。文獻[13]提出一種不增加網(wǎng)絡(luò)參數(shù)的遞歸神經(jīng)網(wǎng)絡(luò)的新方法,該方法具有基于復(fù)數(shù)值向量的聯(lián)想記憶功能。

      在記憶服務(wù)方面。研究的熱點主要聚焦在往事回憶和記憶分享上[14]。文獻[15-16]將記憶與實物結(jié)合起來,建立一種體驗式回憶系統(tǒng),用戶可通過實物聯(lián)想記憶中的場景。文獻[17] 將日常生活中發(fā)生的事情,記錄到一個電子記事系統(tǒng)中,以幫助記憶損傷的用戶回憶往事,輔助治療老年癡呆癥等。文獻[18]設(shè)計了一個用戶郵件整理和分析系統(tǒng),系統(tǒng)根據(jù)記憶提示信息,將郵件可視化分類管理,用戶利用用戶界面快速瀏覽郵件信息,激發(fā)用戶回憶。文獻[19]利用文本知識機器學(xué)習(xí)方法,建立了一種基于內(nèi)容的文本知識推薦系統(tǒng),實現(xiàn)文本知識的推薦,幫助用戶理解知識。文獻[20]基于云存儲理論,設(shè)計了一個智慧健康大數(shù)據(jù)管理系統(tǒng),實現(xiàn)醫(yī)療健康信息共享與智能分析。此外,像微信、微博和Facebook等在線共享服務(wù)發(fā)展迅速,使用非常廣泛。

      綜上所述,通過對當(dāng)前國內(nèi)外關(guān)于記憶理論研究現(xiàn)狀和發(fā)展趨勢的調(diào)查分析,發(fā)現(xiàn)很少有研究者將云存儲和記憶聯(lián)系一起來開展相關(guān)研究工作。本文正是基于在這方面考慮,對云存儲的記憶系統(tǒng)進行探索,以此來推動智慧健康的發(fā)展和應(yīng)用,為人類的健康生活提供理論和技術(shù)支持。

      2 記憶服務(wù)系統(tǒng)架構(gòu)

      本文提出的記憶服務(wù)系統(tǒng)采用四層設(shè)計架構(gòu),自下而上分別為數(shù)據(jù)采集層、云存儲層、記憶計算層和記憶服務(wù)層。系統(tǒng)架構(gòu)及數(shù)據(jù)流如圖1所示。

      圖1 系統(tǒng)體系架構(gòu)圖

      2.1 數(shù)據(jù)采集層

      數(shù)據(jù)采集層的主要任務(wù)是收集個人日常使用的電子設(shè)備、網(wǎng)絡(luò)社交而產(chǎn)生的大量記憶數(shù)據(jù)。比如,在旅游、聚會、重要節(jié)日、網(wǎng)購、微信、微博、QQ、Facebook等活動過程中產(chǎn)生的本文、圖像、聲音、視頻等數(shù)據(jù),這些數(shù)據(jù)通常稱為感知數(shù)據(jù),它們隱含著非常重要的記憶特征。

      2.2 云存儲層

      云存儲層主要任務(wù)是使用云服務(wù)來存儲個人感知數(shù)據(jù),并利用ETL(Extract Transform Load)和數(shù)據(jù)挖掘技術(shù),將本文、圖像、聲音、視頻數(shù)據(jù)等用戶數(shù)據(jù)進行預(yù)處理,解決數(shù)據(jù)源格式不統(tǒng)一,無法進行一致地高效地數(shù)據(jù)處理問題。預(yù)處理提取的數(shù)據(jù)記憶特征,將加載到一個面向主題的、集成的、穩(wěn)定的、反映歷史的、隨著時間流逝發(fā)生變化的記憶數(shù)據(jù)庫中,并向記憶計算層提供數(shù)據(jù)。

      2.3 記憶計算層

      記憶計算層主要任務(wù)是構(gòu)建一個記憶模型,將記憶數(shù)據(jù)進行聚類計算,形成記憶簇,并向記憶服務(wù)層提供往事回憶和記憶分享服務(wù)。該模型是本文的分析重點,將在第四部分詳細介紹。

      2.4 記憶服務(wù)層

      記憶服務(wù)層主要任務(wù)是向用戶提供一個友好的交互記憶服務(wù),它包括往事回憶和記憶分享兩項功能。往事回憶是通過輸入用戶的情境數(shù)據(jù)特征到記憶計算模型,模型給出云存儲數(shù)據(jù)庫中相似度較高的按降序列出記憶信息,向用戶呈現(xiàn)個人存儲的往事。記憶分享主要是提供與家人、朋友、同事、同學(xué)等群體共同分享個存儲的往事服務(wù),便于社群交流與協(xié)作。

      3 BMMoCS記憶模型

      3.1 定義

      用戶存儲的云數(shù)據(jù)通常是增量變化的,這就要求設(shè)計的記憶計算模型能適應(yīng)這種變化,具有很好的普適性。因此,采用自組織增量學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)來分析設(shè)計記憶模型。為了描述模型方便,在這里定義下列術(shù)語和符號。

      定義1:記憶庫M,形式化定義為

      M={(x1,P1),…,(xd,Pd),…,(xN,PN)}

      式中:二元組(xd,Pd)表示記憶庫中第d個文件,由記憶特征向量xd和文件存儲位置Pd兩部分構(gòu)成,N表示文件總數(shù)。

      定義2:xd表示存儲文件d的記憶特征向量,形式化定義為

      xd=(xd1,xd2,…,xdi,…,xdm)

      式中:xdi表示存儲文件d中第i個記憶屬性,m表示文件d中記憶屬性總數(shù)。

      定義3:Pd表示存儲文件d的存儲信息集,形式化定義為

      Pd=(p1,p2,…,pi,…,pn)

      式中:pi表示文件d的第i個存儲信息。如,文件的存儲位置、時間、類型等。

      定義4:神經(jīng)網(wǎng)絡(luò)NE,形式化定義為

      NE=(V,E)

      式中:V為頂點集,每個頂點vi由五元組(ci,ni,φi,Hi,Pi)組成,ci表示記憶特征向量,ni表示神經(jīng)元被激活的次數(shù),φi表示神經(jīng)元的平均累積協(xié)方差矩陣,Hi表示描述神經(jīng)元區(qū)域的超橢球邊界閾值參數(shù),Pi含義同定義3。E為邊集,每條邊用二元組(i,j)表示,i,j分別表示頂點vi,vj。

      3.2 模型

      本文提出BMMoCS模型(見圖2)。輸入層的數(shù)據(jù)是云存儲原始數(shù)據(jù)的記憶特征向量,即輸入模式,它表示在記憶特征空間分布中所處的位置。記憶層與輸入層進行全連接,將輸入模式數(shù)據(jù)經(jīng)變換后存儲到對應(yīng)的神經(jīng)元記憶子網(wǎng)中,它們之間的連接反映了原始數(shù)據(jù)的分布情況以及拓撲結(jié)構(gòu)。

      圖2 BMMoCS模型

      模型的基本思想是用一定數(shù)量的代表性數(shù)據(jù)來近似原始的完整數(shù)據(jù)集,結(jié)構(gòu)上保持原始數(shù)據(jù)的鄰近相關(guān)性,然后再以這些代表性的數(shù)據(jù)為基礎(chǔ)對新來輸入模式做出決策。具體而言,記憶層中的神經(jīng)元是輸入層空間中的某些輸入模式的代表,它周圍的區(qū)域與輸入模式的空間分布是一致的。假設(shè)這個局部信息服從高斯分布,用式(1)描述的超橢球來表示它的周圍區(qū)域。

      (1)

      式中:x表示輸入層的特征向量(x∈M),ci表示記憶層的一個神經(jīng)元向量,φi表示神經(jīng)元i的平均累積協(xié)方差矩陣(見式2),Hi是一個相似度閾值參數(shù),表示超橢球邊界。

      (2)

      Hi參數(shù)的取值對記憶層的穩(wěn)定性影響較大。如果取值得過小,則會有許多相似的數(shù)據(jù)模式被當(dāng)作獨立的神經(jīng)元,導(dǎo)致記憶層神經(jīng)元結(jié)點過多;而取值過大,則會有許多不同的數(shù)據(jù)模式被掩蓋,導(dǎo)致量化誤差增大。取值過大或過小均不能準確地反映原始數(shù)據(jù)的分布。下面對Hi參數(shù)進行分析。

      顯然,式(1)的邊界方程是

      (3)

      q為置信度 (4)

      (5)

      輸入模式x與神經(jīng)元ci之間采用式(6)馬氏距離度量。

      (6)

      3.3 算法

      輸入:記憶庫M,λ,ω,σ,α,β,q。

      輸出:記憶層神經(jīng)網(wǎng)絡(luò)NE(N,E)。

      算法步驟

      1:初始化集合N=?,E=?。

      2:隨機選擇一輸入模式(x,p)∈M。

      3:根據(jù)式(7),計算被輸入模式激活的神經(jīng)元集T:

      T={i|Di(x)

      (7)

      若N=?或T=?,則生成新結(jié)點inew,

      置T=T∪{inew},轉(zhuǎn)到2。

      4:根據(jù)式(8),計算T中與輸入模式距離最小的神經(jīng)元結(jié)點(即,競爭獲勝的結(jié)點)iwin,

      iwin=argmini∈TDi(x)

      (8)

      5:更新iwin結(jié)點,

      ciwin=ci+(x-ci)/(ni+1)

      niwin=ni+1

      φiwin=φi+[ni(x-ci)(x-ci)T-

      (ni+1)φi]/(ni+1)2

      (9)

      Piwin=Pi∪{p}

      6:建立連接邊。在T中,若iwin結(jié)點與其它結(jié)點間沒有邊,建立連接,并更新邊集。E=E∪{(iwin,j)|iwin,j∈T}

      7:若iwin的鄰接點j滿足式(10),

      Diwin(j)<α*(Hiwin+Hj)

      (10)

      則,合并iwin和j為新結(jié)點inew。

      cnew=(nici+njcj)/(ni+nj)

      nnew=ni+nj

      (11)

      Pnew=Pi∪Pj

      N=(N-{iwin,j})∪{inew}

      將E中所有(iwin,k)、(j,k)改為(inew,k)

      若iwin與鄰接點j,滿足條件:Diwin(j)>β*(Hiwin+Hj),則刪除iwin和j之間的連接邊。

      8:當(dāng)輸入數(shù)據(jù)總數(shù)是λ整數(shù)倍時,若某神經(jīng)元結(jié)點的激活次數(shù)ni遠遠小于均值mean,則示該結(jié)點為噪聲,刪除結(jié)點及連接邊。

      (12)

      9:若還有新的輸入模式,則轉(zhuǎn)到2;否則,輸出NE(N,E)。

      在算法學(xué)習(xí)過程中,當(dāng)被激活的神經(jīng)元與它鄰接點之距離越來近時,且小于一定閾值時,說明它們分別所代表的區(qū)域具有相同模式,需要合并操作,保持模型的簡潔和穩(wěn)定性。當(dāng)它們之間距離越來越遠,且大于一定閾值時,說明它們分別所代表的區(qū)域?qū)儆诓煌J?,需要斷開連接,保持模型的魯棒性。

      λ,ω,σ,α,β,q是超參數(shù),在實際應(yīng)用中,根據(jù)具體的數(shù)據(jù)集來設(shè)置。ω是神經(jīng)元激活次數(shù)ni函數(shù),且滿足limni→∞ω(ni)=1。σI決定了新結(jié)點超橢球區(qū)域的大小,I是單位矩陣。α,β分別表示兩個神經(jīng)元超橢球重疊和分離比。

      這里,給出式(9)和式(11)的推導(dǎo)過程。

      a. 式(9)推導(dǎo)

      假設(shè)i結(jié)點當(dāng)前的協(xié)方差矩陣為

      當(dāng)i結(jié)點被輸入模式xn+1激活,那么,

      (xn+1-ci)(xn+1-ci)T+

      b. 式(11)推導(dǎo)

      假設(shè)i和j合并為新結(jié)點inew,i,j的協(xié)方差矩陣分別為

      那么,

      φinew=∑ni+njk=1(xk-cinew)(xk-cinew)T/(ni+nj)=

      4 仿真實驗

      實驗數(shù)據(jù)來源百度個人云盤,數(shù)據(jù)集是某用戶在2015年8月至2017年9月期間,閱讀并保存到百度網(wǎng)盤上的1852個文本文檔(為便于驗證,只用文本類型數(shù)據(jù)來分析模型的有效性)。實驗時,去除了語料庫中所有無意義的停止詞和頻次低于5的詞,用語料庫中的單詞描述文檔的記憶特征,單詞在文檔中出現(xiàn)的頻率作為特征值,增加文檔標題詞權(quán)重,突出它的重要性,經(jīng)過預(yù)處理后,得到文檔-詞的特征矩陣和文檔-存儲信息向量數(shù)據(jù)庫,其結(jié)構(gòu)如圖3~4所示。圖3中,xi,j表示第i個文檔中第j個單詞的特征值;圖4中,{pi,1,pi,2,…,pi,j,…,pi,m}表示第i個文檔中存儲的信息集,其中pi,j表示信息集中的一個元素。

      圖3 文檔-詞特征矩陣

      圖4 文檔-存儲信息向量

      模型穩(wěn)定性分析。從兩個方面來驗證,a)在記憶特征數(shù)據(jù)庫中隨機選擇輸入模式,運行學(xué)習(xí)算法,得到記憶層神經(jīng)網(wǎng)絡(luò)NE1;b)將記憶特征庫中數(shù)據(jù)按相關(guān)度排序,順序選擇輸入模式,運行學(xué)習(xí)算法,得到記憶層神經(jīng)網(wǎng)絡(luò)NE2。兩種方法實驗生成的神經(jīng)元結(jié)點變化越勢如圖5所示。實驗結(jié)果表明,在特征數(shù)據(jù)庫給定的情況下,模型與輸入次序無關(guān),它有較好的穩(wěn)定性。

      圖5 記憶層神經(jīng)元結(jié)點變化越勢

      模型有效性分析。根據(jù)云存儲記憶數(shù)據(jù)特點,用戶通常在兩種情境下,回憶已存儲的數(shù)據(jù),一種是用戶讀到一篇新文檔,聯(lián)想回憶以前已閱讀過的文檔,并把它們提取出來。另一種是用戶依據(jù)自己的模糊記憶描述,提取已存儲在云盤上的文檔。在這里把上述兩種情境,分別稱為A記憶模式和B記憶模式。并從兩個方面來仿真實驗,a)從特征數(shù)據(jù)庫中隨機抽取200個文檔特征數(shù)據(jù)作為測試數(shù)據(jù),其余1 652個文檔特征數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。b)從語料庫中隨機抽取100個單詞,然后將其組合成200個短語測試數(shù)據(jù),1 852個文檔特征數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。實驗采用查準率和查全率來衡量模型的性能。查準率和查全率分別定義為

      (13)

      (14)

      式(13)(14)中,P表示查準率,R表示查全率,T表示測試結(jié)果中查找正確的樣本數(shù),N表示測試獲得的結(jié)果樣本總數(shù),M表示測試樣本中與查找目標相關(guān)的正確樣本總數(shù)。通過實驗得到表1實驗結(jié)果,該結(jié)論表明模型在文本數(shù)據(jù)分析上是有效的。

      表1 A、B兩種記憶模式的查準率和查全率 %

      5 結(jié)論

      本文提出了一種基于云存儲的自組織增量類腦記憶模型,模型依據(jù)云存儲中個人行為數(shù)據(jù),運用自組織增量網(wǎng)絡(luò)學(xué)習(xí)模型,致力于重構(gòu)記憶服務(wù)系統(tǒng),解決記憶數(shù)據(jù)呈現(xiàn),從而輔助個體記憶,支持往事回憶、記憶分享等服務(wù)。模型通過真實數(shù)據(jù)集上仿真實驗,結(jié)果證明該模型的穩(wěn)定性和有效性達到了預(yù)期的效果。算法比較容易現(xiàn)實,能夠較好地進行云存儲記憶數(shù)據(jù)分析。但是,文中只對文本類型數(shù)據(jù)進行了驗證,還有像聲音、圖像、視頻、表格等復(fù)雜數(shù)據(jù)驗證需要進一步研究,這也是未來工作的研究方向。

      猜你喜歡
      結(jié)點文檔神經(jīng)元
      《從光子到神經(jīng)元》書評
      自然雜志(2021年6期)2021-12-23 08:24:46
      有人一聲不吭向你扔了個文檔
      躍動的神經(jīng)元——波蘭Brain Embassy聯(lián)合辦公
      Ladyzhenskaya流體力學(xué)方程組的確定模與確定結(jié)點個數(shù)估計
      基于RI碼計算的Word復(fù)制文檔鑒別
      Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
      基于二次型單神經(jīng)元PID的MPPT控制
      毫米波導(dǎo)引頭預(yù)定回路改進單神經(jīng)元控制
      基于Raspberry PI為結(jié)點的天氣云測量網(wǎng)絡(luò)實現(xiàn)
      不讓他人隨意下載Google文檔
      電腦迷(2012年4期)2012-04-29 06:12:13
      孙吴县| 新和县| 慈溪市| 黔南| 巴里| 宁河县| 鄂伦春自治旗| 辰溪县| 什邡市| 峡江县| 万源市| 渭南市| 宕昌县| 潞城市| 吴桥县| 灵丘县| 收藏| 杭锦后旗| 宣化县| 巍山| 织金县| 沙坪坝区| 施甸县| 黄梅县| 遵义县| 虞城县| 驻马店市| 崇义县| 武邑县| 凯里市| 三门县| 治多县| 广丰县| 乌兰浩特市| 朝阳区| 柳州市| 仙居县| 汉川市| 旌德县| 乡城县| 城步|