畢雪
摘要:隨著社會(huì)不斷進(jìn)步,集中體現(xiàn)研究成果的學(xué)術(shù)著作的數(shù)目以指數(shù)形式快速增長。本文擬采用稀疏模型,針對(duì)海量的著作信息,設(shè)計(jì)正則約束策略并聯(lián)合稀疏重建算法,實(shí)現(xiàn)對(duì)學(xué)者信息的有效采集。
關(guān)鍵詞:正則約束; 稀疏模型;信息采集;高效
1 引言
科學(xué)知識(shí)具有顯著的長期可積累性、可繼承性,任何新的科學(xué)技術(shù)都是在原有科學(xué)技術(shù)的基礎(chǔ)上分化、衍生出來的,即是對(duì)原有科學(xué)技術(shù)的發(fā)展。各學(xué)科的研究成果和學(xué)者的學(xué)術(shù)積累可由學(xué)術(shù)著作直接體現(xiàn)。因此,對(duì)這種承擔(dān)重要學(xué)術(shù)傳播功能和作用的學(xué)術(shù)文獻(xiàn)的相關(guān)信息進(jìn)行數(shù)據(jù)采集和分析具有重要的意義。
然而,學(xué)術(shù)著作通常篇幅大、出版和使月周期長、電子化程度較低。這些因素造成對(duì)學(xué)術(shù)著作數(shù)據(jù)的采集和分析都比較困難。與此同時(shí),有關(guān)著者的基本信息包括姓名、項(xiàng)目支持情況、所在單位、學(xué)者類型等基本情況不能直接從著作本身準(zhǔn)確獲取。因此,如何有效獲取學(xué)術(shù)著作的數(shù)據(jù)是一個(gè)亟待解決的問題。考慮到學(xué)術(shù)著作數(shù)目較多,提出基于正則約束的稀疏模型的采集方法,實(shí)現(xiàn)對(duì)學(xué)者信息、學(xué)術(shù)著作的高效匹配,從而實(shí)現(xiàn)對(duì)學(xué)術(shù)著作相關(guān)信息的采集和分析。
2 基于正則約束的學(xué)術(shù)著作信息采集模型
根據(jù)學(xué)者信息與學(xué)術(shù)著作的匹配問題的實(shí)際情況,即立足于海量的、不同類別的著作,著作者的信息--學(xué)者的姓名和單位具有稀疏性。與此同時(shí),基于稀疏性或可壓縮性的先驗(yàn)特性,Donoho[1]和Candès [2]等提出信號(hào)采樣和重建的理論—壓縮采樣。因此本文提出將稀疏重建模型引入到學(xué)術(shù)著作信息采集,公式如(1)所示:
3 仿真結(jié)果分析
仿真環(huán)境為:待重建的信號(hào)維度是5000,對(duì)應(yīng)共有5000個(gè)學(xué)者信息,稀疏度K的范圍為210至300,即有210至300名學(xué)者的信息需要被采集。仿真結(jié)果如表1所示,模型所使用的觀測(cè)矩陣為滿足約束等距性質(zhì)的隨機(jī)矩陣,當(dāng)稀疏度為210至300的情況下,成功重建的概率為100%以上。
4 結(jié)語
在這個(gè)信息爆炸的時(shí)代,如何有效提取和采集有用信息是亟待解決的問題,特別是對(duì)承擔(dān)重要學(xué)術(shù)傳播功能和作用的學(xué)術(shù)文獻(xiàn)的相關(guān)信息進(jìn)行數(shù)據(jù)采集和分析具有重要的意義。本文從信息本身稀疏的角度出發(fā),將信息采集問題視為一個(gè)欠定問題。下一步,我們將進(jìn)一步結(jié)合深度學(xué)習(xí)探討該問題。
參考文獻(xiàn)
[1] Y. Tsaig, D.L. Donoho. Extensions of compressed sensing. Signal Processing.2006, 86(3): 533-548.
[2] E. J. Candès, J. Romberg, and T. Tao. Robust uncertainty principles: Exact signal recognition from highly incomplete frequency information. IEEE Transactions on Information Theory.2006, 52(2): 489-509.
[3] Liu Y, Haldar JP. PALMNUT: An Enhanced Proximal Alternating Linearized Minimization Algorithm With Application to Separate Regularization of Magnitude and Phase. IEEE Trans. Comput. Imaging 2021;7:530–518 doi: 10.1109/TCI.2021.3077806.
[4] Bi, X.; Leng, L.; Kim, C.; Liu,X.; Du, Y.; Liu, F. Constrained Backtracking Matching Pursuit Algorithm for Image Reconstruction in Compressed Sensing. Appl. Sci. 2021, 11, 1435.
[5]劉亞新,趙瑞珍.用于壓縮感知信號(hào)重建的正則化自適應(yīng)匹配追蹤算法. 電子與信息學(xué)報(bào). 2010,32(11):2713-2717.
助理研究員,項(xiàng)目資助編號(hào):SCAA16B10,四川學(xué)術(shù)成果分析與應(yīng)用研究中心,西華大學(xué)重點(diǎn)項(xiàng)目資助Z1520908,四川省教育廳資助項(xiàng)目17ZB0416,教育部春暉計(jì)劃項(xiàng)目資助Z2017075