[摘 要]人工智能技術(shù)在農(nóng)業(yè)類高校圖書館信息化建設(shè)中的應(yīng)用面臨數(shù)據(jù)標(biāo)準(zhǔn)化缺失、集成難度大,智能推薦系統(tǒng)領(lǐng)域知識(shí)適配性不足,特色資源數(shù)字化處理技術(shù)局限等問題。文章分析這些問題的具體表現(xiàn)與成因,提出實(shí)施數(shù)據(jù)標(biāo)準(zhǔn)化與集成平臺(tái)構(gòu)建、優(yōu)化領(lǐng)域知識(shí)模型以提高推薦系統(tǒng)精準(zhǔn)度、推進(jìn)農(nóng)業(yè)特色資源深度數(shù)字化技術(shù)創(chuàng)新等建議,以期為相關(guān)領(lǐng)域的研究與實(shí)踐提供參考。
[關(guān)鍵詞]農(nóng)業(yè)類高校;圖書館;人工智能技術(shù);信息化建設(shè)
doi:10.3969/j.issn.1673 - 0194.2024.20.049
[中圖分類號(hào)]G258.6;G250.7 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1673-0194(2024)20-0-03
0" " "引 言
近年來,人工智能技術(shù)的蓬勃發(fā)展,給圖書館信息化建設(shè)帶來新的契機(jī)。農(nóng)業(yè)類高校作為專業(yè)性較強(qiáng)的院校,其圖書館在信息化建設(shè)過程中有著獨(dú)特需求。探索將人工智能技術(shù)應(yīng)用于農(nóng)業(yè)類高校圖書館信息化建設(shè),對(duì)提升圖書館服務(wù)效能、助力高校人才培養(yǎng)和科研創(chuàng)新具有重要意義[1]。
1" " "人工智能技術(shù)概述
人工智能是計(jì)算機(jī)科學(xué)與智能科學(xué)的交叉領(lǐng)域,涵蓋機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、自然語言處理、計(jì)算機(jī)視覺、表示學(xué)習(xí)等多個(gè)分支。其核心是通過算法模型使機(jī)器具備感知、學(xué)習(xí)、推理、決策等智能行為。當(dāng)前,深度學(xué)習(xí)技術(shù)已成為人工智能領(lǐng)域的研究熱點(diǎn)。例如,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)通過局部連接和權(quán)值共享,能夠高效處理圖像、視頻等數(shù)據(jù);長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)通過門控機(jī)制,能夠建模序列數(shù)據(jù),廣泛應(yīng)用于語音識(shí)別、機(jī)器翻譯等。此外,強(qiáng)化學(xué)習(xí)、遷移學(xué)習(xí)、元學(xué)習(xí)等新興范式不斷涌現(xiàn),進(jìn)一步拓展了人工智能的應(yīng)用邊界[2]。我國(guó)高度重視人工智能的發(fā)展,先后出臺(tái)了《“十三五”國(guó)家科技創(chuàng)新規(guī)劃》《新一代人工智能發(fā)展規(guī)劃》等政策文件,部署構(gòu)筑開放協(xié)同的人工智能科技創(chuàng)新體系。在此背景下,將人工智能技術(shù)引入圖書館信息化建設(shè),能夠增強(qiáng)圖書館智能化服務(wù)能力,優(yōu)化資源配置與用戶體驗(yàn)。例如,運(yùn)用自然語言處理技術(shù)構(gòu)建書目信息智能檢索系統(tǒng),基于深度學(xué)習(xí)算法開發(fā)個(gè)性化資源推薦引擎,利用知識(shí)圖譜技術(shù)組織多源異構(gòu)數(shù)據(jù)。這對(duì)于農(nóng)業(yè)類高校圖書館而言尤為重要,能夠滿足師生在專業(yè)領(lǐng)域內(nèi)的精準(zhǔn)信息需求,為農(nóng)業(yè)教學(xué)科研提供有力支撐。
2" " "農(nóng)業(yè)類高校圖書館信息化建設(shè)的特點(diǎn)
農(nóng)業(yè)類高校圖書館肩負(fù)著服務(wù)農(nóng)業(yè)教學(xué)科研、傳承農(nóng)業(yè)文化的重要使命,其信息化建設(shè)呈現(xiàn)出鮮明特點(diǎn)。一是館藏資源領(lǐng)域?qū)I(yè)性強(qiáng),涵蓋作物學(xué)、園藝學(xué)、植物保護(hù)、農(nóng)業(yè)工程等多個(gè)學(xué)科,對(duì)信息資源的組織、揭示、利用提出了更高的要求[3]。二是服務(wù)對(duì)象的信息需求呈多樣化趨勢(shì),既有基礎(chǔ)性的教學(xué)參考資源需求,也有前沿性的科研文獻(xiàn)需求,還有應(yīng)用性的農(nóng)技推廣需求。三是數(shù)字資源建設(shè)專業(yè)特色突出,注重農(nóng)業(yè)專題數(shù)據(jù)庫(kù)、特色農(nóng)業(yè)文獻(xiàn)的數(shù)字化采集與加工。例如,農(nóng)業(yè)類高校圖書館采用光學(xué)字符識(shí)別(Optical Character Recognition,OCR)技術(shù)對(duì)古農(nóng)書進(jìn)行文字識(shí)別,運(yùn)用本體構(gòu)建方法組織農(nóng)業(yè)知識(shí),利用3D建模技術(shù)保存農(nóng)具模型。四是移動(dòng)信息服務(wù)覆蓋農(nóng)村,助力高校服務(wù)“三農(nóng)”。在此背景下,農(nóng)業(yè)類高校圖書館亟須運(yùn)用人工智能技術(shù)突破傳統(tǒng)模式。例如,基于用戶畫像與協(xié)同過濾算法優(yōu)化資源推送,構(gòu)建農(nóng)業(yè)知識(shí)圖譜促進(jìn)檢索發(fā)現(xiàn),應(yīng)用自動(dòng)摘要與機(jī)器翻譯簡(jiǎn)化文獻(xiàn)獲取,搭建智能問答平臺(tái)幫助用戶辨?zhèn)未嬲妫?]?!督逃畔⒒?.0行動(dòng)計(jì)劃》提出積極應(yīng)用智能技術(shù)推動(dòng)教育變革,為高校圖書館人工智能應(yīng)用指明方向。農(nóng)業(yè)類高校圖書館要順應(yīng)數(shù)字化、網(wǎng)絡(luò)化、智能化發(fā)展趨勢(shì),充分釋放人工智能賦能效應(yīng),加快實(shí)現(xiàn)信息資源、服務(wù)模式、管理方式的智慧化變革。
3" " "人工智能技術(shù)在農(nóng)業(yè)類高校圖書館信息化建設(shè)中應(yīng)用的現(xiàn)存問題
3.1" "數(shù)據(jù)標(biāo)準(zhǔn)化缺失與集成難度大
當(dāng)前,人工智能技術(shù)在農(nóng)業(yè)類高校圖書館信息化建設(shè)中的應(yīng)用尚處于探索階段,數(shù)據(jù)標(biāo)準(zhǔn)化缺失與集成難度大是亟待解決的現(xiàn)實(shí)問題。農(nóng)業(yè)領(lǐng)域數(shù)據(jù)來源廣泛,涉及作物種植、動(dòng)物養(yǎng)殖、農(nóng)產(chǎn)品加工等各個(gè)環(huán)節(jié),且數(shù)據(jù)格式多樣,包括文本、數(shù)值、圖像、視頻等異構(gòu)數(shù)據(jù),加之缺乏統(tǒng)一的描述規(guī)范和管理標(biāo)準(zhǔn),導(dǎo)致數(shù)據(jù)質(zhì)量參差不齊,語義表達(dá)模糊。以農(nóng)作物病蟲害數(shù)據(jù)為例,不同來源的數(shù)據(jù)在病蟲害名稱、危害程度、防治方法等關(guān)鍵要素的表示上存在差異,急需建立統(tǒng)一的數(shù)據(jù)描述規(guī)范[5]。此外,農(nóng)業(yè)數(shù)據(jù)分散在不同的業(yè)務(wù)系統(tǒng)和存儲(chǔ)介質(zhì)中,缺乏關(guān)聯(lián)機(jī)制,“數(shù)據(jù)孤島”問題突出。圖書館、科研機(jī)構(gòu)、政府部門雖然都積累了大量農(nóng)業(yè)數(shù)據(jù),但元數(shù)據(jù)標(biāo)準(zhǔn)不一致,對(duì)數(shù)據(jù)的語義理解存在偏差,導(dǎo)致跨系統(tǒng)、跨部門的數(shù)據(jù)整合共享難度大。
3.2" "智能推薦系統(tǒng)領(lǐng)域知識(shí)適配性不足
智能推薦系統(tǒng)在農(nóng)業(yè)類高校圖書館的應(yīng)用中,暴露出領(lǐng)域知識(shí)適配性不足的問題。以農(nóng)作物育種領(lǐng)域?yàn)槔N過程涉及品種選育、分子標(biāo)記輔助選擇、雜交優(yōu)勢(shì)利用等多個(gè)環(huán)節(jié),不同研究方向的學(xué)者對(duì)文獻(xiàn)資源的側(cè)重點(diǎn)存在明顯差異。例如,遺傳學(xué)家可能更關(guān)注數(shù)量性狀座位(Quantitative Trait Locus,QTL)定位、候選基因挖掘等方面的研究進(jìn)展,而育種學(xué)家則偏重優(yōu)良農(nóng)藝性狀的鑒定篩選和品種選育技術(shù)的研究文獻(xiàn)。當(dāng)前的推薦系統(tǒng)大多采用基于用戶和物品的協(xié)同過濾算法,通過挖掘用戶或物品之間的相似性實(shí)現(xiàn)推薦,但這類算法只能以隱式反饋數(shù)據(jù)(如借閱、點(diǎn)擊、收藏等)作為用戶興趣的代理,無法精準(zhǔn)建模用戶在農(nóng)學(xué)領(lǐng)域的專業(yè)背景和知識(shí)訴求,導(dǎo)致推薦的相關(guān)性和多樣性不足。推薦系統(tǒng)缺乏農(nóng)學(xué)本體知識(shí)的融入,難以充分挖掘用戶興趣和農(nóng)學(xué)文獻(xiàn)資源的語義關(guān)聯(lián)。以作物育種文獻(xiàn)為例,不同環(huán)節(jié)的研究成果在方法、原理上往往存在依賴關(guān)系,如QTL定位是開展標(biāo)記輔助選擇的前提,育種材料的創(chuàng)制又離不開雜種優(yōu)勢(shì)的利用。然而,受農(nóng)學(xué)本體構(gòu)建滯后的影響,這些語義關(guān)系在文獻(xiàn)資源組織中未能充分揭示,推薦系統(tǒng)難以利用領(lǐng)域知識(shí)實(shí)現(xiàn)精準(zhǔn)鏈接,導(dǎo)致推薦解釋性不足。
3.3" "農(nóng)業(yè)特色資源數(shù)字化處理技術(shù)存在局限性
隨著數(shù)字技術(shù)的發(fā)展,農(nóng)業(yè)類高校圖書館積累了大量農(nóng)業(yè)特色資源,但在數(shù)字化處理過程中存在技術(shù)瓶頸。以古農(nóng)書的數(shù)字化為例,古農(nóng)書一般存在紙張泛黃、字跡模糊、版式復(fù)雜等問題,直接利用OCR技術(shù)進(jìn)行文字識(shí)別,往往難以達(dá)到理想的識(shí)別精度。雖然深度學(xué)習(xí)模型的出現(xiàn)在一定程度上提升了識(shí)別效果,但針對(duì)古農(nóng)書字形字體的專用樣本較少,模型的泛化性能有限。加之缺乏農(nóng)學(xué)領(lǐng)域的語言模型與詞典,難以有效提高農(nóng)業(yè)命名實(shí)體識(shí)別的準(zhǔn)確率。又以三維農(nóng)具模型的構(gòu)建為例,農(nóng)具造型獨(dú)特,紋飾精美,傳統(tǒng)的多視角圖像拼接技術(shù)難以生成細(xì)節(jié)清晰、結(jié)構(gòu)完整的三維模型,而激光掃描等主動(dòng)式采集設(shè)備成本高,點(diǎn)云數(shù)據(jù)后期拼接與語義標(biāo)注工作量大,導(dǎo)致農(nóng)具三維模型數(shù)字化難度高,示范性應(yīng)用少。知識(shí)密集型農(nóng)業(yè)特色資源對(duì)數(shù)字化處理技術(shù)的領(lǐng)域適配性要求高,但通用的人工智能模型在農(nóng)業(yè)領(lǐng)域的專用訓(xùn)練數(shù)據(jù)少,遷移學(xué)習(xí)與增量學(xué)習(xí)的研究有待深入,難以充分挖掘農(nóng)業(yè)資源特征,提煉領(lǐng)域知識(shí),數(shù)字化效果受限。
4" " "提高人工智能技術(shù)在農(nóng)業(yè)類高校圖書館信息化建設(shè)中應(yīng)用效能的對(duì)策
4.1" "實(shí)施數(shù)據(jù)標(biāo)準(zhǔn)化與集成平臺(tái)構(gòu)建
面對(duì)農(nóng)業(yè)數(shù)據(jù)標(biāo)準(zhǔn)化不足、異構(gòu)數(shù)據(jù)集成困難的問題,農(nóng)業(yè)類高校圖書館亟須從戰(zhàn)略高度統(tǒng)籌規(guī)劃,系統(tǒng)推進(jìn)農(nóng)業(yè)數(shù)據(jù)標(biāo)準(zhǔn)化進(jìn)程,夯實(shí)人工智能應(yīng)用基礎(chǔ)。首要任務(wù)是構(gòu)建覆蓋農(nóng)業(yè)產(chǎn)業(yè)鏈各環(huán)節(jié)的數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范。以作物種質(zhì)資源數(shù)據(jù)為例,需要從種質(zhì)分類、種質(zhì)特性、種質(zhì)保護(hù)、種質(zhì)評(píng)價(jià)等方面,制定統(tǒng)一的元數(shù)據(jù)描述標(biāo)準(zhǔn),明確品種名稱、學(xué)名、種質(zhì)類型、特征性狀、種質(zhì)來源、評(píng)價(jià)方法等關(guān)鍵要素的表示形式和填寫規(guī)則。農(nóng)業(yè)科教機(jī)構(gòu)、行業(yè)協(xié)會(huì)、企業(yè)應(yīng)積極參與標(biāo)準(zhǔn)制定,農(nóng)業(yè)類高校圖書館可發(fā)揮學(xué)科館員優(yōu)勢(shì),協(xié)調(diào)不同利益方的訴求,推動(dòng)標(biāo)準(zhǔn)在全行業(yè)的應(yīng)用和普及。
在夯實(shí)數(shù)據(jù)基礎(chǔ)的同時(shí),還需要構(gòu)建農(nóng)業(yè)科教融合的一體化數(shù)據(jù)集成平臺(tái),全面梳理分散在科研院所、涉農(nóng)企業(yè)、圖書情報(bào)機(jī)構(gòu)的數(shù)據(jù)資源,形成農(nóng)業(yè)數(shù)據(jù)資源的統(tǒng)一目錄,依托分布式架構(gòu)和鏈接開放數(shù)據(jù)原則,實(shí)現(xiàn)元數(shù)據(jù)、主題數(shù)據(jù)、引文數(shù)據(jù)的關(guān)聯(lián)融合,打破“數(shù)據(jù)孤島”,實(shí)現(xiàn)跨部門、跨區(qū)域的農(nóng)業(yè)數(shù)據(jù)互聯(lián)互通。在數(shù)據(jù)集成的過程中,要注重對(duì)數(shù)據(jù)溯源、質(zhì)量、安全、權(quán)屬等方面的規(guī)范管理,借助區(qū)塊鏈、隱私計(jì)算等技術(shù),實(shí)現(xiàn)數(shù)據(jù)全生命周期追溯、數(shù)據(jù)質(zhì)量多維評(píng)估、數(shù)據(jù)使用過程可信授權(quán)與監(jiān)管、數(shù)據(jù)價(jià)值利益分配機(jī)制創(chuàng)新,從而充分調(diào)動(dòng)多方參與數(shù)據(jù)匯聚、流通、應(yīng)用的積極性,激發(fā)農(nóng)業(yè)要素?cái)?shù)字化的創(chuàng)新活力,以高質(zhì)量的數(shù)據(jù)供給推動(dòng)人工智能在農(nóng)業(yè)領(lǐng)域的深度應(yīng)用。
4.2" "優(yōu)化領(lǐng)域知識(shí)模型以提高推薦系統(tǒng)的精準(zhǔn)度
智能推薦系統(tǒng)要贏得農(nóng)業(yè)類高校圖書館用戶的信任,必須充分體現(xiàn)農(nóng)學(xué)學(xué)科特點(diǎn),深度挖掘農(nóng)業(yè)領(lǐng)域知識(shí),優(yōu)化推薦算法的知識(shí)表示與應(yīng)用機(jī)制。構(gòu)建面向農(nóng)業(yè)文獻(xiàn)資源的領(lǐng)域本體與知識(shí)圖譜,是增強(qiáng)推薦系統(tǒng)專業(yè)性的重要路徑。以設(shè)施園藝領(lǐng)域?yàn)槔?,可從作物類型、栽培設(shè)施、環(huán)境調(diào)控、病蟲防治等方面梳理領(lǐng)域核心概念,明晰概念間的語義關(guān)系,形成規(guī)范化的本體框架。在此基礎(chǔ)上,利用自然語言處理技術(shù),從海量文獻(xiàn)中自動(dòng)抽取作物品種特性、栽培設(shè)施結(jié)構(gòu)參數(shù)、環(huán)境調(diào)控手段效果、病蟲害防治最佳方案等顯式知識(shí)要素,并通過知識(shí)推理獲取概念間的隱式關(guān)聯(lián),最終形成覆蓋設(shè)施園藝領(lǐng)域的多維度、多粒度知識(shí)圖譜。推薦系統(tǒng)可引入知識(shí)圖譜嵌入表示學(xué)習(xí),捕捉用戶興趣偏好與候選資源的語義相關(guān)性,克服傳統(tǒng)協(xié)同過濾算法依賴交互行為、忽視領(lǐng)域語義的局限。同時(shí),知識(shí)圖譜可作為可解釋的推理依據(jù),系統(tǒng)生成推薦解釋,提高推薦透明度。針對(duì)農(nóng)業(yè)跨學(xué)科用戶的特點(diǎn),推薦系統(tǒng)還應(yīng)加強(qiáng)不同學(xué)科本體間的映射融合,實(shí)現(xiàn)跨領(lǐng)域知識(shí)的關(guān)聯(lián)發(fā)現(xiàn)與推薦。例如,將施肥策略本體與環(huán)境科學(xué)本體進(jìn)行連接,挖掘減肥增效技術(shù)和面源污染的潛在聯(lián)系,當(dāng)環(huán)境領(lǐng)域用戶檢索農(nóng)田面源污染防治內(nèi)容時(shí),系統(tǒng)可主動(dòng)推薦測(cè)土配方施肥、水肥一體化等清潔生產(chǎn)技術(shù)的文獻(xiàn)。推薦系統(tǒng)的知識(shí)適配性增強(qiáng),將更精準(zhǔn)地把握用戶意圖,提升農(nóng)業(yè)科研人員的資源發(fā)現(xiàn)效率。
4.3" "推進(jìn)農(nóng)業(yè)特色資源深度數(shù)字化技術(shù)創(chuàng)新
農(nóng)業(yè)特色資源的深度數(shù)字化離不開人工智能技術(shù)的創(chuàng)新應(yīng)用,面對(duì)古農(nóng)書OCR識(shí)別難題,農(nóng)業(yè)類高校圖書館應(yīng)聯(lián)合人工智能企業(yè),在古農(nóng)書數(shù)字化場(chǎng)景下開展文字識(shí)別技術(shù)攻關(guān)。一方面,充分利用館藏古農(nóng)書底本,通過數(shù)據(jù)增強(qiáng)方法構(gòu)建訓(xùn)練樣本,優(yōu)化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),提高復(fù)雜版式字形的識(shí)別精度;另一方面,引入農(nóng)學(xué)詞典與語言模型,利用上下文語義信息對(duì)識(shí)別結(jié)果進(jìn)行糾錯(cuò),提升農(nóng)業(yè)命名實(shí)體識(shí)別效果。在此基礎(chǔ)上,應(yīng)進(jìn)一步結(jié)合內(nèi)容理解與知識(shí)抽取技術(shù),對(duì)古農(nóng)書進(jìn)行全文語義表示、核心術(shù)語抽取、因果關(guān)系挖掘,實(shí)現(xiàn)知識(shí)單元級(jí)別的深度標(biāo)引。針對(duì)農(nóng)業(yè)實(shí)物模型三維重建難度大的問題,可借鑒計(jì)算機(jī)視覺與圖形學(xué)的最新研究成果,探索多視角圖像與CAD模型融合建模方法,通過結(jié)構(gòu)化的三維形狀表示,動(dòng)態(tài)優(yōu)化每個(gè)視角的三維配準(zhǔn)參數(shù),減少數(shù)據(jù)采集量的同時(shí)保證精細(xì)化程度。另外,輔以深度學(xué)習(xí)特征提取與增量語義分割方法,實(shí)現(xiàn)大規(guī)模農(nóng)具三維模型的自動(dòng)語義標(biāo)注,提升后續(xù)檢索、展示、應(yīng)用的智能化水平。
面對(duì)農(nóng)業(yè)音像資源語義提取難題,農(nóng)業(yè)類高校圖書館可在多模態(tài)深度學(xué)習(xí)信息融合框架下,建立農(nóng)業(yè)知識(shí)驅(qū)動(dòng)的跨模態(tài)語義理解模型,利用農(nóng)學(xué)本體加強(qiáng)視聽覺特征學(xué)習(xí),實(shí)現(xiàn)農(nóng)業(yè)概念、農(nóng)事活動(dòng)等多粒度實(shí)體的關(guān)聯(lián)理解與語義標(biāo)注。同時(shí),應(yīng)通過小樣本學(xué)習(xí)、主動(dòng)學(xué)習(xí)、在線學(xué)習(xí)等機(jī)器學(xué)習(xí)新范式,解決農(nóng)業(yè)領(lǐng)域訓(xùn)練樣本不足的問題,提高模型對(duì)新實(shí)體、新事件的學(xué)習(xí)效率,賦能農(nóng)業(yè)特色資源數(shù)字化過程智能化,為用戶提供更具專業(yè)特色的深度揭示、語義檢索、知識(shí)發(fā)現(xiàn)等智能化服務(wù)。
5" " "結(jié)束語
人工智能為農(nóng)業(yè)類高校圖書館信息化建設(shè)注入新動(dòng)能,但受制于行業(yè)數(shù)據(jù)基礎(chǔ)薄弱、學(xué)科知識(shí)建模滯后、特色資源數(shù)字化瓶頸等因素,技術(shù)應(yīng)用效能發(fā)揮不充分。未來,農(nóng)業(yè)類高校圖書館應(yīng)著眼前沿技術(shù)發(fā)展,加強(qiáng)與人工智能產(chǎn)業(yè)界的深度合作,在農(nóng)業(yè)數(shù)據(jù)治理、學(xué)科知識(shí)工程化、特色資源數(shù)字化等方面先行先試,探索符合農(nóng)業(yè)場(chǎng)景特點(diǎn)的人工智能應(yīng)用模式。
主要參考文獻(xiàn)
[1]高家琦,馬秀峰.基于文獻(xiàn)計(jì)量的國(guó)內(nèi)圖書館人工智能應(yīng)用研究探析[J].圖書情報(bào)導(dǎo)刊,2023(10):1-11.
[2]李金,張玲.基于人工智能技術(shù)的微信平臺(tái)信息采集模型研究[J].自動(dòng)化與儀器儀表,2024(2):11-14,19.
[3]陳德銳.人工智能驅(qū)動(dòng)下的智慧圖書館創(chuàng)新策略[J].華章,2024(4):156-158.
[4]姜亞男.基于人工智能的圖書館信息檢索與推薦系統(tǒng)分析[J].電子技術(shù),2023(12):402-403.
[5]燕卓君.人工智能機(jī)器人技術(shù)在圖書館的應(yīng)用[J].信息與電腦(理論版),2023(23):162-164.