[摘 要]AI是未來國際競爭的焦點和經(jīng)濟發(fā)展的新引擎,也是圖書館數(shù)智化轉(zhuǎn)型的關(guān)鍵推動力。大模型成功研發(fā)和快速迭代的過程有6個關(guān)鍵性的事件和節(jié)點。詳細(xì)剖析了ChatGPT的算法模型Transformer及LLM的主要能力表現(xiàn)。當(dāng)前圖書館發(fā)展面臨一些亟待解決的問題,而這些問題比較理想的解決方案就是導(dǎo)入以大模型為標(biāo)志的AI技術(shù)。但AI的導(dǎo)入也必將讓圖書館喜憂參半,應(yīng)在做好戰(zhàn)略分析的基礎(chǔ)上,審慎制定圖書館AI戰(zhàn)略對策。
[關(guān)鍵詞]智慧圖書館 人工智能(AI) 大語言模型(LLM) 圖書館數(shù)智化轉(zhuǎn)型
[分類號]G250.7
1 引言
人工智能(AI)技術(shù)的發(fā)展受到了國家的高度重視,被視為未來國際競爭的焦點和經(jīng)濟發(fā)展的新引擎。隨著數(shù)字經(jīng)濟的蓬勃興起和社會整體數(shù)字化程度的提升,AI的正面效應(yīng)日益顯著,其深度融入各行各業(yè),正逐步成為推動傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型升級的關(guān)鍵驅(qū)動力。政府高度重視AI的發(fā)展,出臺了一系列政策以促進AI技術(shù)與實體經(jīng)濟的深度融合,如《關(guān)于加快場景創(chuàng)新以人工智能高水平應(yīng)用促進經(jīng)濟高質(zhì)量發(fā)展的指導(dǎo)意見》[1]等,為AI的應(yīng)用提供了明確的指導(dǎo)和保障。各地政府如北京、上海、深圳等發(fā)布了支持AI產(chǎn)業(yè)的政策文件,推動了AI技術(shù)的創(chuàng)新和應(yīng)用。
在“十四五”規(guī)劃中,智慧圖書館的建設(shè)被視為數(shù)字化轉(zhuǎn)型的重要內(nèi)容,旨在推進圖書館事業(yè)的高質(zhì)量轉(zhuǎn)型。這表明AI在智慧圖書館領(lǐng)域的應(yīng)用不僅是技術(shù)進步的體現(xiàn),也是國家戰(zhàn)略的一部分。智慧圖書館作為知識傳播的重要載體,在AI技術(shù)的推動下迎來了前所未有的發(fā)展機遇[2]。大模型技術(shù)在這一領(lǐng)域的應(yīng)用,加速了智慧圖書館的建設(shè),提升了圖書館的服務(wù)質(zhì)量和效率。智慧圖書館的應(yīng)用場景包括智慧管理、智慧業(yè)務(wù)、智慧服務(wù)、智慧空間等方面。這些應(yīng)用不僅優(yōu)化了圖書館內(nèi)部的管理流程,還極大地提升了讀者服務(wù)體驗,例如語義化管理和深度分析館藏資源,提供智能化的館員輔助等。通過自然語言處理技術(shù),圖書館能夠提供更加智能化的檢索推薦和新型閱讀體驗。
2 AI與大模型時代
在1956年的重要歷史節(jié)點上,麥卡錫匯聚了哈佛大學(xué)、麻省理工學(xué)院、IBM及貝爾實驗室的頂尖學(xué)者,于達(dá)特茅斯會議中首次明確提出了“人工智能”的概念。這一領(lǐng)域?qū)W⒂谥悄軝C器的創(chuàng)造,特別是智能計算機程序的研發(fā),旨在模擬并拓展人類智能的邊界。盡管它與利用計算機模擬人類智能的任務(wù)緊密相關(guān),但人工智能的探索并不受限于生物學(xué)視角的觀察方法,展現(xiàn)出更為廣闊的探索空間。
人工智能被視為一種“通用目的技術(shù)”(GPT),即“General Purpose Technology”的縮寫,這一稱謂凸顯其四大核心特征。首先,應(yīng)用范疇極為廣泛,能夠滲透至社會經(jīng)濟的多個領(lǐng)域;其次,持續(xù)推動生產(chǎn)效率的提升,同時降低了使用者的成本負(fù)擔(dān);再次,作為技術(shù)創(chuàng)新的催化劑,不斷激發(fā)新技術(shù)與產(chǎn)品的誕生;最后,深刻影響著生產(chǎn)流程、物流體系及組織管理模式的革新與優(yōu)化[3]。
經(jīng)濟學(xué)家回顧人類發(fā)展歷程,共識別出26項具有里程碑意義的通用技術(shù),而人工智能赫然在列,彰顯了其在技術(shù)發(fā)展史上的重要地位。人工智能學(xué)科的研究版圖廣泛,涵蓋知識表示、自動推理與搜索策略、機器學(xué)習(xí)與知識獲取機制、知識處理系統(tǒng)構(gòu)建、自然語言處理、計算機視覺技術(shù)、智能機器人研發(fā)以及自動程序設(shè)計等多個關(guān)鍵領(lǐng)域,這些研究共同推動著人工智能技術(shù)的不斷前行與深化。
2.1 AI發(fā)展階段
在人工智能的發(fā)展歷程中,其演進路徑可以大體做如下劃分。
第一,從理論發(fā)展階段看。首先是規(guī)則導(dǎo)向階段,接著是機器學(xué)習(xí)階段,隨后進入深度學(xué)習(xí)階段(當(dāng)前我們正處于這一階段),并預(yù)期未來會邁向自主學(xué)習(xí)的新階段[4]。深度學(xué)習(xí)的“層次化”學(xué)習(xí)思想與人類視覺認(rèn)知機理高度適應(yīng)。1958年,約翰霍普金斯大學(xué)的David Hubel和Torsten Wiesel發(fā)現(xiàn)人的視覺系統(tǒng)的信息處理是分級的,人對物品的識別可能是一個不斷迭代和抽象的過程。這一發(fā)現(xiàn)是神經(jīng)科學(xué)與認(rèn)知領(lǐng)域的重大突破,促進了人工智能領(lǐng)域以后50年的發(fā)展。
第二,從發(fā)展水平來看。人工智能又可以分為弱人工智能(ANI)、強人工智能(AGI)和超人工智能(ASI)3個階段。其中,目前我們正享受著弱人工智能(ANI)給我們工作學(xué)習(xí)帶來的便利和效率的大幅度提升。
第三,從應(yīng)用成熟程度看。人工智能的分類可進一步細(xì)化為4種主要類型:感知式AI、分析式AI、決策式AI以及生成式AI(Generative AI)。感知式AI與分析式AI在應(yīng)用上已相對成熟,它們在處理信息和理解環(huán)境方面發(fā)揮著重要作用。而決策式AI作為近年來的熱點,正以前所未有的速度發(fā)展,助力各行業(yè)做出更加精準(zhǔn)和高效的決策。
值得注意的是,生成式AI這一領(lǐng)域正迎來重大的技術(shù)突破。相比傳統(tǒng)的用戶生成內(nèi)容(UGC)和專業(yè)生成內(nèi)容(PGC),生成式AI能夠?qū)崿F(xiàn)內(nèi)容創(chuàng)作質(zhì)的飛躍,不僅能夠以更高的效率生成大量內(nèi)容,而且內(nèi)容質(zhì)量也顯著提升,同時大幅降低了單位成本。隨著技術(shù)的不斷進步,生成式AI將從當(dāng)前的輔助創(chuàng)作生成階段,逐步邁向高度自動化甚至自主創(chuàng)造的新紀(jì)元,為內(nèi)容創(chuàng)作領(lǐng)域帶來革命性的變革。
2.2 代表性的AI大模型
國內(nèi)AI產(chǎn)品有智能體(Kimi+、Coze)、多模態(tài)大模型(通義千問、智譜清言)、長文檔分析(Kimi、通義千問)、AI搜索(秘塔AI搜索、天工AI搜索)、智能辦公(WPS AI、通義聽悟)、語音聊天(豆包、海螺AI)、智能存儲(百度網(wǎng)盤、夸克網(wǎng)盤)。表1和圖1分別為國內(nèi)外通用大模型。
2.3 ChatGPT發(fā)展的關(guān)鍵性事件
對話式生成型預(yù)訓(xùn)練轉(zhuǎn)換程序(Chat Generative Pre-training Transformer,ChatGPT)發(fā)布于2022年11月30日,是由OpenAI公司研發(fā)的對話系統(tǒng)。由于其能在諸多知識領(lǐng)域中給出清晰、詳盡的答案,甚至寫出接近真人撰寫的文章,自推出后便迅速獲得關(guān)注,5天內(nèi)注冊用戶數(shù)就超過百萬。2022年見證了生成式AI領(lǐng)域的顯著飛躍,這一進步很大程度上歸功于自然語言處理(NLP)技術(shù)的顯著革新。特別是大語言模型(Large Language Model,LLM)的興起,極大地促進了文本理解與連貫生成的能力,實現(xiàn)了從理論到實踐的跨越性應(yīng)用。在這一背景下,ChatGPT模型通過引入人類反饋的強化學(xué)習(xí)(RLHF)機制,進一步優(yōu)化了其性能。截至2023年1月,ChatGPT用戶規(guī)模已迅猛突破一億大關(guān),成為當(dāng)時增速最為驚人的消費者級應(yīng)用之一,彰顯了其巨大的市場潛力和社會影響力。
根據(jù)2023年11月15日Writerbuddy.ai公布的一項數(shù)據(jù),2022年9月至2023年8月期間,前50名人工智能工具的總訪問量達(dá)到240億,其中ChatGPT獨占146億。結(jié)果顯示,ChatGPT作為OpenAI開發(fā)的生成式AI聊天機器人,在短短不到一年的時間里,每月平均吸引了15億的訪問量,占據(jù)了總流量的60%。圖2為GPT發(fā)展關(guān)鍵節(jié)點。
ChatGPT已實現(xiàn)的創(chuàng)新包括以下幾個方面。第一,自然語言處理的進步。ChatGPT在理解和生成自然語言方面表現(xiàn)出色,展示了先進的自然語言理解和生成能力。第二,上下文感知對話管理。能夠在一定程度上理解和記憶對話歷史,實現(xiàn)上下文順暢地交流。第三,跨領(lǐng)域知識應(yīng)用。集成了廣泛的領(lǐng)域知識,可以在多種主題上進行交流和生成信息。第四,用戶意圖識別與適應(yīng)性回應(yīng)。具備識別用戶意圖并據(jù)此調(diào)整回答的能力,能夠根據(jù)不同的查詢提供相應(yīng)的信息和服務(wù)。第五,多模態(tài)交互能力。集成并理解多種類型的數(shù)據(jù)(如文本、圖像、聲音)進行綜合交互。而其尚未實現(xiàn)的創(chuàng)新有3個方面。第一,高級情感智能。雖然具備基本的情感識別能力,但在理解和表達(dá)復(fù)雜情感方面仍有局限。第二,深層次常識推理。在復(fù)雜的常識推理和深入邏輯分析方面的表現(xiàn)仍有提升空間。第三,無偏見輸出。由于訓(xùn)練數(shù)據(jù)的限制,模型輸出可能受到數(shù)據(jù)、技術(shù)等偏見的影響。人類的偏見導(dǎo)致AI也無法實現(xiàn)完全的無偏見。
ChatGPT自2022年11月發(fā)布以來,有六大標(biāo)志性事件或節(jié)點。
第一,GPT-4V(ision)發(fā)布。2023年9月25日,OpenAI 發(fā)布具有視覺功能的GPT-4V(ision), 使用戶能夠指示GPT-4分析用戶提供的圖像輸入。4天后,2023年9月29日,微軟發(fā)布了166頁的GPT-4V(ision)的研究報告《大型多模態(tài)的新時代:GPT-4V(ision)的初步探索》The Dawn of LMMs:Preliminary Explorations with GPT-4V(ision) 這也將是人們了解 GPT-4V(ision) 的敲門磚。GPT-4V在十大任務(wù)中的表現(xiàn):開放世界視覺理解、視覺描述、多模態(tài)知識、常識、場景文本理解、文檔推理、寫代碼、時間推理、抽象推理、情感理解。
第二,Sora發(fā)布。2024年2月16日,OpenAI發(fā)布了第一個Text to Video大模型——Sora。 其強大之處在于能夠根據(jù)文本描述,生成長達(dá)60秒的視頻,其中包含精細(xì)復(fù)雜的場景、生動的角色表情以及復(fù)雜的鏡頭運動。
第三,F(xiàn)igure 01機器人發(fā)布。2024年3月13日,F(xiàn)igure AI發(fā)布了Figure 01機器人與人類交互的視頻。Figure 01機器人是第一個真正意義上的自主機器人。另外,具身機器人的快速發(fā)展,以及包括特斯拉的FSD驅(qū)動的無人駕駛代表汽車機器人的崛起都是這一領(lǐng)域的典型代表。
第四,ChatGPT-4o發(fā)布。ChatGPT-4o被稱為“OpenAI的一小步,人類AI助理的一大步”。北京郵電大學(xué)人機交互與認(rèn)知工程實驗室主任劉偉高度評價ChatGPT-4o。他認(rèn)為無論是在文本生成、做題、問答系統(tǒng)還是情感分析等任務(wù)中,GPT-4o都表現(xiàn)出很好的能力。這種技術(shù)的突破,無疑將對國內(nèi)外的相關(guān)企業(yè)產(chǎn)生重大影響,它不僅推動了自然語言處理技術(shù)的發(fā)展,也讓人工智能在多個領(lǐng)域的應(yīng)用變得更加廣泛和深入。
第五,融入傳統(tǒng)主流操作系統(tǒng)。ChatGPT融入微軟和蘋果的應(yīng)用系統(tǒng)。微軟推出Copilot全面融入Windows 11,蘋果推出Apple Intelligence。
第六,“AIGC+腦機接口”。2024年8月6日,為幫助殘疾人士及患有運動障礙的人更容易地使用手機、電腦和其他設(shè)備,美國腦機接口(BCI)公司的Synchron正在嘗試將ChatGPT集成到其腦機系統(tǒng)中,是為全球首創(chuàng)。
2.4 AI大模型的算法及能力表現(xiàn)
大語言模型是指具有大規(guī)模參數(shù)、高度復(fù)雜結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)模型,通常用于處理大規(guī)模、高維度的數(shù)據(jù)。參數(shù)大、訓(xùn)練數(shù)據(jù)集大是大模型的兩大特征。
大語言模型包括3個主要類型,分別是語言大模型、視覺大模型和多模態(tài)大模型。大語言模型通常由多個神經(jīng)網(wǎng)絡(luò)層組成,通過學(xué)習(xí)大量的數(shù)據(jù),可以生成與原始數(shù)據(jù)相似的新數(shù)據(jù),主要依賴于深度學(xué)習(xí)(Deep Learning,DL)技術(shù)。DL是機器學(xué)習(xí)(Machine Learning,ML)領(lǐng)域中一個新的研究方向,其最終目標(biāo)是讓機器能夠像人一樣具有分析學(xué)習(xí)能力,能夠識別文字、圖像和聲音等數(shù)據(jù)。大模型最常見的是生成對抗網(wǎng)絡(luò)、長短期記憶網(wǎng)絡(luò)、Transformer模型,如表2所示。
推動ChatGPT發(fā)展的關(guān)鍵性模型是Transformer架構(gòu),它是一種基于自注意力機制(self-attention)的模型,能夠有效處理長文本序列,并捕捉到單詞之間的關(guān)聯(lián)關(guān)系。Transformer模型由Google團隊在2017 年的論文Attention Is All You Need[5]中提出,該模型由兩部分組成:編碼器和解碼器。編碼器負(fù)責(zé)處理輸入數(shù)據(jù),而解碼器則負(fù)責(zé)生成輸出數(shù)據(jù)。這兩部分都使用了注意力機制,使得模型能夠理解和生成復(fù)雜的文本數(shù)據(jù)[6],如圖3所示。
目前,SU、UCSD、UC、UC Berkeley和Meta的研究人員提出了一種全新的大語言模型(LLM)架構(gòu)——Test-Time Training(TTT),有望代替至今在AI領(lǐng)域如日中天的Transformer,性能也比Mamba更好[7]。TTT層作為一種新的信息壓縮和模型記憶機制,可以簡單地直接替代 Transformer中的自注意力層。
目前大模型具備以下能力:(1)語言能力。包括對話(角色扮演)、解答、翻譯、寫文章、寫摘要。(2)語音能力。包括語音生成、文本轉(zhuǎn)錄、文音互譯。(3)圖像能力。包括理解和生成圖像和視頻,將認(rèn)知突破到具身智能,讓視障人士不再視障,讓機器人趕上并超越人類。(4)編程能力。如草圖生成界面、文本產(chǎn)生代碼、直接生成游戲、程序糾錯等。(5)數(shù)學(xué)能力。處理復(fù)雜的數(shù)學(xué)任務(wù),包括推理,如破譯復(fù)雜的稅碼和執(zhí)行復(fù)雜的計算。(6)多模態(tài)能力。理解多種媒體內(nèi)容,隨意交互,多種輸出(文本、圖像、3D圖像、音頻、視頻)。(7)整合能力——“智能體”崛起。自動API連接包括各類搜索在內(nèi)的所有應(yīng)用,形成有機聯(lián)系的智慧世界,并創(chuàng)建高度定制化的豐富場景,針對特定用例定制模型,提供流暢的交互和響應(yīng)。
當(dāng)然,大模型的快速迭代除了得益于上述算法的進步,還得益于算力的大幅度提升。OpenAI發(fā)布了一份關(guān)于AI計算能力增長趨勢的分析報告,報告顯示,自2012年以來,AI訓(xùn)練中所使用的計算力每三個半月增長一倍,自2012年以來,這個指標(biāo)已經(jīng)增長了三十萬倍以上。每兩年超過兩倍的數(shù)據(jù)增長意味著超過五倍的模型建構(gòu),需要超過十倍的算力提升。
2.5 AI大模型的雙面性
AI大模型作為一種新事物,展現(xiàn)出上述等方面的強大信息處理能力,但也引發(fā)了人們的擔(dān)憂。密歇根大學(xué)信息學(xué)院教授富山健太郎(Kentaro Toyama)也指出,以ChatGPT為代表的人工智能技術(shù)具有雙重影響。一方面,其有望顯著提高生產(chǎn)力,使許多任務(wù)自動化;另一方面,其也可能帶來諸如加劇欺詐活動、增加失業(yè)率以及干擾人際關(guān)系等負(fù)面效應(yīng)。富山健太郎強調(diào),面對如此強大的技術(shù),必須實施嚴(yán)格的監(jiān)管措施,并建議放緩創(chuàng)新步伐,以便為制定恰當(dāng)?shù)谋O(jiān)管政策留出時間。
關(guān)于大模型的雙面性的辯論由來已久,如比爾·蓋茨認(rèn)為ChatGPT的重要性不亞于互聯(lián)網(wǎng)的發(fā)明,將改變我們的世界。而馬斯克認(rèn)為AI會摧毀文明甚至毀滅人類。中國科學(xué)院譚鐵牛院士在中國科學(xué)院第十九次院士大會上發(fā)表了《人工智能:天使還是魔鬼》的主題報告,深度解讀了六十多年來人工智能的發(fā)展歷史,人工智能的七大現(xiàn)狀,發(fā)展趨勢、展望和現(xiàn)有人工智能的局限性等,認(rèn)為“人工智能的春天剛剛開始”。 物理學(xué)家斯蒂芬·霍金曾提出一個重要觀點,“人類文明的一切成就皆源于人類智慧的偉大”。通過分析國際象棋與圍棋等人機對抗的結(jié)果,他得出結(jié)論,認(rèn)為生物智能與計算機智能之間并不存在根本性的差距。由此推斷,計算機理論上具備模擬甚至超越人類智能的能力。霍金還預(yù)見,一旦人工智能擺脫現(xiàn)有的設(shè)計框架,其自我進化速度將以指數(shù)級增長,遠(yuǎn)遠(yuǎn)超過人類因自然選擇所需的時間。因此,他警告稱人類在未來可能面臨被人工智能取代的風(fēng)險。
總體而言,生成式人工智能工具通過分析大量數(shù)據(jù)集中的模式來進行預(yù)測生成,而不是基于對內(nèi)容的理解。這導(dǎo)致了幾方面的局限性和風(fēng)險:(1)依賴人類監(jiān)督。由于AI缺乏對生成內(nèi)容的理解,因此需要專業(yè)人士進行驗證以確保準(zhǔn)確性。(2)數(shù)據(jù)集的質(zhì)量問題。學(xué)習(xí)的數(shù)據(jù)可能存在缺陷、偏見或限制,從而影響生成結(jié)果的可靠性和公正性。(3)事實準(zhǔn)確性。生成的內(nèi)容可能包含不準(zhǔn)確的信息或虛假陳述。(4)安全性考量。生成的代碼可能存在安全隱患、錯誤或版權(quán)問題。(5)表面合理性。盡管生成的代碼或文本初看合理,但仍需專業(yè)審查以發(fā)現(xiàn)潛在錯誤。(6)缺乏倫理判斷。AI不具備區(qū)分生成內(nèi)容是否適當(dāng)、準(zhǔn)確或具有誤導(dǎo)性的能力,甚至有可能生成不當(dāng)或冒犯性的內(nèi)容。(7)虛假引用??赡軙刹淮嬖诘囊没騾⒖假Y料。
隨著數(shù)字化進程的推進,數(shù)據(jù)收集與處理的專業(yè)技能已成為眾多行業(yè)尖端技術(shù)的代表。ChatGPT進一步強化了這一趨勢,表明了一個新興的理念:只要擁有充足的數(shù)據(jù)和強大的計算資源,就能“構(gòu)建”出權(quán)威的知識體系。這意味著,掌握數(shù)據(jù)和技術(shù)的工程師逐漸成為新的知識權(quán)威,而不僅僅是傳統(tǒng)意義上的科學(xué)專家。簡單來說,知識的概念正在經(jīng)歷一場變革。隨著ChatGPT的普及應(yīng)用,其生成的知識內(nèi)容將會越來越多地滲入人類大的知識體系之中,這就像是轉(zhuǎn)基因食品,對人類的未來是福是禍還有待時間觀察。AI是一襲華麗的袍子,里面爬滿了虱子。我們一定要有敬畏之心、謹(jǐn)慎之心,使用大模型生成的知識,一定要經(jīng)過嚴(yán)格的驗證才能投放到公共知識領(lǐng)域。
3 AI是第一新質(zhì)生產(chǎn)力
2023年9月,習(xí)近平總書記在黑龍江考察時首次提出“新質(zhì)生產(chǎn)力”,指出要“整合科技創(chuàng)新資源,引領(lǐng)發(fā)展戰(zhàn)略性新興產(chǎn)業(yè)和未來產(chǎn)業(yè),加快形成新質(zhì)生產(chǎn)力”。習(xí)近平總書記指出:“新質(zhì)生產(chǎn)力是創(chuàng)新起主導(dǎo)作用,擺脫傳統(tǒng)經(jīng)濟增長方式、生產(chǎn)力發(fā)展路徑,具有高科技、高效能、高質(zhì)量特征,符合新發(fā)展理念的先進生產(chǎn)力質(zhì)態(tài)”,強調(diào)“科技創(chuàng)新能夠催生新產(chǎn)業(yè)、新模式、新動能,是發(fā)展新質(zhì)生產(chǎn)力的核心要素”[8]。
習(xí)近平總書記強調(diào):“人工智能是引領(lǐng)這一輪科技革命和產(chǎn)業(yè)變革的戰(zhàn)略性技術(shù),具有溢出帶動性很強的‘頭雁’效應(yīng)?!敝袊こ淘涸菏苦w賀銓認(rèn)為大模型、AIGC是當(dāng)前全球數(shù)字經(jīng)濟發(fā)展的熱點和趨勢,也是人工智能重要的核心技術(shù)[9]。大模型、AIGC的應(yīng)用落地也將創(chuàng)新產(chǎn)業(yè)生態(tài)模式,MaaS、PaaS將成為智能經(jīng)濟時代的重要業(yè)態(tài)。
在新質(zhì)生產(chǎn)力的諸要素中,人工智能技術(shù)不僅可作為勞動工具發(fā)揮重要的作用,而且能以人工智能體的身份擔(dān)當(dāng)勞動者的角色甚至主角,從而促成生產(chǎn)力的躍升。智能生產(chǎn)力具有將人工智能生產(chǎn)力要素化為引擎的先進性,以生產(chǎn)力要素智能化為依托的快速迭代性,滿足多樣發(fā)展需求的普惠性,使各領(lǐng)域聯(lián)系日益緊密的通約性,推動人類可持續(xù)發(fā)展的綠色性[10]。隨著人工智能推動新質(zhì)生產(chǎn)力的不斷發(fā)展,人類將會進入一個更加注重體驗的新時代[11]。
人工智能正成為加快發(fā)展新質(zhì)生產(chǎn)力的關(guān)鍵著力點,通過“AI+”模式賦能新質(zhì)生產(chǎn)力的形成與發(fā)展。在2024年,隨著政策聚焦于人工智能作為“新質(zhì)生產(chǎn)力”的發(fā)展?jié)摿Γ貏e是隨著GPT-4Turbo和Sora等產(chǎn)品的推出和應(yīng)用,讓人們感受到人工智能的大規(guī)模實際應(yīng)用為時不遠(yuǎn)。人工智能技術(shù)在醫(yī)療保健、交通領(lǐng)域等多個領(lǐng)域的應(yīng)用已經(jīng)展現(xiàn)出驚人的突破性案例,展示了其巨大潛力與廣泛影響力??梢灶A(yù)見,人工智能將會成為推動經(jīng)濟社會進步的第一新質(zhì)生產(chǎn)力,是決定國家核心競爭力的關(guān)鍵。
4 大模型賦能智慧圖書館
4.1 圖書館對數(shù)智技術(shù)的迫切需求
目前,圖書館存在以下迫切需要解決的問題。如圖書館員數(shù)量多,管理難度增加;服務(wù)效率降低;專業(yè)水平低;服務(wù)質(zhì)量下降;館員要求(待遇、工作環(huán)境、維權(quán)意識)高;運行成本提高;讀者要求高,需求個性化、精準(zhǔn)化、便利化更加明顯,外部壓力加大。而現(xiàn)在面臨的很多問題似乎都只能由智能手段解決[12],如個性化服務(wù)、多源信息融合、紙質(zhì)文獻的大規(guī)模數(shù)字化、自動化知識服務(wù)、數(shù)據(jù)監(jiān)管、紙質(zhì)圖書借閱率下降等。
因此,推進圖書館數(shù)智化深刻轉(zhuǎn)型是當(dāng)前的戰(zhàn)略性工作任務(wù)[13]。圖書館數(shù)智化轉(zhuǎn)型呈現(xiàn)出3種顯著形態(tài)[14]:一是增強型變革。在這一階段,圖書館積極吸納并融合數(shù)字化技術(shù),顯著增強了其服務(wù)效能。盡管服務(wù)內(nèi)容與方式得到了豐富與提升,但圖書館的基本職能框架、業(yè)務(wù)流程及管理模式仍保持相對穩(wěn)定,未發(fā)生根本性變革。二是解構(gòu)型變革。隨著數(shù)字化技術(shù)的深入應(yīng)用,圖書館的服務(wù)模式、服務(wù)主體及操作流程開始經(jīng)歷深刻的解構(gòu)與重組。在這一過程中,傳統(tǒng)服務(wù)方式逐漸被智能化、自動化的新流程所取代,圖書館內(nèi)部結(jié)構(gòu)與服務(wù)體系實現(xiàn)了基于技術(shù)創(chuàng)新的全面優(yōu)化與升級。三是新生型變革。當(dāng)數(shù)字化技術(shù)達(dá)到一定的滲透與融合程度后,圖書館將步入一個全新的發(fā)展階段。部分傳統(tǒng)職能可能逐漸淡化甚至消失,取而代之的是一系列新興職能、創(chuàng)新工作方法以及更加高效的管理制度。這一過程不僅標(biāo)志著圖書館本質(zhì)的深刻變化,更可能孕育出與以往截然不同的全新圖書館形態(tài),引領(lǐng)未來圖書館發(fā)展的新趨勢,如圖4所示。
4.2 AI引發(fā)圖書館的喜與憂
AI給圖書館帶來提高服務(wù)效率、優(yōu)化資源利用、促進創(chuàng)新服務(wù)模式、提升讀者體驗等方面的進步。具體表現(xiàn)在:(1)個性化推薦。通過分析用戶的閱讀歷史、借閱記錄以及搜索行為,大模型可以為用戶提供個性化的圖書推薦服務(wù)。這有助于提高用戶在圖書館的滿意度和借閱率,同時也可以幫助圖書館更好地了解用戶需求,優(yōu)化圖書采購和分類布局。(2)智能問答與導(dǎo)覽。大模型可以實現(xiàn)對用戶提問的智能回答,提供圖書檢索、借閱規(guī)則、場館導(dǎo)覽等信息服務(wù),從而提高圖書館的服務(wù)效率,減輕工作人員的負(fù)擔(dān)[15]。(3)文獻檢索與分析。大模型可以幫助圖書館進行文獻檢索和分析,快速找到用戶需要的資料。此外,還可以對館藏進行統(tǒng)計和分析,為圖書館的決策提供數(shù)據(jù)支持。(4)自動分類與編目。大模型可以根據(jù)圖書的屬性自動進行分類和編目,提高圖書館整理和管理工作效率[16]。(5)智能管理與維護。大模型可以幫助圖書館進行智能化的管理和維護,如實時監(jiān)控場館狀況、分析設(shè)備運行數(shù)據(jù)、預(yù)測故障等,提高圖書館運營的穩(wěn)定性和安全性。
大模型已成為下一代圖書館的基礎(chǔ)性數(shù)字能力,圖書館將越來越依賴大模型賦能發(fā)展和變革,下一代圖書館業(yè)務(wù)系統(tǒng)典型特征是大模型驅(qū)動。大模型對智慧圖書館的賦能作用有提升信息檢索效率、個性化服務(wù)、智能輔導(dǎo)與教育、智能推送服務(wù)、智能代理服務(wù)、人機交互優(yōu)化、服務(wù)效率提升、專業(yè)化定題服務(wù)、智慧空間建設(shè)、智慧管理與業(yè)務(wù)創(chuàng)新[17]。
另外,AI在圖書館的大規(guī)模應(yīng)用也會遇到一些現(xiàn)實問題,如面臨技術(shù)應(yīng)用與人員素質(zhì)的矛盾、數(shù)據(jù)安全與隱私保護問題、AI算法可能存在偏見、圖書館傳統(tǒng)職能與AI技術(shù)融合的挑戰(zhàn)以及行業(yè)競爭加劇等困難。
2023年11月20日,國際圖聯(lián)發(fā)布了一篇題為《制定圖書館人工智能戰(zhàn)略對策》的重要報告,報告采用SWOT戰(zhàn)略框架,列出圖書館制定人工智能戰(zhàn)略對策的相關(guān)考慮因素,如表3所示。
5 結(jié)語
目前,AI技術(shù)在圖書館領(lǐng)域的應(yīng)用正逐步深化,不僅提升了圖書館的服務(wù)質(zhì)量和效率,也推動了圖書館事業(yè)的數(shù)字化轉(zhuǎn)型。應(yīng)通過AI驅(qū)動圖書館新質(zhì)態(tài)發(fā)展。圖書館新質(zhì)服務(wù)是以更高素質(zhì)的館員為基礎(chǔ),以更高技術(shù)含量的館藏資源、基礎(chǔ)設(shè)施、空間為動力,以更高質(zhì)量的服務(wù)為根本的服務(wù)方式。服務(wù)新質(zhì)生產(chǎn)力發(fā)展也將成為圖書館新時代的歷史使命!
參考文獻:
[1] 中華人民共和國中央人民政府.科技部等六部門關(guān)于印發(fā)《關(guān)于加快場景創(chuàng)新以人工智能高水平應(yīng)用促進經(jīng)濟高質(zhì)量發(fā)展的指導(dǎo)意見》的通知[EB/OL].[2022-08-12].https://www.gov.cn/zhengce/zhengceku/2022-08/12/content_5705154.htm.
[2] 董曉霞,等.智慧圖書館的定義、設(shè)計以及實現(xiàn)[J].現(xiàn)代圖書情報技術(shù),2011(2):76-80.
[3] 關(guān)樂寧,徐凌驗.通用目的技術(shù)視角下新一代人工智能的作用機理與治理體系[J].系統(tǒng)工程理論與實踐,2024(1):245-259.
[4] 李曉理,等.人工智能的發(fā)展及應(yīng)用[J].北京工業(yè)大學(xué)學(xué)報,2020(6):583-590.
[5] Vaswani A,Shazeer N, Parmar N, et al. Attention is all you need[C]//Advances in Neural Information Processing Systems 30: Annual Conference on Neural Information Processing Systems 2017.Long Beach,USA,2017:5998-6008.
[6] 暴泰焚,等.基于Detection Transformer的反射對稱關(guān)系物體分類研究[J].制造業(yè)自動化,2022(11):191-195.
[7] Wang R,et al.Test-Time Training on Video Streams[J].Computer Vision and Pattern Recognition,2023:1-29.
[8] 中華人民共和國中央人民政府.習(xí)近平:發(fā)展新質(zhì)生產(chǎn)力是推動高質(zhì)量發(fā)展的內(nèi)在要求和重要著力點[EB/OL].[2024-09-08].https://www.gov.cn/yaowen/liebiao/202405
/content_6954761.htm.
[9] 鄔賀銓.AI為互聯(lián)網(wǎng)基礎(chǔ)資源治理提供新手段[J].互聯(lián)網(wǎng)天地,2023(12):2-3.
[10] 王水興,劉勇.智能生產(chǎn)力:一種新質(zhì)生產(chǎn)力[J].當(dāng)代經(jīng)濟研究,2024(1):36-45.
[11] 酈全民.人工智能在生產(chǎn)力中的角色[J].華東師范大學(xué)學(xué)報:哲學(xué)社會科學(xué)版,2023(5):6-12,170.
[12] 郭暢,等.數(shù)據(jù)驅(qū)動下智慧圖書館精細(xì)化管理機制與發(fā)展路徑[J].圖書館理論與實踐,2024(4):97-102.
[13] 王勇,劉佳佳.數(shù)字技術(shù)賦能圖書館智慧化服務(wù):邏輯、障礙與紓解路徑[J].圖書館,2024(1):47-52.
[14] 儲節(jié)旺,陳夢蕾.人工智能驅(qū)動圖書館變革[J].大學(xué)圖書館學(xué)報,2019(4):5-13.
[15] 郭亞軍,等.大語言模型賦能圖書館參考咨詢服務(wù):邏輯、場景與體系[J/OL].圖書館論壇,1-10[2024-09-08].https://link.cnki.net/urlid/44.1306.G2.20240220.0947.004.
[16] 肖燕.圖書采分編的自動化技術(shù)運用——以廣東省立中山圖書館“采編圖靈”為例[J].圖書館論壇,2024(4):20-28.
[17] 趙楊,張雪,范圣悅.AIGC驅(qū)動的智慧圖書館轉(zhuǎn)型:框架、路徑與挑戰(zhàn)[J].情報理論與實踐,2023(7):9-16.
儲節(jié)旺 男,1969年生。教授,博士生導(dǎo)師,館長。研究方向:知識管理、創(chuàng)新管理、科技管理。
樊鑫鑫 女,2001年生。碩士研究生在讀。研究方向:知識管理、創(chuàng)新管理、科技管理。
(收稿日期:2024-09-08;責(zé)編:婁明輝。)
*本文系國家社科基金一般項目“數(shù)智創(chuàng)新生態(tài)系統(tǒng)知識生成動力、擴散邏輯與治理機制研究”(項目編號:23BTQ055)的研究成果之一。