李驍天 胡良平 尚熙明 陳榮志
關(guān)鍵詞:體育科學(xué)研究;大型語言模型;ChatGPT;重塑;應(yīng)用
在信息爆炸的今天,數(shù)據(jù)成為了科學(xué)研究的重要基石。如何高效、準(zhǔn)確地從海量數(shù)據(jù)中提取有價(jià)值的信息,已經(jīng)成為當(dāng)代科研工作者面臨的重大挑戰(zhàn)。這一挑戰(zhàn)并不僅僅局限于傳統(tǒng)的自然科學(xué)領(lǐng)域,體育科學(xué)研究也同樣面臨如何從海量數(shù)據(jù)中提取有價(jià)值的信息的問題。近年來,隨著大型語言模型(large-scale language
model,LLM)的發(fā)展與應(yīng)用,我們看到了解決這一問題的可能性。然而,大型語言模型并不只是一個(gè)解決問題的工具,它更是在悄無聲息中改變并重塑著體育科學(xué)研究。本文將以O(shè)penAI公司發(fā)布的大型語言模型——ChatGPT為例,深入探討這一現(xiàn)象。ChatGPT的發(fā)布,逐步展現(xiàn)出人工智能在輔助科研工作方面的強(qiáng)大潛力。經(jīng)過海量文本數(shù)據(jù)的訓(xùn)練,ChatGPT能夠與用戶進(jìn)行流暢的對(duì)話,并生成看似類人、智能的文本。2023年3月14日.ChatGPT升級(jí)為GPT-4.0.并增設(shè)了應(yīng)用市場(chǎng)(plug-in),使其成為了一個(gè)功能豐富的生態(tài)系統(tǒng),允許研究人員根據(jù)任務(wù)需求從市場(chǎng)中選擇對(duì)應(yīng)的插件應(yīng)用。此進(jìn)展無疑標(biāo)志著“AIl.0到AI2.0”的新契機(jī)已經(jīng)來臨。對(duì)于體育科學(xué)研究而言,ChatGPT式的啟發(fā)性內(nèi)容生成、對(duì)話情景理解、序列任務(wù)執(zhí)行、程序語言解析與人工智能生成內(nèi)容(AIgenerated content,AIGC)的到來,勢(shì)必將引起體育科學(xué)研究一場(chǎng)數(shù)智化的變革。
大型語言模型的采用對(duì)體育科學(xué)研究提供了一種全新的研究工具。借助ChatGPT的功能,研究者能夠更有效地從海量的體育相關(guān)數(shù)據(jù)中提取有價(jià)值的信息,從而對(duì)運(yùn)動(dòng)員的身體狀況、運(yùn)動(dòng)表現(xiàn)等進(jìn)行深入分析。此外,通過程序語言解析與AIGC的功能,研究者甚至可以模擬各種體育競(jìng)技場(chǎng)景,為運(yùn)動(dòng)員的訓(xùn)練和比賽提供數(shù)據(jù)支持。然而,大型語言模型不只是帶來了研究?jī)?yōu)勢(shì),更是在改變并重塑著體育科學(xué)研究。例如:大型語言模型在文獻(xiàn)分析、定量分析、定性分析以及可視化技術(shù)等各個(gè)方面都產(chǎn)生了深遠(yuǎn)的影響。體育科研工作者必須認(rèn)識(shí)到,大型語言模型也給體育科學(xué)研究帶來了一些挑戰(zhàn)和問題,主要有如何有效地處理和分析大規(guī)模的數(shù)據(jù),模型的不透明性如何影響我們對(duì)研究結(jié)果的理解和評(píng)價(jià)。
本文將深入探討這些問題,并以此為契機(jī),進(jìn)一步理解大型語言模型在體育科學(xué)研究中的應(yīng)用和影響,同時(shí)也將關(guān)注使用這些模型可能帶來的挑戰(zhàn)和問題。通過本文的探討,希望能為未來的相關(guān)研究提供一些啟示,以更好地利用這些強(qiáng)大的模型,推動(dòng)體育科學(xué)研究的發(fā)展。全文框架如下:首先,概述大型語言模型的發(fā)展及其形式;其次,對(duì)大型語言模型給體育科學(xué)研究帶來的優(yōu)勢(shì)和機(jī)遇展開探討;再次,詳細(xì)分析大型語言模型如何重塑體育科學(xué)研究;最后,結(jié)合重塑繼而探討大型語言模型在體育科學(xué)研究中的局限、挑戰(zhàn),以及對(duì)未來研究的啟示。
1大型語言模型概述
1.1大型語言模型的發(fā)展演進(jìn)
大型語言模型是人工智能(AI)的一種技術(shù),它是一種利用自然語言處理(natural language process-ing,NLP)技術(shù)來理解、生成和處理人類語言的機(jī)器學(xué)習(xí)模型,這類模型直接可以用人類自然語言進(jìn)行對(duì)話,而不需要編程。其發(fā)展可以追溯到20世紀(jì)50年代的計(jì)算機(jī)科學(xué)重要分支——自然語言處理,側(cè)重于編程使計(jì)算機(jī)理解和生成人類語言,重點(diǎn)是如何讓計(jì)算機(jī)處理和理解人類語言。在大型語言模型發(fā)展的早期階段,它是基于N-gram統(tǒng)計(jì)語言模型來運(yùn)行的,但該模型存在數(shù)據(jù)稀疏性和泛化能力差的問題,無法很好地處理復(fù)雜的自然語言任務(wù)。隨著統(tǒng)計(jì)學(xué)、計(jì)算機(jī)硬件技術(shù)的發(fā)展,大型語言模型迎來了第2個(gè)發(fā)展階段,即采用循環(huán)神經(jīng)網(wǎng)絡(luò)(re-current neural networks,RNN)、長(zhǎng)短期記憶網(wǎng)絡(luò)(long short-term
memory,LSTM)等構(gòu)架。隨著深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展,學(xué)者Vaswani于2017年首度提出了transformer架構(gòu),這是第3個(gè)發(fā)展階段的標(biāo)志性事件。Transformer架構(gòu)完全依賴自注意力(self-attention)來計(jì)算輸入和輸出序列表示的深度學(xué)習(xí)相關(guān)的神經(jīng)網(wǎng)絡(luò)架構(gòu),它解決了RNNs和LSTM等模型在處理長(zhǎng)序列數(shù)據(jù)時(shí)存在的梯度消失或梯度爆炸的問題,同時(shí)也克服了CNNs等模型對(duì)于序列長(zhǎng)度的限制,逐漸使得它成為自然語言處理領(lǐng)域的主要技術(shù)之一。在Vaswani提出Trans-former之后的2年里,出現(xiàn)了包括Open AI的大型預(yù)訓(xùn)練語言模型機(jī)器人即GPT(generative pre -training transformer)、GPT-2、GPT-3/GPT-3.5、GPT-4和Google的Bard采用的BERT(bidirection-al encoder representations from transformers)與LaM-DA(language model for dialogue
applications)等大型語言模型。這些模型機(jī)器人都是通過在大量文本數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練,獲得豐富的語言知識(shí)和語義信息,能夠處理龐大的數(shù)據(jù)集并生成人類自然語言。模型在問答系統(tǒng)、機(jī)器翻譯、文本摘要等任務(wù)中取得了非常好的效果,逐漸在科學(xué)研究應(yīng)用場(chǎng)景中具備了廣泛潛力。
1.2主流常見大型語言模型
當(dāng)前大型語言模型除了人們所熟悉的ChatG-PT、Bard等之外還有ChatSonic、Jasper AI、The NewBing(Bing AI)、CoPilot和Claude等十多種。參閱國(guó)內(nèi)外學(xué)術(shù)期刊中的大型語言模型文獻(xiàn),本文選擇ChatGPT、Bard、Claude、The New Bing及Sage作為本節(jié)分析對(duì)象(見表1)。這幾類模型都在大量的文本和代碼數(shù)據(jù)集上進(jìn)行了數(shù)年的訓(xùn)練及完善,意味著它們都能進(jìn)行富有信息性和吸引力的對(duì)話,能很大程度上改變?nèi)藗儷@取信息的方式。它們還可以生成不同的創(chuàng)造性文本格式,如詩歌、代碼、劇本、音樂作品、電子郵件、信件等。Open AI有GPT -3.5和GPT-4 2種模型,也是當(dāng)前應(yīng)用最多的大型語言模型。GPT-4是目前最新的、功能較全的模型,比其他類型模型擁有更大的數(shù)據(jù)集,并在模型內(nèi)容參數(shù)方面進(jìn)行了微調(diào),這意味著它更有可能生成準(zhǔn)確且與更廣泛主題相關(guān)的文本。Bard由Google開發(fā),集合了LaMDA和BERT 2種模型技術(shù)。Bard已被用于生成研究論文、文獻(xiàn)的文本;Bard可以聯(lián)網(wǎng),因而信息準(zhǔn)確性會(huì)更高;它與github進(jìn)行整合,代碼輸出、分析的能力更強(qiáng)大。截至2023年7月,Bard支持40種語言且可以上傳文本、圖片進(jìn)行分析??傮w而言,ChatGPT在對(duì)寫作提示的復(fù)雜度評(píng)估方面與市場(chǎng)占有率略高于Bard(Experiment)。
Claude+和Claude Instant由Anthropic開發(fā),都基于GPT -3語言模型。Claude+的特點(diǎn)是支持長(zhǎng)文本及大型視頻的解析;Claude-instant設(shè)計(jì)用于學(xué)術(shù)研究應(yīng)用,可以快速響應(yīng)指令,生成準(zhǔn)確且與研究主題相關(guān)的文本。Sage由POE開發(fā),主要用于學(xué)術(shù)研究應(yīng)用,在學(xué)術(shù)論文的數(shù)據(jù)集上進(jìn)行了微調(diào),這就表明著它更有可能生成準(zhǔn)確且與研究主題相關(guān)的文本。該模型在通用目的的文本和代碼數(shù)據(jù)集上進(jìn)行了微調(diào)。這就表明它著可以用于多種任務(wù),翻譯語言和編寫不同種類的創(chuàng)意內(nèi)容,但主要特點(diǎn)是輔助寫作。
本文后續(xù)以ChatGPT-4為例進(jìn)行討論,因?yàn)榻刂?023年7月ChatGPT-4的插件應(yīng)用中約有近700多個(gè),且數(shù)量還在不斷更新中。這些插件主要以訪問網(wǎng)絡(luò)獲取各類型信息、執(zhí)行復(fù)雜的計(jì)算、與第三方服務(wù)交互的形式擴(kuò)展了ChatGPT功能,極大提升了體育科學(xué)研究的效率與效果。
1.3大型語言模型的特點(diǎn)與功能
現(xiàn)階段大型語言模型特點(diǎn)之一即上文提及的采用無監(jiān)督學(xué)習(xí)的技術(shù)進(jìn)行模型訓(xùn)練。通常模型被訓(xùn)練成預(yù)測(cè)給定的一系列詞語之后會(huì)出現(xiàn)的下一個(gè)詞,這意味著他們?cè)谟?xùn)練數(shù)據(jù)中并未給出明確的標(biāo)簽或答案,而是學(xué)習(xí)根據(jù)前面的單詞提供的上下文來預(yù)測(cè)句子中的下一個(gè)單詞,從而在生成一段語言時(shí),可以模擬人類語言的復(fù)雜性和連貫性,因而又稱為概率語言模型。大型語言模型的特點(diǎn)之二就是“大型語言模型”中的“大型”,是指模型有上億的參數(shù)。參數(shù)是訓(xùn)練數(shù)據(jù)中模型學(xué)習(xí)的部分,并用于進(jìn)行預(yù)測(cè)。例如:GPT-3截至2022年9月最后的訓(xùn)練數(shù)據(jù)有1750億個(gè)參數(shù),GPT-4截至2023年3月最后的訓(xùn)練數(shù)據(jù)有100萬億個(gè)參數(shù),Bard截至2023年5月最后的訓(xùn)練數(shù)據(jù)有1370萬億個(gè)參數(shù)。大型語言模型的特點(diǎn)之三就是模型信息量巨大。GPT-4的內(nèi)容來源主要是從互聯(lián)網(wǎng)上獲取的大量文本數(shù)據(jù)。這些數(shù)據(jù)可能來自各種不同的源頭,包括但不限于書籍、新聞文章、網(wǎng)頁、科技論文、博客、論壇帖子等。截至2021年9月,OpenAI的模型如GPT-3和GPT-4是基于廣泛的互聯(lián)網(wǎng)文本進(jìn)行訓(xùn)練的。大型語言模型的特點(diǎn)之四就是高級(jí)語言生成。在大型語言模型訓(xùn)練的過程中,這些文本數(shù)據(jù)被用來教會(huì)模型如何理解和生成人類語言。模型從這些數(shù)據(jù)中學(xué)習(xí)語言的模式,如單詞和短語的常見組合、句子的結(jié)構(gòu),以及在特定上下文中使用特定語言的習(xí)慣等。大型語言模型可以生成連貫、自然的文本,幾乎與人類產(chǎn)生的文本無法區(qū)分。這使得它們?cè)诤芏鄳?yīng)用中有巨大的價(jià)值,如在寫作助手、聊天機(jī)器人或自動(dòng)郵件響應(yīng)等場(chǎng)景中生成文本。
要弄清楚使用大型語言模型的功能,那么需要先弄清楚大型語言模型能做什么。學(xué)者吳軍認(rèn)為大型語言模型主要用于:第一,信息查詢,過去搜索引擎Baidu、Google是給出有答案的網(wǎng)頁鏈接,但現(xiàn)在ChatGPT是直接給出結(jié)果;第二,信息濃縮與編輯,這主要是專業(yè)人員使用。上述大型語言模型任務(wù)的核心:一個(gè)是理解自然語言,明白人的意圖;另一個(gè)是產(chǎn)生自然語言的文本,滿足人的要求。簡(jiǎn)言之,就是信息形式轉(zhuǎn)換、根據(jù)要求產(chǎn)生文本和信息精簡(jiǎn)。上述主要用途可以反映出,大型語言模型在自然語言理解與內(nèi)容生成方面具有以下幾項(xiàng)能力,即啟發(fā)性內(nèi)容生成能力、對(duì)話情景理解能力、序列任務(wù)執(zhí)行能力、程序語言解析能力。最后,由于ChatGPT的底層模型是在英文文本數(shù)據(jù)集上進(jìn)行自主學(xué)習(xí),故而采用英文提問的準(zhǔn)確性,要比其他語言問答的準(zhǔn)確性更高。
2大型語言模型應(yīng)用到體育科學(xué)研究中的優(yōu)勢(shì)與機(jī)遇
2.1大型語言模型應(yīng)用到體育科學(xué)研究中的優(yōu)勢(shì)
體育科學(xué)研究使用大型語言模型具有較大的優(yōu)勢(shì)。第一,在當(dāng)前的跨學(xué)科科研環(huán)境下,數(shù)據(jù)分析已經(jīng)成為常見的研究方法之一。大型語言模型可以處理和分析大量的定性數(shù)據(jù)(文本)和定量數(shù)據(jù),它可以幫助研究者解讀復(fù)雜的數(shù)據(jù)集,幫助學(xué)者從數(shù)據(jù)中發(fā)現(xiàn)隱藏的模式和數(shù)據(jù)趨勢(shì),并提供有關(guān)數(shù)據(jù)背后的含義。這對(duì)于數(shù)據(jù)驅(qū)動(dòng)的研究和實(shí)證研究非常有價(jià)值,可以幫助研究者做出準(zhǔn)確的結(jié)論和推斷。第二,大型語言模型可以提供快速而準(zhǔn)確的信息檢索和知識(shí)獲取。作為預(yù)訓(xùn)練生成的智能語言模型,它可以回答各種學(xué)術(shù)領(lǐng)域的問題,并提供相關(guān)的背景知識(shí)和文獻(xiàn)引用。這使得研究者能夠更高效地獲得所需的信息,節(jié)省大量的時(shí)間和精力。第三,大型語言模型具有強(qiáng)大的多語言處理能力,它能將研究成果翻譯成不同的語言,使學(xué)者可以更方便地獲取和理解其他語言的研究成果,拓寬研究視野。這里多語言處理不僅是不同語種間科研成果的翻譯,還可以實(shí)現(xiàn)與各種計(jì)算機(jī)語言的對(duì)話。第四,論文寫作是體育科研工作的核心環(huán)節(jié),且非常耗時(shí)。大型語言模型可以在寫作過程中為研究人員提供建議和提示,如提供論文結(jié)構(gòu)的建議,或者根據(jù)前文生成接下來的句子。大型語言模型還可以作為一個(gè)高效的文字編輯工具,特別是在英文方面可以自動(dòng)檢查并修正語法、拼寫和標(biāo)點(diǎn)錯(cuò)誤等,甚至可以對(duì)文章的流暢性和邏輯性進(jìn)行修改和優(yōu)化。大型語言模型能夠輸出連貫、自然的文本,具有一定類人語言特性。在某些特定情景下可以借助大型語言模型自動(dòng)生成科研文章的初稿,節(jié)省研究人員的寫作時(shí)間。第五,大型語言模型可以幫助體育科研人員增強(qiáng)知識(shí)儲(chǔ)備,降低知識(shí)使用門檻。國(guó)外學(xué)者使用ChatG-PT和Bard,為運(yùn)動(dòng)員制訂了為期4周個(gè)性化四周的下肢預(yù)防損傷訓(xùn)練方案(包括有氧熱身、動(dòng)態(tài)拉伸、訓(xùn)練和冷卻等)。大型語言模型不僅能夠滿足在運(yùn)動(dòng)訓(xùn)練中具備一定學(xué)識(shí)和文化水平的教練員、科研人員和管理人員的需求,還可以適用于文化程度相對(duì)較低的運(yùn)動(dòng)員。運(yùn)動(dòng)員可以通過自然語言交互的方式,與大型語言模型進(jìn)行交流,幫助他們識(shí)別運(yùn)動(dòng)動(dòng)作,獲取運(yùn)動(dòng)技能,并提供實(shí)日寸的反饋和指導(dǎo)。第六,大型語言模型能幫助快速撰寫體育新聞和提供熱點(diǎn)體育資訊分析,可以根據(jù)體育目標(biāo)人群的興趣偏好自動(dòng)生成指向性廣告內(nèi)容,從而提高營(yíng)銷工作的有效性。GPT-4已經(jīng)擁有了多模態(tài)的內(nèi)容輸出和處理功能。2023年5月,ChatGPTAPI的發(fā)布已經(jīng)應(yīng)允第三方將GPT植入自己的商業(yè)服務(wù)中,這意味著GPT將使AIGC的體育新聞制作能力實(shí)現(xiàn)質(zhì)的飛躍。此外,大型語言模型可通過分析偏好、行為和歷史記錄等粉絲數(shù)據(jù),進(jìn)而根據(jù)每個(gè)粉絲的需求和興趣生成定制報(bào)道內(nèi)容和信息推薦,如體育比賽看點(diǎn)、門票促銷、獨(dú)家商品優(yōu)惠等,以增加與粉絲的情感聯(lián)系,提供良好消費(fèi)體驗(yàn)。
2.2大型語言模型給體育科學(xué)研究帶來的機(jī)遇
大型語言模型,如ChatGPT,已經(jīng)在自然語言處理、機(jī)器翻譯、語音識(shí)別等領(lǐng)域取得了顯著的成果。這些技術(shù)的應(yīng)用,為體育科學(xué)研究提供了強(qiáng)大的工具和技術(shù)支持,從而提高了研究效率和準(zhǔn)確性,推動(dòng)了體育科學(xué)研究的進(jìn)程。具體來說,大型語言模型為體育科學(xué)研究帶來了發(fā)展機(jī)遇。第一,大型語言模型可以有效提升體育科學(xué)研究工作的效率與質(zhì)量。通過利用其強(qiáng)大的分析和生成能力,研究人員能夠快速查找及整理文獻(xiàn)資料,減輕繁重的信息篩選工作。例如:ChatGPT利用啟發(fā)性內(nèi)容生成能力可以生成研究提綱、研究報(bào)告等,能夠減輕研究人員的寫作負(fù)擔(dān),使其將精力集中在實(shí)驗(yàn)和創(chuàng)新上。第二,科研工作者可以通過與大型語言模型的交互,進(jìn)行頭腦風(fēng)暴和創(chuàng)新思考,發(fā)現(xiàn)新的研究領(lǐng)域和問題。例如:大型語言模型可以提供新的觀點(diǎn)、領(lǐng)域交叉的啟發(fā)和潛在的研究方向,幫助研究者拓展新的研究領(lǐng)域。第三,大型語言模型具有一定的自然語言理解能力,可以被用于體育科學(xué)研究中不同的學(xué)科領(lǐng)域知識(shí)的學(xué)習(xí)與運(yùn)用,推動(dòng)跨學(xué)科研究。例如:它可以幫助運(yùn)動(dòng)訓(xùn)練專家理解認(rèn)知神經(jīng)科學(xué),從而推動(dòng)體育神經(jīng)管理科學(xué)的發(fā)展。第四,使用大型語言模型的過程本身就是人工智能的研究機(jī)遇。研究人員可以通過與其互動(dòng),探索和理解人工智能模型的工作原理,例如:它是如何理解和生成語言的,以及它的優(yōu)點(diǎn)和局限在哪里。這些理解可以進(jìn)一步幫助科研人員構(gòu)建具有體育科學(xué)研究專業(yè)特色的大型語言模型。第五,大型語言模型能理解和生成多種語言的文本,這在進(jìn)行跨學(xué)科、跨語種研究時(shí)非常關(guān)鍵。用ChatGPT來翻譯和解析其他語言的學(xué)術(shù)資料,就可以提供多學(xué)科的視角。第六,大型語言模型可以幫助研究者創(chuàng)建豐富、引人入勝的可視化效果,幫助研究人員更好地理解和解釋他們的數(shù)據(jù),使得體育科學(xué)研究中的結(jié)果可視化變得可能。第七,大型語言模型將推動(dòng)“即時(shí)體育知識(shí)服務(wù)”的出現(xiàn),即在運(yùn)動(dòng)訓(xùn)練中可以提供個(gè)性化、高效、實(shí)時(shí)、全面的教學(xué)指導(dǎo)和服務(wù)。有研究表明,大型語言模型在提升運(yùn)動(dòng)員競(jìng)技技能、改善團(tuán)隊(duì)績(jī)效等方面有顯著的積極作用。隨著大型語言模型不斷迭代完善,它將為體育科學(xué)研究帶來巨大的機(jī)遇。下文從大型語言模型的3個(gè)核心任務(wù)、4項(xiàng)核心能力擴(kuò)展到文獻(xiàn)閱讀、視頻分析、實(shí)證定量分析、定性分析、定制研究框架、激發(fā)體育科學(xué)研究的創(chuàng)意展開,詳細(xì)討論大型語言模型如何重塑體育科學(xué)研究。
3大型語言模型對(duì)體育科學(xué)研究的重塑
3.1大型語言模型對(duì)體育科學(xué)研究中文獻(xiàn)分析的重塑
第一,大型語言模型通過信息形式轉(zhuǎn)換和信息精簡(jiǎn),借助強(qiáng)大插件(Xpaper、Scholar AI、NextPa-per. ai等)功能,能夠通過搜索、分析龐大的文獻(xiàn)數(shù)據(jù)庫,快速、準(zhǔn)確檢索相關(guān)文獻(xiàn),提供相關(guān)文獻(xiàn)的摘要和關(guān)鍵信息,借助人工智能圖形插件(Show Me)構(gòu)建文獻(xiàn)的思維導(dǎo)圖并進(jìn)行分析(見圖1—圖2)。第二,ChatGPT可以通過信息精簡(jiǎn)對(duì)海量文獻(xiàn)進(jìn)行自動(dòng)摘要和信息提取。以往我們?cè)谖墨I(xiàn)學(xué)習(xí)過程中,需要耗費(fèi)大量時(shí)間閱讀和整理大量的文獻(xiàn),提取其中的關(guān)鍵信息。ChatGPT及其采用GPT-3.5技術(shù)的文獻(xiàn)閱讀網(wǎng)頁插件(ChatDOC、ChatPDF等)能夠通過深度學(xué)習(xí)技術(shù),高效生成概覽和提取關(guān)鍵信息,還可以定位到具體頁碼提出的關(guān)鍵信息,高效地獲取所需的文獻(xiàn)知識(shí)。第三,由于體育科學(xué)研究屬于多學(xué)科交叉融合性的研究,需要閱讀大量外文、不同學(xué)科的文獻(xiàn)。ChatGPT具有信息形式轉(zhuǎn)換、根據(jù)要求產(chǎn)生文本和信息精簡(jiǎn)功能,可以實(shí)現(xiàn)對(duì)多語言的支持和跨學(xué)科融合。通過自然語言處理和對(duì)話情境理解能力,能夠幫助研究人員跨越語言障礙,獲取和理解不同時(shí)期、不同語種和不同領(lǐng)域的體育科學(xué)研究的成果,促進(jìn)體育科學(xué)研究間的交流和合作。例如:使用ChatGPT可以同時(shí)閱讀多個(gè)不同語言種類的文獻(xiàn),同時(shí)可以聯(lián)網(wǎng)進(jìn)行查閱,對(duì)互聯(lián)網(wǎng)、學(xué)術(shù)期刊論文進(jìn)行融合閱讀學(xué)習(xí)。第四,通常進(jìn)行一項(xiàng)研究的初期階段,學(xué)者需要快速、高效地概覽大量文獻(xiàn),并從中找到符合要求的文獻(xiàn)。如前所述,ChatG-PT能夠快速地掃描和總結(jié)大量的文本,它們能夠提供文章、書籍和論文的簡(jiǎn)潔摘要,方便研究者決定是否值得閱讀全文,整合、綜述篩選出來的文獻(xiàn),可以生成更全面、準(zhǔn)確的知識(shí)綜述,從而更好地了解相關(guān)研究領(lǐng)域的現(xiàn)狀和前沿。第五,ChatGPT通過信息精簡(jiǎn)、信息形式轉(zhuǎn)換還能夠挖掘文獻(xiàn)之間的關(guān)系,快速分析文獻(xiàn)間的相互引用關(guān)系,幫助研究人員建立知識(shí)網(wǎng)絡(luò)和關(guān)聯(lián)圖譜,促進(jìn)跨文獻(xiàn)的綜合分析和理解。
3.2大型語言模型對(duì)體育科學(xué)研究中定量分析的重塑
定量研究是體育科學(xué)研究中重要的方法之一,它是基于數(shù)理統(tǒng)計(jì)方法的研究,多采用描述性統(tǒng)計(jì)分析、推斷性統(tǒng)計(jì)分析和數(shù)據(jù)挖掘等,能夠提供深度的洞見并證明某些因果關(guān)系。許多體育科學(xué)研究需要處理大量的數(shù)據(jù),如大型全民健身問卷調(diào)查數(shù)據(jù)、中小學(xué)生體育鍛煉參與問卷數(shù)據(jù)、國(guó)民體質(zhì)測(cè)試數(shù)據(jù)、社交平臺(tái)上關(guān)于體育話題數(shù)據(jù)、社群關(guān)系中的體育參與影響數(shù)據(jù)、運(yùn)動(dòng)員的表現(xiàn)數(shù)據(jù)、大型商業(yè)體育賽事數(shù)據(jù)和比賽結(jié)果甚至觀眾的反饋等。這類數(shù)據(jù)數(shù)量大,變量多,不僅需要研究人員具備深厚的數(shù)理統(tǒng)計(jì)方法的知識(shí),還需要不同統(tǒng)計(jì)分析數(shù)據(jù)編程知識(shí),且分析時(shí)間較長(zhǎng),不易出成果。GPT-4具有強(qiáng)大的數(shù)據(jù)處理能力,可以把數(shù)據(jù)上傳到Chat-GPT的在線分析平臺(tái)(Python分析為主),它擁有較多的數(shù)據(jù)代碼的插件,能夠?qū)崿F(xiàn)自然語言與數(shù)據(jù)代碼間的交互,插件商場(chǎng)中已有多個(gè)代碼自動(dòng)撰寫的插件,可以使用代碼撰寫、文獻(xiàn)閱讀、網(wǎng)頁分析3個(gè)插件同時(shí)工作。體育科學(xué)研究中的實(shí)證定量研究不再受本地計(jì)算機(jī)算力的局限,可以實(shí)時(shí)、快速、高效地進(jìn)行諸如決策樹(decision trees)、支持向量機(jī)(support vector machines.SVM)、線性回歸(linearregression)、邏輯回歸(logistic regression)和神經(jīng)網(wǎng)絡(luò)(neural
networks)等監(jiān)督、無監(jiān)督機(jī)器學(xué)習(xí)分析,并根據(jù)研究中的要求進(jìn)行繪制統(tǒng)計(jì)圖表并撰寫簡(jiǎn)單的數(shù)據(jù)分析報(bào)告。ChatGPT能夠在客觀分析數(shù)據(jù)的同時(shí),以清晰、簡(jiǎn)潔的文字為學(xué)者提供概括與解釋,從而為研究人員提供分析結(jié)果、趨勢(shì)的預(yù)探析,加快研究進(jìn)程。此外,可以借助ChatGPT根據(jù)要求產(chǎn)生文本、信息精簡(jiǎn)的功能,幫助學(xué)者快速理解、學(xué)習(xí)各類統(tǒng)計(jì)模型,使用統(tǒng)計(jì)軟件進(jìn)行分析。最重要的是,ChatGPT具有一定程序語言解析能力,可以根據(jù)要求生成數(shù)據(jù)分析代碼,并給出每行代碼的幫助解釋,可以將代碼從一種編碼語言翻譯成另一種編碼語言,可以捕獲編碼中的拼寫錯(cuò)誤或違反基本語法的行為,極大地降低了體育科研工作者學(xué)習(xí)定量研究的門檻。圖3展示了ChatGPT-4根據(jù)體育科研工作者的要求寫的一段Python神經(jīng)網(wǎng)絡(luò)運(yùn)算的代碼,圖4展示了ChatGPT-4對(duì)每行代碼的解釋。更重要的是在實(shí)際操作過程,假如Python出現(xiàn)運(yùn)行錯(cuò)誤,ChatGPT-4根據(jù)錯(cuò)誤運(yùn)行信息,可以及時(shí)糾錯(cuò)。這個(gè)神經(jīng)網(wǎng)絡(luò)運(yùn)算代碼可能存在錯(cuò)誤的地方,這對(duì)于完全不了解Python、神經(jīng)網(wǎng)絡(luò)的研究人員來說極大地提高了研究效率。
3.3大型語言模型對(duì)體育科學(xué)研究中定性分析的重塑
常見的定性研究有訪談、焦點(diǎn)小組、現(xiàn)象學(xué)、扎根理論、民族志和口述史等。定性研究的目的是理解人類行為和經(jīng)驗(yàn)的復(fù)雜性和多樣性,通常采用更具開放式、靈活性的方法,以便研究者可以深入了解參與者的觀點(diǎn)和經(jīng)驗(yàn),從而獲得更全面、深入的理解。
體育科學(xué)研究中的定性研究常涉及文本材料、音頻材料、視頻材料的分析,但更多以前兩者為主。第一,ChatGPT通過信息精簡(jiǎn)能快速、準(zhǔn)確地從文本材料中識(shí)別和提取關(guān)鍵信息,如文本中的主題、觀點(diǎn)、論據(jù)等。研究人員使用ChatGPT的API接口,訓(xùn)練專門的定性研究話題的模型,使模型內(nèi)容可以更加聚焦,使其能夠識(shí)別和標(biāo)記潛在的主題或感興趣的體育定性研究議題??梢愿鶕?jù)已經(jīng)訓(xùn)練的ChatGPT模型提供對(duì)文本材料的獨(dú)特分析視角,ChatGPT可以協(xié)助解釋結(jié)果,生成復(fù)雜構(gòu)念的研究摘要,并幫助以更易于理解的方式將研究結(jié)果呈現(xiàn)給科研工作者,如借助思維導(dǎo)圖形式展現(xiàn)研究結(jié)果。雖然這不能完全替代學(xué)者在這個(gè)復(fù)雜任務(wù)中的工作,但是在主題分析的初始階段,可以簡(jiǎn)化研究人員的工作量。需要強(qiáng)調(diào)的是,GPT-4借助強(qiáng)大的自然語言處理能力,加之具有處理各種語言的能力,可以簡(jiǎn)化文本分析過程。第二,大型語言模型可以為體育定性研究提供新的視角和方法,文本分類研究是其他學(xué)科定性研究的常用方法之一,通過聚類和分類技術(shù),它們可以幫助研究人員發(fā)現(xiàn)文本數(shù)據(jù)中的隱藏模式,或者幫助人們理解復(fù)雜的問題與現(xiàn)象。通過生成模型,甚至可以模擬社會(huì)互動(dòng),以預(yù)測(cè)和理解這類現(xiàn)象與關(guān)系。具體來說,ChatGPT在以下幾個(gè)體育科學(xué)研究領(lǐng)域中可以重塑定性研究。體育法規(guī)政策研究能借助ChatGPT進(jìn)行信息精簡(jiǎn),可以從大量的體育政策法規(guī)文件中快速提取相關(guān)信息,基于給定主題或在多輪對(duì)話過程中識(shí)別的上下文信息,生成有啟發(fā)性和創(chuàng)意性進(jìn)而獲得有價(jià)值的研究材料。
在研究不同時(shí)期、不同語種奧林匹克運(yùn)動(dòng)的文件時(shí),ChatGPT可以通過信息形式轉(zhuǎn)化、信息精簡(jiǎn),進(jìn)行跨語種的奧林匹克研究,將不同歷史時(shí)期奧林匹克運(yùn)動(dòng)中相關(guān)的文件進(jìn)行思維導(dǎo)圖呈現(xiàn)。在體育新聞學(xué)研究中,賽事中運(yùn)動(dòng)員采訪文稿是常見的體育新聞研究重要素材之一,ChatGPT可以迅速歸納出訪談材料中出現(xiàn)的關(guān)鍵詞和主題,幫助新聞工作者聚焦體育新聞研究中的重點(diǎn)。體育新聞?shì)浨檠芯恐?,ChatGPT還可以分析社交媒體上、網(wǎng)站中評(píng)論中人們對(duì)體育賽事、體育事件的情感和觀點(diǎn),幫助研究者了解人們的態(tài)度和觀點(diǎn)。體育民族志研究將體育作為一種文化現(xiàn)象進(jìn)行研究,要求研究者進(jìn)行田野調(diào)查、參與觀察和口述史訪談,會(huì)收集到大量的文本、音頻數(shù)據(jù)等非結(jié)構(gòu)化數(shù)據(jù)。ChatGPT的信息精簡(jiǎn)、對(duì)話情景能力在這方面具有一定優(yōu)勢(shì),已有研究采用其對(duì)人格預(yù)測(cè)、情感分析等任務(wù)進(jìn)行了探索。在體育心理學(xué)研究中,ChatGPT分析運(yùn)動(dòng)員和教練之間的對(duì)話文本,運(yùn)用文本分類能力,對(duì)運(yùn)動(dòng)競(jìng)技狀態(tài)預(yù)測(cè)、情緒分析、團(tuán)隊(duì)配合等任務(wù)進(jìn)行分類,改善教練員執(zhí)教能力與提升運(yùn)動(dòng)員競(jìng)技技能。
3.4大型語言模型對(duì)體育科學(xué)研究中可視化技術(shù)的重塑
可視化分析在理解和解釋復(fù)雜的體育科學(xué)研究數(shù)據(jù)和概念方面發(fā)揮著重要作用。然而,創(chuàng)建高質(zhì)量的可視化內(nèi)容通常需要大量的時(shí)間和專業(yè)知識(shí)。ChatGPT-4已經(jīng)開放了關(guān)于分析視頻、圖片的大量插件,這有利于體育科學(xué)研究可視化研究。學(xué)者認(rèn)為ChatGPT研究的可視化方面具有顯著的優(yōu)勢(shì)。體育訓(xùn)練學(xué)領(lǐng)域中,有大量體育競(jìng)技賽事、訓(xùn)練的視頻,這部分視頻需要體育科研工作者花費(fèi)大量的時(shí)間進(jìn)行觀看、分析。ChatGPT可以用于創(chuàng)建交互式的可視化工具。這些工具可以讓用戶通過自然語言與數(shù)據(jù)進(jìn)行交互,從而更好地理解數(shù)據(jù)。ChatGPT可以幫助研究人員解釋復(fù)雜的數(shù)據(jù)集。例如:分析足球比賽視頻,提取視頻中雙方進(jìn)攻、防守路線時(shí)間軸上的關(guān)鍵信息,并生成文本,進(jìn)而構(gòu)建數(shù)據(jù)集,將數(shù)據(jù)統(tǒng)計(jì)分析和可視化,轉(zhuǎn)化為使用Jupyter的編程問題;在城市公共體育服務(wù)研究方面,城市公共體育設(shè)施地理信息圖表可以有交互元素,允許用戶向ChatGPT提問關(guān)于特定地標(biāo)或全民健身基本的問題。此外,定性研究中,研究人員經(jīng)常需要觀看大量田野調(diào)查的視頻,如對(duì)體育愛好者訪談視頻、晨晚練點(diǎn)中群眾參與體育活動(dòng)中對(duì)話的視頻,可以利用ChatGPT-4提供的視頻分析插件,總結(jié)、提煉視頻中的信息,再使用其他插件進(jìn)行表格、思維導(dǎo)圖等研究任務(wù)。還可以使用詞云圖插件進(jìn)行文本數(shù)據(jù)可視化,給研究者提供一個(gè)直觀的概覽,可以大大節(jié)省時(shí)間,提高研究的效率。在上文提到的實(shí)證定量研究中,ChatGPT可以幫助我們更好地理解和解釋數(shù)據(jù),借助強(qiáng)大的插件系統(tǒng)還可以將數(shù)據(jù)生成可視化的數(shù)據(jù),這有助于研究人員更好地理解數(shù)據(jù)的模式和趨勢(shì)。統(tǒng)計(jì)學(xué)有大量模型概念和公式,這部分概念、公式對(duì)于僅將統(tǒng)計(jì)學(xué)作為研究工具使用的體育科研工作者來說有一定的難度。ChatGPT可以對(duì)概念進(jìn)行解釋,輔助以圖示能直觀地解釋概念(見圖5~圖6)。
社交網(wǎng)絡(luò)分析結(jié)合了機(jī)器學(xué)習(xí)、可視化等多個(gè)方法,它可以幫助研究者深入了解人們之間的關(guān)系和互動(dòng)方式。ChatGPT借助自然語言技術(shù)進(jìn)行信息形式轉(zhuǎn)換、對(duì)話情景理解、程序語言解析。例如:可以利用ChatGPT幫助研究者自動(dòng)抽取微信的聊天記錄中關(guān)于體育活動(dòng)、體育參與、體育組織關(guān)鍵詞、實(shí)體和話題,并通過網(wǎng)絡(luò)分析工具構(gòu)建出體育組織、體育活動(dòng)中人際關(guān)系網(wǎng)絡(luò)圖,了解不同群體之間的體育活動(dòng)、組織的互動(dòng)方式和信息傳播路徑。ChatG-PT可以快速、準(zhǔn)確地進(jìn)行結(jié)果的可視化呈現(xiàn),能提升研究效果與效率。最后,知識(shí)視頻學(xué)習(xí)是體育科技工作者的學(xué)習(xí)方式,但是會(huì)耗費(fèi)大量的時(shí)間,ChatGPT強(qiáng)大的視頻分析能力,可以快速對(duì)視頻的內(nèi)容進(jìn)行文字內(nèi)容展示,并可以精確定位視頻中不同知識(shí)點(diǎn)的時(shí)間,從而有針對(duì)性地學(xué)習(xí)。
頂尖期刊的論文基本都把結(jié)果可視化作為一個(gè)優(yōu)秀論文的核心指標(biāo)之一,在學(xué)術(shù)圈里流傳這樣一句話,一圖抵千字,足見研究結(jié)果可視化的重要性。ChatGPT在體育科學(xué)研究中的可視化方面具有以下優(yōu)點(diǎn)。首先,使信息圖表更具動(dòng)態(tài)性和交互性,從而提高用戶的參與度和留存率,且可以不斷進(jìn)行修改、完善。其次,ChatGPT使創(chuàng)建交互式信息圖表變得更容易。憑借其先進(jìn)的語言生成能力,ChatGPT可以幫助自動(dòng)化創(chuàng)建交互元素的文本和對(duì)話的過程,從而節(jié)省研究人員的時(shí)間和資源。此外,ChatGPT還可以通過提供易于理解的自然語言解釋和概括,使信息圖表更易于被讀者所理解。
4大型語言模型應(yīng)用到體育科學(xué)研究中的局限與挑戰(zhàn)
4.1大型語言模型給體育科學(xué)研究帶來的局限
大型語言模型給體育科學(xué)研究帶來的局限主要由體育科學(xué)研究的特殊性和模型設(shè)計(jì)中自身缺陷所致。第一,盡管ChatGPT具有多語言支持和跨學(xué)科融合能力,但對(duì)于某些特定領(lǐng)域或語種的文獻(xiàn),可能會(huì)存在語言障礙或理解困難。例如:研究導(dǎo)引養(yǎng)生功法對(duì)身體健康的影響,采用ChatGPT對(duì)相關(guān)的文獻(xiàn)進(jìn)行查閱和分析。眾所周知,中國(guó)傳統(tǒng)養(yǎng)生文化源遠(yuǎn)流長(zhǎng),作為一個(gè)特定研究領(lǐng)域有自己獨(dú)特的術(shù)語、技巧和理論,并且在這個(gè)領(lǐng)域中的文獻(xiàn)大都是中文文獻(xiàn)。雖然ChatGPT具有多語言支持,但它可能無法提供準(zhǔn)確的理解和翻譯。如此使用ChatGPT杏詢、閱讀和理解文獻(xiàn)將有很大局限。第二,雖然ChatGPT可以自動(dòng)提取文獻(xiàn)中的關(guān)鍵信息,但是它無法理解這些信息的深層含義或上下文關(guān)系,這是它基于統(tǒng)計(jì)模型和模式匹配的工作原理導(dǎo)致的。第三,ChatGPT的信息主要來源包括互聯(lián)網(wǎng)和學(xué)術(shù)期刊論文,但并不能保證所有相關(guān)數(shù)據(jù)的質(zhì)量和準(zhǔn)確性。使用ChatGPT時(shí),研究人員仍然需要審查和驗(yàn)證數(shù)據(jù)的可靠性。另外,因?yàn)樗妮敵隹赡苁艿接?xùn)練數(shù)據(jù)偏見的影響,其提供的文獻(xiàn)摘要或關(guān)鍵信息可能會(huì)有偏差。此外,如果需要進(jìn)行深度的文獻(xiàn)分析,如理解文獻(xiàn)的研究方法、設(shè)計(jì)或論證邏輯,Chat-GPT可能也會(huì)有所不足。第四,大型語言模型在訓(xùn)練數(shù)據(jù)中并未給出明確的標(biāo)簽或答案,而是學(xué)習(xí)根據(jù)前面的單詞提供的上下文來預(yù)測(cè)句子中的下一個(gè)單詞。這個(gè)訓(xùn)練過程通常在互聯(lián)網(wǎng)文本的各種范圍內(nèi)完成。然而,模型并不知道具體哪些文件在他們的訓(xùn)練集中,也無法訪問任何專有數(shù)據(jù)庫、分類信息、機(jī)密信息或個(gè)人數(shù)據(jù)(除非在對(duì)話過程中有人與它們分享這些數(shù)據(jù)),從而造成大型語言模型的工作方式數(shù)據(jù)“黑箱”工作方式。第五,在使用大型語言模型進(jìn)行定量研究時(shí),首先可能會(huì)遇到的局限性是其無法替代專業(yè)統(tǒng)計(jì)知識(shí)和數(shù)據(jù)分析技能。雖然ChatGPT可以生成數(shù)據(jù)分析代碼并提供代碼的解釋,但是它無法像專業(yè)的統(tǒng)計(jì)分析師那樣理解和解釋復(fù)雜的統(tǒng)計(jì)模型和結(jié)果。另外,盡管ChatGPT可以處理大量數(shù)據(jù),但是對(duì)于某些特定類型的數(shù)據(jù),如非結(jié)構(gòu)化數(shù)據(jù)或者復(fù)雜的數(shù)據(jù),會(huì)遇到困難。第六,盡管ChatGPT可以幫助研究者提取視頻中的關(guān)鍵信息和創(chuàng)建交互式的可視化工具,但是它不能完全替代人類對(duì)體育訓(xùn)練和比賽的理解和洞察。如對(duì)比賽策略和運(yùn)動(dòng)員心理狀態(tài)的理解就需要具體的專業(yè)知識(shí)和體育科研工作者的直覺。
4.2大型語言模型給體育科學(xué)研究帶來的挑戰(zhàn)
大型語言模型給體育科學(xué)研究帶來的挑戰(zhàn),體現(xiàn)在實(shí)際應(yīng)用可能會(huì)遇到的問題,第一,雖然Chat-GPT可以生成具有邏輯連貫性的響應(yīng),但它無法解釋自己的推理過程,這對(duì)于需要理解和解釋結(jié)果的體育科學(xué)研究可能是個(gè)挑戰(zhàn)。例如:如何提高Chat-GPT的理解能力以使其能夠更好地理解文獻(xiàn)的深層含義和上下文關(guān)系;如何更好地利用ChatGPT的多語言支持和跨學(xué)科融合能力以促進(jìn)跨語言和跨學(xué)科的研究。第二,大型語言模型如ChatGPT的訓(xùn)練依賴于大量的文本數(shù)據(jù)。這些數(shù)據(jù)的質(zhì)量、內(nèi)容和偏差都會(huì)直接影響模型的表現(xiàn)。模型可能還會(huì)學(xué)習(xí)并復(fù)制互聯(lián)網(wǎng)上的錯(cuò)誤信息。在實(shí)際應(yīng)用中,如何提高ChatGPT在數(shù)據(jù)處理和分析方面的準(zhǔn)確性和效率是一個(gè)重要的挑戰(zhàn)。對(duì)于復(fù)雜的數(shù)據(jù)分析任務(wù),如多元線性回歸、主成分分析或者神經(jīng)網(wǎng)絡(luò)分析,ChatGPT可能需要更深入的訓(xùn)練和優(yōu)化才能得到可靠的結(jié)果。另外,定量研究涉及大量的數(shù)據(jù),因而數(shù)據(jù)的質(zhì)量、完整性和一致性也是一個(gè)重要的挑戰(zhàn)。第三,雖然ChatGPT具有高效處理文本的能力,并能提供視角和分析方法,但它對(duì)于音頻和視頻材料的處理能力有限。在分析教練和運(yùn)動(dòng)員的訪談視頻或錄音中,ChatGPT可能無法理解和處理非語言的信息,如肢體語言、面部表情和語調(diào)等。此外,ChatG-PT的理解和解釋能力還無法達(dá)到人類的水平,對(duì)于復(fù)雜、抽象和難以量化的概念,如體育精神、公平競(jìng)賽等,ChatGPT可能無法準(zhǔn)確捕捉和作出反應(yīng)。特別是ChatGPT可以生成具有邏輯連貫性的響應(yīng),但它無法解釋自己的推理過程。這對(duì)于需要理解和解釋結(jié)果的體育科學(xué)研究是一個(gè)極大的挑戰(zhàn)。第四,在體育科學(xué)研究中,研究結(jié)果的可復(fù)現(xiàn)性是非常重要的。然而,大型語言模型是一個(gè)語言概率模型,由于大型語言模型的輸出受到諸多因素(如模型的初始狀態(tài)、指令輸入的細(xì)微變化等)影響,其結(jié)果可能并不總是可復(fù)現(xiàn)的。第五,雖然,Open AI的GPT-4推出了海量的應(yīng)用,這正在降低使用大型語言模型的難度,但對(duì)于一些缺乏計(jì)算機(jī)科學(xué)背景的社會(huì)科學(xué)研究人員來說,技術(shù)門檻可能依然是一個(gè)挑戰(zhàn)。第六,雖然大型語言模型具有巨大的潛力,但不能過分夸大其能力。它們并不能解決所有問題,對(duì)它們的期待需要建立在對(duì)其能力和局限的理解基礎(chǔ)上。對(duì)于大型語言模型生成的結(jié)果,既有可能過于依賴其輸出,也有可能對(duì)其過于懷疑。同時(shí),過度依賴大型語言模型可能會(huì)削弱科研工作者的創(chuàng)新能力和批判思維能力。如何找到適當(dāng)?shù)钠胶猓壤媚P偷膬?yōu)點(diǎn),又避免對(duì)其結(jié)果的盲目信任,也是一個(gè)挑戰(zhàn)。
必須清醒認(rèn)識(shí)到大型語言模型的使用中還面臨諸多挑戰(zhàn),如隱私和數(shù)據(jù)倫理問題,模型的可解釋性、缺乏統(tǒng)一的規(guī)范,如何在科研中正確、高效、倫理地使用等。因此,需要在應(yīng)用大型語言模型的同時(shí),不斷探索并解決這些問題;充分利用這些模型作為工具來輔助研究,而不是完全依賴它們,以實(shí)現(xiàn)更加創(chuàng)新和可持續(xù)的體育科學(xué)研究。
5大型語言模型應(yīng)用給體育科學(xué)研究帶來的啟示
大型語言模型在體育科學(xué)研究中,盡管面臨某些局限和挑戰(zhàn),但其對(duì)科研工作者的啟示卻不可忽視。首先,隨著大型語言模型的不斷優(yōu)化,其在提升文獻(xiàn)研究的效率和準(zhǔn)確性方面的優(yōu)勢(shì)日漸顯現(xiàn)。這不僅打破了語言和學(xué)科的壁壘,還為多學(xué)科交叉的體育科學(xué)研究提供了可能。其次,大型語言模型的運(yùn)用將改變定量研究的工作方式。特別是Open AI于2023年7月上旬發(fā)布了Code interpreter,它結(jié)合了數(shù)據(jù)自動(dòng)分析、報(bào)告撰寫、圖片分析于一身,被視為GPT-4.5時(shí)代來臨。這會(huì)鼓勵(lì)體育科研工作者更廣泛地使用大數(shù)據(jù)和計(jì)算機(jī)輔助的研究方法,使得數(shù)據(jù)分析結(jié)果更為直觀,降低使用數(shù)據(jù)分析工具的學(xué)習(xí)難度,進(jìn)一步推動(dòng)體育科學(xué)研究更加依賴科學(xué)研究范式。再次,隨著大型語言模型的泛化能力增強(qiáng),其在體育科學(xué)研究的多領(lǐng)域應(yīng)用將有力推動(dòng)體育學(xué)科的跨學(xué)科研究發(fā)展。這要求體育科學(xué)研究者重新審視傳統(tǒng)的研究方法,如采訪、觀察等,并探索如何將這些傳統(tǒng)的研究方法與大型語言模型相結(jié)合。另外,隨著GPT-4等大型語言模型的API接口逐漸開放,科研工作者和開發(fā)者能夠在各類應(yīng)用程序中利用其強(qiáng)大的語言模型能力,這使得AI技術(shù)在體育科學(xué)研究中的作用日益凸顯,同時(shí)也為體育科學(xué)研究提供了新的發(fā)展機(jī)遇。最后,隨著大型語言模型技術(shù)的深入發(fā)展,大型語言模型將由執(zhí)行單一任務(wù)向執(zhí)行多模態(tài)任務(wù)(MLLM)轉(zhuǎn)變,這將大大拓展了獲取知識(shí)的范圍,包括文本、圖像和聲音等多種模式,使其能夠在上下文中進(jìn)行學(xué)習(xí),并遵循給定的指令。在此背景下,體育科學(xué)研究的理念、模式和工具將會(huì)經(jīng)歷重大的轉(zhuǎn)型。
維特根斯坦的名言“語言的邊界就是思想的邊界”揭示了語言在塑造理解世界的方式中的決定性作用。借此視角,可以重新審視大型語言模型對(duì)體育科學(xué)研究的影響,它們不僅是一種功能強(qiáng)大的工具,也是一種可以擴(kuò)展思維邊界的媒介。對(duì)于體育科研工作者來說,未來的差異可能更多地來自于如何構(gòu)建和利用大型語言模型來推動(dòng)在體育科學(xué)研究中的思考和創(chuàng)新。
西安體育學(xué)院學(xué)報(bào)2023年4期