倪妮
GPTs和GPT Store是OpenAI創(chuàng)始人山姆·阿爾特曼在其首屆開發(fā)者大會DevDay上介紹的重點。
2023年11月7日,OpenAI首屆開發(fā)者大會DevDay在舊金山舉行。相比上下文窗口變大、應用程序編程接口(API)使用價格降低等動作,GPTs和GPTStore才是這場發(fā)布會中最受關注的“大招”。
OpenAI對GPTs的定義是“用戶為特定目的創(chuàng)建的自定義版ChatGPT”。OpenAI創(chuàng)始人山姆·阿爾特曼(SamAltman)介紹稱,每個人都可以定制自己的ChatGPT,從而形成一個“家族GPTs”。為了分發(fā)這些GPTs,OpenAI還會在2023年11月底上線GPTStore,經審核的GPTs將出現(xiàn)在這個在線平臺內,用戶可以通過功能搜索找到需要的GPTs,也可以看到GPTs排行榜,類似于蘋果的AppStore。
然而,2023年11月中旬發(fā)生于OpenAI內部的“宮斗風波”拖慢了GPTStore的發(fā)布進程。12月初,OpenAI宣布將其延后至2024年年初上線。目前,GPTPlus訂閱用戶可以在ChatGPT主頁左上角點擊“Exlpore”按鈕,找到OpenAI官方推出的GPTs或創(chuàng)建自己的GPT。對于非官方的GPT,用戶搜索應用名稱找到鏈接后,也可以跳轉至ChatGPT頁面使用。而就在GPTStore等待上線的“窗口期”,一批非官方的GPTs商店如OpenGPT、GPTStore.AI、GPTsHunter等也已陸續(xù)出現(xiàn)。
無需代碼就能定制ChatGPT,這是OpenAI在促進技術平權方面邁出的重要一步。普通用戶想創(chuàng)立一個GPTs,在告知使用目的后,OpenAI開發(fā)的創(chuàng)建GPTs的工具GPTBuilder會為用戶生成相關應用的logo。之后,在正式的配置頁面,只需完成“知識”(Knowledge)、“功能”(Capabilities)和“行動”(Actions)3個步驟,即分別輸入本地數(shù)據、希望加載的基本能力和外部API,就能定制一款GPTs。在2023年11月的現(xiàn)場演示中,阿爾特曼創(chuàng)建了一個名為“風投導師”的GPTs。
目前,用GPTBuilder創(chuàng)建GPTs的功能僅對Plus訂閱用戶開放。用戶可以選擇私有、企業(yè)擁有和公開定制的GPTs。除了創(chuàng)立自己的GPTs,用戶也可以試用其他公開的GPTs。這已足夠激發(fā)起用戶自行創(chuàng)建GPTs的熱情。截至2023年12月20日,僅GPTsHunter這一個非官方商店中,已有超7萬個GPTs。
讓GPTStore成為AppStore一樣的存在,這無疑顯示出OpenAI想要構建GPTs生態(tài)的野心。但實現(xiàn)它,其實難度頗大。
訓練數(shù)據和提示詞(Prompt)的質量是一款GPTs質量的保證。但是,GPTs目前存在極大的安全隱患,用戶的初始設置很容易被盜取,這也造成目前GPTs質量參差不齊的局面。而且企業(yè)用戶或版權方公開私有數(shù)據的意愿較低,市場上可以公開獲取的數(shù)據有限,長期來看也可能造成GPTs同質化的問題。
其次,目前GPTs的交互限定于自然語言,即對話的形式,如果后續(xù)依然不支持自定義用戶界面,GPTs的形態(tài)大概率會局限于一款多對象的聊天應用,或是一款超級應用。而相較于一款應用的開發(fā)者,GPTs的創(chuàng)造者們更類似于YouTube博主這樣的內容生成者。
此外,在商業(yè)模式方面,OpenAI稱,將為受歡迎的應用提供利潤分成,但是目前尚未公布具體形式。如果除了每月20美元的GPTPlus訂閱費用,用戶還需要為不同GPTs付費,也會提高GPTStore的使用門檻。目前,很多公司只是將GPTs作為一個流量入口,比如Canva。
還需注意的是,通過GPTStore,OpenAI想要建立一個獨立于現(xiàn)有應用商店的AI新生態(tài),但這一模式很可能與蘋果和OpenAI背后的支持者微軟等公司的利益發(fā)生沖突。所以,OpenAI的龐大野心該如何實現(xiàn),充滿懸念。
GPTs功能上線以來,已經涌現(xiàn)出一些熱門應用。開源軟件托管平臺GitHub的一位開發(fā)者1mrat統(tǒng)計了各GPTs的訪問量。截至2023年12月10日,最受歡迎的GPTs是OpenAI官方推出的DALL·E,訪問量超過640萬,占據41.1%份額。在訪問量排名前10位的應用中,有8個都是OpenAI官方推出的,占據的訪問份額近9成。而非官方GPTs中,最受歡迎的是研究助手ResearchGPT。
我們從官方和非官方發(fā)布的GPTs中,挑選了10個實用有趣的項目,幫你了解GPTs都可以做些什么。
DataAnalysis
OpenAI官方推出的數(shù)據分析GPTs,可以處理CSV、JSON、Excel等格式的數(shù)據文件,還支持編寫和執(zhí)行Python代碼。
首先,這款工具可以識別缺失或異常數(shù)據,標準化數(shù)據格式,使文件更易于分析和處理。再者,它可以執(zhí)行各類數(shù)據分析任務,包括統(tǒng)計檢驗(如t檢驗、方差分析等)、計算描述性統(tǒng)計數(shù)據(平均值、中位數(shù)、標準差等),也可以分析不同數(shù)據變量之間的相關性和因果關系。DataAnalysis還支持數(shù)據可視化,可以創(chuàng)建折線圖、條形圖、直方圖、散點圖等各類圖表,并能應用基本的機器學習算法構建和驗證模型(如回歸、分類或聚類),解釋模型結果。
如果你是一名股票投資者,DataAnalysis可以幫你計算具體的財務指標,還可以通過時間序列分析,幫你掌握股票價格趨勢,或者建立統(tǒng)計模型預測未來走勢;如果你是一名企業(yè)供應鏈運營者,通過研究庫存數(shù)據,DataAnalysis可以幫你分析影響交貨時間的因素,預測未來的庫存需求,并能創(chuàng)建儀表板來監(jiān)控供應鏈效率。
CreativeWritingCoach
OpenAI官方推出的寫作助手GPTs,用于提供寫作修改建議、提高寫作技巧。它的訓練數(shù)據包括大量不同題材、流派和文化視角的文學作品。
當你輸入自己創(chuàng)作的短篇小說,它會指出作品的優(yōu)點,也會從角色發(fā)展、對話、沖突深度、故事節(jié)奏等方面提出修改意見。你還可以針對特定方面,向它詢問具體的請求優(yōu)化建議。
當你想寫一個故事卻不知如何下筆時,這個GPTs則能幫助你激發(fā)寫作靈感。比如,它可能會給你提供一個“弗萊塔格金字塔”式的結構大綱;如果在寫作過程中被卡住了,它則能提供情節(jié)發(fā)展的多個方向。
當然,如果你只想學習具體的寫作技巧,也可以向它提出“如何在寫作中用展示替代講述”“常見的小說結構有哪幾類”等問題,它會提供詳盡的回答,或為你推薦更系統(tǒng)的學習資料。
TheNegotiator
OpenAI官方推出的談判助手GPTs,可以在各種談判場景中為用戶提供策略建議、模擬練習及反饋,提升用戶的談判技巧。
當你提供談判方、談判場景、談判目的和談判原則等信息后,TheNegotiator會通過角色扮演與你模擬練習。你還可以讓它充當“唱反調”的挑戰(zhàn)者,把方案準備得更加全面。在模擬談判之后,它也會提供反饋和建議。TheNegotiator的核心功能之一是幫助發(fā)現(xiàn)談判的最佳替代方案,找到談判無法達成時的備選方案。
除了提供技巧支持,它還可以幫助你管理自己在談判中的情緒,提出換位思考、積極框架等建議,并指導你應在談判前練習的技巧。
MathMentor
OpenAI官方推出的數(shù)學輔導GPTs,可以幫助家長輔導孩子的數(shù)學作業(yè)。
ChatGPT上線初期,其數(shù)學能力曾被質疑,而這款工具證明了其數(shù)學能力。從小學的乘法問題到大學的微積分,MathMentor不只會告訴你問題的答案,還會提供概念或具體問題的分步講解。比如為了講解一道f(x)求導的數(shù)學問題,MathMentor會先解釋導數(shù)的概念,之后分步演示求導過程,還會提供背景資料說明導數(shù)的應用場景。
對于不同年齡階段、不同年級的對象,MathMentor也會根據對象的理解程度和既有知識,選擇不同的回答風格和方式。MathMentor還支持圖像識別,對于作業(yè)本上的習題,拍攝并上傳圖片后,它能識別出其中的文字和圖像再作答。
TechSupportAdvisor
OpenAI官方推出的技術支持GPTs,幫助用戶解決各類技術問題。
無論是Windows、MacOS、Linux等操作系統(tǒng),還是MicrosoftOffice、Adobe等應用軟件,它都能提供功能解讀和使用指南。遇到打印機或臺式機安裝難題時,它也能給出清晰的步驟說明。遇到電子設備故障,它則會一步步幫你診斷,并提供解決策略。此外,它還能提供防范病毒、惡意軟件的安全建議。
這款GPTs還可以與用戶探討各類技術概念和最新趨勢,如果你希望提升某一方面的技術能力,它可以幫你制定計劃,提供學習資源。
最具普適性的是,如果你是“技術小白”,只想選購一款電子產品,它能依據你的需求和預算提供購買建議,雖然無法提供最新的在線價格和庫存信息,但這款工具能幫助你確定合適的產品類型。
ColoringBookHero
OpenAI官方推出的繪本生成GPTs,可以生成自然場景、卡通人物、太空科幻等各類主題的圖片。與其他文生圖應用相比,它的主要特點是生成的圖片主體為輪廓簡單的黑白線條。
官方介紹稱,這款應用主要面向的是兒童群體,但成人也可以從中獲得樂趣。還記得之前受到成年人追捧的涂色書《秘密花園》嗎?現(xiàn)在,通過這款應用,你就可以設計自己的“秘密花園”,再在上面完成涂色。
ColoringBookHero無法生成彩色的圖片,且只能生成1024×1024一種尺寸的圖像。不過OpenAI推出的文生圖模型DALL·E3可以生成3種尺寸的圖片。
ResearchGPT
Consensus推出的學術研究GPTs。它是一家2021年創(chuàng)立于波士頓的公司,目標是利用人工智能創(chuàng)造所有人都可以獲得的專家信息。
ResearchGPT集成了2億多篇學術論文,在回答問題時可以提供所引用的論文信息,且數(shù)據庫中的論文是實時更新的。
如果你是一名研究人員,這款工具可以幫助你搜索特定領域的文獻,還能直接生成完整的文獻綜述。輸入文章的主題、參考文獻數(shù)量和引文格式,ResearchGPT就可以返回一篇引用格式規(guī)范的文獻綜述,還會在引用文本中嵌入論文的超鏈接,供用戶直接跳轉查看。上傳已經完成的學術論文,它也會分章節(jié)提出具體的修改意見。
即便你不是學術研究者,也可以將ResearchGPT當作專業(yè)的搜索引擎,它會用學術論文中的觀點回答你提出的問題,并且標注內容出處,提高信息的準確性。
Grimoire
AI多任務管理平臺MindGoblinStudios推出的編碼向導GPTs,可以幫助用戶通過自然語言創(chuàng)立網站。
Grimoire推出了20個練習項目,范圍包括經典的編程練習和涉及人工智能的網頁開發(fā),從初學者到高級開發(fā)人員都適用。它還提供了超過20個熱鍵快捷指令。
此外,Grimoire可以識別圖片,上傳網站模板截圖或手繪的網站草圖,它就會分析網頁的區(qū)域分布和內容,并輸出代碼,用戶將代碼粘貼到html測試頁面中就可以預覽效果。如果你對生成的效果有任何不滿意,也可以讓它幫你修改,用戶無需掌握任何代碼知識。
除了Grimoire,MindGoblinStudios還有GPTShopKeeper(非官方GPT應用商店)、Gif-PT(動圖生成器)等多款產品。
AiPDF
AiDrive網站推出的PDF整理GPTs,可以處理多個PDF的內容。
用戶在進入這款GPTs的界面前,將需要處理的PDF文件上傳到AiDrive網站上,獲得鏈接并復制到GPTs的對話窗口,就可以開始處理任務了。AiPDF可以總結文檔,也可以針對某個具體細節(jié)查詢文檔內容。如果上傳了多個文件,AiPDF會在多個文件中執(zhí)行搜索。
相較于在ChatGPT中直接上傳文檔,AiPDF單次可上傳的文件數(shù)量更多,文件的大小上限為2GB。而且上傳的文件可以無限期保存在用戶的賬戶中,而ChatGPT需要用戶為每個新的聊天會話重新上傳文檔。
如果你是一名律師,可以直接上傳多個法律案件的PDF文件,針對關鍵法律判例或術語提出具體問題后,AiPDF可以快速定位并提供文檔摘錄;如果你是一名分析師,上傳多家公司的財報后,可以得到某一特定財務指標的對比。
AiDrive之前還推出過AiPDF插件,但很快下線。
Canva
Canva公司推出的設計GPTs。OpenAI創(chuàng)始人阿爾特曼在DevDay演示的就是這款GPTs,當他在對話框中輸入“為11月6日下午5點的DevDay招待會制作海報”后,Canva生成了兩張海報。
Canva還能生成logo、社交網站配圖等。如果你對生成的效果不太滿意,可以點擊縮略圖進入Canva官網繼續(xù)編輯;如果你想做個PPT,在提供主題、風格、頁數(shù)等基本要求后,Canva也會給你推薦PPT模板,用戶同樣可以進入Canva官網編輯。
需要注意的是,使用Canva生成各類作品前,需要授權調用Canva的API。而且用戶無法
直接下載生成的圖片,必須進入Canva網站才能找到下載按鈕。在這個環(huán)節(jié)中,Canva可能會提示圖中的某些元素是付費的,需要升級成Canva高級版才能下載圖片。
Canva是全球最大的在線設計平臺,估值超過250億美元,在全球獨角獸公司的排名中高居第六,月活用戶超1.5億。
在這場開發(fā)者大會上,阿爾特曼將GPTs稱作“Agent的前身”。Agent通常被翻譯為“智能體”,相比于用來聊天的ChatGPT,Agent讓AI具有了行動能力,即可以幫用戶完成各種任務。同樣在2023年11月初,比爾·蓋茨也發(fā)文稱,Agent不僅會改變人類與計算機交互的方式,還將顛覆軟件行業(yè),帶來從鍵入命令到點擊圖標之后的最大計算革命。
作為AI的下一個重要發(fā)展方向,OpenAI自然十分重視Agent。2023年8月中旬,OpenAI完成首筆收購,對象是游戲公司GlobalIllumination。這家公司推出的沙盒游戲相當于為AI提供了一個開放性的訓練場景,OpenAI正是看中了其Agent研發(fā)能力。
GPTs的發(fā)布也引發(fā)了Agent創(chuàng)業(yè)者的焦慮,他們擔心GPTs會蠶食市場,尤其是GPTBuilder中的“行動”按鈕允許創(chuàng)建者在內置功能之外,通過外部API來自定義操作,這使得GPTs擁有了和外部交互的能力,也具有了完成多種任務的可能性。
但是從以上介紹的應用中可以發(fā)現(xiàn),大部分GPTs在功能上其實還無法滿足Agent的標準。OpenAI安全系統(tǒng)主管翁麗蓮(LilianWeng)提出了Agent的基本結構,其中的4個關鍵要素分別是記憶、計劃、工具和行動。而現(xiàn)有GPTs的主要功能停留在對話交互的層面,沒有使用太多外部工具,僅作為任務輔助的角色,獨立完成任務的能力還有欠缺。
其實,創(chuàng)建過GPTs的用戶可以發(fā)現(xiàn),GPTBuilder在接到指令后會設定目標并分解任務,最終完成工具的生成,已經可以被視為一個初級的Agent。雖然目前市場上的GPTs還無法真正威脅到專業(yè)的Agent廠商,但OpenAI已經展露了對于這一領域的野心和實力。