行者AI(成都潛在人工智能科技有限公司)作為產(chǎn)業(yè)界代表,從2020年創(chuàng)立以來,一直致力于用人工智能和機(jī)器學(xué)習(xí)技術(shù)提高文娛行業(yè)生產(chǎn)力,提供內(nèi)容生產(chǎn)制作全生命周期解決方案。這些技術(shù)實(shí)踐源自2013年成立的游戲公司。2016年,我們?cè)谟螒蚬緝?nèi)部成立了人工智能實(shí)驗(yàn)室,開發(fā)了一系列“人工智能+內(nèi)容創(chuàng)作”相關(guān)工具。隨著技術(shù)不斷成熟與應(yīng)用拓展,我們決定將這些技術(shù)獨(dú)立分拆,成立全新公司,以更專業(yè)的姿態(tài)服務(wù)于全行業(yè)。
行者AI在AI+美術(shù)、AI+音樂等多元化領(lǐng)域不斷探索,同時(shí),我們進(jìn)行AI+安全和AI智能體等應(yīng)用場(chǎng)景的產(chǎn)品開發(fā)和服務(wù),成果被廣泛應(yīng)用于大視聽行業(yè)、文娛及教育領(lǐng)域,取得了顯著的市場(chǎng)化成果。
AI賦能提升視聽領(lǐng)域生產(chǎn)力
從產(chǎn)業(yè)角度出發(fā),我們始終關(guān)注如何解決行業(yè)痛點(diǎn)。例如,在內(nèi)容制作領(lǐng)域,長期存在一個(gè)“不可能三角”問題,即在追求高質(zhì)量、高效率與低成本時(shí),往往三者難以同時(shí)滿足。無論是視頻制作、短劇創(chuàng)作、文章撰寫,還是繪畫、音樂創(chuàng)作,這一難題都普遍存在。然而,隨著AI 2.0和生成式AI技術(shù)的到來,我們可以同時(shí)實(shí)現(xiàn)高質(zhì)量、高效率與低成本的內(nèi)容創(chuàng)作,這無疑為我們帶來了全新挑戰(zhàn)和巨大機(jī)遇。
對(duì)視聽娛樂與教育領(lǐng)域來講,機(jī)遇就是正在迎來一種全新形態(tài),即多模態(tài)和互動(dòng)式。盡管當(dāng)前我們看到AI在繪畫、音樂創(chuàng)作等領(lǐng)域的應(yīng)用,但這些仍屬于傳統(tǒng)媒體形態(tài)。例如,利用AI生成一幅畫作,盡管這在一定程度上提升了生產(chǎn)力并降低了生產(chǎn)成本,但它的本質(zhì)沒有變化。而我們希望能通過生產(chǎn)力的提升,創(chuàng)造與以前完全不同且無法想象的全新場(chǎng)景。這正是多模態(tài)和互動(dòng)式所帶來的可能性。
行者AI團(tuán)隊(duì)始終圍繞人工智能多模態(tài)這個(gè)理念進(jìn)行實(shí)踐。無論是視覺上的圖片、視頻,還是聽覺上的音頻生成(包括語音合成、歌唱合成)及智能體,都是我們關(guān)注與探索的重點(diǎn)。當(dāng)我們完成了這些基礎(chǔ)組件的構(gòu)建,便能創(chuàng)造豐富多樣的應(yīng)用場(chǎng)景。智能化多模態(tài)的體驗(yàn)將為解決未來眾多問題提供可能,特別是內(nèi)容創(chuàng)作行業(yè)。例如,拍攝一部短劇的平均成本需要幾十萬元,這要求創(chuàng)作者和從業(yè)者迅速實(shí)現(xiàn)盈利,如果無法盈利就無法產(chǎn)生連續(xù)性。游戲、短劇、電影等行業(yè)均面臨這一問題。為了快速回籠資金,許多創(chuàng)作者和從業(yè)者過于關(guān)注如何利用“人性”快速吸引觀眾,讓他們迅速獲得滿足感,從而訂閱或付費(fèi)。這種趨勢(shì)導(dǎo)致許多作品忽略了真正有價(jià)值的“真善美”元素。
在追求經(jīng)濟(jì)效益的同時(shí),行者AI團(tuán)隊(duì)始終堅(jiān)守對(duì)“真善美”的追求。我們相信,只有平衡商業(yè)目標(biāo)與藝術(shù)價(jià)值,才能創(chuàng)作真正有深度和影響力的作品。
AI技術(shù)研發(fā)應(yīng)精心調(diào)配
從產(chǎn)業(yè)角度看,例如,在全球范圍內(nèi)有眾多抑郁癥患者,AI生成的新內(nèi)容是否適宜這類群體,確實(shí)值得探討和商榷。盡管如此,這類內(nèi)容擁有巨大潛力,能夠開啟全新體驗(yàn)。其可以被應(yīng)用于醫(yī)療、教育和宣傳等方面,為人們帶來美的體驗(yàn),治愈心靈,陪伴成長。雖然這類內(nèi)容在各類平臺(tái)上的推廣可能面臨困難,廣告購買意愿不高,盈利能力有限,但考慮其低成本和高價(jià)值,我們應(yīng)給予更多重視。
在我們的理念中,無論是從事美術(shù)創(chuàng)作、音樂制作,還是從事文本生成,抑或是進(jìn)行智能體的研發(fā),都希望從業(yè)者走在人工智能前面,學(xué)習(xí)AI,運(yùn)用AI,駕馭AI,而絕非被AI所取代。在內(nèi)容生產(chǎn)的每一個(gè)環(huán)節(jié),我們都致力于使AI成為提升生產(chǎn)力的工具,而非替代人類的存在,生產(chǎn)力提升的最終目標(biāo)仍是為人服務(wù)。
在此前提下,我們必須強(qiáng)調(diào)三個(gè)核心概念,這些概念構(gòu)成了玩具與工具的根本區(qū)別。首先是“可控性”,其次是“一致性”,最后是“高精度”。例如,在AI繪畫領(lǐng)域,盡管AI能夠繪制畫作,但在完成作品后,其并未展現(xiàn)足夠的實(shí)用性和穩(wěn)定性。為此,我們開發(fā)了一款名為“行者丹爐”的產(chǎn)品。這個(gè)名稱源于我們認(rèn)為人工智能研發(fā)就像用丹爐“煉丹”一樣,是一種自我調(diào)侃。在人工智能領(lǐng)域,研發(fā)過程指的是通過不斷調(diào)整和優(yōu)化算法參數(shù),以獲得更好模型效果。這與傳說中的煉丹術(shù)有著異曲同工之妙,都需要經(jīng)過精心調(diào)配和磨礪。
通過我們的產(chǎn)品,用戶可以訓(xùn)練屬于自己的畫風(fēng)模型。從學(xué)術(shù)角度來看,這相當(dāng)于一個(gè)模型訓(xùn)練器,它可以為用戶創(chuàng)建獨(dú)特畫風(fēng)提供支持,并通過“行者丹爐”將其轉(zhuǎn)化為獨(dú)一無二的模型。這樣,AI就能夠根據(jù)用戶的畫風(fēng)進(jìn)行創(chuàng)作,既保證了作品獨(dú)特性,又避免了侵權(quán)問題發(fā)生。這正是我們所追求的可控性和一致性的體現(xiàn)。
另外,AI寫真作為一種先進(jìn)技術(shù)應(yīng)用,主要是針對(duì)個(gè)人臉部特征進(jìn)行模型訓(xùn)練。一旦臉部模型訓(xùn)練完成,即可生成多樣化的、屬于個(gè)人的寫真集,從而保證一致性和可控性。從高精度方面來看,AI已經(jīng)可以生成16K超高清大圖,屬于工業(yè)化AI工具所應(yīng)達(dá)成的標(biāo)準(zhǔn),遠(yuǎn)超一般消費(fèi)者級(jí)應(yīng)用。據(jù)真實(shí)用戶反饋,使用此技術(shù),工作效率平均提升3至5倍,這便是AI技術(shù)在美術(shù)領(lǐng)域的獨(dú)特價(jià)值。
在AI音樂領(lǐng)域,我們秉持相同理念,即追求可控性、一致性和高精度。盡管Suno具備AI作曲功能,但在細(xì)節(jié)調(diào)整方面,仍存在局限。相比之下,我們的交互式創(chuàng)作工具支持對(duì)細(xì)節(jié)的精細(xì)調(diào)整。
AI為產(chǎn)業(yè)發(fā)展帶來無限可能
我們研發(fā)的AI智能體,面向更高層次智能推理,如在電子競技領(lǐng)域,AI智能體可以發(fā)揮強(qiáng)大陪練作用。在AI應(yīng)用中,安全性至關(guān)重要。在利用AI創(chuàng)作豐富多樣的內(nèi)容時(shí),如何確保這些內(nèi)容的合規(guī)性成為亟待解決的問題。為此,我們遵循全球各地的法律法規(guī),建立了各種審核標(biāo)準(zhǔn)。目前,我們支持22個(gè)國家和地區(qū)的語言,能夠在全球范圍內(nèi)進(jìn)行AI合規(guī)性審查,確保所創(chuàng)作的內(nèi)容符合各項(xiàng)法律法規(guī)。
我們?cè)谔剿鹘逃龍?chǎng)景的應(yīng)用時(shí),把AI音樂跟我們的音樂學(xué)習(xí)結(jié)合起來,開啟交互式沉浸式體驗(yàn)。例如,在音樂創(chuàng)作中包括寫詞、作曲、編曲、演唱等,創(chuàng)作手法和過程很復(fù)雜。利用AI技術(shù),用戶可以輕松地獲得自動(dòng)譜曲的服務(wù),而我們則提供精細(xì)調(diào)整和優(yōu)化。在這個(gè)過程中,AI會(huì)為用戶提供創(chuàng)作模板,用戶可以在此基礎(chǔ)上二次創(chuàng)作,加入自己的獨(dú)特元素。
如果用戶覺得某個(gè)部分不理想,AI能夠重新生成,直至滿足用戶審美要求。這種實(shí)際應(yīng)用場(chǎng)景在學(xué)校音樂創(chuàng)客教室中得到了充分體現(xiàn)。我們?nèi)诤狭舜罅恳魳分R(shí)點(diǎn),通過一邊創(chuàng)作一邊復(fù)盤的方式,幫助學(xué)生提升音樂創(chuàng)作能力。該系統(tǒng)曾連續(xù)被中央電視臺(tái)報(bào)道,并在全國各地幫助眾多學(xué)生學(xué)習(xí)音樂創(chuàng)作。此外,AI技術(shù)還能輔助師生進(jìn)行實(shí)時(shí)溝通交流,提升互動(dòng)體驗(yàn)。
同樣,我們的AI應(yīng)用可以跟文旅結(jié)合,打造豐富多樣的用戶體驗(yàn)。例如,中國傳統(tǒng)文化中的皮影,就可以用AI生成各種各樣的風(fēng)格,我們與中國皮影博物館的合作項(xiàng)目便是這一點(diǎn)的生動(dòng)體現(xiàn),其中所有內(nèi)容均由AI創(chuàng)作完成。
何為交互式體驗(yàn)?zāi)??比如,AI和皮影博物館結(jié)合,當(dāng)你進(jìn)入博物館時(shí),可以使用AI技術(shù)拍攝自己的照片并生成自己的皮影形象。無論你走到哪里,皮影都會(huì)緊隨其后,為你提供一種全新的探索尋寶體驗(yàn)。這種體驗(yàn)不僅更加有趣,并且每一次來訪都會(huì)帶給你全新感受。更為重要的是,我們的AI技術(shù)能夠?qū)崟r(shí)生成內(nèi)容,不受任何限制,可以創(chuàng)造無限可能。W
(作者尹學(xué)淵系行者AI創(chuàng)始人兼CEO)