• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    全網(wǎng)刷屏的Sora有多“可怕”

    2024-03-18 10:13:28王一鵬
    科學(xué)大觀園 2024年6期
    關(guān)鍵詞:邏輯世界模型

    王一鵬

    2月16日凌晨,在沒有任何預(yù)兆和消息透露的情況下,OpenAI 突然發(fā)布了自己的首個(gè)文生視頻模型:Sora,大幅刷新行業(yè)多個(gè)指標(biāo),重新定義了 AI 文生視頻在現(xiàn)階段的技術(shù)極限,顛覆了生成式 AI 在視頻領(lǐng)域的全球市場(chǎng)格局。

    Sora 使用 Transformer 架構(gòu),建立在 DALL·E 3 和 GPT 模型之上,可以生成長(zhǎng)達(dá)一分鐘的有運(yùn)動(dòng)、多機(jī)位視頻。相比業(yè)界水平,Sora 將視頻生成的時(shí)長(zhǎng)一次性提升了 15 倍,直接邁過了市面上所有短視頻的時(shí)長(zhǎng)要求。

    同時(shí),Sora 也帶有世界模型的特質(zhì)。世界模型不是 AI 視頻生成的必需要素,卻是這個(gè)領(lǐng)域較為高端的一個(gè)研究方向。所謂世界模型,簡(jiǎn)單點(diǎn)說,是要對(duì)真實(shí)的物理世界進(jìn)行建模,讓機(jī)器像人類一樣,對(duì)世界有一個(gè)全面而準(zhǔn)確的認(rèn)知。視頻與文字不同,大多數(shù)是在描繪一個(gè)主體,在一個(gè)真實(shí)或虛構(gòu)的物理世界中的動(dòng)作,因此,世界模型會(huì)讓 AI 視頻生成更流暢、更符合邏輯,降低視頻模型的訓(xùn)練成本,提升訓(xùn)練效率。同時(shí),世界模型也為生成式 AI 真正進(jìn)入自動(dòng)駕駛行業(yè)鋪好了路。

    此次,Sora 的世界模型,已經(jīng)能幫助它還原一輛越野車在山區(qū)小路上的行駛情況,在視頻中添加逼近真實(shí)的傾斜和顛簸感。

    但 Sora 的世界模型仍有非常多的問題,比如,一塊餅干被咬過之后,卻沒有留下咬痕。OpenAI 非常實(shí)在,把這些問題都寫在了官網(wǎng)上。

    目前,Sora 僅開放給了少部分人進(jìn)行內(nèi)測(cè),據(jù)稱是一些視覺藝術(shù)家、設(shè)計(jì)師和電影制作人。同時(shí),OpenAI 內(nèi)部仍在進(jìn)行模型倫理側(cè)的對(duì)抗性測(cè)試,比如錯(cuò)誤信息、仇恨內(nèi)容、偏見內(nèi)容,至于色情暴力,則會(huì)在文本輸入時(shí),就被拒絕掉。

    對(duì)于 Sora,今天的我們,必須注意到幾個(gè)顯而易見的推論:

    1.OpenAI 一拳打在了所有人的肝上:全球的 AI 視頻生成賽道投資邏輯,乃至相關(guān)企業(yè)的生存邏輯,在此刻都已經(jīng)改變了。未來一個(gè)季度內(nèi),如果該企業(yè)的視頻生成能力,仍然停留在 4s,或?qū)е轮苯映鼍帧?/p>

    2.AI 已經(jīng)快速邁過文生文、Chatbot時(shí)期,大步進(jìn)軍視頻生成領(lǐng)域:當(dāng)下最火的短視頻、短劇,將迎接 AI 的到來;那些卡在瓶頸上的領(lǐng)域,比如自動(dòng)駕駛、智慧城市,或?qū)⒂瓉硗黄啤?/p>

    3.不要過度神話 Sora 或其他 AI 視頻生成工具,當(dāng)下仍有巨量的技術(shù)、產(chǎn)品、商業(yè)問題等待解決;但也不要低估 AI 技術(shù)的進(jìn)步速度,那個(gè)凝固在未來時(shí)光中、讓人看不清面貌的 AGI(通用人工智能),正在向我們邁步。

    Sora到底牛在哪兒?

    就在年前,2024年 1月27 日,虎嗅舉辦了一場(chǎng)關(guān)于 AI 視頻生成的開放沙龍,會(huì)上有一個(gè)有趣的互動(dòng):AI 視頻生成多快迎來 Midjourney 時(shí)刻?

    選項(xiàng)分別是半年內(nèi)、一年內(nèi)、一至兩年或更長(zhǎng)。

    在現(xiàn)場(chǎng),每個(gè)選項(xiàng)都各有擁躉,但 OpenAI 26日公布了準(zhǔn)確答案:20 天。

    AI 視頻生成真正的難點(diǎn)是在文生視頻,而非圖生視頻、視頻生視頻。個(gè)中奧妙在于,文生視頻,需要根據(jù)指令,從文字解碼出視頻的時(shí)空邏輯,同時(shí)保證在這一邏輯下,畫面中所有物體的運(yùn)動(dòng)、變化,符合要求,符合現(xiàn)實(shí)世界規(guī)律。而圖生視頻、視頻生視頻,皆有“照貓畫虎”的意味,因此反倒要簡(jiǎn)單一些。這也是為什么,市面上的 AI 視頻生成,始終停留在 2s~4s 的時(shí)長(zhǎng)范圍內(nèi)——一旦超過了這個(gè)時(shí)長(zhǎng),視頻的可控性和質(zhì)量都將大大下降。

    很多視頻生成,更像是個(gè)固定人物配上動(dòng)態(tài)背景,畫面很單調(diào),幾乎沒什么動(dòng)作,這也是因?yàn)閺奈淖值揭曨l,在時(shí)空邏輯推理層面的局限。同時(shí),很多企業(yè)更關(guān)注所謂 AI 視頻生成的產(chǎn)品化、商業(yè)化,聚焦于推出一些基于模板,快速用于營(yíng)銷的視頻生成工具,在世界模型層面有所欠缺,一旦視頻時(shí)長(zhǎng)增加,模型不能理解真實(shí)的物理運(yùn)動(dòng)和相互作用邏輯,變得十分無力。

    OpenAI 的 Sora ,就是在文生視頻、增加視頻時(shí)長(zhǎng)、建立世界模型這幾大最主要的難點(diǎn)上,走出了突破性的一步。但這并不代表 Sora 沒有問題,可以以假亂真,當(dāng)下最違和的問題在于憑空生成:三只小狗在嬉鬧,憑空出現(xiàn)了第四只小狗、第五只小狗;一個(gè)人撿起一大塊塑料片,憑空出現(xiàn)一把塑料椅子。

    另外一類主要問題,在于 Sora 的世界模型仍然不夠完善。比如一個(gè)男人倒著跑跑步機(jī),且跑步動(dòng)作并不連貫自然?;蛘咭粋€(gè)籃球撞在籃筐上,發(fā)出符合物理規(guī)律的彈跳,然而下一秒就撞破了籃網(wǎng),發(fā)生爆炸。一群考古學(xué)家,在沙漠里挖出一個(gè)塑料椅子,煞有介事地清理灰塵,而椅子本身則在詭異地飄浮和變形。

    AI 視頻生成真正的難點(diǎn)是在文生視頻,而非圖生視頻、視頻生視頻。個(gè)中奧妙在于,文生視頻,需要根據(jù)指令,從文字解碼出視頻的時(shí)空邏輯,同時(shí)保證在這一邏輯下,畫面中所有物體的運(yùn)動(dòng)、變化,符合要求,符合現(xiàn)實(shí)世界規(guī)律。

    世界模型一直處于一個(gè)相當(dāng)狹窄的研究領(lǐng)域,這概念研究難度大,目標(biāo)太高,帶有相當(dāng)?shù)膶W(xué)術(shù)色彩,因此一度參與者寥寥。

    值得一提的是,Meta 首席人工智能科學(xué)家、圖靈獎(jiǎng)得主楊立昆(Yann LeCun)本人,盡管在 Meta 的生成式AI落后問題上,正承受著巨大壓力,但其卻是世界模型構(gòu)想的主要提出者。

    楊立昆一向?qū)ι墒?AI 的幻覺和一系列反智行為嗤之以鼻,并認(rèn)為AI只有真正理解物理世界,才具備真正的價(jià)值,斷言 GPT 模型活不過5年。他在 2023 年 6 月基于自己的構(gòu)想,推出了 I-JEPA 模型,用真實(shí)世界的背景知識(shí),補(bǔ)充圖像缺失的片段,但這仍然是個(gè)技術(shù)研究層面的概念。

    2023 年 12 月,AI視頻生成的領(lǐng)頭羊之一 Runway,官宣下場(chǎng)通用世界模型,高調(diào)發(fā)布系列招聘,宣稱要用生成式AI來模擬整個(gè)世界,以應(yīng)對(duì) Pika 的步步緊逼。

    這是一個(gè)信號(hào),或許在楊立昆看來,局面一度在向著好的方向發(fā)展:自己的研究方向得到認(rèn)同,拖累 Meta 的謠言不攻自破。

    Sora革了誰的命?

    Sora 發(fā)布前,有很多煙幕彈式的訊息更新,比如:OpenAI 組建研究?jī)和踩男聢F(tuán)隊(duì)、OpenAI 正準(zhǔn)備推出 GPT-4.5-turbo,但真正的“殺手級(jí)更新”被隱藏得很好,這也導(dǎo)致像 Pika、Runway 一樣的明星創(chuàng)業(yè)公司,措手不及。何況 OpenAI 的聯(lián)合創(chuàng)始人 Andrej Karpathy 本來就是 Pika 的資方之一。

    源碼資本副總裁李露霖在虎嗅主辦的沙龍上表示,短視頻是當(dāng)前硬件基礎(chǔ)設(shè)施Mass Market滲透率最高的形態(tài)。

    有數(shù)據(jù)顯示,目前國(guó)內(nèi)短視頻用戶的規(guī)模在10億以上,有數(shù)據(jù)稱抖音2022年年收入700億美金以上,快手也在900億元人民幣以上。不過面對(duì)這樣一個(gè)市場(chǎng),在 Sora 發(fā)布前,所有的視頻生成工具,均沒有達(dá)到可付諸商業(yè)或工業(yè)化生產(chǎn)的水平。

    有專家對(duì)虎嗅表示,大廠目前對(duì)于AI視頻生成的態(tài)度模棱兩可。根本問題在于,現(xiàn)在的人工視頻生成效果更好,且成本也能接受,AI 視頻生成,在此前沒有大家想象的那么顛覆,所以整體策略偏向“防御”,而非“進(jìn)攻”。

    這一切,既麻痹了像 Pika、Runway 一樣的創(chuàng)業(yè)公司,讓他們以為機(jī)會(huì)已至、前景夠好;也讓這些公司及其投資人,低估了視頻生成賽道的競(jìng)爭(zhēng)烈度,以為窗口期仍然足夠長(zhǎng)。

    所有的 AI 視頻生成公司,在這種麻痹里,都陷入了同質(zhì)化競(jìng)爭(zhēng):過多關(guān)注更高畫質(zhì)、更高成功率、更低成本,而非更長(zhǎng)時(shí)長(zhǎng)以及世界模型。

    Pika、Runway、Meta,大體都是如此,在時(shí)長(zhǎng)不超過 4s 的范圍內(nèi),可以做到畫質(zhì)極度精美,但物體本身的運(yùn)動(dòng)幅度極低,且會(huì)變形。

    國(guó)內(nèi)的字節(jié)跳動(dòng),反倒是其中的另類。在視頻領(lǐng)域,字節(jié)的嗅覺更加敏銳。2023 年 11 月,字節(jié)跳動(dòng)發(fā)布 PixelDance,通過上一個(gè)視頻片段尾幀,為下一個(gè)視頻片段頭幀提供指導(dǎo)的思路,在視頻時(shí)長(zhǎng)上有所突破,但截止到發(fā)稿時(shí)間,仍然沒有開放用戶測(cè)試。

    接下來在資本市場(chǎng)的影響,很可能是隱性的。Pika 創(chuàng)始團(tuán)隊(duì)曾被打上“學(xué)霸”“完美”等標(biāo)簽,并在 2023 年 11 月底完成 5500 萬美元融資,可下一輪的資本將在怎樣的時(shí)間點(diǎn),以什么樣的數(shù)額進(jìn)入?Runway 2023 年 5 月完成 1.41 億美元融資,但主攻世界模型的團(tuán)隊(duì)還在組建中,下一步融資的節(jié)奏也存疑。

    如果說 Pika、Runway 身上還有布局價(jià)值,那么對(duì)于國(guó)內(nèi) AI 出海的企業(yè)而言,形勢(shì)將變得更加艱難。換句話說,從移動(dòng)時(shí)代遷移至今的、基于場(chǎng)景和產(chǎn)品能力,快速上線一個(gè)插件的商業(yè)模式,正在海外 AI 市場(chǎng)失效——

    因?yàn)橄?OpenAI 這樣的企業(yè),正屹立在市場(chǎng)上。他們幾乎重現(xiàn)了當(dāng)年 Oracle 市場(chǎng)領(lǐng)導(dǎo)力,一步快,步步快,降維打擊所有競(jìng)爭(zhēng)者。對(duì)于所有做模式、趕風(fēng)口的機(jī)會(huì)主義創(chuàng)始人而言,巨頭若要?dú)⑺滥悖峙乱仓粫?huì)發(fā)生在一夜之間。

    ◎ 來源|虎嗅網(wǎng)

    猜你喜歡
    邏輯世界模型
    一半模型
    刑事印證證明準(zhǔn)確達(dá)成的邏輯反思
    法律方法(2022年2期)2022-10-20 06:44:24
    邏輯
    創(chuàng)新的邏輯
    重要模型『一線三等角』
    重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
    女人買買買的神邏輯
    37°女人(2017年11期)2017-11-14 20:27:40
    我愛你和世界一樣大
    3D打印中的模型分割與打包
    彩世界
    足球周刊(2016年15期)2016-11-02 11:39:47
    噶尔县| 成武县| 石柱| 石泉县| 万盛区| 塘沽区| 英吉沙县| 石城县| 射阳县| 苍梧县| 渭南市| 天等县| 龙山县| 尼勒克县| 江城| 武穴市| 库尔勒市| 扶风县| 勐海县| 蓝田县| 东阿县| 乐陵市| 柳河县| 东光县| 通州市| 水富县| 铜梁县| 元阳县| 曲阳县| 奉贤区| 宿迁市| 吴堡县| 花莲市| 新民市| 龙泉市| 吉林市| 广河县| 靖边县| 新乡县| 辉县市| 正镶白旗|