吳洋洋
Midjourney創(chuàng)始人David Holz。
時隔9個月,Midjourney在2023年圣誕節(jié)前推出了第六代文生圖模型MidjourneyV6。相較于上一代產(chǎn)品,新版本可以生成分辨率更高的圖像,像素達到2048×2048,用戶可以在生成的圖像中看清人皮膚上的細紋和汗毛,其他動物的毛發(fā)、各種場景的光影細節(jié),也都與高清相機拍攝出來的差不多—區(qū)別在于Midjourney的圖是通過AI模型生成的,用戶只需要像聊天一樣在對話框中輸入幾句圖像描述,幾秒種后,對話另一端的AI就會生成一幅相應的圖像。
市面上的文生圖模型和產(chǎn)品已有很多,單國內(nèi)就有百度的文心一格、阿里云的通義萬相、騰訊的混元,國外就更多了,Stability、Google旗下的Imagen2、OpenAI旗下的DALL·E3、Adobe旗下的Firefly……但最受設(shè)計師歡迎的還是Midjourney。
如果說MidjourneyV6售賣的是工業(yè)級的逼真,最初版本的Midjourney售賣的其實是想象力。
在諸多文生圖AI軟件中,Midjourney最先成為“網(wǎng)紅”。初代產(chǎn)品發(fā)布不到一個月,用Midjourney生成的圖片便登上了一個藝術(shù)博覽會。2022年8月,在美國科羅拉多州舉辦的藝術(shù)博覽會上,39歲的游戲設(shè)計師杰森·艾倫用Midjourney生成了一張圖,經(jīng)過Photoshop加工之后,這幅名為《太空歌劇院》的作品戰(zhàn)勝人類畫手,摘得展會數(shù)字藝術(shù)類別的冠軍。
當時的Midjourney擅長模仿藝術(shù)家,它學習過莫奈的《睡蓮》、達利的《記憶的永恒》,知道如何扮演不同風格的畫家。此外,它還擅長創(chuàng)建漂浮在太空中的古代城市,或是一個虛構(gòu)的星球景觀。
大衛(wèi)·霍爾茲(DavidHolz)是Midjourney的創(chuàng)始人,他一直試圖讓Midjourney變成一個更獨特的產(chǎn)品。2023年7月,在MidjourneyV5中,會員用戶可以使用更新的“weird”模式生成各種搞怪、有趣甚至詭異的表情包。比如你可以讓馬斯克穿上粉紅色的裙子,也可以讓雪人變成雪怪。
圖像設(shè)計工具領(lǐng)域的老牌公司Adobe一直在更新技術(shù),以避免被生成式AI時代拋棄。2023年8月,它在Photoshop中推出了一個叫“生成式填充”(GenerativeFill)的功能,用戶可以通過輸入文本在圖片中添加或刪除對象、生成背景,也可以擴展圖像。但Midjourney的“weird”模式生成的圖片更加有趣和前衛(wèi)。在其0到3000的參數(shù)范圍中,用戶給出的參數(shù)值越大,生成的圖片越離譜。
總之,競品努力追求準確描繪現(xiàn)實世界的時候,Midjourney著重提供的是想象力。這種想象力讓Midjourney比對手更早吸引到種子用戶—設(shè)計師。這部分人向其下游客戶售賣的首先同樣是想象力。
位于硅谷的Midjourney并不是全球第一個文生圖模型公司,若追溯這個細分市場的歷史,位于英國倫敦的Stability和位于美國紐約的Runway,都更早開始研究圖像生成技術(shù),目前市面上流行的文生圖模型算法StableDiffusion就是Stability和Runway共同研發(fā)并由Stability開源的。
然而,眼下獲得最多用戶的產(chǎn)品是Midjourney。僅在Discord社區(qū),Midjourney的社區(qū)用戶數(shù)就達到1480萬。
Midjourney開辟了一種新型產(chǎn)品發(fā)布方式—寄身社交產(chǎn)品。迄今為止,Midjourney的所有產(chǎn)品都是在一個叫Discord的美國社交平臺上發(fā)布,而不是蘋果或安卓的應用商店。
Discord擁有1.5億左右的Z世代月活用戶。2022年3月,霍爾茲在這個平臺上推出了第一版Midjourney。用戶只要登錄Discord,在Midjourney頻道中輸入一些文字需求,背后的AI模型就能生成相應的圖片。比如,當用戶想要生成一個未來主義風格的城市景觀,可以在對話框中輸入“未來主義城市景觀、高科技建筑、夜晚、霓虹燈光”等提示詞(prompt),Midjourney很快就可以吐出圖片。如果想要修改,可以通過同樣的交互方式向模型提出要求,比如將“城市”改為“日落時的城市”,Midjourney會在畫面中添加相應的光影效果。
由Midjourney所生成的漂浮在太空中的古代城市。
整個過程中,用戶不需要單獨打開Midjourney的網(wǎng)頁,或者下載一個同名App,他們只要是Discord用戶就可以使用這個工具。
寄身Discord使Midjourney獲得了一種社交裂變。在這個平臺上,用戶自發(fā)組成各種“提示詞小組”,共同討論如何給提示詞調(diào)優(yōu),以獲得期望的圖像,他們還可以在Discord的“畫廊”中展示自己的作品。依賴Discord平臺本身的用戶基礎(chǔ),Midjourney擁有了其他文生圖AI應用不具備的社群氛圍。
進駐Discord一年后,Midjourney的社區(qū)用戶數(shù)就從200萬增長到了1480萬,成為Discord上最大的AI應用。根據(jù)數(shù)據(jù)統(tǒng)計網(wǎng)站Photutorial的信息,截至2023年11月,Midjourney每天平均生成的圖片達到27.5萬張,其產(chǎn)量與用戶歡迎度都超過了競爭對手Stability和DALL·E3。
文生視頻模型開發(fā)商Runway和Pika也開始效仿Midjourney,把Discord作為產(chǎn)品首發(fā)地。2023年5月,Midjourney曾試圖以類似方式進入中國市場,當時它選擇的產(chǎn)品發(fā)布平臺是QQ。
直到2023年12月13日,“寄居”Discord社區(qū)兩年后,Midjourney才推出獨立網(wǎng)站,用戶終于可以直接在Midjourney的網(wǎng)站上使用它的文生圖功能,而無需注冊成為Discord用戶。
目前,Midjourney是生成式AI領(lǐng)域唯一沒有從外部融資、單純靠產(chǎn)品營收維持運營的公司。
盯著Midjourney的風險投資機構(gòu)和大公司都不少,紅杉資本、AndreessenHorowitz都曾向Midjourney表明投資意向,然而都被大衛(wèi)·霍爾茲拒絕了。
“我(從上一次創(chuàng)業(yè)中)學到的是,首先要構(gòu)建一個真正受人們喜歡的好產(chǎn)品。然后,當你完成這個產(chǎn)品時,才可以開始著手構(gòu)建生態(tài)系統(tǒng)?!贝笮l(wèi)·霍爾茲在接受技術(shù)媒體“極客公園”采訪時說。在資本的控制下,很多創(chuàng)業(yè)者都被推動著過早地構(gòu)建了生態(tài)系統(tǒng),霍爾茲認為這會讓創(chuàng)業(yè)者的注意力分散,不能專注于構(gòu)建真正每個人可用的東西,而風險投資機構(gòu)們在炒作時大筆投入,又常常在泡沫破裂后迅速退出。
創(chuàng)辦Midjourney之前,大衛(wèi)·霍爾茲是LeapMotion的聯(lián)合創(chuàng)始人,后者是一家2010年成立的3D運動檢測技術(shù)公司,其核心技術(shù)是能夠精確識別并跟蹤手部和指尖的動作,從而用手勢控制計算機。當時正值VR投資熱期間,LeapMotion從硅谷最知名的風險投資公司之一AndreessenHorowitz等投資機構(gòu)那里籌集了超過1億美元的資金。之后,霍爾茲就開始把大量精力花在了構(gòu)建產(chǎn)品的內(nèi)容生態(tài)上,而不是聚集于讓產(chǎn)品交互體驗更好。最終,由于設(shè)備需要專門的軟件和驅(qū)動程序才能在Windows系統(tǒng)上運行,LeapMotion并未如霍爾茲所期望的那樣,成為觸摸屏之后的新一代交互方式。這次創(chuàng)業(yè)失敗讓霍爾茲格外注重產(chǎn)品本身與用戶之間的關(guān)系,他開始在多個場合強調(diào)“先產(chǎn)品,后生態(tài)”的重要性。
賣掉LeapMotion后,2021年8月,霍爾茲創(chuàng)辦了Midjourney,繼續(xù)關(guān)注視覺,這一次,他選擇不再被資本裹挾。
據(jù)早期用戶Ebersweiler透露,2022年年底時Midjourney的月收入就已超過100萬美元,當時,整個公司只雇用了11位員工。Midjourney很早就采用了付費模式,根據(jù)服務(wù)條款,付費用戶擁有所生成圖像的所有權(quán),但如果用戶是公司的雇員或所有者,且公司年收入超過100萬美元,那么他們必須購買專業(yè)計劃(ProPlan)或超級會員計劃(MegaPlan)。2023年,Midjourney的1500萬社區(qū)成員預計為其帶來2億美元收入。