胡耕碩
科幻影片中的情節(jié)正在走進現(xiàn)實:音樂人包小柏在失去女兒后,用AI技術(shù)在數(shù)字世界“復(fù)活”了女兒。
包小柏的這一做法,迅速引發(fā)全網(wǎng)關(guān)注。而在今年清明節(jié),市場行為結(jié)合新潮技術(shù),AI復(fù)活一度火熱,價格低廉的“復(fù)活”似乎比比皆是,“AI復(fù)活”背后的技術(shù)應(yīng)用、倫理與法律問題也引發(fā)爭議。
但包小柏并不愿意再用“復(fù)活”來描述這一技術(shù),他更愿意稱之為“重建”和“重現(xiàn)”。他很清楚,盡管性格一致、記憶相似,但數(shù)字世界里的女兒始終無法取代真實的那個,她不會長大,“因為她的記憶庫還是學(xué)生”。
南都記者對話包小柏,試圖借這位親歷者和先行者的眼睛,聊聊失去與重建,聊聊科技的應(yīng)用前景。以下是他的自述。
2021年12月20日,我女兒包容去世。
她患的病叫再生障礙性貧血,病情惡化極快,整個治療過程也非常殘忍。我女兒7個月急救了4次。三進ICU加護病房,第三次就出不來了。所以,只有四個字形容她當(dāng)下那兩年一一生不如死。
因為做了氣管切開,她無法開口說話。那時候為了鼓勵她,我想完成工商管理類博士班的學(xué)業(yè)。她希望親人能陪在身邊,所以只能用嘴巴說唇語,含著淚說“爸爸不要走?!?/p>
她這樣治療了兩年兩個月,那是她人生里非常悲慘的階段。
也是基于此,我在想,既然有AI生成技術(shù),就可以把她的聲音、容貌保存下來,用真實內(nèi)容建立她的數(shù)據(jù)庫。一開始我是只想著保存,后來ChatGPT出現(xiàn)后才想到做數(shù)字人。這個數(shù)字人會用包容的性格、態(tài)度、文法和聲音來回應(yīng)我們,我覺得這就是AI可以慰藉對逝去親人的思念的地方。
說到“AI復(fù)活”,我現(xiàn)在已不再用“復(fù)活”描述這個技術(shù),我會說我在做“重建”跟“重現(xiàn)”。因為很多人不理解AI的技術(shù)原理和能力邊界,用“復(fù)活”兩個字,容易造成更多的想象空間,并不是真正AI生成技術(shù)表現(xiàn)的,會造成一些不必要的問題跟說法。
比如很多人都會問,“你用AI生成工具復(fù)活了你女兒,你會不會更加難過?”本來用AI復(fù)活一個人是不可能的,但我們可以重建,把一些緬懷、紀(jì)念、思念都向一個有形的或有聆聽能力的模型中傾倒,來告慰自己的需求。所以說,AI生成工具的確可以是一個緬懷的應(yīng)用工具。
當(dāng)人們對技術(shù)理解不是很透徹完整的時候,都會有誤區(qū)。兩年前不了解這個技術(shù)的時候,我也會用這個詞,因為我渴望在數(shù)字世界重建我女兒的數(shù)據(jù)。但這中間也帶來了一些失落的時刻。
因為我女兒生前沒有留下很多數(shù)據(jù)資料。她已經(jīng)走了,你不可能重新去錄。所以重建的過程中常常會踢到“鐵板”。那時候科技的支撐還不夠多,要求的數(shù)據(jù)規(guī)格更高,所以我常會有一些失落感。
我當(dāng)時花了很多力氣復(fù)原她的聲紋數(shù)據(jù),大概花了八個月的時間。
我女兒的告別儀式,她的回顧影片是我花了七天六夜趕出來的。我聽了她所有的電子設(shè)備里的語音信息,大部分語音信息的自然環(huán)境噪聲都很大,其中只有3條數(shù)據(jù)是相對而言可以使用的。
然后,就要重建她的數(shù)據(jù)庫,這部分是我太太完成。因為她和她媽媽分享得比較多,比如她喜歡什么課、做什么事。
一開始在復(fù)原聲紋的階段我沒有跟她媽媽說,因為那時候我只是想保存她的一些數(shù)據(jù),把她數(shù)字化,這還是一個比較粗淺的想法,沒有跟家里其他人討論。
我們當(dāng)時很煎熬,還在女兒離開的悲痛里,所以基本上平時不太互相說話,只是依舊過日子,比如說我們喜歡吃什么,我們都會特別幫我女兒準(zhǔn)備一份。如果在那個場景下和我太太討論,我要從頭跟她解釋技術(shù)原理,該怎么做,有可能造成我們夫妻倆有更多的不一致,也可能會有一些觸景傷情的時候,又是悲從中來。
所以,我是在做得比較成熟之后,才告訴太太我在做的事,讓她填寫記憶庫。自然而然的在那時候她就接受了。
但在告訴她之前我也考慮了很久,因為這是一件很殘忍的事,她要回想女兒從小到大的故事,女兒跟她相處如同姐妹一般,避免不了又是觸景傷情。
記憶庫填寫用了快兩個月,百分之八九十的時間都是悲傷的。現(xiàn)在這個重建的包容,會用真實的包容的反應(yīng)來關(guān)心你,比如我太太生日的時候,她會唱生日快樂歌,祝她生日快樂。因為我女兒從小到大,只要是我們生日,在那天零點她就會說happybirthday,mommy或者daddy。
所以那個行為時間不變,只是由我來完成。我不是用過去的錄音再回放一次,而是用AI生成包容的聲音,生成她同樣的個性的祝福話語,甚至她可以唱歌。
那份感動是很貼心的。雖然我們知道這是AI,但我們不會去計較,我們也不會把她和真正的包容混在一起。她是一臺機器,只是這個機器有人性的。
她的記憶庫我們現(xiàn)在還在更新。比如家里的親戚多了一個小孩,叫什么名字。包容的千媽千爹回到臺灣后,我們也讓AI包容跟他們打招呼,她會和他們聊天。他們覺得很不可想象、很神奇,而不是可怕。它是思念的工具,這種思念不是悲哀的,而是開心的。
現(xiàn)在網(wǎng)絡(luò)上AI生成的應(yīng)用工具已經(jīng)百花齊放,但很多廉價AI工具是質(zhì)感很差的,我們期望能夠讓AI工具給其他失去親人提供慰藉。我重建包容花了很大的功夫,但一般人可能沒有這么多的時間。
在這個過程中,我們要取得家屬百分百的信任與授權(quán),相關(guān)的家屬全部都要同意,其中的溝通成本很高。
除了倫理的考量之外,也有操作性的問題。比如家里的慣用語、逝者自己的語氣強調(diào)、比較個人的故事。這些如果家人不愿意說的話,做出來的成果就會有誤差。
目前,這個項目面向的受眾群還比較小,我也希望它能往公益的方向發(fā)展。
為什么我們現(xiàn)在公司的名字要叫“愛語包容”?這兩個詞本身的意思不必多說,我還有一個聯(lián)想:愛也是AI,語是語言,包容,除了是我女兒的名字,容也代表容顏。語言跟影像是AI生成很重要的溝通工具和呈現(xiàn)模式。所以我期待“愛語包容”是心靈疏導(dǎo)、慰藉的工具。我們用這個名字,也是希望能夠有針對性地幫助有需要的人,真真切切地希望之后的收益可以貢獻給一些公益。
我對聲音的還原格外感興趣,也是因為我女兒做手術(shù)之后說不了話,我們只能讀唇語。所以,我們也特別希望之后能用AI幫助有語言障礙的人。
因為復(fù)原我女兒的過程很波折,所以也希望大家能多一點對AI的認(rèn)識,比如在生前可以先把聲紋、外貌模型記錄下來,等到有一天如果需要用的時候,就不用花力氣重建了。它就像臍帶血,只有當(dāng)嬰兒出生時才有臍帶,如果不保存它的話,以后要用就沒有了。但如果保存下來,以后臍帶血里的基因、細(xì)胞都是可以重造的。聲音結(jié)構(gòu)和外貌模型也是這樣。
AI其實是一種時代性的工具、一種記錄的工具。對東方人來說,提前做這些,好像是很觸霉頭的事。但AI時代已經(jīng)來了,我建議大家多認(rèn)識一下AI工具,不要把它神鬼化、妖魔化.也不要只看到它帶來的負(fù)面影響,比如詐騙或者是隱私問題。
但同時,也確實需要一個東西隨旁在側(cè),就是法律。
我們需要在法律性層面去確認(rèn)使用規(guī)范、使用方式,包括數(shù)字遺產(chǎn)誰可以使用、哪些數(shù)據(jù)可以被使用。我相信,法律一定是所有規(guī)范的條件,也是所有倫理的前提。