未知
①《權(quán)力的游戲》角色死亡概率預(yù)測(cè)頁(yè)面,綠色代表生存幾率
在8季《權(quán)力的游戲》中,最讓觀眾揪心的一件事就是,你永遠(yuǎn)無(wú)法猜到某一角色能否活到下一集,即使是十分重要的角色也隨時(shí)可能死掉。https://got.show網(wǎng)站應(yīng)運(yùn)而生,它是由慕尼黑工業(yè)大學(xué)( Technical University ofMunich)的學(xué)生創(chuàng)建,通過(guò)一套Al算法為觀眾預(yù)測(cè)劇中各角色的死亡率。其中某些角色的預(yù)測(cè)相當(dāng)準(zhǔn),以瓊-雪諾為例,預(yù)測(cè)其在第8季中活下去的可能性極高死亡概率僅為12%(圖1),與最終的劇情結(jié)果還是相當(dāng)吻合的。
got.show網(wǎng)站究竟是怎么預(yù)測(cè)的呢?原來(lái)他們主要應(yīng)用了機(jī)器學(xué)習(xí)技術(shù)(Machine learning,ML)。傳統(tǒng)軟件,都是預(yù)先編寫好程序來(lái)執(zhí)行特定的任務(wù),相對(duì)來(lái)說(shuō)是固定不變的。應(yīng)用機(jī)器學(xué)習(xí)的Al軟件則不去編寫具體的執(zhí)行程序,而是通過(guò)算法對(duì)大量的樣本數(shù)據(jù)進(jìn)行“學(xué)習(xí)”(解析),從中找出規(guī)律、抽取模型,再用此模型對(duì)新數(shù)據(jù)進(jìn)行判定和預(yù)測(cè)(圖2)。機(jī)器學(xué)習(xí)并不是固定不變的,在不斷地“學(xué)習(xí)訓(xùn)練”的過(guò)程中,它自動(dòng)對(duì)算法進(jìn)行改進(jìn)以達(dá)到更優(yōu)的性能。
②機(jī)器學(xué)習(xí)的三種模式(監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí))
相比于其他的電視劇,《權(quán)力的游戲》中的角色可能是最沒(méi)有安全感的,他們不斷地死掉,有的被暴力殺死,有的死于年老疾病,有的死于意外,不一而足。那么這些角色的死亡到底是隨機(jī)出現(xiàn)的,還是他們都具有某些相似的特征呢?比如年齡、性別、爭(zhēng)奪遺產(chǎn)等等。got.show通過(guò)機(jī)器學(xué)習(xí),對(duì)這些死亡角色的生活進(jìn)行分析,找出其中共有的模型特征,再以此模型去預(yù)測(cè)還活著的角色的死亡可能性百分比(PLOD),也就是——下一個(gè)死的可能會(huì)是誰(shuí)?
got.show搜集了《權(quán)力的游戲》中的近千個(gè)角色,并從多個(gè)相關(guān)的百科網(wǎng)站及社交網(wǎng)站等媒體上,提取每個(gè)角色是否死亡的信息,以及每個(gè)角色的描述信息,建立起一個(gè)數(shù)據(jù)集,并提取出各角色生與死的特征集。
接下來(lái)他們應(yīng)用了貝葉斯生存分析模型,對(duì)所搜集的數(shù)據(jù)進(jìn)行學(xué)習(xí)。貝葉斯生存分析常用于醫(yī)學(xué)臨床研究中,檢查治療、并發(fā)癥或重大事件等對(duì)患者的影響,從而來(lái)評(píng)估存活率。got.show應(yīng)用這一模型,則主要通過(guò)貝葉斯推理的相關(guān)技術(shù),檢查不同特征和角色壽命之間的關(guān)系。他們做出的一個(gè)主要假設(shè)就是:每個(gè)角色的生命都會(huì)有一些基本的危險(xiǎn)概率,并且某些屬性存在與否將導(dǎo)致一些角色比其他角色更容易死。比如根據(jù)統(tǒng)計(jì),《權(quán)力的游戲》中男性角色的死亡率要高于女性(圖3),那么在預(yù)測(cè)某個(gè)男性的死亡率時(shí),他的危險(xiǎn)概率就會(huì)提高。
除了性別之外,got.show還加入了家族、情侶、婚姻、身份、年齡、主要/次要角色等參數(shù),將它們綜合到一起后計(jì)算出角色的存活率。比如瓊·雪諾,作為一個(gè)男性以及史塔克家族的成員,他的危險(xiǎn)概率可能有60%或更高(圖4),但他的年齡、貴族身份等,又使得這一概率下降不少。如此建立起模型之后,通過(guò)不斷地學(xué)習(xí)訓(xùn)練,就使得預(yù)測(cè)的準(zhǔn)確度越來(lái)越高了。
當(dāng)然,貝葉斯生存分析可以進(jìn)行大概率的預(yù)測(cè),但是對(duì)那些毫無(wú)征兆的突然性死亡事件,它會(huì)作為隨機(jī)異常值進(jìn)行處理,無(wú)法精準(zhǔn)地預(yù)測(cè),于是got.show在貝葉斯模型之外,還引入了更為復(fù)雜的神經(jīng)網(wǎng)絡(luò)技術(shù)(基于Python的Keras框架)。有關(guān)神經(jīng)網(wǎng)絡(luò)的技術(shù)原理,本欄目已有過(guò)介紹,就不再贅述了。
③《權(quán)力的游戲》中男性和女性存活率及身份比較
④由上自下:Arryn(藍(lán)色)、Lannister(金色)、None(綠色)和Stark(灰色)家族存活率比較
正如got.show項(xiàng)目的導(dǎo)師Guy Yachdav所說(shuō),他們所開(kāi)發(fā)的這套預(yù)測(cè)算法的數(shù)據(jù)雖然都來(lái)自虛構(gòu)的故事,不過(guò)這項(xiàng)Al技術(shù)其實(shí)也可以應(yīng)用到現(xiàn)實(shí)世界中,對(duì)不同的領(lǐng)域做出有價(jià)值的趨勢(shì)預(yù)測(cè)。
當(dāng)下比較流行的機(jī)器學(xué)習(xí)預(yù)測(cè)應(yīng)用領(lǐng)域有很多,比如天氣預(yù)報(bào)預(yù)測(cè)、股市行情預(yù)測(cè)、房?jī)r(jià)趨勢(shì)預(yù)測(cè)、市場(chǎng)各類商品價(jià)格預(yù)測(cè)、銷售預(yù)測(cè)(圖5)等等,甚至還有預(yù)測(cè)葡萄酒的釀造質(zhì)量這樣的另類預(yù)測(cè)??傊谖磥?lái),它的應(yīng)用將會(huì)越來(lái)越廣。
⑤預(yù)測(cè)領(lǐng)先評(píng)分是眾多機(jī)器學(xué)習(xí)應(yīng)用之一