周曉
在新冠疫情肆虐人類(lèi)社會(huì)、給人類(lèi)的日常生活領(lǐng)域帶來(lái)巨大的直接影響的同時(shí),人工智能算法也受到疫情的間接影響,且影響巨大。但是人工智能算法并不屬于生物、經(jīng)濟(jì)或政治,那么它是怎么被新冠疫情沖擊的?
2020年結(jié)束時(shí),新冠病毒依然在世界各地肆虐,英國(guó)也不例外。由于疫情嚴(yán)重,英國(guó)也不得不關(guān)閉學(xué)校,到了期末,依然沒(méi)有開(kāi)學(xué)。但是,在沒(méi)有上課和考試的情況下,英國(guó)政府依然要求各個(gè)學(xué)校為學(xué)生打分。
然而,老師也封閉在家,已經(jīng)好幾個(gè)月沒(méi)看見(jiàn)學(xué)生了,無(wú)法給學(xué)生打分。于是,英國(guó)政府這次就用人工智能算法來(lái)給學(xué)生打分。算法會(huì)預(yù)測(cè),如果學(xué)生來(lái)參加了考試,他們的成績(jī)會(huì)是什么樣的。
人工智能算法的結(jié)果出來(lái)了。40%的學(xué)生的成績(jī)低于老師的預(yù)期。其中一些學(xué)生的成績(jī)直接低了好幾個(gè)等級(jí),這就相當(dāng)于一位原本可以考90分(滿(mǎn)分100分)的學(xué)生,被人工智能算法預(yù)測(cè)只能考60分。一些學(xué)生甚至因此失去了考入名校的機(jī)會(huì)。
更糟糕的是,在這40%的學(xué)生當(dāng)中,更多的是公立學(xué)校的學(xué)生,而非私立學(xué)校的學(xué)生。換句話說(shuō),人工智能算法預(yù)測(cè),公立學(xué)校的學(xué)生無(wú)論過(guò)往學(xué)習(xí)有多認(rèn)真、成績(jī)有多好,“一定”是比不上私立學(xué)校的學(xué)生的。
人工智能算法給出的成績(jī)直接導(dǎo)致了大規(guī)模質(zhì)疑與抗議,那么它為何給出如此不合理且矛盾的成績(jī)?
人工智能的算法是基于現(xiàn)實(shí)的數(shù)據(jù)所建立的。現(xiàn)實(shí)的數(shù)據(jù)跟數(shù)學(xué)數(shù)字一個(gè)很大的區(qū)別就是,現(xiàn)實(shí)數(shù)據(jù)帶有時(shí)間的屬性,而單純的數(shù)字則沒(méi)有時(shí)間屬性。在數(shù)學(xué)里,“90”就是單純的90,而“一個(gè)學(xué)生的成績(jī)是90分”里的“90分”指的是過(guò)去的分?jǐn)?shù)(英語(yǔ)語(yǔ)法里會(huì)直接提示90分是過(guò)去的)。這也就導(dǎo)致了人工智能算法的構(gòu)建,是基于過(guò)去的數(shù)據(jù),而非未來(lái)的數(shù)據(jù)。因此,目前的智能算法只能很好地“描述”過(guò)去,而無(wú)法“預(yù)測(cè)”未來(lái)。
就拿這次人工智能算法預(yù)測(cè)英國(guó)學(xué)生成績(jī)的案例來(lái)說(shuō)?;谶^(guò)去的數(shù)據(jù),因?yàn)榻逃Y源遠(yuǎn)比不上私立學(xué)校的,公立學(xué)校學(xué)生的成績(jī)總體上確實(shí)比私立學(xué)校的低。但是,由于這次疫情,幾乎所有學(xué)校都關(guān)閉了,那么教育資源造成的成績(jī)差距理應(yīng)縮小,而非依舊那么大。只不過(guò),算法的數(shù)據(jù)庫(kù)里可沒(méi)有新冠疫情,因?yàn)椤斑^(guò)去”沒(méi)有新冠疫情,所以它就只能依據(jù)以往的情況進(jìn)行預(yù)測(cè)。
造成人工智能算法預(yù)測(cè)結(jié)果不靠譜的因素當(dāng)中還有“人”。這次英國(guó)的成績(jī)預(yù)測(cè)如此離譜的原因還有,英國(guó)政府為了避免由于考試試題變得簡(jiǎn)單導(dǎo)致的“成績(jī)膨脹”,讓算法一定要把某一等級(jí)的成績(jī)維持在某一特定的比例之內(nèi)。
舉個(gè)例子,得90分的學(xué)生只能占1%,那么一些本應(yīng)處于這個(gè)分段的學(xué)生,由于人數(shù)已滿(mǎn),分?jǐn)?shù)只能向下調(diào)。隨后再加上私立學(xué)校學(xué)生的成績(jī)大概率好于公立學(xué)校的判定,那么這些90分的學(xué)生當(dāng)中,大多是私立學(xué)校的,隨后的成績(jī)也按相同的邏輯安排,最后的結(jié)果就是獲得好成績(jī)的學(xué)生當(dāng)中,更多的是私立學(xué)校的;而在成績(jī)較差的學(xué)生里,更多是公立學(xué)校的。
除了人工智能算法的操控者之外,被預(yù)測(cè)者也會(huì)使算法不具有預(yù)測(cè)性。人是有主觀能動(dòng)性的。一位成績(jī)?cè)静缓玫墓W(xué)校學(xué)生,可能因?yàn)橥蝗挥辛四繕?biāo),奮發(fā)圖強(qiáng),在下一次考試中取得難以置信的好成績(jī);公立學(xué)校為了提高學(xué)生成績(jī),在下次的考試之前,痛下血本,聘請(qǐng)更好的老師……然而,人工智能算法可不會(huì)知道這些未來(lái)將要發(fā)生的事情,它只能認(rèn)為,成績(jī)不好的群體以后的成績(jī)只能一直差下去。
早在這次英國(guó)預(yù)測(cè)成績(jī)事件之前,智能算法已經(jīng)用于對(duì)人類(lèi)進(jìn)行一些預(yù)測(cè)。
智能算法預(yù)測(cè)犯罪已在美國(guó)應(yīng)用于司法實(shí)踐。美國(guó)一位教授于2010年至2012年之間,制作出了一款名為Prepol的犯罪預(yù)測(cè)軟件。這款軟件的預(yù)測(cè)模型直接取自地震余震的預(yù)測(cè)模型。它根據(jù)以前的犯罪數(shù)據(jù),預(yù)測(cè)未來(lái)的犯罪會(huì)發(fā)生在哪個(gè)區(qū)域,從而指導(dǎo)警局把警力集中在目標(biāo)區(qū)域,進(jìn)行巡邏,以達(dá)到打斷犯罪計(jì)劃,以及預(yù)防犯罪的目的。由于這地震余震的預(yù)測(cè)模型的準(zhǔn)確率非常之高,以致于不少人對(duì)Prepol非常有信心,當(dāng)時(shí)超過(guò)半數(shù)的警局裝備了它。
但是,一段時(shí)間后,奇怪的狀況發(fā)生了。裝備了Prepol的警局,往往被引導(dǎo)把警力集中在某一以前犯罪率較高的社區(qū)。然而,這些社區(qū)的犯罪率依然居高不下,換句話說(shuō),Prepol沒(méi)有任何的預(yù)測(cè)和預(yù)防效果。乍一看,這款犯罪預(yù)測(cè)軟件似乎至少成功預(yù)測(cè)了高犯罪率的社區(qū)??茖W(xué)家調(diào)查發(fā)現(xiàn),這是警察的“自我實(shí)現(xiàn)預(yù)言”所導(dǎo)致的。
由于一些警察對(duì)軟件的“預(yù)言”深信不疑,一些看似可疑的人員就直接被當(dāng)成罪犯。但沒(méi)有證據(jù),于是警察就對(duì)可疑人員進(jìn)行語(yǔ)言、肢體或行為挑釁,當(dāng)引起對(duì)方的反抗后,警察就會(huì)趁機(jī)反擊或拔槍。于是,一件件由警察自己制造的案件就此產(chǎn)生。
除了P re p o l,還有一款名叫“替代制裁罪犯管理剖析”(簡(jiǎn)稱(chēng)COMPAS)的軟件應(yīng)用于司法實(shí)踐。這款軟件于2016年投入使用,它主要用于預(yù)測(cè)假釋或出獄人員再次犯罪的可能性。有意思的是,無(wú)論是Prepol ,還是COMPAS,它們所使用的建構(gòu)數(shù)據(jù)里完全不涉及膚色,但是前者預(yù)測(cè)黑人的犯罪率是白人的兩倍,而后者預(yù)測(cè)黑人的再犯率是白人的兩倍。
為什么Prepol和COMPAS會(huì)出現(xiàn)歧視黑人的情況?科學(xué)家對(duì)此的解釋是“基于不公平的數(shù)據(jù)做出的預(yù)測(cè)也是不公平的”。如今這兩款犯罪預(yù)測(cè)軟件已逐漸停止使用。
在商業(yè)領(lǐng)域,也有人工智能算法產(chǎn)生離譜預(yù)測(cè)的情況。例如,亞馬遜公司的招聘算法不久前被披露,它認(rèn)為男性的工作能力更強(qiáng),因此在招聘過(guò)程中,更青睞男性。亞馬遜的招聘算法之所以得出這種性別歧視般的預(yù)測(cè),原因是它的數(shù)據(jù)來(lái)自于現(xiàn)任成功員工與男性之間的關(guān)聯(lián):現(xiàn)任成功的員工大多是男性。招聘算法忽視了現(xiàn)代社會(huì)依然存在的“男人工作,女人養(yǎng)家”的刻板印象要求。
這一個(gè)個(gè)案例告訴我們,人工智能算法想要預(yù)測(cè)人類(lèi),還有很長(zhǎng)的一段路要走。