◎文/任敏
訴別離,它說,“離別恨難分,琵琶不忍聞。斷腸空有淚,明月已無魂?!痹伌喝?,它說,“三月初春雪未消,東風(fēng)吹送柳絲飄。綠楊枝上鶯聲急,紅杏梢頭蝶夢遙?!?/p>
它是誰?它是“熟讀”詩歌90萬首,通曉平仄、押韻、對仗等“潛規(guī)則”,只需輸入關(guān)鍵詞句,即可在數(shù)秒之內(nèi)出口成詩的人工智能機(jī)器人,名曰九歌。這位古詩界的“最強(qiáng)大腦”,誕生于清華大學(xué)自然語言處理與社會人文計(jì)算實(shí)驗(yàn)室,其主要研發(fā)者矣曉沅,是清華園里一位輪椅上的博士。九歌,寄托了他的志向,也帶領(lǐng)他抵達(dá)詩意的遠(yuǎn)方。
6歲起,矣曉沅身體就被類風(fēng)濕性關(guān)節(jié)炎糾纏。無法自由行走的曉沅,多了思考的時(shí)間,他是名副其實(shí)的學(xué)霸。2012年高考,曉沅以云南省理科第16名的成績考入清華計(jì)算機(jī)系。2016年8月,成績優(yōu)異的曉沅開始讀研究生。
近年來,隨著深度學(xué)習(xí)的興起,人工智能與文學(xué)藝術(shù)碰撞出炫目的火花。那在人類語言高度凝練的詩歌領(lǐng)域,AI表現(xiàn)如何?曉沅與他的導(dǎo)師孫茂松教授二人一拍即合,何不做一個(gè)自動作詩機(jī)器人?他們鄭重地為機(jī)器人取名九歌。曉沅解釋,《九歌》既是自己名字的來源,也是《楚辭》名篇,這一命名意在致敬屈原。
當(dāng)時(shí),人工智能作詩,是比較小眾的研究領(lǐng)域。九歌研發(fā)團(tuán)隊(duì)白手起家,他們借鑒詩歌寫作、語言學(xué)、心理學(xué)等方面的理論,設(shè)計(jì)出專門的模型結(jié)構(gòu)。
古詩文是篇章結(jié)構(gòu),講究上下文一致,前后呼應(yīng)。這是他們要解決的頭號難題?!耙灰箵P(yáng)州月,凄涼萬里心。故鄉(xiāng)無限意,惆悵暮云陰。”這首機(jī)器生成的五言絕句,看似文從字順,首尾卻露出馬腳,第一句“月”字點(diǎn)明時(shí)間為夜晚,第四句卻變成“暮云”,前后矛盾。嘗試不少思路之后,他們設(shè)計(jì)出了顯著性線索機(jī)制模型。在此模型主導(dǎo)下,上文的詩有了改進(jìn):“憶昔揚(yáng)州月,于今又一秋。故人何處是,落葉滿汀洲。”
第二關(guān),扣題。對于自動作詩系統(tǒng),主題一般以用戶輸入的一個(gè)或多個(gè)關(guān)鍵詞來確定,如“春風(fēng)”“寒月”“相思”等?,F(xiàn)有的系統(tǒng)要么漏詞,要么將用戶給定的關(guān)鍵詞直接生搬硬套地嵌入生成的詩歌中。他們從心理語言學(xué)角度切入,提出了基于工作記憶模型的詩歌生成方法。該方法使用不同的記憶模塊存儲用戶輸入的不同關(guān)鍵詞和生成的詩文內(nèi)容。模型不斷動態(tài)讀取和更新“自我”記憶,以此來提升扣題的緊密度和靈活性。
攻下一個(gè)又一個(gè)難關(guān)后,2017年年底,九歌1.0版正式上線,系統(tǒng)內(nèi)錄入了從唐代到清代數(shù)千名詩人的30多萬首詩,能自動創(chuàng)作出集句詩、絕句和藏頭詩。那年年底,坐著輪椅的曉沅登上了央視舞臺。曉沅帶著自己的作品迎戰(zhàn)青年詩人,他的九歌會用“機(jī)智過人”四個(gè)字作一首藏頭詩,也能以“心有靈犀一點(diǎn)通”打頭作集句詩,且速度遠(yuǎn)超人類?;诰鸥?,曉沅連續(xù)兩年獲得中國計(jì)算語言學(xué)大會的“最佳系統(tǒng)展示獎(jiǎng)”。一年半之后,九歌2.0版上線。曉沅說,通過改進(jìn)算法,九歌2.0版既能作律詩,又能生成蕭瑟凄涼、憶舊感喟、孤寂惆悵、思鄉(xiāng)憂老、渺遠(yuǎn)孤逸五種風(fēng)格的絕句。
如今,九歌系統(tǒng)的訪問量已超過1000萬人次。九歌3.0新版本正在緊鑼密鼓地開發(fā)。曉沅透露,目前系統(tǒng)已錄入從魏晉南北朝到近現(xiàn)代所能找到的90萬首詩歌,未來,他們還計(jì)劃讓這個(gè)“腹有詩書”的機(jī)器人學(xué)會看圖作詩、觀視頻作詩,也將嘗試作現(xiàn)代詩。