羅啟睿 沈一凡 羅孟波?
1) (杭州鏈坊科技有限公司,杭州 310013)
2) (浙江大學(xué)物理學(xué)院,杭州 310027)
機(jī)器學(xué)習(xí)是一種人工智能技術(shù),其基本思想是通過(guò)建立多層神經(jīng)網(wǎng)絡(luò)模型來(lái)實(shí)現(xiàn)對(duì)數(shù)據(jù)的學(xué)習(xí)和識(shí)別[1,2].機(jī)器學(xué)習(xí)使用大量的數(shù)據(jù)進(jìn)行訓(xùn)練,可以自動(dòng)從數(shù)據(jù)中提取出最優(yōu)的特征表示,并在多個(gè)層次上逐步抽象數(shù)據(jù)的特征,從而實(shí)現(xiàn)高效的模式識(shí)別和分類任務(wù).機(jī)器學(xué)習(xí)已成為圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理、材料信息等領(lǐng)域的重要技術(shù),并在多個(gè)領(lǐng)域得到廣泛應(yīng)用[3-6].近年來(lái),機(jī)器學(xué)習(xí)也開始應(yīng)用于材料研究和性能預(yù)測(cè)、高分子相變和玻璃態(tài)轉(zhuǎn)變的研究中[7-9].
高分子相變是指高分子材料在不同溫度及不同條件下發(fā)生的相變現(xiàn)象,包括熔融、結(jié)晶、凝膠化等過(guò)程,也包括高分子在溶液中的塌縮相變和在平面上的臨界吸附相變.這些相變現(xiàn)象與高分子材料的物理性質(zhì)密切相關(guān),對(duì)高分子材料的制備和應(yīng)用具有重要作用.塌縮相變是高分子稀溶液中一個(gè)重要的現(xiàn)象,隨溫度的變化高分子發(fā)生從伸展無(wú)規(guī)線團(tuán)態(tài)到塌縮液滴態(tài)的轉(zhuǎn)變,從而引發(fā)相分離.塌縮相變?cè)诩{米材料制備、藥物傳遞等很多領(lǐng)域有廣泛的應(yīng)用[10].此外,高分子鏈在表界面的吸附是高分子科學(xué)和生物物理的重點(diǎn)研究領(lǐng)域之一.高分子在表面的吸附可以改變表面的性質(zhì),在制備高分子復(fù)合材料、改善材料表面性能、制備生物醫(yī)用材料,以及印刷電路等許多技術(shù)和生物應(yīng)用中有重要作用[11-13].因此,聚合物的塌縮和吸附相變得到了實(shí)驗(yàn)、理論和模擬的廣泛研究[14-17].其中,研究塌縮相變溫度和臨界吸附溫度是高分子科學(xué)研究中的重要的基礎(chǔ)問(wèn)題.
本文用朗之萬(wàn)動(dòng)力學(xué)方法產(chǎn)生了稀溶液中不同溫度的高分子構(gòu)象,利用均方回轉(zhuǎn)半徑隨溫度的變化確定了高分子塌縮相變的溫度,機(jī)器學(xué)習(xí)則通過(guò)計(jì)算伸展無(wú)規(guī)線團(tuán)態(tài)和塌縮液滴態(tài)的概率得到高分子塌縮相變的溫度.本文也用動(dòng)力學(xué)Monte Carlo方法模擬了低接枝密度的接枝高分子的臨界吸附現(xiàn)象,利用吸附鏈節(jié)數(shù)的漲落確定了高分子臨界吸附溫度,同時(shí)獲得了不同溫度的大量高分子構(gòu)象,然后機(jī)器學(xué)習(xí)通過(guò)計(jì)算高分子處于脫附態(tài)和吸附態(tài)的概率得到高分子臨界吸附相變的溫度.研究發(fā)現(xiàn)模擬和機(jī)器學(xué)習(xí)得到的高分子塌縮相變溫度和臨界吸附相變溫度幾乎相同.動(dòng)力學(xué)Monte Carlo和郎之萬(wàn)動(dòng)力學(xué)是研究高分子熱力學(xué)性質(zhì)的兩個(gè)重要的模擬方法,本文分別用這兩種模擬方法模擬了高分子的塌縮和臨界吸附相變,并分別與機(jī)器學(xué)習(xí)進(jìn)行了比較.
利用計(jì)算機(jī)模擬和機(jī)器學(xué)習(xí)的方法研究稀溶液中高分子的塌縮相變溫度和低接枝密度的接枝高分子的臨界吸附溫度.對(duì)于稀溶液中高分子的塌縮相變,用朗之萬(wàn)動(dòng)力學(xué)方法模擬了高分子均方回轉(zhuǎn)半徑隨溫度的變化,估算了塌縮相變溫度;對(duì)于接枝高分子在吸引平面上的臨界吸附,采用動(dòng)力學(xué)Monte Carlo方法模擬了吸附鏈節(jié)數(shù)隨溫度的變化,估算了臨界吸附溫度.然后利用大量不同狀態(tài)的高分子構(gòu)象數(shù)據(jù)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,完成訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)從不同溫度的高分子構(gòu)象中計(jì)算出高分子處于塌縮液滴態(tài)及吸附態(tài)的概率.最后,利用從機(jī)器學(xué)習(xí)得到的高分子狀態(tài)概率變化的極大值估算高分子塌縮相變溫度和臨界吸附溫度,并與模擬結(jié)果進(jìn)行了比較.
采用粗粒化的珠簧高分子模擬,鏈長(zhǎng)為N的高分子鏈由直徑為σ的鏈節(jié)組成.為簡(jiǎn)化模擬系統(tǒng)并加快模擬速度,將溶劑看成背景.溶劑分子與高分子的隨機(jī)相互作用提供模擬系統(tǒng)的隨機(jī)力,而高分子運(yùn)動(dòng)帶動(dòng)溶劑分子的運(yùn)動(dòng)則表現(xiàn)為高分子鏈?zhǔn)艿饺軇┑酿?圖1給出了兩個(gè)模擬系統(tǒng)的高分子示意圖: 稀溶液中高分子和低接枝密度的孤立接枝高分子.在這兩個(gè)系統(tǒng)中,高分子鏈之間相互作用可以忽略,因此模擬系統(tǒng)內(nèi)只考慮一條高分子鏈.高分子鏈內(nèi)的相互作用包括成鍵鏈節(jié)之間的相互作用和非成鍵鏈節(jié)之間的相互作用,接枝高分子鏈還存在鏈節(jié)與平面的相互作用.
圖1 模擬高分子的示意圖 (a) 稀溶液中的高分子;(b) 低接枝密度的孤立接枝高分子Fig.1.Schematic diagram of simulated polymers: (a) A polymer in dilute solution;(b) an isolated grafted polymer at low grafting density.
成鍵鏈節(jié)之間的相互作用包含有限伸展的非線性彈性(finitely extensible nonlinear elastic,FENE)勢(shì):
以及鏈節(jié)-鏈節(jié)之間成對(duì)的純排斥Weeks-Chandler-Andersen (WCA)勢(shì)[20]:
這里b是鍵長(zhǎng),K=30ε/σ2是鍵的彈性系數(shù),R0=1.5σ是最大鍵長(zhǎng),ε是WCA勢(shì)的相互作用強(qiáng)度.FENE勢(shì)和WCA勢(shì)的共同作用決定了鍵的平均長(zhǎng)度約為1σ.高分子中非鍵連的鏈節(jié)之間的相互作用采用截?cái)嗟腖ennard-Jones (LJ)勢(shì):
其中r是鏈節(jié)之間的空間距離.為了加快計(jì)算速度,LJ相互作用的計(jì)算在rcut處截?cái)?如果取rcut=21/6σ,LJ勢(shì)演變?yōu)閃CA勢(shì),鏈節(jié)之間只考慮短程的排斥作用.如果取rcut> 21/6σ,模擬還考慮鏈節(jié)之間的相互吸引作用.在塌縮相變的研究中,取rcut=2.5σ,鏈節(jié)之間的吸引作用在低溫下引起鏈的塌縮;而在臨界吸附的研究中,取rcut=21/6σ,高分子鏈節(jié)之間為純排斥作用,高分子總是處于伸展無(wú)規(guī)線團(tuán)狀態(tài).
在臨界吸附的研究中,高分子的一端接枝在平面上.平面位于z=0,接枝鏈節(jié)中心位于z=1的位置.假定一個(gè)厚的無(wú)限大平面,高分子鏈節(jié)與平面的相互作用勢(shì)取[21]:
這里z是鏈節(jié)離開平面的垂直距離,εps是平面的吸引強(qiáng)度,取截?cái)嗑嚯xzc=4σ 和
當(dāng)zmin=0.8585σ,Ups取極小值 -εps.當(dāng)鏈節(jié)位于zmin<z< 1.22σ 時(shí),勢(shì)能值小于-0.5εps,認(rèn)為這樣的鏈節(jié)為吸附鏈節(jié).模擬中平面的吸引強(qiáng)度εps固定為ε.
模擬中的物理量均是約化的無(wú)量綱量,取長(zhǎng)度單位σ=1,能量單位ε=1,和鏈節(jié)的質(zhì)量為質(zhì)量單位m=1.溫度的單位為 ε/kB,其中kB是玻爾茲曼常數(shù).
高分子鏈節(jié)的運(yùn)動(dòng)方程采用朗之萬(wàn)(Langevin)方程:
其中 -?U代表相互作用力,F(T)是熱運(yùn)動(dòng)隨機(jī)力,-ηvi是黏滯力.F(T)具有高斯分布,其平均值為0,漲落為6ηkBT.鏈節(jié)的位置和速度的演化過(guò)程采用修正 velocity-Verlet 算法.
模擬的時(shí)間單位為τ0=(mσ2/ε)1/2.模擬中黏滯系數(shù)取η=1,模擬的時(shí)間步長(zhǎng)取δt=0.01τ0,每間隔δt時(shí)間高分子鏈節(jié)的位置和速度同步演化一次.
采用模擬退火的方法得到高分子不同溫度的構(gòu)象.從高溫的初始無(wú)序態(tài)高分子構(gòu)象出發(fā),緩慢地降低模擬溫度,前一個(gè)溫度的高分子構(gòu)象作為后一個(gè)溫度的高分子初始構(gòu)象.在每個(gè)溫度,長(zhǎng)時(shí)間模擬得到平衡態(tài),然后用更長(zhǎng)的模擬時(shí)間統(tǒng)計(jì)高分子鏈的模擬數(shù)據(jù).由于溫度的改變非常小,高分子構(gòu)象的平衡通常都比較快.為了選擇正確的模擬時(shí)間,會(huì)先對(duì)少量樣本做一個(gè)預(yù)模擬,觀察與高分子構(gòu)象相關(guān)的物理量的收斂過(guò)程,估算出平衡時(shí)間和弛豫時(shí)間.
在動(dòng)力學(xué)Monte Carlo方法中,高分子鏈的整體運(yùn)動(dòng)通過(guò)高分子鏈節(jié)的局域移動(dòng)來(lái)實(shí)現(xiàn).高分子鏈節(jié)的局域運(yùn)動(dòng)導(dǎo)致高分子鏈構(gòu)象的變化,這種構(gòu)象變化可以通過(guò)構(gòu)造一個(gè)Markov過(guò)程來(lái)實(shí)現(xiàn),即假定高分子鏈原來(lái)處于構(gòu)象{r},通過(guò)鏈節(jié)運(yùn)動(dòng)以一定的轉(zhuǎn)移概率P({r}→{r′}) 得到新的構(gòu)象{r′}.鏈節(jié)局域運(yùn)動(dòng)成功與否采用Metropolis算法決定,即該轉(zhuǎn)移概率P取P=min[1,exp(-ΔE/kBT)],其中ΔE是構(gòu)象轉(zhuǎn)變前后的能量差,即ΔE=E{r′}-E{r}.
鏈節(jié)的每次局域運(yùn)動(dòng)對(duì)應(yīng)于鏈節(jié)在x,y和z方向分別移動(dòng)dx,dy和dz,其中dx,dy和dz是介于(-Δ,Δ)之間均勻分布的隨機(jī)量,模擬中取Δ=0.1σ.Monte Carlo的時(shí)間單位為Monte Carlo步(MCS),1個(gè)MCS中每個(gè)高分子鏈節(jié)平均運(yùn)動(dòng)一次.與朗之萬(wàn)動(dòng)力學(xué)模擬相同,動(dòng)力學(xué)Monte Carlo方法也采用退火模擬的方法得到高分子構(gòu)象隨溫度的變化.
采用機(jī)器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)模式,建立了基于神經(jīng)網(wǎng)絡(luò)的分類器.高分子鏈的空間構(gòu)象通過(guò)鏈節(jié)序列的數(shù)據(jù)來(lái)表示,每個(gè)數(shù)據(jù)點(diǎn)代表每個(gè)鏈節(jié)所處的空間位置.在塌縮相變的研究中,鏈節(jié)序列的數(shù)據(jù)反映了高分子鏈處于伸展無(wú)規(guī)線團(tuán)態(tài)或塌縮液滴態(tài);而在臨界吸附相變的研究中,鏈節(jié)序列的數(shù)據(jù)反映了高分子鏈屬于吸附或者非吸附兩種狀態(tài)的一種.機(jī)器學(xué)習(xí)的任務(wù)是: 神經(jīng)網(wǎng)絡(luò)分析輸入的高分子構(gòu)象的鏈節(jié)序列數(shù)據(jù),正確輸出該高分子構(gòu)象所屬的狀態(tài)概率.經(jīng)典的機(jī)器學(xué)習(xí)方法有循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)及長(zhǎng)短期記憶(long-short term memory,LSTM)等神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)[22].但是對(duì)于高分子鏈來(lái)說(shuō),循環(huán)神經(jīng)網(wǎng)絡(luò)可能存在一定問(wèn)題.循環(huán)神經(jīng)網(wǎng)絡(luò)會(huì)認(rèn)為后時(shí)刻輸入的內(nèi)容與前面時(shí)刻輸入的內(nèi)容完全無(wú)關(guān),因此后輸入的鏈節(jié)數(shù)據(jù)可能會(huì)賦予極高的判斷權(quán)重,而早期的鏈節(jié)數(shù)據(jù)會(huì)被“遺忘”,這與所有鏈節(jié)等效的物理事實(shí)不符.而長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)可以克服這個(gè)問(wèn)題.與一般的前饋神經(jīng)網(wǎng)絡(luò)不同,長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)可以利用前后數(shù)據(jù)的時(shí)間序列對(duì)輸入進(jìn)行分析,在自然語(yǔ)言處理方面有廣泛的應(yīng)用[22].
考慮到高分子鏈節(jié)的順序排列性,長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)可以有效地處理高分子構(gòu)象的長(zhǎng)數(shù)據(jù)特征,從而正確得到高分子鏈節(jié)數(shù)據(jù)與高分子鏈構(gòu)象類型的映射關(guān)系.因此,本文處理高分子鏈的構(gòu)象數(shù)據(jù)的核心神經(jīng)網(wǎng)絡(luò)的是長(zhǎng)短期記憶網(wǎng)絡(luò).圖2給出了機(jī)器學(xué)習(xí)進(jìn)行數(shù)據(jù)處理的流程圖.
圖2 機(jī)器學(xué)習(xí)的流程圖Fig.2.Flowchart of machine learning.
長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)的LSTM層接收高分子鏈各個(gè)鏈節(jié)的空間坐標(biāo)信息,并和當(dāng)前的LSTM層狀態(tài)進(jìn)行計(jì)算,輸出新的狀態(tài).完成高分子鏈構(gòu)象所有鏈節(jié)數(shù)據(jù)的計(jì)算后,LSTM層最后輸出的狀態(tài)向量是該高分子鏈構(gòu)象在高維嵌入空間中的一個(gè)表達(dá).接下來(lái)的兩個(gè)線性層都做數(shù)據(jù)的空間降維工作.第一個(gè)線性層負(fù)責(zé)將數(shù)據(jù)從高維嵌入空間變換到一個(gè)較低維的隱藏空間,第二個(gè)線性層再將隱藏空間變換到最后的標(biāo)簽空間.激活層用sigmoid函數(shù)將數(shù)據(jù)轉(zhuǎn)換成(0,1) 之間的數(shù),然后輸出層輸出該值表示該高分子構(gòu)象中處于所屬狀態(tài)的概率.
監(jiān)督學(xué)習(xí)需要有一個(gè)訓(xùn)練過(guò)程,因此先對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和驗(yàn)證.收集高溫和低溫的高分子構(gòu)象,假設(shè)在這兩種溫度下,幾乎只會(huì)生成對(duì)應(yīng)兩種狀態(tài)的高分子鏈構(gòu)象,取其中75%的數(shù)據(jù)作為訓(xùn)練集,剩余25%的數(shù)據(jù)作為驗(yàn)證集.我們?cè)O(shè)置驗(yàn)證的成功概率大于0.9999以保證我們的學(xué)習(xí)效果.本文的神經(jīng)網(wǎng)絡(luò)模型使用二分類交叉熵?fù)p失(binary cross entropy loss)作為損失函數(shù),使用AdamW優(yōu)化器[23].在訓(xùn)練時(shí),二分類交叉熵?fù)p失結(jié)果意味著神經(jīng)網(wǎng)絡(luò)輸出結(jié)果和期望結(jié)果的差異,重復(fù)訓(xùn)練過(guò)程直到損失收斂.圖3給出了損失隨訓(xùn)練次數(shù)的變化.由圖3可以看到,損失隨訓(xùn)練次數(shù)的增加先快速下降,然后快速收斂到一個(gè)穩(wěn)定值.根據(jù)圖3的結(jié)果,在訓(xùn)練次數(shù)達(dá)到40的時(shí)候,認(rèn)為該機(jī)器學(xué)習(xí)模型已經(jīng)收斂.因此在實(shí)際訓(xùn)練中,設(shè)置訓(xùn)練次數(shù)為40,在確保模型效果的情況下節(jié)約計(jì)算時(shí)間.
圖3 機(jī)器學(xué)習(xí)中的損失隨訓(xùn)練次數(shù)的變化Fig.3.Loss in machine learning varies with the number of trainings.
完成長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)訓(xùn)練以后,把高溫和低溫之間的其他溫度的高分子鏈構(gòu)象作為測(cè)試集,判斷各個(gè)溫度下的高分子構(gòu)象處于給定狀態(tài)的概率.最后對(duì)同一溫度的所有高分子構(gòu)象的狀態(tài)概率求平均,得到該溫度下高分子處于某一狀態(tài)的概率的統(tǒng)計(jì)平均值.
本文的神經(jīng)網(wǎng)絡(luò)模型中LSTM層使用雙向LSTM結(jié)構(gòu),內(nèi)部為三層雙向LSTM,每層單方向有200個(gè)隱藏神經(jīng)元,共有1200個(gè)神經(jīng)元.第一線性層有400個(gè)隱藏神經(jīng)元,第二線性層有80個(gè)隱藏神經(jīng)元,最后的激活層有一個(gè)sigmoid神經(jīng)元.因此處理1個(gè)數(shù)據(jù)的神經(jīng)元數(shù)目為1681.輸入層使用1000的批大小,即一次同時(shí)輸入和處理1000條高分子構(gòu)象數(shù)據(jù).這樣,神經(jīng)網(wǎng)絡(luò)模型中總神經(jīng)元數(shù)量達(dá)到1681000.機(jī)器學(xué)習(xí)使用Python語(yǔ)言,基于PyTorch 框架搭建了機(jī)器學(xué)習(xí)程序,在支持CUDA 的 Nvidia GPU上運(yùn)行.為了能處理不同長(zhǎng)度的高分子鏈的數(shù)據(jù),把每條數(shù)據(jù)長(zhǎng)度固定為80,長(zhǎng)度不足的數(shù)據(jù)會(huì)自動(dòng)用0補(bǔ)齊.對(duì)不同鏈長(zhǎng)的高分子構(gòu)象均得到相同的結(jié)論,因此本文給出的數(shù)據(jù)是模擬中所用的最大鏈長(zhǎng)的計(jì)算結(jié)果.
在塌縮相變的研究中,還考慮了高分子鏈節(jié)之間的短程屏蔽庫(kù)侖勢(shì)[24],即把高分子鏈視作聚電解質(zhì).引入靜電相互作用大幅降低了塌縮相變溫度,也同時(shí)降低了模擬的溫度區(qū)間,減小了熱運(yùn)動(dòng)的無(wú)序漲落,從而可以使用較大的模擬時(shí)間步長(zhǎng),加快模擬的速度.用朗之萬(wàn)動(dòng)力學(xué)方法模擬了鏈長(zhǎng)N=64的高分子構(gòu)象性質(zhì)隨溫度的變化,圖4給出了高分子的均方回轉(zhuǎn)半徑對(duì)溫度的依賴關(guān)系.模擬在一個(gè)考慮周期性邊界條件的三維立方系統(tǒng)中進(jìn)行,系統(tǒng)的尺寸L取約為最高模擬溫度(T=3.2)高分子的方均根回轉(zhuǎn)半徑的10倍,即L≈.每個(gè)高分子構(gòu)象的平方回轉(zhuǎn)半徑定義為高分子鏈節(jié)距離質(zhì)心的平均平方距離,即
其中rj是鏈節(jié)的位矢;rc是高分子質(zhì)心的位矢.是76000個(gè)獨(dú)立高分子構(gòu)象的平均.高分子的隨著溫度的降低而減小,表明高分子構(gòu)象發(fā)生了從高溫的伸展無(wú)規(guī)線團(tuán)(coil state,C態(tài))態(tài)到低溫的緊縮液滴(globule state,G 態(tài))態(tài)的轉(zhuǎn)變,即塌縮相變.塌縮相變溫度Tc通常定義為隨溫度變化最快時(shí)對(duì)應(yīng)的溫度,即極值處.從圖4的插圖,得到Tc=0.5,這與之前的模擬結(jié)果接近[24].
比較了不同溫度下高分子構(gòu)象的差別,圖5給出了3個(gè)特殊溫度下(極低溫、塌縮相變溫度和極高溫)高分子的歸一化概率分布.在極低溫T=0.01,從圖5(a)的分布可以看到不同構(gòu)象的差別極小,分布在2.5到3之間很小的區(qū)間范圍內(nèi).如圖5(a)插圖所示,高分子的構(gòu)象是一個(gè)緊縮的液滴狀.而在遠(yuǎn)高于塌縮相變溫度的高溫,如圖5(c)的溫度T=3.2,高分子的變化范圍很寬,主要變化范圍為從10到60,遠(yuǎn)大于緊縮液滴狀的.這表明,雖然高分子的構(gòu)象很多,但基本上都處于伸展的無(wú)規(guī)線團(tuán)狀,如圖5(c)的插圖.在塌縮相變溫度Tc=0.5,如圖5(b)所示,高分子的變化范圍從4到30,涵蓋了近緊縮液滴狀構(gòu)象和伸展無(wú)規(guī)線團(tuán)狀構(gòu)象.我們看到隨著溫度的變化,高分子構(gòu)象的分布也隨之發(fā)生變化,這正是機(jī)器學(xué)習(xí)的基礎(chǔ).
圖5 高分子平方回轉(zhuǎn)半徑 在溫度T=0.01 (a),0.5(b)和3.2 (c)的概率分布.插圖分別給出了T=0.01和3.2時(shí)高分子的典型構(gòu)象Fig.5.Plots of the probability distribution of square radius of gyration for polymer at temperatures T=0.01 (a),0.5 (b),and 3.2 (c).The insets show the typical polymer conformations at T=0.01 and 3.2.
然后用基于長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)方法計(jì)算了高分子鏈處于塌縮態(tài)的平均概率PG.每個(gè)溫度下高分子的構(gòu)象數(shù)目均為76000.在機(jī)器學(xué)習(xí)的訓(xùn)練階段,假定高分子在模擬的最低溫(T=0.01)均處在G態(tài)而在模擬的最高溫(T=3.2)都處于C態(tài).這種假定的合理性通過(guò)成功率大于0.9999的構(gòu)象驗(yàn)證得到保證.對(duì)長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)訓(xùn)練以后,機(jī)器學(xué)習(xí)自動(dòng)計(jì)算不同溫度的高分子處于塌縮態(tài)的概率.高分子鏈處于塌縮態(tài)的平均概率PG隨溫度的變化結(jié)果見圖6.由圖6可以看到,PG隨溫度的升高而下降,表明高分子的構(gòu)象發(fā)生了從G態(tài)到C態(tài)的轉(zhuǎn)變,在T=0.5附近構(gòu)象的轉(zhuǎn)變迅速增加.圖6的插圖給出了概率隨溫度的變化率|dPG/dT|,|dPG/dT|的峰值位置在T=0.5,表明在T=0.5高分子的狀態(tài)變化最快,即機(jī)器學(xué)習(xí)得到的塌縮相變溫度為0.5,與模擬結(jié)果一致.這表明機(jī)器學(xué)習(xí)通過(guò)學(xué)習(xí)C態(tài)和G態(tài)的高分子構(gòu)象,能有效地判斷其他高分子的構(gòu)象特征,從而給出符合模擬結(jié)果的塌縮相變溫度.
圖6 高分子處于塌縮態(tài)的平均概率PG與溫度T關(guān)系的機(jī)器學(xué)習(xí)結(jié)果.插圖給出了|dPG/dT| 隨T的變化.Fig.6.Machine learning results of the mean probability of polymer being in the compact globule state,PG,versus temperature T.The inset shows the change of |dPG/dT| with temperature T.
這里需要指出模擬結(jié)果只給出了高分子構(gòu)象數(shù)據(jù)和構(gòu)象性質(zhì)的統(tǒng)計(jì)平均值,如圖4所示,并不能給出高分子處于G態(tài)和C態(tài)的概率,而機(jī)器學(xué)習(xí)則從高分子構(gòu)象判斷出高分子的狀態(tài),如圖6所示.雖然模擬和機(jī)器學(xué)習(xí)的一致性不能直接通過(guò)狀態(tài)的概率來(lái)比較,但可以通過(guò)臨界溫度的數(shù)值的一致性來(lái)比較.
高分子的吸附伴隨著吸附能量或者吸附鏈節(jié)數(shù)的變化,高溫脫附態(tài)的吸附能量低而構(gòu)象熵大,低溫吸附態(tài)的吸附能量大而構(gòu)象熵小.高分子吸附過(guò)程是一個(gè)能量和熵的變化和競(jìng)爭(zhēng)過(guò)程,臨界吸附點(diǎn)定義為能量和熵的競(jìng)爭(zhēng)平衡點(diǎn).吸附過(guò)程中平均吸附鏈節(jié)數(shù)〈M〉隨著溫度的下降而持續(xù)增大.高分子的臨界吸附相變通常被認(rèn)為是連續(xù)相變,在臨界吸附相變溫度,由于高分子不斷的吸附和脫附,吸附鏈節(jié)數(shù)的漲落(類似于熱容):
達(dá)到最大[15,25].模擬研究中常利用吸附鏈節(jié)數(shù)的漲落來(lái)標(biāo)定高分子鏈的臨界吸附溫度[25].
用動(dòng)力學(xué)Monte Carlo方法模擬了鏈長(zhǎng)N=65的接枝高分子鏈的吸附.無(wú)窮大平面位于z=0,平面的邊長(zhǎng)L也取約為最高模擬溫度(T=4)高分子的方均根回轉(zhuǎn)半徑的10倍,即系統(tǒng)的高度大于高分子完全伸直的長(zhǎng)度.在平行平面的方向考慮周期性邊界條件.高分子的第一個(gè)鏈節(jié)中心固定在平面中心位于z=1的位置,模擬中定義z< 1.22 的其他鏈節(jié)(除接枝鏈節(jié))為吸附鏈節(jié).圖7給出了鏈長(zhǎng)N=65的高分子吸附鏈節(jié)數(shù)的漲落與溫度T的關(guān)系.模擬得到高分子的臨界吸附溫度約為Tads=0.9.注意到因?yàn)楸竟ぷ髦衅矫鎸?duì)高分子的吸引勢(shì)((4)式)是文獻(xiàn)[26]的0.95倍,我們的模擬結(jié)果與之前朗之萬(wàn)動(dòng)力學(xué)的模擬結(jié)果相近[26].圖7的插圖顯示了高溫的非吸附態(tài)(non-adsorption state或desorption state,D態(tài))和低溫的吸附態(tài)(adsorption state,A態(tài))兩種典型的高分子構(gòu)象: 高溫時(shí)高分子呈現(xiàn)為蘑菇狀的脫附態(tài),低溫時(shí)高分子呈現(xiàn)為吸附態(tài).可見,高分子在吸附前后的構(gòu)象也發(fā)生了明顯的變化.
圖7 高分子吸附鏈節(jié)數(shù)漲落 與溫度T的關(guān)系的動(dòng)力學(xué)Monte Carlo模擬結(jié)果.插圖給出了高溫的非吸附態(tài)和低溫的吸附態(tài)高分子構(gòu)象Fig.7.Plot of the fluctuation of adsorption monomer number of polymer chain versus temperature T.The inset presents non-adsorbed polymer at high temperature and adsorbed polymer at low temperature.
基于長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)通過(guò)學(xué)習(xí)脫附態(tài)和吸附態(tài)的高分子三維構(gòu)象,然后自動(dòng)給出了不同溫度下高分子處于吸附態(tài)的平均概率PA,結(jié)果如圖8所示.這里每個(gè)溫度的高分子構(gòu)象數(shù)為248640.機(jī)器學(xué)習(xí)的結(jié)果也顯示高分子從低溫的完全吸附態(tài)過(guò)渡到高溫的完全脫附態(tài),與模擬結(jié)果一致.從溫度變化率|dPA/dT|隨溫度的變化可看到,高分子狀態(tài)變化最激烈的溫度在T=0.9附近,與模擬得到的臨界吸附溫度Tads=0.9一致.
圖8 高分子處于吸附態(tài)的平均概率PA和溫度變化率|dPA/dT|與溫度T的關(guān)系的機(jī)器學(xué)習(xí)結(jié)果Fig.8.Plot of the mean adsorption probability PA of polymer and its temperature change rate dPA/dT versus temperature T.
從圖7的插圖可以看到,吸附鏈與脫附鏈構(gòu)象的最大區(qū)別體現(xiàn)為鏈節(jié)離開平面的距離(z坐標(biāo))的區(qū)別,即吸附鏈節(jié)數(shù)的區(qū)別,而描述高分子構(gòu)象尺寸的平方回轉(zhuǎn)半徑的差別并不是很明顯,因此我們認(rèn)為機(jī)器學(xué)習(xí)主要通過(guò)區(qū)分高分子構(gòu)象的鏈節(jié)z坐標(biāo)來(lái)實(shí)現(xiàn)的.為此,只讓機(jī)器學(xué)習(xí)分析高分子構(gòu)象的鏈節(jié)z坐標(biāo),而忽略它們的x和y坐標(biāo).圖9給出了分別利用高分子構(gòu)象的三維坐標(biāo)和z坐標(biāo)進(jìn)行機(jī)器學(xué)習(xí)得到的高分子處于吸附態(tài)的平均概率PA與溫度T的關(guān)系.發(fā)現(xiàn)兩種方法得到的差別比較小,說(shuō)明機(jī)器學(xué)習(xí)在研究臨界吸附時(shí)主要分析了構(gòu)象的z坐標(biāo).但在臨界吸附溫度Tc附近,PA的值有一些差別,這說(shuō)明在Tc附近,三維構(gòu)象還是對(duì)機(jī)器學(xué)習(xí)有一定的影響.這可能是在Tc附近,高分子構(gòu)象的變化非常大,這個(gè)時(shí)候z坐標(biāo)不能唯一決定PA,高分子狀態(tài)可能還跟鏈節(jié)的z的變化序列相關(guān).
圖9 利用高分子構(gòu)象的三維坐標(biāo)和z坐標(biāo)進(jìn)行機(jī)器學(xué)習(xí)得到的高分子處于吸附態(tài)的概率PA與溫度T的關(guān)系Fig.9.Relationship between adsorption probability PA and temperature T obtained by machine learning using the three-dimensional coordinates and z-coordinates only of polymer conformations.
進(jìn)一步分析了每個(gè)高分子構(gòu)象的機(jī)器學(xué)習(xí)結(jié)果與構(gòu)象性質(zhì)之間的關(guān)聯(lián).關(guān)聯(lián)了總共248640個(gè)構(gòu)象的吸附數(shù)M和鏈質(zhì)心高度zc與機(jī)器學(xué)習(xí)得到的每個(gè)構(gòu)象可能處于吸附態(tài)的概率PA,找出PA在(0,0.2),(0.2,0.8)和(0.8,1)三個(gè)范圍內(nèi)高分子構(gòu)象的分布.圖10給出了臨界吸附溫度Tc=0.9 時(shí)的結(jié)果.發(fā)現(xiàn)小的PA對(duì)應(yīng)于小的M和大的zc,而大的PA對(duì)應(yīng)于大的M和小的zc.這說(shuō)明機(jī)器學(xué)習(xí)的結(jié)果是符合物理預(yù)期的.在PA∈ (0.2,0.8)區(qū)域有一段重疊區(qū),在這段重疊區(qū)內(nèi),雖然高分子的M和zc相同,但高分子構(gòu)象變化范圍大,因此具有各種不同的狀態(tài)和PA值.這說(shuō)明PA不是M和zc的單值函數(shù),機(jī)器學(xué)習(xí)對(duì)高分子構(gòu)象的判斷還與構(gòu)象的其他因素有關(guān),這也與圖9的結(jié)論相符.
圖10 機(jī)器學(xué)習(xí)得到的吸附態(tài)概率PA在(0,0.2),(0.2,0.8)和(0.8,1)三個(gè)范圍內(nèi)高分子構(gòu)象相對(duì)于構(gòu)象的吸附數(shù)M和鏈質(zhì)心高度zc的分布Fig.10.Distribution of polymer conformation relative to the adsorbed number M and the mean height zc for the adsorption probability PA obtained by machine learning in three ranges of (0,0.2),(0.2,0.8) and (0.8,1).
本文模擬研究了高分子的塌縮相變和臨界吸附相變,得到了大量的高分子構(gòu)象數(shù)據(jù).機(jī)器學(xué)習(xí)采用長(zhǎng)短期記憶網(wǎng)絡(luò)作為核心神經(jīng)網(wǎng)絡(luò),對(duì)高分子鏈構(gòu)象按塌縮態(tài)和吸附態(tài)進(jìn)行了分類統(tǒng)計(jì).結(jié)果表明: 模擬和機(jī)器學(xué)習(xí)得到了相同的塌縮相變溫度和臨界吸附相變溫度,機(jī)器學(xué)習(xí)的結(jié)果符合物理預(yù)期.本文的研究擴(kuò)展了機(jī)器學(xué)習(xí)在高分子構(gòu)象識(shí)別方面的應(yīng)用,有望應(yīng)用到高分子材料在不同溫度下的相變行為的智能自動(dòng)分析中.