范 偉 李世光 武志鵬 段 晨 宗明成
(1.中國科學院微電子研究所 北京 100029)
(2.中國科學院大學 北京 100049)
光刻機是大規(guī)模集成電路芯片制造的核心設備,對焦控制[1]是保障光刻機成像質量、光刻工藝窗口和產(chǎn)品良率的重要技術保障,調焦調平測量系統(tǒng)是光刻機對焦控制的核心部件。調焦調平測量系統(tǒng)的數(shù)據(jù)處理精度影響光刻機的對焦控制性能[2],計算速度影響光刻機的產(chǎn)能[3],因此需要綜合考慮這兩個因素。本文對比分析多項式擬合算法(polynomial fitting)[4]、RF(random forest)算法[5~6]和XGBoost(extreme gradient boosting)算法[7]在調焦調平測量系統(tǒng)中的測量精度與計算耗時,提出適用于光刻調焦調平測量系統(tǒng)的擬合算法。
本實驗室搭建的調焦調平測量系統(tǒng)[8]基于光學三角法測量硅片高度,探測器接收到的O光與E光信號[9]為
式中,N為光柵狹縫個數(shù),P是矩形光柵周期,Δx是硅片高度變化為h時從投影光柵出射的光束中心位置在探測光柵處產(chǎn)生的偏移,c是(偏振片+分光晶體)組件的透射率。
對O光和E光信號進行歸一化差分處理[9]后得到hraw,即當硅片在調焦調平測量系統(tǒng)零位附近± 1.25μm范圍內變化時,hraw隨h近似線性變化。光柵狹縫個數(shù)為29,周期為30,采樣點數(shù)為7520個,仿真生成該范圍內連續(xù)掃描35次的hraw與h數(shù)據(jù),如圖1所示。通過擬合算法得到硅片表面高度h隨hraw的變化關系模型后,即可通過hraw計算得到硅片表面擬合高度hfit。不同的擬合算法得到的這種變化關系模型具有不同的計算精度和速度。
使用基于Python的Scikit-learn工具包對數(shù)據(jù)進行處理。將hraw與h輸入到模型中可得擬合算法模型,將hraw代入擬合算法模型中即可得到硅片表面高度擬合值hfit,記錄獲得hfit的耗時,計算硅片表面真實高度h與擬合高度hfit的差herror及其3σ值,即,式中μ為herror的均值,N為數(shù)據(jù)個數(shù)。
圖1 實驗數(shù)據(jù)
本研究采用3種擬合算法:多項式擬合、RF算法和XGBoost。多項式擬合算法是曲線擬合的基本方法,其形式簡單且易于工程實現(xiàn)。RF算法是Bagging集成算法[10]的典型代表,通過并聯(lián)多個基學習器的結果提高精度。XGBoost算法是Boosting集成算法的典型代表,通過串聯(lián)多個基學習器的結果提高精度。
多項式擬合函數(shù)為多次方程,其形式為
式中αi為擬合系數(shù),由最小二乘法確定,即最小化
RF由多個決策樹(decision tree)并聯(lián)組合而成,對單個決策樹的結果進行結合后作為RF集成方法的結果,算法主要參數(shù)為決策樹的總個數(shù)n與單個決策樹的最大深度(max depth),其框架示意如圖2所示。
決策樹在構建過程中采用平方誤差準則(square error criterion)進行特征選擇構建二叉樹。對于輸入樣本(xi,yi),單個決策樹的模型[11]如下:
式中,R1,R2,…,RM為輸入空間可劃分成的M個區(qū)域,Cm為每個區(qū)域Rm上的輸出值。
XGBoost由多個決策樹串聯(lián)組合而成,前一個決策樹的輸出結果作為輸入傳送到下一個決策樹中,經(jīng)過多個決策樹得的輸出作為RF集成方法的結果,主要參數(shù)為決策樹的總個數(shù)n與單個決策樹的最大深度(max depth),其框架示意如圖3所示。
圖3 XGBoost算法框架示意圖
對于給定N個樣本、m個特征的數(shù)據(jù)集D={(xi,yi)}(|D|=N,xi∈Rm,yi∈R),集成樹模型使用K棵CART決策樹結果的累加值作為預測值[6]:
式中,fk(xi)是樣本(xi,yi)在第k棵樹的葉子結點上的權重。F={f(x)=wq(x)}(q:Rm→T,w∈RT),q表示將樣本映射到相應葉子結點的樹結構,T表示樹中葉子結點的個數(shù)。wi表示第i個葉子結點的評分(score)。
將圖1原始數(shù)據(jù)轉化成hraw-h曲線,如圖4(a)曲線所示。使用多項式、RF和XGBoost算法對該曲線進行擬合,擬合高度hfit分別如圖4(a)曲線所示。3種算法計算得到的hfit與h相減后得到擬合誤差,如圖4(b)~(d)所示。誤差圖中的水平線縱坐標值對應誤差的±3σ值,多項式擬合誤差為0.001nm,RF擬合誤差為0,XGBoost擬合誤差為10.789nm。其中,RF算法擬合誤差為0的原因將在4.2節(jié)分析。
圖4展示的是某特定參數(shù)下不同算法的擬合高度、誤差和3σ值。實際上,算法的擬合精度3σ與計算耗時會隨擬合參數(shù)變化而變化,下文對此變化關系進行仿真與實驗分析,并說明圖4(b)~(d)的擬合參數(shù)設置過程。
圖4 擬合高度與誤差圖
改變多項式擬合階數(shù),對圖4(a)中hraw-h曲線進行擬合,擬合誤差的3σ值如圖5所示,小圖為局部放大圖。隨著擬合階數(shù)的增加,擬合誤差的3σ值不斷減小。多次統(tǒng)計發(fā)現(xiàn)多項式擬合算法計算耗時總小于1ms,這是因為多項式擬合算法簡單,時間復雜度小。
圖5 多項式擬合算法3σ 值隨階數(shù)變化圖
RF算法中影響精度與計算耗時的主要因素是決策樹的最大深度與決策樹的個數(shù)n,使用網(wǎng)格搜索[12]方法改變這兩個參數(shù),擬合誤差的3σ值與計算耗時如圖6所示。
由圖6(a)可知,RF算法中,決策樹的最大深度對擬合誤差有較大影響,決策樹個數(shù)的變化對擬合誤差影響小。這是因為RF算法采用的并行計算策略在決策樹增多時可以降低擬合方差,擬合誤差的減少主要依靠單個決策樹的最大深度,決策樹的最大深度越深,擬合誤差越小。由圖6(b)可知,計算耗時隨決策樹個數(shù)與決策樹的最大深度的增加呈增加趨勢,模型復雜度的提升會造成計算時長的增加。
在RF算法中,單個決策樹的輸入為hraw,輸出為該決策樹得到的擬合高度hfit,由于仿真數(shù)據(jù)是沒有噪聲影響的采樣點序列,當決策樹最大深度增加時,算法對數(shù)據(jù)的擬合能力不斷增強,算法能獲得hraw序列和h序列間的一一對應關系,如同構建了鍵為hraw,值為h的映射表,通過查詢hraw,可直接得到對應的h,因此圖4(c)中誤差為0。
圖6 RF算法3σ 值與計算耗時圖
改變決策樹的個數(shù)和最大深度,XGBoost算法擬合誤差的3σ值與計算耗時如圖7所示。
圖7 XGBoost算法3σ 值與計算耗時圖
由圖7(a)可知XGBoost算法中測量精度隨決策樹的最大深度與決策樹的個數(shù)增加而增加。由圖7(b)可知計算耗時隨決策樹個數(shù)n與決策樹最大深度的增加而增加。RF算法中各決策樹相互獨立,而XGBoost算法中,前一個決策樹的輸出作為下一個決策樹的輸入,hfit為各個決策樹的輸出加權和。XGBoost與RF算法計算機制的不同,使得盡管RF和XGBoost均采用決策樹個數(shù)和最大深度作為擬合參數(shù),兩者的擬合精度有較大差異。
分別改變多項式擬合算法的階數(shù)、RF和XG?Boost算法中的最大深度與決策樹個數(shù),對圖1所示的數(shù)據(jù)重新進行擬合。當多項式擬合階數(shù)在2~8范圍內變化,決策樹個數(shù)在1~100范圍內變化,最大深度在2~15范圍內變化時,得到不同參數(shù)下的3σ值。在光刻機中,為了兼顧對焦精度和產(chǎn)能,必須兼顧算法的擬合精度與擬合時間,最終得到一個優(yōu)化方案。因此在參數(shù)選取時,設定兩個約束條件:1)計算當前參數(shù)與前一次參數(shù)下的3σ差值Δ3σ,只選取保證Δ3σ<0.3nm的參數(shù)。其中,0.3nm是個擬合實踐值,當Δ3σ<0.3nm時,可以認為擬合精度基本維持在最高精度,不隨參數(shù)遞增而提高;2)設定計算耗時小于某給定計算時間。這是因為計算耗時越長,擬合精度通常更好,而工程實踐一般不允許擬合時間過長。對于多項式擬合算法,在8階擬合范圍內,計算時間均小于1ms,滿足Δ3σ<0.3nm的階數(shù)有4,6,7,8。擬合殘差3σ最小時(0.001nm)對應的階數(shù)為7和8,由于7階對應的計算時間短,因此選擇7階作為多項式擬合的階數(shù)。對于RF算法和XGBoost算法,約束條件1)具體為:當前參數(shù)對(i,j)得到的3σ值(i為決策樹個數(shù)n,j為最大深度max depth),與參數(shù)對(i-1,j)和(i,j-1)得到的3σ值的差異都滿足Δ3σ<0.3nm 。由圖6和圖7可知,同時滿足上述兩個約束條件的(i,j)通常不唯一,為了得到最佳擬合效果,選取擬合殘差3σ最小時所對應的那組(i,j)作為該曲線的擬合參數(shù)。繪制不同計算時間下的3σ曲線如圖8所示,小圖為局部放大圖。圖4表示的是當計算時間為3ms時(圖8矩形框區(qū)域所示),3類算法的擬合高度與誤差曲線,此時多項式擬合為7階;RF決策樹個數(shù)為3,最大深度為8;XGBoost決策樹個數(shù)為8,最大深度為10。
由圖8可知,多項式擬合算法精度隨時間變化不敏感,7階多項式擬合的3σ值為0.001nm,RF算法和XGBoost算法精度隨計算時間的增加迅速提升,RF算法在2ms時,對仿真數(shù)據(jù)完全擬合,誤差為0,XFBoost算法在5ms時,擬合精度基本趨于穩(wěn)定,為0.6nm。在計算時間比較關鍵的情況下,例如計算時間為1ms,多項式擬合算法精度最高,其次為RF算法。
圖8 不同算法3σ 值隨給定計算時間的變化圖
為了驗證上述3種算法在實際數(shù)據(jù)中的有效性,采集3組實驗數(shù)據(jù),按4.4節(jié)中所示流程獲得不同算法的3σ值隨給定計算時間的變化,如圖9所示。3種算法隨計算時間變化的趨勢與圖8相同,多項式擬合精度隨時間變化不敏感,RF算法和XGBoost算法精度隨計算時間的增加而迅速提升,相對于XGBoost算法,RF算法可以更快地穩(wěn)定到比較高的精度。但總體上,3σ值均有所增加,RF和XGBoost算法趨于穩(wěn)定的時間有所延長,RF算法精度在3ms時超越多項式擬合算法,而XGBoost在5ms時擬合精度超越多項式擬合算法,且RF算法在處理實際數(shù)據(jù)上,擬合精度略優(yōu)于XGBoost算法。
從圖9中可知,3次實驗在給定計算時間為10ms時,多項式擬合算法的3σ值分別為14.1nm、25.6nm和17.4nm;RF算法的3σ值分別為7.8nm、24.8nm和13.9nm;XGBoost算法的3σ值分別為9.2nm、24.7nm和14.4nm。在給定1ms的計算時間下,多項式擬合算法精度最高。圖9中的3σ值大于仿真結果中對應的數(shù)值,這是因為實驗環(huán)境不理想,存在環(huán)境噪聲,實驗系統(tǒng)自身存在10nm的重復性誤差等。隨給定計算時間增加,RF算法與XG?Boost算法擬合精度不斷提升并超越多項式擬合算法,這是因為多項式擬合基于最小二乘法,因此對噪聲比較敏感,而基于決策樹的RF算法與XG?Boost算法對噪聲有較好的魯棒性。
圖9 不同算法3σ 值隨給定計算時間的變化圖
本文通過仿真與實驗對比分析了多項式擬合、RF算法和XGBoost算法在光刻調焦調平測量系統(tǒng)中數(shù)據(jù)處理的精度與速度。仿真與實驗結果表明,多項式擬合精度隨時間變化不敏感,RF算法和XGBoost算法精度隨計算時間的增加而迅速提升。對于不存在噪聲的仿真數(shù)據(jù),7階多項式擬合的3σ值固定在0.001nm;RF算法在2ms時,算法對仿真數(shù)據(jù)完全擬合,誤差為0;XGBoost算法在5ms時,擬合精度基本趨于穩(wěn)定,為0.6nm。對于存在噪聲的實驗數(shù)據(jù),RF算法相對于XGBoost算法可以更快地穩(wěn)定到比較高的精度,且擬合精度略優(yōu)于XGBoost算法。隨計算時間的增加,RF算法與XG?Boost算法擬合精度不斷提升并分別于3ms和5ms超越多項式擬合算法,這是因為多項式擬合基于最小二乘法,因此對噪聲比較敏感,而基于決策樹的RF算法與XGBoost算法對噪聲有較好的魯棒性。在計算時間比較關鍵的情況下,例如計算時間為1ms,多項式擬合算法精度最高,其次為RF算法。在光刻機中,為了兼顧對焦精度和產(chǎn)能,必須兼顧算法的擬合精度與擬合時間。在處理實際數(shù)據(jù)時,RF和XGBoost擬合精度盡管在3ms~5ms以后比多項式擬合精度略有提高,但提高有限,而3ms~5ms處理一組數(shù)據(jù)對光刻機產(chǎn)能而言難以容忍。綜合考慮擬合精度與計算時間,調焦調平測量系統(tǒng)選用多項式擬合算法較為合適。