朱驚天,樊軍輝,蔡金庭
(1. 廣州大學(xué)天體物理中心,廣東 廣州 510006;2. 廣東省高校天文觀測(cè)與技術(shù)重點(diǎn)實(shí)驗(yàn)室,廣東 廣州 510006;3. 廣州天文觀測(cè)與技術(shù)重點(diǎn)實(shí)驗(yàn)室,廣東 廣州 510006)
5BZCAT[7], 3FGL[8]和4FGL[9]源表均包含1 000多個(gè)耀變體以及它們的紅移、同步峰頻、多波段流量/流量密度、多波段有效譜指數(shù)等觀測(cè)數(shù)據(jù),這些源表為研究耀變體的性質(zhì)提供了大樣本。同時(shí),這些源表中也包含了數(shù)百個(gè)未知類型的耀變體。對(duì)未知類型的耀變體的分類已經(jīng)引起不少學(xué)者的興趣,隨著機(jī)器學(xué)習(xí)(Machine Learning, ML)方法在天文領(lǐng)域的廣泛應(yīng)用[10-12],很多未知類型的耀變體的分類工作也使用了這些方法[13-19]。例如,F(xiàn)ermi/LAT 3期活動(dòng)星系核源表(3LAC)[20]中的高置信度樣本(3LAC Clean Sample)共有402個(gè)未知類型的耀變體,文[15]對(duì)其中無缺失數(shù)據(jù)的400個(gè)未知類型的耀變體進(jìn)行了分類,他們用了4種機(jī)器學(xué)習(xí)分類方法,綜合這些分類器的結(jié)果,獲得了246個(gè)蝎虎天體候選體和74個(gè)平譜射電類星體候選體;Fermi/LAT 4期源表(4FGL)中共有1 312個(gè)未知類型的耀變體,文[16]用3種機(jī)器學(xué)習(xí)分類方法對(duì)它們進(jìn)行分類,同時(shí)考慮3種分類方法的結(jié)果,得到724個(gè)蝎虎天體候選體和332個(gè)平譜射電類星體候選體,仍有256個(gè)未知類型的耀變體沒有給出明確的光學(xué)分類。為了對(duì)羅馬5期耀變體多波段目錄中不確定類型的耀變體的光學(xué)分類進(jìn)行評(píng)估,本文使用支持向量機(jī)、隨機(jī)森林、集成學(xué)習(xí)和多層感知機(jī)這4種機(jī)器學(xué)習(xí)分類方法,將不確定類型的耀變體分類為蝎虎天體候選體和平譜射電類星體候選體。
機(jī)器學(xué)習(xí)是人工智能領(lǐng)域一種新興的方法,包含多種分類模型(分類器)和回歸模型,這些模型能從已知數(shù)據(jù)中學(xué)到某種規(guī)律,并應(yīng)用到新數(shù)據(jù)。機(jī)器學(xué)習(xí)方法在天文領(lǐng)域的分類和回歸研究中有良好的表現(xiàn)[10-12]。Scikit-learn(sklearn)[21]是Python提供的機(jī)器學(xué)習(xí)模塊,其中包含許多機(jī)器學(xué)習(xí)算法,例如數(shù)據(jù)預(yù)處理方法和多種機(jī)器學(xué)習(xí)分類器。分類器通過學(xué)習(xí)已知類別的數(shù)據(jù)獲得分類標(biāo)準(zhǔn),然后用于未知類別的數(shù)據(jù)。通常已知類別的數(shù)據(jù)按一定比例隨機(jī)劃分為訓(xùn)練集和測(cè)試集,未知類別的數(shù)據(jù)則作為預(yù)測(cè)集。訓(xùn)練集用來訓(xùn)練分類器,在分類過程中學(xué)習(xí)訓(xùn)練集的參數(shù)蘊(yùn)含的信息,確定不同類別的區(qū)分標(biāo)準(zhǔn);測(cè)試集用來測(cè)試分類器的性能,利用優(yōu)化分類模型(標(biāo)準(zhǔn))來評(píng)估預(yù)測(cè)集的分類結(jié)果。
樣本中227個(gè)不確定類型的耀變體作為預(yù)測(cè)集。利用klearn.train_test_split函數(shù)將已知類別的3 334個(gè)耀變體(1 425個(gè)蝎虎天體和1 909個(gè)平譜射電類星體)按7∶3的比例隨機(jī)劃分為訓(xùn)練集和測(cè)試集。每次劃分訓(xùn)練集和測(cè)試集時(shí),為確保訓(xùn)練集和測(cè)試集中的蝎虎天體和平譜射電類星體的數(shù)量比例與樣本相同,設(shè)置隨機(jī)種子為固定值(如random_state=1)。文中,訓(xùn)練集有2 333個(gè)耀變體(997個(gè)蝎虎天體和1 336個(gè)平譜射電類星體),測(cè)試集有1 001個(gè)耀變體(428個(gè)蝎虎天體和573個(gè)平譜射電類星體)。為了確保結(jié)果的穩(wěn)定性,對(duì)sklearn.train_test_split函數(shù)中random_state(隨機(jī)數(shù)種子)取5個(gè)不同值:0、1、2、3、4,用這5個(gè)數(shù)隨機(jī)劃分訓(xùn)練集和測(cè)試集,得到5個(gè)不同的訓(xùn)練集和對(duì)應(yīng)的測(cè)試集;訓(xùn)練集1、測(cè)試集1,…,訓(xùn)練集5、測(cè)試集5。在5個(gè)訓(xùn)練集上分別訓(xùn)練分類器,得到5個(gè)不同的候選分類器,利用5個(gè)測(cè)試集測(cè)試5個(gè)候選分類器的性能,然后選擇性能最優(yōu)的1個(gè)用于預(yù)測(cè)227個(gè)不確定類型的耀變體(預(yù)測(cè)集)的分類。
支持向量機(jī)、隨機(jī)森林、多層感知機(jī)和集成學(xué)習(xí)的介紹如下。
(1)對(duì)于線性可分的兩類樣本,可以在參數(shù)空間找到無窮多個(gè)超平面,將兩類樣本分隔在超平面兩側(cè),其中距離超平面最近的樣本點(diǎn)稱為支持向量(Support Vector, SV)。支持向量機(jī)的原理是尋找唯一的最優(yōu)超平面,使得支持向量到該最優(yōu)超平面的距離最大。如果兩類樣本是非線性可分的,支持向量機(jī)可以將樣本映射到高維(甚至無窮維)空間,然后尋找高維空間的最優(yōu)超平面。
(2)決策樹(Decision tree, DT)的結(jié)構(gòu)是二叉樹,分類時(shí),信息進(jìn)入節(jié)點(diǎn)時(shí)進(jìn)行二元判斷,當(dāng)一個(gè)節(jié)點(diǎn)無法判斷類別,則分裂為兩個(gè),直至判斷出類別為止。由于決策樹容易陷入節(jié)點(diǎn)過度分裂,導(dǎo)致分類器泛化性差。隨機(jī)森林由大量決策樹構(gòu)成,決策樹之間相互獨(dú)立,給每個(gè)決策樹隨機(jī)劃分訓(xùn)練集和參數(shù),分類結(jié)果由所有決策樹投票決定,隨機(jī)森林的泛化性能往往優(yōu)于單個(gè)決策樹。
(3)多層感知機(jī)是人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)的一種。人工神經(jīng)網(wǎng)絡(luò)是一系列模仿生物神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的算法,這些結(jié)構(gòu)由多個(gè)人工神經(jīng)層組成,包括一個(gè)輸入層、一個(gè)或多個(gè)隱藏層和一個(gè)輸出層。每個(gè)人工神經(jīng)層可以識(shí)別數(shù)據(jù)中的特定元素,然后將結(jié)果傳輸?shù)较乱蝗斯ど窠?jīng)層。通過綜合每個(gè)神經(jīng)層的結(jié)果,人工神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)識(shí)別數(shù)據(jù)中的復(fù)雜特性。
(4)集成學(xué)習(xí)通過某種集成規(guī)則,將一組基評(píng)估器的結(jié)果集成,其性能往往優(yōu)于單個(gè)基評(píng)估器。本文將支持向量機(jī)、隨機(jī)森林、多層感知機(jī)作為集成學(xué)習(xí)的基評(píng)估器,集成規(guī)則為軟投票,即給每個(gè)基評(píng)估器輸出的類別概率一個(gè)權(quán)重,權(quán)重在[0, 1]區(qū)間,然后對(duì)基評(píng)估器的類別概率加權(quán)求和,作為集成學(xué)習(xí)輸出的類別概率。本文嘗試了多種權(quán)重組合,并選取其中最優(yōu)的一個(gè)。
機(jī)器學(xué)習(xí)常用的性能指標(biāo)有準(zhǔn)確率(Accruacy)、精準(zhǔn)率(Precision)、召回率(Recall)等。本文只考慮準(zhǔn)確率:
(1)
其中,TP(True Positive)是正確分類的正類別樣本點(diǎn)數(shù);TN(True Negative)是正確分類的負(fù)類別樣本點(diǎn)數(shù);FP(False Positive)是誤分類的正類別樣本點(diǎn)數(shù);FN(False Negative)是誤分類的負(fù)類別樣本點(diǎn)數(shù)。準(zhǔn)確率代表正確分類的樣本點(diǎn)數(shù)占樣本容量的比重。
機(jī)器學(xué)習(xí)中,描述樣本點(diǎn)屬性的參數(shù)稱為特征,本文分類所用的特征是羅馬5期耀變體多波段目錄中的8個(gè)參數(shù)。真實(shí)樣本的特征往往還包含缺失值、噪聲、無關(guān)信息、冗余信息等,它們會(huì)影響機(jī)器學(xué)習(xí)分類器的性能。因此,在使用機(jī)器學(xué)習(xí)分類器之前,需要先對(duì)原始數(shù)據(jù)進(jìn)行數(shù)據(jù)集轉(zhuǎn)換和特征選擇,目的是保證最大限度地從原始數(shù)據(jù)中提取有效特征供機(jī)器學(xué)習(xí)分類器學(xué)習(xí)。數(shù)據(jù)集轉(zhuǎn)換通常包括數(shù)據(jù)預(yù)處理和無監(jiān)督降維,特征選擇和無監(jiān)督降維都是降維方法,可以減少特征數(shù)。
(1)數(shù)據(jù)預(yù)處理一般包括缺失值補(bǔ)全和標(biāo)準(zhǔn)化。本文中,若某個(gè)特征有缺失值,用同類特征的平均值填充。標(biāo)準(zhǔn)化是將所有特征映射到相同區(qū)間,以免某些特征的量級(jí)比其他特征小,導(dǎo)致分類器只學(xué)習(xí)量級(jí)大的特征。用sklearn中的preprocessing.StandardScaler將所有特征化為標(biāo)準(zhǔn)正態(tài)分布。
(2)降維一般包括特征選擇和無監(jiān)督降維,可以降低特征維度,減少計(jì)算成本,并提升分類器性能。本文采用的特征選擇和無監(jiān)督降維分別為序列向后選擇(Sequential Backward Selection, SBS)和主成分分析(Principal Component Analysis, PCA),其中,序列向后選擇是選取原特征集的子集,而主成分分析是將原特征映射到新空間,再選取新特征集的子集。序列向后選擇不斷從當(dāng)前全部特征中舍去一個(gè)特征,直到所剩特征數(shù)量滿足要求,被舍棄的特征與舍棄其他特征相比,舍棄該特征后分類器的性能損失最小。主成分分析不依賴分類器,它將樣本點(diǎn)從原n維特征空間映射到新的n維正交空間,得到n個(gè)兩兩線性無關(guān)的新特征。新空間中,每個(gè)坐標(biāo)軸稱為主成分,在每個(gè)主成分方向上,樣本點(diǎn)的分離達(dá)到最大。第1個(gè)主成分代表樣本方差最大的方向?yàn)榈?主成分,其余坐標(biāo)軸稱為第2,第3,…,第n主成分,每個(gè)主成分均為n個(gè)原特征的線性組合,它們對(duì)樣本方差的貢獻(xiàn)率依次遞減,可根據(jù)需要取前k個(gè)主成分,k≤n。
對(duì)支持向量機(jī)和隨機(jī)森林做序列向后選擇和主成分分析,并將分類準(zhǔn)確率與不做降維的分類準(zhǔn)確率進(jìn)行比較。在八維原特征空間的訓(xùn)練集1上用序列向后選擇篩選特征,序列向后選擇每次減少1個(gè)特征直至只剩1個(gè)特征,在此過程中觀察分類器在不同維度特征空間的性能,選出最優(yōu)的特征空間。主成分共有8個(gè),舍棄第8主成分,其方差貢獻(xiàn)率只有0.030 5%,其余主成分的方差貢獻(xiàn)率均大于5%。序列向后選擇和主成分分析的結(jié)果分別如圖1、圖2。圖1為支持向量機(jī)和隨機(jī)森林的序列向后選擇結(jié)果,橫坐標(biāo)為特征數(shù)量,縱坐標(biāo)為對(duì)應(yīng)的分類器準(zhǔn)確率。圖2為主成分分析的結(jié)果,橫坐標(biāo)為各主成分,縱坐標(biāo)為對(duì)應(yīng)的方差貢獻(xiàn)率,為了便于觀察,圖中第8主成分的方差貢獻(xiàn)率放大了50倍。多層感知機(jī)的一個(gè)優(yōu)勢(shì)是無需做太多特征工程,因?yàn)槿斯ど窠?jīng)網(wǎng)絡(luò)的隱藏層能自動(dòng)提取有效特征,并能自適應(yīng)特征間的非線性關(guān)系,因此,沒有對(duì)多層感知機(jī)做數(shù)據(jù)降維。對(duì)于集成學(xué)習(xí),在每個(gè)訓(xùn)練集上將性能最優(yōu)的支持向量機(jī)、隨機(jī)森林、多層感知機(jī)分類器以最優(yōu)的權(quán)重集成。
圖1 序列向后選擇結(jié)果圖。(a)支持向量機(jī)的序列向后選擇結(jié)果;(b)隨機(jī)森林的序列向后選擇結(jié)果Fig.1 The result graph of SBS. (a) SBS for SVM; (b) SBS for RF
在sklearn提供的機(jī)器學(xué)習(xí)和分類器中,有部分函數(shù)參數(shù)屬于自由變量,稱為超參數(shù)。超參數(shù)不能通過訓(xùn)練分類器得到,而要在訓(xùn)練分類器前人為賦值。本文使用網(wǎng)格搜索方法(Grid Search, GS)找出超參數(shù)的最優(yōu)值,具體來說,指定一組候選值,網(wǎng)格搜索以暴力窮舉的方式選出能最大化分類器準(zhǔn)確率的值。本文對(duì)4種分類器中較重要的超參數(shù)使用了網(wǎng)格搜索,例如支持向量機(jī)中的C和多層感知機(jī)中的α,這兩個(gè)超參數(shù)可以提高模型的泛化性能。
機(jī)器學(xué)習(xí)分類器的性能見表1,表1第1列為分類器名稱; 第2列為測(cè)試集名稱; 第3~5列分別為八維原特征空間、序列向后選擇選取的子特征空間、七維主成分空間中的分類器準(zhǔn)確率;第6列為集成學(xué)習(xí)分類器準(zhǔn)確率。4種分類器的準(zhǔn)確率見圖3,4種分類器在測(cè)試集上的準(zhǔn)確率和不確定類型的耀變體的分類結(jié)果概述如下:
(1)對(duì)于支持向量機(jī),分類結(jié)果顯示,訓(xùn)練集3上,八維原特征空間的分類器準(zhǔn)確率最高,為84.62%(見表1、圖3)。在所有訓(xùn)練集上,主成分分析選取的七維子主成分空間的分類器準(zhǔn)確率均不如其他特征空間。
圖2 主成分分析結(jié)果圖。第8主成分放大50倍
(3)對(duì)于多層感知機(jī),分類結(jié)果顯示,在訓(xùn)練集5上,八維原特征空間的分類器準(zhǔn)確率最高,為94.21%。
(4)對(duì)于集成學(xué)習(xí),在每個(gè)訓(xùn)練集上,選取準(zhǔn)確率最高的支持向量機(jī)、隨機(jī)森林、多層感知機(jī)分類器集成。分類結(jié)果顯示,在訓(xùn)練集5上分類器準(zhǔn)確率最高,為94.81%(見表1、圖3)。此時(shí)成員分類器支持向量機(jī)、隨機(jī)森林、多層感知機(jī)的權(quán)重分別為0、0.62和0.38。
分類器在5個(gè)測(cè)試集上的準(zhǔn)確率表明,對(duì)于同一種分類器和同一個(gè)特征空間,5個(gè)測(cè)試集上分類器的準(zhǔn)確率相近,說明本文的分類結(jié)果穩(wěn)定,并且對(duì)于隨機(jī)森林,當(dāng)序列向后選擇將8個(gè)特征減少到5個(gè)時(shí),最大程度地提高了分類器的準(zhǔn)確率。相反地,支持向量機(jī)和隨機(jī)森林使用主成分分析后性能均明顯下降,這可能是由于原特征間有非線性關(guān)系,不能很好地分離成兩兩線性無關(guān)的新特征。分類結(jié)果顯示,4種分類器中,支持向量機(jī)的準(zhǔn)確率明顯低于其余3種,原因可能是在8參數(shù)空間,蝎虎天體和平譜射電類星體不能很好地被線性邊界分開,而隨機(jī)森林、多層感知機(jī)和集成學(xué)習(xí)分類器能很好地捕捉非線性分類邊界,因此,其性能良好且優(yōu)于支持向量機(jī)。4種分類器的最優(yōu)超參數(shù)見表2,表2第1列為分類器名稱; 第2列為測(cè)試集名稱;第3~7列分別為八維原特征空間、序列向后選擇選取的子特征空間、七維主成分空間中分類器的最優(yōu)超參數(shù)。圖3展示了4種分類器的準(zhǔn)確率,可以更直觀地看到每種分類器在每個(gè)訓(xùn)練集上的準(zhǔn)確率。圖3中4張子圖的橫軸均為測(cè)試集名稱,縱軸為分類器的準(zhǔn)確率; 圖3上半部分兩張子圖,從左到右分別為支持向量機(jī)和隨機(jī)森林分類器,其中藍(lán)色、橘色、綠色柱狀圖分別代表八維原特征空間、序列向后選擇選取的子特征空間、七維主成分空間分類器的準(zhǔn)確率; 圖3下半部分兩張子圖,從左到右分別為多層感知機(jī)在八維原特征空間和集成學(xué)習(xí)分類器的準(zhǔn)確率。
表1 機(jī)器學(xué)習(xí)分類器性能Table 1 Accuracy for ML classifiers
選擇在測(cè)試集上準(zhǔn)確率最高的4個(gè)分類器,用它們對(duì)227個(gè)不確定類型的耀變體進(jìn)行分類,得到每個(gè)不確定類型的耀變體為蝎虎天體的概率。若將判別概率的閾值設(shè)為p0=0.5,即某個(gè)源的pBL Lacs> 0.5判為蝎虎天體,否則判為平譜射電類星體。支持向量機(jī)、隨機(jī)森林、多層感知機(jī)、集成學(xué)習(xí)分別給出116、106、112、112個(gè)蝎虎天體候選體和111、121、115、115個(gè)平譜射電類星體候選體。將4種分類器的分類結(jié)果與3FGL,4FGL和文[15-16]中的蝎虎天體和平譜射電類星體進(jìn)行比較發(fā)現(xiàn),本文的分類結(jié)果與其他文獻(xiàn)并不完全一致,例如,對(duì)于集成學(xué)習(xí)的分類結(jié)果,分別有8、10、9、14個(gè)不確定類型的耀變體的分類與3FGL,4FGL和文[15-16]中的分類不同。本文嘗試進(jìn)一步改進(jìn)分類方法,以減少與其他文獻(xiàn)分類不一致的不確定類型的耀變體數(shù)量:(1)對(duì)p0分別取0.5、0.6、0.7、0.8、0.9、0.95這6個(gè)不同值,并比較分別取6個(gè)值時(shí)4個(gè)分類器的不匹配源的數(shù)量,即對(duì)p0做網(wǎng)格搜索。比較結(jié)果顯示,當(dāng)p0=0.7和p0=0.8,與3FGL對(duì)比分類結(jié)果時(shí),支持向量機(jī)和隨機(jī)森林的不匹配源的數(shù)量明顯下降,其余情況下,不匹配源的數(shù)量隨p0取值不同沒有顯著變化。(2)對(duì)于某個(gè)不確定類型的耀變體的預(yù)測(cè)類別,同時(shí)考慮4個(gè)分類器的分類結(jié)果,即只有當(dāng)4個(gè)分類器的預(yù)測(cè)類別一致時(shí),才認(rèn)為該未知類型的耀變體屬于該預(yù)測(cè)類別,否則認(rèn)為該未知類型的耀變體的類別是不確定的。即對(duì)于某個(gè)源,只有當(dāng)4個(gè)分類器同時(shí)預(yù)測(cè)其類別為蝎虎天體或平譜射電類星體時(shí),本文才認(rèn)為該源是蝎虎天體候選體或平譜射電類星體候選體,否則認(rèn)為該源的類別是不確定源。依此標(biāo)準(zhǔn),再次比較當(dāng)p0取方法(1)中的6個(gè)不同值時(shí)不匹配源的數(shù)量,此時(shí)的比較結(jié)果表明,6個(gè)不同p0的不匹配源的數(shù)量相當(dāng),且均顯著小于方法(1)中不匹配源的數(shù)量,當(dāng)p0=0.8和p0=0.9時(shí),不確定源的數(shù)量最少。綜合以上兩種分類改進(jìn)方法,本文使用的分類改進(jìn)方法是p0取0.8時(shí),由4個(gè)分類器共同決定每個(gè)未知類型的耀變體的類別。
圖3 4種分類器的準(zhǔn)確率Fig.3 The accuracy graph of 4 classifiers
4個(gè)分類器的不匹配源的數(shù)量如表3和表4,p0取0.8時(shí),227個(gè)不確定類型的耀變體由4個(gè)分類器共同決定的類別,以及和其他文獻(xiàn)共同源的類別均展示在表5中。表3第1列為進(jìn)行分類比較的文獻(xiàn);第2列為不同文獻(xiàn)中蝎虎天體和平譜射電類星體的總數(shù);第3列為分類器名稱;第4~9列為p0取不同值時(shí),4種分類器不匹配源的數(shù)量。表4第1列為進(jìn)行分類比較的文獻(xiàn)和不確定源;第2列為不同文獻(xiàn)中蝎虎天體和平譜射電類星體的總數(shù);第3~8列為4個(gè)分類器共同決定未知類型的耀變體類別時(shí),不同的p0對(duì)應(yīng)的不匹配源和不確定源的數(shù)量。表5第1~3列為未知類型的耀變體在5BZCAT,3FGL和4FGL中的名稱;第4~7列為4種分類器預(yù)測(cè)的pBL Lacs;第8~11列為5BZCAT,3FGL,4FGL和文[15-16]對(duì)不確定類型的耀變體的分類;第12列為p0=0.8時(shí),4個(gè)分類器共同決定的不確定類型的耀變體類別。
表2 各分類器的最優(yōu)超參數(shù)Table 2 Optimal hyper parameters for ML classifiers
表3 4種分類器與其他文獻(xiàn)的不匹配源Table 3 Mismatched sources of 4 classifiers
表4 聯(lián)合4種分類器后與其他文獻(xiàn)的不匹配源Table 4 Mismatched sources of combining 4 classifiers
表5 227個(gè)未知類型的耀變體的分類結(jié)果與其他文獻(xiàn)的分類結(jié)果Table 5 Classification results of 227 bzus and other literatures
(續(xù)表5)
(續(xù)表5)
(續(xù)表5)
(續(xù)表5)
(續(xù)表5)
(續(xù)表5)
(續(xù)表5)
本文以羅馬5期耀變體多波段目錄為主要樣本,結(jié)合河外星系數(shù)據(jù)庫的數(shù)據(jù),選取紅移、多波段有效譜指數(shù)、多波段流量/流量密度等8個(gè)參數(shù),用支持向量機(jī)、隨機(jī)森林、集成學(xué)習(xí)和多層感知機(jī)對(duì)羅馬5期耀變體多波段目錄中的227個(gè)不確定類型的耀變體進(jìn)行分類,用特征工程和網(wǎng)格搜索分別篩選最優(yōu)的特征和超參數(shù),提升分類準(zhǔn)確率。與其他文獻(xiàn)的分類結(jié)果進(jìn)行比較,通過將判別概率閾值p0設(shè)為0.8,并同時(shí)考慮4種分類器的預(yù)測(cè)類別,進(jìn)一步減少了與其他文獻(xiàn)不匹配的源。本文的分類結(jié)果表明,蝎虎天體和平譜射電類星體在8參數(shù)空間是可區(qū)分的,最終得到33個(gè)蝎虎天體候選體和119個(gè)平譜射電類星體候選體。