高 揚, 申怡然, 徐嘉熙
(北京工業(yè)大學(xué) 經(jīng)濟與管理學(xué)院,北京 100124)
投資者情緒對金融資產(chǎn)價格的影響是行為金融學(xué)研究的重要主題[1]。相比國外成熟的股票市場,我國股票市場個人投資者比例較高,受個人投資者行為的影響較大。因此,厘清投資者情緒對股票市場的影響對于維護我國金融市場穩(wěn)定至關(guān)重要。現(xiàn)有文獻主要對投資者情緒與滬深兩個主板市場的關(guān)系進行了探究,對科創(chuàng)板的研究較少。然而科創(chuàng)板作為中國多層次資本市場建設(shè)的重要組成部分之一,其設(shè)立對于提高市場運行效率、完善中國特色市場體系、促進實體經(jīng)濟增長十分重要。因此,研究投資者情緒對科創(chuàng)板市場的影響,有助于我國證券市場監(jiān)督層完善科創(chuàng)板交易機制,充分發(fā)揮經(jīng)濟轉(zhuǎn)型期科創(chuàng)板的關(guān)鍵作用,對推進我國市場化改革具有廣泛的理論和實踐意義。
早期關(guān)于投資者情緒對股票市場影響的研究多采用新增開戶數(shù)、換手率等單一的市場變量作為投資者情緒的代理變量。然而,與投資者情緒無關(guān)的因素也可以引發(fā)這些市場變量的變動[2]?;诰W(wǎng)絡(luò)大數(shù)據(jù)的投資者情緒研究能夠突破傳統(tǒng)方法的局限,為更加準(zhǔn)確和迅速地測度投資者情緒提供了新渠道[3]?;诖?,本文通過網(wǎng)頁爬蟲技術(shù)獲取國內(nèi)最大的股吧——東方財富股吧中2019年7月至2020年3月的日度股評數(shù)據(jù),基于Bi-LSTM模型對文本數(shù)據(jù)情感傾向進行分類并構(gòu)建投資者情緒指標(biāo),探討情緒對科創(chuàng)板股票收益率的影響及其作用機制,并討論這種影響在科創(chuàng)板不同的經(jīng)濟運行周期下的穩(wěn)健性。本研究對于我國證券市場監(jiān)管機構(gòu)充分理解投資者情緒在科創(chuàng)板中的重要作用,完善科創(chuàng)板交易機制,以及中小投資者優(yōu)化投資戰(zhàn)略具有重要意義。
此外,隨著通訊技術(shù)的快速發(fā)展,網(wǎng)絡(luò)輿情能夠更加便捷地通過股吧、微博等平臺進行傳播,從而影響投資者行為和市場表現(xiàn)。不少學(xué)者從理論和實證分析等方面研究了網(wǎng)絡(luò)輿情對金融市場的影響并取得了較大進展。本節(jié)主要從文本挖掘方法和投資者情緒與市場關(guān)系兩方面進行綜述。目前,金融領(lǐng)域的文本挖掘方法主要分為監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)兩類。其中,非監(jiān)督學(xué)習(xí)不需要事先對文本進行分類標(biāo)注,主要包括詞典法和主題分類模型。監(jiān)督學(xué)習(xí)需要事先標(biāo)注訓(xùn)練集,主要包括樸素貝葉斯等經(jīng)典的機器學(xué)習(xí)方法和深度學(xué)習(xí)方法。Antweiler和Frank[4]選擇了1000條雅虎財經(jīng)評論,手動將其歸類為買入、賣出、持有三種情感,并使用樸素貝葉斯算法對未分類帖子進行分類。此后,在經(jīng)濟金融領(lǐng)域不少文獻將樸素貝葉斯算法應(yīng)用到投資者情緒的研究中,如熊熊等[5]、段江嬌等[6]。隨著大數(shù)據(jù)可用性的提高和人工智能技術(shù)的發(fā)展,自然語言處理領(lǐng)域深度學(xué)習(xí)方法逐漸顯現(xiàn)其優(yōu)勢。
在投資者情緒與市場收益的研究中,現(xiàn)有文獻主要從二者的關(guān)系以及投資者情緒對收益率的預(yù)測能力兩方面展開。一方面,關(guān)于投資者情緒與市場收益的關(guān)系研究,現(xiàn)有文獻已表明通過網(wǎng)絡(luò)論壇文本挖掘得到的投資者情緒指數(shù)是影響股票定價的一個不可忽視的因素。目前國內(nèi)關(guān)于投資者情緒對股票收益率影響的研究多聚焦于A股市場和創(chuàng)業(yè)板市場,研究方法分為針對指數(shù)收益率的時間序列分析和公司層面的面板數(shù)據(jù)分析兩種。例如部慧等[7]、石善沖等[8]均以上證綜合指數(shù)收益率為研究對象,通過實證研究驗證了投資者情緒對上證綜合指數(shù)收益率具有顯著的正向促進作用。部分學(xué)者通過構(gòu)建面板數(shù)據(jù)模型探究投資者情緒與收益率之間的關(guān)系[1,6]。另一方面,對于投資者情緒的預(yù)測能力,Antweiler和Frank[4]、部慧等[7]通過實證研究得出投資者情緒與股票市場未來收益率的相關(guān)性不顯著,而Renault[9]等學(xué)者認(rèn)為高頻數(shù)據(jù)下投資者情緒有顯著的預(yù)測作用。此外,部分研究表明低頻數(shù)據(jù)下情緒具有部分預(yù)測作用,如Siganos et al.[10]利用Facebook國民幸福指數(shù)進行實證研究,發(fā)現(xiàn)周日的情緒會影響周一的股票收益率等。
目前學(xué)者對于投資者情緒對股票市場影響的研究存在以下兩點不足:首先,國內(nèi)已有文獻研究對象主要為滬深兩個主板市場,然而對于中國多層次資本市場建設(shè)的重要組成部分——科創(chuàng)板市場的研究較少。第二,現(xiàn)有國內(nèi)外文獻在研究投資者情緒對股票市場的作用時,沒有考慮到情緒與市場變量同時變化的內(nèi)生性問題,導(dǎo)致可能低估了情緒的影響作用。鑒于此,本文基于東方財富股吧中2019年7月22日至2020年3月31日的日度股評數(shù)據(jù)構(gòu)建投資者情緒指標(biāo),選取適當(dāng)?shù)墓ぞ咦兞?,探討投資者情緒對科創(chuàng)板股票市場收益率的影響作用,并通過構(gòu)建聯(lián)立方程模型對其機制進行識別。
與現(xiàn)有文獻相比,本文的貢獻主要體現(xiàn)在以下兩方面:首先,在樣本選擇方面,本文研究對象為科創(chuàng)板首批上市的全部25只股票。由于科創(chuàng)板股票市場股本數(shù)小,股價波動大,更容易反映市場情緒的波動。并且為避免日內(nèi)收益率與情緒之間相互影響造成的內(nèi)生性,本文采用隔夜情緒作為工具變量,由于收盤后只有投資者在論壇發(fā)表言論而沒有價格信息,因此隔夜情緒與股市收益率只存在單向關(guān)系,可以有效地避免日內(nèi)交易過程中情緒與市場變量同時變化產(chǎn)生的內(nèi)生性。其次,考慮到新冠疫情對證券市場造成的較大影響,本文將樣本劃分為平穩(wěn)運行期和沖擊波動期,并比較投資者情緒在不同市場運行狀態(tài)下作用的差異,驗證了結(jié)論的穩(wěn)健性。
1.1.1 投資者情緒數(shù)據(jù)
關(guān)于投資者情緒對股票市場影響的國內(nèi)研究樣本主要來自東方財富股吧,該股吧在影響力、用戶數(shù)量和活力方面具有更好的代表性。由于機構(gòu)投資者有自己的發(fā)布網(wǎng)絡(luò)信息的特殊平臺(如證券公司主頁、博客、微博等),在股票欄中討論的大多數(shù)是散戶投資者。本研究將東方財富股吧作為股評文本的數(shù)據(jù)來源,針對第一批上市的25支科創(chuàng)板股票,利用Python爬取了2019年7月22日至2020年3月31日的歷史發(fā)帖信息,基于Bi-LSTM模型提取特征,使用Softmax函數(shù)進行情感分類,并根據(jù)分類結(jié)果構(gòu)建情緒指數(shù)。具體數(shù)據(jù)采集過程如下:
第一步,文本爬取:使用Python逐一爬取東方財富股吧科創(chuàng)板首批上市的25只股票每條股評的發(fā)帖時間、評論內(nèi)容和閱讀量等信息。
第二步,數(shù)據(jù)清洗:刪除重復(fù)值和無效符號,最終得到有效文本數(shù)據(jù)169922條。根據(jù)科創(chuàng)板股票市場交易時間,對文本數(shù)據(jù)進行匹配,得到交易時間內(nèi)評論111205條,交易時間外評論58717條。
(1)
其中,y(i)表示情感預(yù)測結(jié)果的標(biāo)簽,X(i)為樣本特征,θ為參數(shù)矩陣。本文中采用{-1,0,1}分別代表消極、中性和積極情緒。隨后根據(jù)公式(1)計算得出給定特征的樣本屬于三種標(biāo)簽的概率矩陣[p1,p2,p3],并選擇概率最大的結(jié)果為其輸出結(jié)果。通過計算,模型的分類準(zhǔn)確率為75%。
1.1.2 市場指標(biāo)數(shù)據(jù)
市場指標(biāo)方面,本文樣本為科創(chuàng)板首批上市的25只股票,樣本數(shù)據(jù)區(qū)間為2019年7月22日至2020年3月31日。其開盤價、收盤價、最高價、最低價和日度交易量等數(shù)據(jù)來源于Wind數(shù)據(jù)庫。
1.2.1 投資者情緒構(gòu)建
本文以Antweiler和Frank[4]的方法為基礎(chǔ)構(gòu)建投資者情緒指數(shù)。與之不同的是,考慮到高質(zhì)量的評論可以通過帖子閱讀量進行識別和傳播[5],進而增強輿情影響力,本文依據(jù)帖子閱讀量對股票情感傾向進行加權(quán)。具體計算公式為:
(2)
(3)
此外,本文將交易時間內(nèi)的評論和交易時間外的評論帶入公式(2)和(3),分別計算出日內(nèi)投資者情緒記為IntraSenit,隔夜投資者情緒記為OverSenit。
1.2.2 日內(nèi)收益率指標(biāo)
1.2.3 控制變量
參考已有文獻[11~15],本文采取成交量(Volumeit)、極差波動率(Volatilityit)、換手率(Turnoverit)、市場收益率(MktRetit)及公司規(guī)模(MVit)作控制變量。
首先,為探討投資者情緒對科創(chuàng)板股票市場收益率Retit的當(dāng)期作用及其機制,本文構(gòu)建了雙向固定效應(yīng)的聯(lián)立方程模型,模型如下:
Retit=α0Volumeit+α1IntraSenit+
α2Xi,t-1+μi+γt+ε1,it
(4)
Volumeit=β0IntraSenit+β1Xi,t-1+μi+γt+ε2,it
(5)
其中,i表示25個科創(chuàng)板首批上市公司,t表示樣本時期,Volumeit為成交量,IntraSenit為日內(nèi)投資者情緒,Xi,t-1為控制變量,包括滯后一期的極差波動率(Volatilityi,t-1)、換手率(Turnoveri,t-1)、市場收益率(MktRett-1)和公司市值(MVi,t-1)。其中成交量、極差波動率、換手率和公司市值分別取對數(shù)處理。μi表示個體效應(yīng),γt是將樣本按星期一至星期五劃分的時間效應(yīng),εm,it(m=1,2)為方程的擾動項。方程中所有數(shù)據(jù)采用min-max方法進行標(biāo)準(zhǔn)化。
其次,參照陳曉紅等[11]的研究,本文將投資者情緒指數(shù)取滯后值,以檢驗投資者情緒對科創(chuàng)板收益率的預(yù)測作用。模型基本形式如公式(6)和(7)所示:
Retit=φ0Volumeit+φ1IntraSeni,t-k+
φ2Xi,t-1+μi+γt+ε3,it
(6)
Volumeit=λ0IntraSeni,t-k+λ1Xi,t-1+μi+γt+ε4,it
(7)
其中,k為投資者情緒的滯后階數(shù),εm,it(m=3,4)為方程的擾動項。
考慮到日內(nèi)投資者情緒與收益率之間同時變化,會導(dǎo)致內(nèi)生性問題,本文選用隔夜投資者情緒(OverSenit)作為日內(nèi)投資者情緒的工具變量。由于閉市后股價、成交量、換手率等信息不再變化,所以隔夜投資者情緒的變化不再受股價變化的影響。因此,選取隔夜情緒作為工具變量能較好克服被解釋變量與核心解釋變量同時變動造成的內(nèi)生性問題。根據(jù)方程(4)至(7),本文提出以下假設(shè):
首先,諸多學(xué)者研究均表明投資者情緒與收益率存在同期的正相關(guān)關(guān)系。根據(jù)以往研究,本研究假定投資者情緒越高,市場投資者對股市目前和未來發(fā)展越樂觀,股票收益率越高,反之亦然,即方程(4)中α1為正數(shù)。基于此提出假設(shè)H1。
H1投資者情緒與收益率呈現(xiàn)正相關(guān)關(guān)系。
其次,熊熊等[16]研究表明投資者情緒對證券市場同時存在著直接的和間接的影響。即投資者情緒一方面通過影響投資者不同的交易行為直接作用于證券市場,另一方面也會作用于其他影響市場收益的因素,從而向證券市場產(chǎn)生間接的影響。高漲或者低迷的情緒都會致使噪音交易者增加買賣數(shù)量,故本文假設(shè)投資者情緒通過影響成交量進而影響收益率。即方程(4)中的α0和方程(5)中β0應(yīng)為正數(shù)?;诖颂岢黾僭O(shè)H2。
H2投資者情緒通過影響成交量進而影響收益率。
最后,Siganos et al.[10]基于Facebook日度投資者情緒指數(shù)的實證表明,周日閉市時的投資者情緒對周一的開盤價有顯著的正向作用。即方程(6)中的φ0和方程(7)中λ0顯著為正?;诖颂岢黾僭O(shè)H3。
H3投資者情緒對收益率有預(yù)測作用。
為了保證變量的平穩(wěn)性和避免偽回歸現(xiàn)象,本文首先對所有變量進行單位根檢驗。LLC檢驗和Fisher式檢驗結(jié)果均表明,在1%的顯著性水平下拒絕存在單位根的原假設(shè)。其次,檢驗工具變量與可能的內(nèi)生解釋變量是否強相關(guān)。在隔夜情緒指數(shù)和控制變量對日內(nèi)情緒指數(shù)的回歸結(jié)果中,F(xiàn)值為28.06(大于10),說明為IntraSenit選取的工具變量OverSenit不存在弱相關(guān)問題。此外,內(nèi)生性檢驗的結(jié)果亦表明核心解釋變量IntraSenit存在內(nèi)生性問題。
為驗證假設(shè)H1和假設(shè)H2,本文使用2SLS對方程(4)和方程(5)進行估計,結(jié)果如表1所示。
表1 同期2SLS方法回歸結(jié)果
由方程(4)的估計系數(shù)α1可知,在1%顯著性水平下,投資者情緒指數(shù)對科創(chuàng)板股票市場收益率有顯著的正向作用。這與本文提出的假設(shè)H1相符。本文認(rèn)為其機制在于:當(dāng)一只股票的論壇帖子看漲情緒增多,個人投資者購買概率隨之增加。由于存在限制或禁止賣空的機制,股票價格在短期內(nèi)有所上升,股票收益為正。由于中國的中小投資者具有強烈的追漲殺跌等投機特征,股價上漲導(dǎo)致關(guān)注溢價[6],而看跌的帖子將會增多,因此投資者會拋售高度關(guān)注的股票。因此,在短期內(nèi),股票回報會隨著帖子情緒的高漲而上升,隨著帖子情緒的低落而下降。
由方程(5)的估計結(jié)果可知,投資者情緒對收益率的間接作用(α0和β0)分別在5%和1%的水平下顯著。說明投資者情緒通過影響成交量進而影響科創(chuàng)板收益率,這與本文提出的假設(shè)H2相符。其機制在于:由于科創(chuàng)板上市公司具有投入大、周期長、風(fēng)險高等特點,導(dǎo)致估值難度較大,這增加了中小投資者信息不對稱程度?;谛畔⒉粚ΨQ假說,交易的活躍程度隨著信息不對稱程度的增加而增加,具有慣性趨勢,具體表現(xiàn)為成交量先行于股價的正相關(guān)關(guān)系。
為驗證假設(shè)H3,本文使用2SLS方法對聯(lián)立方程(6)和(7)進行估計。估計結(jié)果如表2所示,表中滯后1期的IntraSeni,t-1、滯后2期的IntraSeni,t-2分別表示聯(lián)立方程(6)和(7)中k=1、k=2時的投資者情緒對應(yīng)的系數(shù)。此外,本文在方程(6)和(7)中同時加入投資者情緒滯后1期和滯后2期變量,檢驗滯后期的不同設(shè)置是否會對結(jié)果造成影響。由表2結(jié)果可知,滯后1期的投資者情緒對收益率的直接作用(φ1)不顯著,這與Antweiler和Frank[4]、部慧等[7]等的研究結(jié)論相符。但投資者情緒在1%的水平下可以通過預(yù)測下一期的成交量(λ0)進而預(yù)測收益率(φ0),這種預(yù)測作用在滯后2期時消失,故本文只列出滯后1期和滯后2期的情形。此外,同時加入投資者情緒滯后1期和2期變量后,回歸結(jié)果的系數(shù)和顯著性均未發(fā)生變化。
表2 取不同滯后期的回歸結(jié)果
為排除樣本時段選擇造成實證結(jié)果的不一致性,本文將樣本時段進行劃分,在新冠疫情背景下檢驗回歸結(jié)果的穩(wěn)健性。北京時間2020年1月11日,國家衛(wèi)健委宣布即日起每天更新疫情最新動態(tài),自此,普通投資者得以獲得實時疫情情況。本文以這一事件為分界,將科創(chuàng)板市場分為平穩(wěn)運行期和沖擊波動期,以檢驗上文結(jié)論的穩(wěn)健性。此外,本文在聯(lián)立方程(6)和(7)中同時加入投資者情緒滯后1期和滯后2期變量,以檢驗變量滯后期的不同設(shè)置是否會對方程穩(wěn)健性產(chǎn)生影響。表3的Panel A和Panel B分別列示了市場平穩(wěn)運行期和疫情沖擊波動期下的回歸結(jié)果。
在兩種市場環(huán)境中,核心解釋變量的符號和顯著性均未發(fā)生顯著變化(表3)。特別地,在新冠疫情爆發(fā)期間,投資者情緒對同期收益率的直接作用(α1)上升63.98%,間接作用(α0和β0)分別上升33.02%和27.68%,投資者情緒對未來1期收益率的間接預(yù)測作用φ0上升34.00%、λ0上升0.75%,即疫情期間股市收益率受投資者情緒影響更大。在股市平穩(wěn)運行期,基于損失厭惡理論,投資者對于等量級的損失比等量級的收益更為敏感,因此愿意繼續(xù)持有已經(jīng)虧損的股票而不選擇賣出;而在股市受疫情影響的時期,市場中悲觀情緒較多,人們預(yù)期未來會有更大的虧損,紛紛拋售股票,造成較大的成交量和收益率變化。因此,疫情期間投資者情緒對投資者收益的影響程度比平穩(wěn)運行期更強。
此外,比較Panel A和Panel B結(jié)果可知,MktRett-1和Volatilityi,t-1的系數(shù)由正值顯著地變?yōu)樨?fù)值。這是因為,在市場平穩(wěn)運行期間,投資者可以通過科創(chuàng)板的高波動進行套利,而新冠疫情期間,人們追求穩(wěn)定的收益,而厭惡過高的波動,因此波動率對收益率的作用發(fā)生了反轉(zhuǎn)。同時,風(fēng)險承受能力相對較低的投資者不愿承擔(dān)疫情期間科創(chuàng)板的劇烈波動,因而將投資資產(chǎn)由科創(chuàng)板轉(zhuǎn)向成立時間更久的A股市場,因此科創(chuàng)板收益率和上證指數(shù)收益率之間的關(guān)系發(fā)生了反轉(zhuǎn)。
本文基于文本挖掘方法,從東方財富股吧爬取科創(chuàng)板首批上市的25只股票上市之日起至2020年3月31日的全部股評,基于Bi-LSTM深度學(xué)習(xí)模型進行情感分類,建立投資者情緒指數(shù)。通過構(gòu)建雙向固定效應(yīng)聯(lián)立方程模型檢驗了我國投資者情緒對科創(chuàng)板股票市場收益率影響和其作用機制。主要研究結(jié)論如下:
投資者情緒通過影響交易量進而影響科創(chuàng)板收益率,且情緒對收益率同期的正向影響在1%的水平下顯著。這種正向作用在新冠疫情對市場的沖擊下保持穩(wěn)健,且在疫情期間,投資者情緒對同期收益率的直接和間接作用均上升。投資者情緒對于收益率的直接作用不具有預(yù)測能力,但可以通過預(yù)測成交量進而預(yù)測下一期的收益率,且在疫情期間,投資者情緒對未來收益率的間接預(yù)測作用φ0上升了34.00%、λ0上升了0.75%。
基于上述結(jié)論,本文提出以下建議與啟示:首先,我國科創(chuàng)板股票市場的投資者尚不成熟。盡管設(shè)置了較高的準(zhǔn)入門檻,科創(chuàng)板仍未擺脫其較強的散戶屬性,這與科創(chuàng)板為科創(chuàng)企業(yè)提供直接融資渠道的定位相悖。在科創(chuàng)板市場運行過程中,監(jiān)管部門需要不斷調(diào)整政策,使科創(chuàng)板順應(yīng)成熟市場,更好地發(fā)揮為科創(chuàng)企業(yè)提供直接融資的功能。
其次,網(wǎng)絡(luò)論壇中體現(xiàn)的投資者情緒對科創(chuàng)板股票市場的影響不可忽視。鑒于中國的股票市場尚未建立科創(chuàng)板投資者情緒指數(shù),建立科學(xué)有效的科創(chuàng)板投資者情緒指數(shù)不僅有助于穩(wěn)定投資者非理性情緒,還有助于證券市場監(jiān)管部門提高監(jiān)管效率,防范在論壇上操縱股票的風(fēng)險,從而促進我國證券市場穩(wěn)定健康發(fā)展。
最后,在突發(fā)事件的影響下,投資者情緒對科創(chuàng)板收益率的正向作用更加明顯。在資本市場運行受到?jīng)_擊時,監(jiān)管部門更應(yīng)加強輿情監(jiān)控,實時跟進股市動態(tài)。在突發(fā)事件下,更加應(yīng)該提高投資情緒透明度,保持市場的流動性,減小投資者非理性因素對經(jīng)濟的穩(wěn)定運行造成負(fù)面影響。
表3 不同市場環(huán)境下的回歸結(jié)果