——基于管理層語(yǔ)意的LSTM深度學(xué)習(xí)研究"/>
楊七中,馬蓓麗
(1.南京財(cái)經(jīng)大學(xué)會(huì)計(jì)學(xué)院,江蘇 南京 210023;2.江蘇理工學(xué)院商學(xué)院,江蘇 常州 213001)
東方文明深受“儒家文化”的熏陶和影響,人們?cè)诮涣餍畔r(shí),習(xí)慣于間接隱晦、繞彎子的表達(dá)方式,甚至有些信息只可意會(huì)不可言傳,即東方社會(huì)是一個(gè)高語(yǔ)境傳播的社會(huì)(Hall,1976)[1]。那么當(dāng)企業(yè)管理層向資本市場(chǎng)傳遞公司私有信息,特別是一些非財(cái)務(wù)信息時(shí),投資者能否聽懂這些話里話、弦外音呢?能否吸收這些非量化、描述性信息呢?對(duì)這一問(wèn)題進(jìn)行研究,有助于理解資本市場(chǎng)異象,提高資本配置效率,緩解股價(jià)崩盤風(fēng)險(xiǎn)。
前期文獻(xiàn)研究了信息傳遞時(shí)的資本市場(chǎng)反應(yīng),其中多數(shù)聚焦于可量化的財(cái)務(wù)信息披露,如盈余、收入和分析師薦股等對(duì)市場(chǎng)反應(yīng)的影響,但對(duì)于那些難以量化的非財(cái)務(wù)信息披露,由于缺乏客觀量化非財(cái)務(wù)信息的方法,長(zhǎng)期以來(lái)針對(duì)投資者能否有效地吸收這些非財(cái)務(wù)信息的研究還不多見。近年來(lái)隨著計(jì)算機(jī)自然語(yǔ)言處理技術(shù)的發(fā)展,已經(jīng)有文獻(xiàn)使用文本分析技術(shù)來(lái)量化非財(cái)務(wù)信息的內(nèi)容和情緒(Tetlock et al.,2008;Loughran et al.,2011;謝德仁等,2015;林樂(lè)等,2016,2017)[2][3][4][5][6],其中使用最多的是“詞袋法”,然而“詞袋法”存在一定的局限性:不同學(xué)科的詞典并不兼容;詞與詞之間缺乏因果關(guān)系,容易導(dǎo)致語(yǔ)義誤判,造成虛假回歸(Jegadeesh et al.,2013)[7],盡管后期有學(xué)者采用構(gòu)建或擴(kuò)充專業(yè)詞典的研究方式(林樂(lè)等,2016)[5],但解決上述問(wèn)題仍需要尋求新的文本量化技術(shù)。
本文選用LSTM深度學(xué)習(xí)技術(shù),對(duì)我國(guó)上市公司年度業(yè)績(jī)說(shuō)明會(huì)上的管理層回復(fù)進(jìn)行文本分析,試圖研究投資者能否聽懂管理層所表達(dá)的真正語(yǔ)意。用Python程序爬取2010~2014年全景網(wǎng)站(http://www.p5w.net/)所有上市公司年度業(yè)績(jī)說(shuō)明會(huì)上管理層和投資者之間問(wèn)答文本,經(jīng)過(guò)數(shù)據(jù)清洗,構(gòu)建人工標(biāo)注和玻森中文語(yǔ)義平臺(tái)(BosonNLP)相互印證的語(yǔ)料庫(kù),利用python的Jieba分詞庫(kù)、tensorflow庫(kù)等基于LSTM神經(jīng)網(wǎng)絡(luò)技術(shù)進(jìn)行深度學(xué)習(xí),以分析管理層回復(fù)的“弦外之音”。進(jìn)一步利用事件研究法分析相關(guān)上市公司業(yè)績(jī)說(shuō)明會(huì)的市場(chǎng)反應(yīng)和管理層語(yǔ)意之間的相關(guān)性,以檢驗(yàn)投資者能否聽懂管理層的“弦外之音”。研究表明,投資者能夠理解管理層的真實(shí)語(yǔ)意,資本市場(chǎng)對(duì)正面語(yǔ)意做出顯著的正向反應(yīng),對(duì)負(fù)面語(yǔ)意做出顯著的負(fù)向反應(yīng),但是對(duì)正面語(yǔ)意的反應(yīng)存在一定滯后期,未發(fā)現(xiàn)證據(jù)支持投資者會(huì)把管理層語(yǔ)意作為交易策略因子。
本文主要有以下幾方面貢獻(xiàn):一是采用的LSTM深度學(xué)習(xí)技術(shù),顧及詞語(yǔ)之間的因果關(guān)系,可以降低語(yǔ)意誤判率,避免陷入虛假回歸陷阱,是對(duì)傳統(tǒng)“詞袋法”文本分析技術(shù)的改進(jìn);二是發(fā)現(xiàn)管理層語(yǔ)意的確具有信息含量,在前期Fama-French五因子模型基礎(chǔ)上,未來(lái)可否考慮將一些非財(cái)務(wù)信息作為影響資產(chǎn)定價(jià)的因子納入模型,這為行為金融量化研究提供有益的啟示;三是研究表明上市公司和投資者之間以業(yè)績(jī)說(shuō)明會(huì)這樣的互動(dòng)敞開方式溝通,起到了有效的信息披露作用,為監(jiān)管部門思考如何進(jìn)一步提高管理層討論與分析質(zhì)量和完善投資者保護(hù)環(huán)境提供經(jīng)驗(yàn)證據(jù)。
作為上市公司年報(bào)的重要組成部分,管理層討論與分析(MD&A)是針對(duì)一些非常重要,但卻無(wú)法通過(guò)定量財(cái)務(wù)指標(biāo)進(jìn)行揭示的機(jī)遇、挑戰(zhàn)和風(fēng)險(xiǎn)向投資者做出說(shuō)明,以便投資者做出合理的決策判斷。上市公司業(yè)績(jī)說(shuō)明會(huì)本身又作為MD&A的一種補(bǔ)充,類似于美國(guó)的自愿性分析師盈余電話會(huì)議,最初源于2004年深交所針對(duì)中小企業(yè)發(fā)布的《深圳證券交易所中小企業(yè)板塊上市公司誠(chéng)信建設(shè)指引》,規(guī)定“上市公司應(yīng)在每年年度報(bào)告披露后舉行年度報(bào)告說(shuō)明會(huì),向投資者真實(shí)、準(zhǔn)確地介紹公司的發(fā)展戰(zhàn)略、生產(chǎn)經(jīng)營(yíng)、新產(chǎn)品和新技術(shù)開發(fā)、財(cái)務(wù)狀況和經(jīng)營(yíng)業(yè)績(jī)、投資項(xiàng)目等各方面情況,并將說(shuō)明會(huì)的文字資料放置于公司網(wǎng)站供投資者查閱”。深交所在2005年、2010年、2015年多次修訂的《深圳證券交易所中小企業(yè)板創(chuàng)業(yè)板上市公司規(guī)范運(yùn)作指引》做了更為明確的規(guī)定“上市公司舉行業(yè)績(jī)說(shuō)明會(huì)、分析師會(huì)議、路演等投資者關(guān)系活動(dòng),為使所有投資者均有機(jī)會(huì)參與,可以采取網(wǎng)上直播的方式”“公司應(yīng)當(dāng)在年度報(bào)告披露后十個(gè)交易日內(nèi)舉行年度報(bào)告說(shuō)明會(huì),公司董事長(zhǎng)(或者總經(jīng)理)、財(cái)務(wù)負(fù)責(zé)人、獨(dú)立董事(至少一名)、董事會(huì)秘書、保薦代表人(至少一名)應(yīng)當(dāng)出席說(shuō)明會(huì)”。2009年10月,創(chuàng)業(yè)板正式上市,深交所發(fā)布《深圳證券交易所創(chuàng)業(yè)板上市公司規(guī)范運(yùn)作指引》規(guī)定“鼓勵(lì)上市公司通過(guò)召開新聞發(fā)布會(huì)、投資者懇談會(huì)、網(wǎng)上說(shuō)明會(huì)等方式擴(kuò)大信息的傳播范圍,以使更多投資者及時(shí)知悉了解公司重大信息”。除中小企業(yè)創(chuàng)業(yè)板之外,證監(jiān)會(huì)并不強(qiáng)制要求主板上市公司舉行業(yè)績(jī)說(shuō)明會(huì),但隨著互聯(lián)網(wǎng)自媒體熱潮席卷,許多主板上市公司為了自身的發(fā)展,自愿舉行業(yè)績(jī)說(shuō)明會(huì)向資本市場(chǎng)傳遞當(dāng)下和未來(lái)的經(jīng)營(yíng)發(fā)展信息。隨著時(shí)間推移,每年越來(lái)越多的大公司借助互聯(lián)網(wǎng),自愿舉行網(wǎng)上業(yè)績(jī)說(shuō)明會(huì),逐漸變成公司管理層和投資者之間交流的主要平臺(tái)。
與MD&A和分析師盈余電話會(huì)議等信息披露方式相比,通過(guò)分析我國(guó)上市公司網(wǎng)上業(yè)績(jī)說(shuō)明會(huì)的形式與內(nèi)容,發(fā)現(xiàn)其具有一些鮮明的披露特征:第一,時(shí)間點(diǎn)較集中。業(yè)績(jī)說(shuō)明會(huì)一般集中在年報(bào)披露之后的14個(gè)交易日之后舉行(林樂(lè),2016)[5],就事件研究而言,可以避免盈余公告效應(yīng)以及其他跨期外生事件對(duì)股票超額累計(jì)收益率的干擾;第二,高管參與度高。八成以上公司由董事長(zhǎng)、總經(jīng)理和獨(dú)立董事親自參與業(yè)績(jī)說(shuō)明,保證了信息披露的權(quán)威性、正規(guī)性及可信性;第三,開放互動(dòng)包容。相對(duì)于美國(guó)盈余電話會(huì)議主要是公司高管和分析師參加而言,我國(guó)上市公司業(yè)績(jī)說(shuō)明會(huì)更加開放,現(xiàn)有和潛在投資者、分析師及各類感興趣的人均可在線參與提問(wèn)。由于采用網(wǎng)絡(luò)在線問(wèn)答,實(shí)時(shí)隨機(jī)互動(dòng),問(wèn)題兼容并包;第四,交流內(nèi)容多元。從行業(yè)狀況、公司戰(zhàn)略、生產(chǎn)經(jīng)營(yíng)、募集資金使用、新產(chǎn)品新市場(chǎng)開發(fā),到公司營(yíng)銷、技術(shù)、財(cái)務(wù)及發(fā)展前景等方面存在的困難和損失,甚至還包含個(gè)人興趣愛(ài)好,涵蓋投資者關(guān)心的大多方面,信息琳瑯滿目,內(nèi)容豐富多元;第五,語(yǔ)言含蓄內(nèi)斂。由于受到中國(guó)文化情境影響和基于商業(yè)機(jī)密的考慮,管理層在回答投資者等提問(wèn)時(shí),常常表現(xiàn)出語(yǔ)言含蓄、避而不答或者程式化答案,這給傳統(tǒng)的文本分析方法帶來(lái)了研究挑戰(zhàn)。
國(guó)外學(xué)者通過(guò)計(jì)算機(jī)自然語(yǔ)言處理技術(shù),提取出非財(cái)務(wù)文本所包含的語(yǔ)意或情感變量,來(lái)研究文本語(yǔ)意與公司價(jià)值和投資者行為等的關(guān)系,發(fā)現(xiàn)其與未來(lái)盈利水平、投資者行為、股票預(yù)期收益率甚至是管理層欺詐行為具有關(guān)聯(lián)性(Price et al.,2012;Mayew et al.,2018)[8][9]。有的學(xué)者從文本的可讀性方面進(jìn)行研究,發(fā)現(xiàn)迷霧指數(shù)越高的公司(即年報(bào)越難讀懂),其盈利水平越差(Feng Li,2008)[10],報(bào)告越易讀懂,則小股東越愿意持股(Lawrence,2013)[11]。還有的學(xué)者從文本的語(yǔ)調(diào)方面進(jìn)行研究,發(fā)現(xiàn)MD&A和盈余電話會(huì)議語(yǔ)調(diào)越正向,則股票收益率越高、波動(dòng)性越低(Price,2012)[8],盈余電話會(huì)議中管理者特定語(yǔ)調(diào)與未來(lái)業(yè)績(jī)正相關(guān),即語(yǔ)調(diào)越正向,未來(lái)四個(gè)季度的資產(chǎn)報(bào)酬率越高(Davis,2015)[12]。在檢驗(yàn)10-K披露的市場(chǎng)反應(yīng)時(shí),發(fā)現(xiàn)正向語(yǔ)調(diào)和負(fù)向語(yǔ)調(diào)與市場(chǎng)反應(yīng)顯著相關(guān)(Jegadeesh and Wu,2013)[7],甚至可以預(yù)測(cè)管理層欺詐(Purda and Skillicorn,2015)[13]。近年,國(guó)外對(duì)非財(cái)務(wù)信息的文本分析已經(jīng)從語(yǔ)調(diào)走向語(yǔ)音研究,如利用測(cè)謊軟件分析盈余電話會(huì)議上管理層音頻聲調(diào)和情感真實(shí)度,發(fā)現(xiàn)正向語(yǔ)調(diào)會(huì)引起當(dāng)期超額收益率(Mayew,2018)[9]。
國(guó)內(nèi)會(huì)計(jì)與財(cái)務(wù)領(lǐng)域的非財(cái)務(wù)信息文本分析研究處于剛剛興起階段。有的學(xué)者從文本的可讀性特征進(jìn)行研究,如彭紅楓(2016)[14]發(fā)現(xiàn)借款陳述的迷霧指數(shù)和文本長(zhǎng)度都與借款成功率呈“倒U型”關(guān)系,并與實(shí)際借款利率存在線性正相關(guān)關(guān)系。有的從文本的語(yǔ)調(diào)角度進(jìn)行研究,如謝德仁等(2015)[4]基于業(yè)績(jī)說(shuō)明會(huì)發(fā)現(xiàn)管理層正面語(yǔ)調(diào)與公司下一年業(yè)績(jī)正相關(guān)。林樂(lè)等(2016)[5]發(fā)現(xiàn)投資者對(duì)管理層正面語(yǔ)調(diào)做出顯著的正向反應(yīng)。朱朝暉等(2018)[15]基于A股上市公司MD&A樣本,檢驗(yàn)管理層語(yǔ)調(diào)離差策略對(duì)分析師預(yù)測(cè)的影響,發(fā)現(xiàn)業(yè)績(jī)較差的公司會(huì)策略性地安排管理層語(yǔ)調(diào)詞的分布,且這樣安排對(duì)分析師預(yù)測(cè)有顯著影響。有的從文本主題類型方面進(jìn)行研究,如孔翔宇等(2016)[16]挖掘了財(cái)經(jīng)新聞主題內(nèi)容與股市的相關(guān)性,發(fā)現(xiàn)國(guó)際貿(mào)易以及城市化新聞主題與股市變動(dòng)密切,能準(zhǔn)確預(yù)測(cè)當(dāng)日股市漲跌。還有學(xué)者研究社交媒體的投資者情緒影響股票未來(lái)收益(徐巍等,2016;金德環(huán)等,2017)[17][18]。
相較于其他披露方式,管理層業(yè)績(jī)說(shuō)明會(huì)受到各地證監(jiān)局的大力支持,上市公司自身的積極響應(yīng)和深交所的嚴(yán)格管制,無(wú)論是披露時(shí)點(diǎn)、內(nèi)容還是形式都比較規(guī)范。另外,參會(huì)的管理層是實(shí)名的,投資者是匿名的,雙方可就主要問(wèn)題開誠(chéng)布公交流,相關(guān)問(wèn)題的回答比較徹底,信息挖掘比較深入,有的問(wèn)題甚至?xí)?jīng)過(guò)多輪重復(fù)博弈,特別是采取網(wǎng)絡(luò)在線、實(shí)時(shí)動(dòng)態(tài)的交流方式,使得一些無(wú)法事先預(yù)設(shè)、即問(wèn)即答的話題能夠原汁原味地呈現(xiàn)出來(lái),有助于降低管理層和投資者之間的潛在信息選擇性偏差和道德風(fēng)險(xiǎn),預(yù)期可以給資本市場(chǎng)帶來(lái)新的信息增量:(1)降低信息選擇性偏差。由于信息披露具有經(jīng)濟(jì)后果,管理層有可能為了特殊利益而選擇性地披露信息,如時(shí)間、內(nèi)容和方式的選擇來(lái)影響投資者的預(yù)期,對(duì)管理層業(yè)績(jī)說(shuō)明會(huì)這一開放互動(dòng)披露方式而言,投資者可以就自己關(guān)心的問(wèn)題反復(fù)追問(wèn)管理層,從而降低了信息不對(duì)稱風(fēng)險(xiǎn),大大減少了公司只披露對(duì)自己有利信息而規(guī)避對(duì)自己不利信息的逆向選擇行為;(2)減少道德風(fēng)險(xiǎn)。公司通常的季報(bào)、年報(bào)和公告等其他披露方式是以集體名義披露,存在搭便車問(wèn)題。而管理層業(yè)績(jī)說(shuō)明會(huì)采取實(shí)名制,管理層個(gè)體要為自己說(shuō)的話負(fù)責(zé),最終交由資本市場(chǎng)去檢驗(yàn),即所有的信息都能承包到戶、責(zé)任到人,另外管理層對(duì)他們的聲譽(yù)資本是非常敏感的(李增泉等,2000)[19],這就意味著資本市場(chǎng)的聲譽(yù)約束機(jī)制可以抑制管理層的“語(yǔ)言膨脹”,減少道德風(fēng)險(xiǎn)。
不確定性是影響宏觀經(jīng)濟(jì)運(yùn)行的潛在因子(Bloom et al.,2018)[20]。Ball and Sadka(2015)認(rèn)為用會(huì)計(jì)盈余對(duì)經(jīng)濟(jì)增長(zhǎng)的預(yù)測(cè)雖然合理,但實(shí)際情況更為復(fù)雜,真正起到資產(chǎn)定價(jià)作用的是盈余風(fēng)險(xiǎn)(Beaver et al.,1970;Fama and French,1995),盈余風(fēng)險(xiǎn)映射了微觀經(jīng)濟(jì)不確定性,可誘導(dǎo)宏觀經(jīng)濟(jì)更大幅波動(dòng)。行為經(jīng)濟(jì)學(xué)的前景理論認(rèn)為人們往往對(duì)損失比對(duì)獲得更敏感,即投資者在決策時(shí)對(duì)損失風(fēng)險(xiǎn)更敏感,考慮到我國(guó)尚處弱式有效市場(chǎng)、信息披露質(zhì)量并不高,投資者對(duì)于正負(fù)語(yǔ)意信息的反應(yīng)可能有所不同。對(duì)于正面語(yǔ)意信息,投資者為了決策更穩(wěn)健,需要花費(fèi)更多的時(shí)間和渠道去驗(yàn)證正面語(yǔ)意信息,而對(duì)于負(fù)面語(yǔ)意信息,投資者往往抱著“寧可信其有,不可信其無(wú)”的心態(tài),反而會(huì)及時(shí)做出風(fēng)險(xiǎn)規(guī)避決策。實(shí)驗(yàn)研究也表明投資者在使用會(huì)計(jì)信息進(jìn)行風(fēng)險(xiǎn)評(píng)估時(shí),更看重負(fù)向預(yù)期而不是正向預(yù)期。在投資者情緒的作用下,會(huì)計(jì)準(zhǔn)則變革引發(fā)的企業(yè)財(cái)務(wù)行為的變化通過(guò)一種加速傳導(dǎo)機(jī)制作用于資本市場(chǎng)和宏觀經(jīng)濟(jì),學(xué)者們發(fā)現(xiàn)投資者情緒能夠引發(fā)資本市場(chǎng)波動(dòng)和跨市場(chǎng)效應(yīng),即損失風(fēng)險(xiǎn)映射了微觀經(jīng)濟(jì)不確定性,可誘導(dǎo)資本市場(chǎng)乃至宏觀經(jīng)濟(jì)更大幅波動(dòng)。因此,我們預(yù)期當(dāng)面臨不確定性時(shí),投資者對(duì)負(fù)向非預(yù)期盈余的反應(yīng)大于對(duì)正向非預(yù)期盈余的反應(yīng),即投資者對(duì)負(fù)向語(yǔ)調(diào)的反應(yīng)更及時(shí)并且也更顯著。
基于以上分析,本文選擇管理層業(yè)績(jī)說(shuō)明會(huì)作為文本分析樣本,利用LSTM神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)技術(shù),提取管理層的語(yǔ)意,再把語(yǔ)意區(qū)分為正面語(yǔ)意和負(fù)面語(yǔ)意,并提出以下待檢驗(yàn)假設(shè)H1和H2。
H1:在其他條件相同的情況下,資本市場(chǎng)會(huì)對(duì)管理層正面語(yǔ)意做出正向反應(yīng),但存在滯后期。
H2:在其他條件相同的情況下,資本市場(chǎng)會(huì)對(duì)管理層負(fù)面語(yǔ)意會(huì)做出更及時(shí)、更顯著地負(fù)向反應(yīng)。
目前比較主流的文本分析方法是詞袋法(Bag of words),原理是忽略文本的詞序和語(yǔ)法,假定文本中每個(gè)詞不依賴于其他的詞,都是獨(dú)立的,僅將其看作是若干詞語(yǔ)所組成的集合。具體執(zhí)行步驟首先是通過(guò)分詞庫(kù)對(duì)文本進(jìn)行分詞(中文如Jieba分詞庫(kù),英文如NLTK庫(kù)),然后通過(guò)詞頻-逆文檔算法(TF-IDF)篩選出每個(gè)文本中一些關(guān)鍵詞,再載入語(yǔ)意/情感詞典進(jìn)行比照,最終計(jì)算得到文本語(yǔ)意/情感概率值。
其中最關(guān)鍵的就是情感詞典的選用。國(guó)外相關(guān)研究主要基于四種英文情感詞典:(1)Henry詞典;(2)Harvard GI詞典;(3)Diction詞典;(4)Loughran and McDonald詞典。國(guó)內(nèi)比較常見的中文情感詞典有臺(tái)灣大學(xué)情感詞典(NYU)、Hownet情感詞典、英文字典漢化(謝德仁等,2015;林樂(lè)等,2017)[4][6]。情感詞典最大的局限性就是缺乏普適性,特別是缺乏在財(cái)務(wù)會(huì)計(jì)領(lǐng)域的普適性。Loughran and McDonald(2011)[3]曾批評(píng)過(guò)Harvard詞典和Diction詞典的高誤判率,用Harvard和Diction詞典發(fā)現(xiàn)年報(bào)中MD&A的管理層語(yǔ)意和未來(lái)業(yè)績(jī)不存在正向關(guān)聯(lián)。Harvard詞典中75%的負(fù)向詞語(yǔ),在金融文本中并不一定表示負(fù)向情緒,比如“稅收”“成本”“債務(wù)”和“折舊”等在詞典中被歸入負(fù)向詞語(yǔ),但在年報(bào)文本中隨處可見,只不過(guò)是會(huì)計(jì)專業(yè)名詞,未必表示負(fù)向情緒。與前三種詞典相比較而言,盡管Loughran and McDonald詞典的主要特點(diǎn)是考慮了情緒詞典在財(cái)務(wù)會(huì)計(jì)領(lǐng)域的適用性,但在判斷準(zhǔn)確率方面仍然差強(qiáng)人意,本文分別使用LSTM和詞袋法在對(duì)測(cè)試集樣本驗(yàn)證后發(fā)現(xiàn),LSTM的總預(yù)測(cè)準(zhǔn)確率約86.25%,高于詞袋法的總預(yù)測(cè)準(zhǔn)確率75.65%。
人的思維具有連貫性,通常在閱讀時(shí),人類不會(huì)孤立地理解所閱讀到的詞語(yǔ),而會(huì)基于對(duì)前面詞語(yǔ)的理解來(lái)推斷后面詞語(yǔ)的意思。關(guān)于這一點(diǎn),傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)卻無(wú)法做到。比如你打算對(duì)一部電影里的某個(gè)鏡頭進(jìn)行分析,想了解它正在上演什么。傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)只能孤立地看待每一個(gè)鏡頭,而無(wú)法把上一個(gè)鏡頭串聯(lián)到下一個(gè)鏡頭發(fā)生的事情(Christopher Olah’s blog, 2015)[注]http://colah. github. jo/posts/2015-09-NN-Types-FP/?,F(xiàn)在RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))解決了這個(gè)問(wèn)題,就是能夠讓信息在網(wǎng)絡(luò)中再次循環(huán)。LSTM(Long Short-Term Memory,譯為長(zhǎng)短期記憶網(wǎng)絡(luò))是一種特殊的RNN,能夠重復(fù)學(xué)習(xí)并記憶以前的信息,并連接到當(dāng)前的任務(wù)中來(lái)。基于此,本文雇傭10名會(huì)計(jì)和金融專業(yè)研究生,首先對(duì)2005~2007年業(yè)績(jī)說(shuō)明會(huì)文本進(jìn)行人工標(biāo)注(正面語(yǔ)意標(biāo)注為1,負(fù)面語(yǔ)意標(biāo)注為0),并相互比對(duì),保留標(biāo)注一致性的文本作為語(yǔ)料庫(kù)(其中管理層正向語(yǔ)意20001條,負(fù)向語(yǔ)意20435條),然后利用LSTM讀取語(yǔ)料庫(kù)并深度學(xué)習(xí)出管理層語(yǔ)意特征,最后去識(shí)別2010~2014年度的業(yè)績(jī)說(shuō)明會(huì)的管理層語(yǔ)意。LSTM法避免了詞袋法沒(méi)有考慮上下文因果邏輯和普適性不足的缺陷,較好地切合所研究樣本的語(yǔ)境特點(diǎn),實(shí)現(xiàn)了文本分析法的改進(jìn)。
本文借鑒Loughran and McDonald(2011)、Price(2012)、林樂(lè)(2016,2017)[3][4][5][8]等的方法,構(gòu)建上市公司業(yè)績(jī)說(shuō)明會(huì)管理層語(yǔ)意(MEANING)衡量指標(biāo)如下:
MEANING_pos=POSNUM/(POSNUM+NEGNUM)當(dāng)POSNUM>NEGNUM
MEANING_neg=-NEGNUM/(POSNUM+NEGNUM)當(dāng)POSNUM 其中,MEANING_pos是t年第i家上市公司業(yè)績(jī)說(shuō)明會(huì)管理層正向語(yǔ)意,等于管理層正向回答問(wèn)題數(shù)目(POSNUM)占全部問(wèn)題數(shù)目的比例,0.5 本文研究樣本來(lái)自全景網(wǎng)投資者關(guān)系互動(dòng)平臺(tái)(http://rs.p5w.net),利用Python程序爬取2010~2014年全景網(wǎng)所有上市公司年度業(yè)績(jī)說(shuō)明會(huì)上管理層和投資者之間問(wèn)答文本,刪除ST公司和針對(duì)IPO前召開的業(yè)績(jī)說(shuō)明會(huì),經(jīng)過(guò)數(shù)據(jù)清洗,最終得到12萬(wàn)余條文本,合計(jì)3276個(gè)公司年觀測(cè)值,其中1710個(gè)公司年觀測(cè)值呈現(xiàn)正向語(yǔ)意,1566個(gè)公司年觀測(cè)值呈現(xiàn)負(fù)向語(yǔ)意,168個(gè)公司年觀測(cè)值呈現(xiàn)中性語(yǔ)意。本研究所需的其他數(shù)據(jù)來(lái)源于CSMAR和WIND數(shù)據(jù)庫(kù)。在回歸前,對(duì)所有連續(xù)變量上下1%進(jìn)行winsorize,以避免異常值影響。數(shù)據(jù)清洗和統(tǒng)計(jì)分析使用Pandas庫(kù)和STATA統(tǒng)計(jì)軟件。 本文采用事件研究法,借鑒林樂(lè)等(2016;2017)[5][6]、Loughran and McDonald(2011)[3]等研究,構(gòu)建了如下市場(chǎng)反應(yīng)與管理層語(yǔ)意的多元回歸模型: CAR=β0+β1MEANING+β2SUE+β3SIZE+β4LEV+β5ROA+β6GROWTH+ β7AGE+∑IND+∑YEAR+ε (1) 在模型(1)中,被解釋變量是股票超額累計(jì)收益率(CAR),包括短窗口期CAR[0,3]、中窗口期CAR[0,10]和長(zhǎng)窗口期CAR[0,20]。解釋變量是管理層語(yǔ)意(MEANING),分為正面語(yǔ)意(MEANING_pos)和負(fù)面語(yǔ)意(MEANING_neg)。根據(jù)假說(shuō)H1和H2,預(yù)期MEANING_pos的系數(shù)顯著為正,MEANING_neg的系數(shù)顯著為負(fù)??刂谱兞坑校篢年末未預(yù)期盈余(SUE)、T年末上市公司資產(chǎn)規(guī)模對(duì)數(shù)(SIZE)、T年末財(cái)務(wù)杠桿(LEV)、T年末資產(chǎn)收益率(ROA)、T年成長(zhǎng)率(GROWTH)、截至T年末上市年限(AGE)。同時(shí)還控制了行業(yè)(IND)和年度(YEAR)。 表1給出了全樣本和子樣本下CAR單變量均值檢驗(yàn)結(jié)果,在全樣本情況下CAR[0,3]的均值是0.0153(t值是3.38),在1%水平上顯著;CAR[0,10]的均值是0.0353(t值是6.98),在1%水平上顯著,可見業(yè)績(jī)說(shuō)明會(huì)無(wú)論在短窗口期還是在中長(zhǎng)窗口期,市場(chǎng)反應(yīng)均顯著不等于0,這表明業(yè)績(jī)說(shuō)明會(huì)具有信息含量;在劃分為正面語(yǔ)意和負(fù)面語(yǔ)意兩組子樣本情況下,正面語(yǔ)意樣本CAR[0,3]均值不顯著異于0,而CAR[0,10]在1%水平上顯著大于0,說(shuō)明正面語(yǔ)意的市場(chǎng)反應(yīng)可能存在一定滯后期;負(fù)面語(yǔ)意樣本無(wú)論是短窗口期CAR[0,3]還是在中長(zhǎng)窗口期CAR[0,10],市場(chǎng)反應(yīng)均顯著不等于0;此外,負(fù)面語(yǔ)意樣本比正面語(yǔ)意樣本短窗口期CAR[0,3]均值大0.0113(t值是2.66),中長(zhǎng)窗口期CAR[0,10]均值大0.0281(t值是2.98),均在1%水平上顯著,說(shuō)明負(fù)面語(yǔ)意樣本市場(chǎng)反應(yīng)比正面語(yǔ)意樣本更強(qiáng)烈。 表1 全樣本及子樣本CAR單變量均值檢驗(yàn) 注*、** 和*** 分別表示10%、5%和1%的顯著性水平,CAR值取絕對(duì)值。 表2是主要變量的描述性統(tǒng)計(jì)結(jié)果。其中,管理層正面語(yǔ)意比負(fù)面語(yǔ)意的觀測(cè)數(shù)稍多一些(1710:1566),這比較符合業(yè)績(jī)說(shuō)明會(huì)的答疑實(shí)質(zhì),即大多數(shù)投資者在業(yè)績(jī)說(shuō)明會(huì)上就自己關(guān)心的問(wèn)題提出各種質(zhì)疑,更多的時(shí)候是表現(xiàn)出負(fù)面情緒,而管理層是盡可能地用正面語(yǔ)意來(lái)回答投資者的各種質(zhì)疑,LSTM深度學(xué)習(xí)的結(jié)果準(zhǔn)確地捕捉了這一雙方勢(shì)均力敵的博弈情況。正面語(yǔ)意的均值(中值)是0.6413(0.6250),標(biāo)準(zhǔn)差是0.0946,最大值是1,最小值是0.5048,負(fù)面語(yǔ)意的均值(中值)是-0.6311(-0.6111),標(biāo)準(zhǔn)差是0.0922,最大值是-0.4717,最小值是-1。未預(yù)期盈余(SUE)的均值和中值為負(fù),資產(chǎn)規(guī)模的對(duì)數(shù)(SIZE)均值是21.4571,ROA的均值(中位數(shù))是0.0458(0.1312)均為正,說(shuō)明公司整體盈利能力良好,其余變量與前期文獻(xiàn)基本一致。 本文對(duì)主要變量進(jìn)行了Pearson和Spearman相關(guān)性檢驗(yàn),在正面語(yǔ)意樣本組,MEANING_pos與CAR[0,3]、CAR[0,10]正向但不顯著相關(guān),與CAR[0,20]在10%水平上顯著正相關(guān)。在負(fù)面語(yǔ)意樣本組,MEANING_neg與CAR[0,3]、CAR[0,10]和CAR[0,20]均在1%水平上顯著負(fù)相關(guān)。其他控制變量的VIF均小于5,故模型不存在多重共線性問(wèn)題。 表2 多變量描述性統(tǒng)計(jì) 本文對(duì)正面語(yǔ)意和負(fù)面語(yǔ)意兩個(gè)樣本組,分別按照正面語(yǔ)意和負(fù)面語(yǔ)意(MEANING_pos/MEANING_neg)從小到大五等分,并對(duì)CAR[0,3]、CAR[0,10]和CAR[0,20]三個(gè)短、中、長(zhǎng)窗口進(jìn)行均值差異檢驗(yàn)。首先對(duì)MEANING_pos分五組,最大組和最小組短窗口期CAR[0,3]的均值差異為0.0375(t值是1.27),中窗口期CAR[0,10]的均值差異為0.0407(t值是1.36),在10%水平上不顯著,長(zhǎng)窗口期CAR[0,20]的均值差異為0.0669(t值是2.21),在5%水平上顯著,可見,管理層正面語(yǔ)意越大,CAR值越大,但兩者在短中窗口期CAR[0,3]、CAR[0,10]并不顯著正相關(guān),但在長(zhǎng)窗口期CAR[0,20]呈現(xiàn)顯著正相關(guān)性。然后對(duì)MEANING_neg分五組,最大組和最小組CAR[0,3]的均值差異為-0.0289(t值是-1.87),在10%水平上顯著,CAR[0,10]的均值差異為-0.0409(t值是-2.59),在1%水平上顯著,CAR[0,20]的均值差異為-0.0645(t值是-2.75),在1%水平上顯著,這說(shuō)明管理層負(fù)面語(yǔ)意越大,CAR值越大,兩者在短、中窗口期和長(zhǎng)窗口期均顯著負(fù)相關(guān)。 表3報(bào)告了多元回歸模型的回歸結(jié)果:(1)在正面語(yǔ)意樣本組中,管理層正面語(yǔ)意(MEANING_pos)對(duì)CAR[0,3]的回歸系數(shù)為0.0206(t值為1.31),在10%水平上不顯著,CAR[0,10]的回歸系數(shù)為0.0407(t值為1.37),在10%水平上不顯著,而CAR[0,20]的回歸系數(shù)為0.1255(t值為3.02),在1%水平上顯著,說(shuō)明資本市場(chǎng)上的投資者并未及時(shí)對(duì)管理層正面語(yǔ)意做出反應(yīng),存在一定的滯后期,基本支持研究假說(shuō)H1。(2)在負(fù)面語(yǔ)意樣本組中,管理層負(fù)面語(yǔ)意(MEANING_neg)對(duì)CAR[0,3]的回歸系數(shù)為-0.2688(t值為-3.58),在1%水平上顯著,CAR[0,10]的回歸系數(shù)為-0.3425(t值為-3.94),在1%水平上顯著,CAR[0,20]的回歸系數(shù)為-0.4413(t值為-4.69),在1%水平上顯著。再進(jìn)一步對(duì)CAR[0,3]和CAR[0,10]的回歸系數(shù)作組間差異性檢驗(yàn),結(jié)果為-0.074(Chi2值為0.05),在10%水平上不顯著。CAR[0,3]和CAR[0,20]組間回歸系數(shù)差異的結(jié)果為-0.173(Chi2值為0.28),在10%水平上不顯著,表明投資者在短窗口已經(jīng)開始對(duì)管理層負(fù)面語(yǔ)意做出及時(shí)并且顯著的負(fù)向反應(yīng),從而支持研究假說(shuō)H2。本文的研究發(fā)現(xiàn)與行為經(jīng)濟(jì)學(xué)的前景理論和相關(guān)前期文獻(xiàn)的結(jié)論是一致的。 本文的研究一方面為行為經(jīng)濟(jì)學(xué)的前景理論提供了經(jīng)驗(yàn)證據(jù),另一方面提供了政策啟示:第一,上市公司業(yè)績(jī)說(shuō)明會(huì)這樣的非財(cái)務(wù)信息披露形式,是財(cái)務(wù)信息披露的有益補(bǔ)充,有利于提高資本市場(chǎng)配置效率。監(jiān)管部門未來(lái)可在非財(cái)務(wù)信息披露的形式多樣性、內(nèi)容互動(dòng)性、現(xiàn)場(chǎng)即時(shí)性等方面做進(jìn)一步拓展,積極引導(dǎo)上市公司實(shí)時(shí)、主動(dòng)、全方位地披露財(cái)務(wù)和非財(cái)務(wù)信息,切實(shí)有效地保護(hù)公司外部投資者的利益。第二,加大規(guī)范非財(cái)務(wù)信息披露的內(nèi)容和質(zhì)量。從目前業(yè)績(jī)說(shuō)明會(huì)上管理層回答的內(nèi)容來(lái)看,并不是每家公司都會(huì)做全面細(xì)致的披露,存在避重就輕、欲說(shuō)還休的情形。監(jiān)管部門應(yīng)當(dāng)在現(xiàn)有的“規(guī)范指引”基礎(chǔ)上,進(jìn)一步規(guī)范公司非財(cái)務(wù)信息內(nèi)容的廣度和深度,加強(qiáng)約束、拉高準(zhǔn)繩。第三,完善技術(shù)手段,建立非財(cái)務(wù)信息預(yù)警體系。如果說(shuō)公司非財(cái)務(wù)信息具有信息增量,能夠修正投資者情緒,那么對(duì)于建立非財(cái)務(wù)信息預(yù)警體系,緩解未來(lái)股價(jià)崩盤風(fēng)險(xiǎn)具有重大實(shí)踐意義。 表3 多元回歸結(jié)果 注:括號(hào)內(nèi)為t值,*、** 和*** 分別表示10%、5%和1%的顯著性水平。 本文進(jìn)一步研究管理層語(yǔ)意可否作為投資者股票交易策略的因子之一?基于Fama and French(1993)三因子模型,通過(guò)計(jì)算管理層語(yǔ)意在低分位組和高分位組之間,三因子模型的Alpha值是否存在顯著差異,用以驗(yàn)證該問(wèn)題。具體步驟如下:(1)先根據(jù)上一年度的管理層語(yǔ)意,對(duì)所有樣本公司進(jìn)行五分位排序;(2)再對(duì)下一年度第一分位和第五分位的公司進(jìn)行三因子模型回歸;(3)最后比較五分位前后Alpha值是否存在顯著差異。如果存在顯著差異,則說(shuō)明投資者在進(jìn)行股票交易時(shí),會(huì)把管理層語(yǔ)意作為股票交易策略因子之一。 表4 基于三因子模型的管理層語(yǔ)意分位回歸結(jié)果 注:括號(hào)內(nèi)為t值,*、** 和*** 分別表示10%、5%和1%的顯著性水平。 表4是2010~2014五個(gè)年度分別根據(jù)上一年度管理層正面語(yǔ)意,分位前后的三因子模型回歸結(jié)果??梢园l(fā)現(xiàn)2010、2011和2013三個(gè)年度的Alpha值在分位前后均不顯著異于0,2012和2014年Alpha值雖然顯著大于0,但分位前后的差異并不顯著(t值分別是1.32和1.05),說(shuō)明基于正面語(yǔ)意分位,并未給投資者帶來(lái)超額Alpha收益,因此本文沒(méi)有證據(jù)支持投資者在進(jìn)行股票交易時(shí),會(huì)把管理層語(yǔ)意作為交易策略因子之一。同樣基于管理層負(fù)面語(yǔ)意的分位研究,得到類似的結(jié)果(限于篇幅,圖表省略)。 為了確保結(jié)論的穩(wěn)健性,本文進(jìn)行了多種穩(wěn)健性檢驗(yàn):(1)采用幼稚模型(Naive Model)重新計(jì)算CAR[0,3]和CAR[0,10],用窗口(-200,-20)作為估計(jì)期,回歸結(jié)果保持不變。(2)選用不同長(zhǎng)度的窗口計(jì)算CAR值。具體包括短窗口(-3,1)、(-3,3)以及長(zhǎng)窗口(3,30)、(3,60)和(3,90),回歸結(jié)果保持一致。(3)分別基于用四因子和五因子模型,對(duì)管理層語(yǔ)意進(jìn)行分位回歸,回歸結(jié)果基本一致。仍然支持假說(shuō)H1和H2。 本文基于2010~2014年間我國(guó)上市公司年度業(yè)績(jī)說(shuō)明會(huì)上管理層披露的文本內(nèi)容,選用LSTM深度學(xué)習(xí)技術(shù),對(duì)管理層的回答文本進(jìn)行分析,研究投資者能否聽懂管理層所表達(dá)的真正語(yǔ)意并做出相應(yīng)的反應(yīng)(用業(yè)績(jī)說(shuō)明會(huì)前后的市場(chǎng)異?;貓?bào)來(lái)衡量)。研究發(fā)現(xiàn)投資者對(duì)正面語(yǔ)意在短窗口期內(nèi)并未做出顯著的正向反應(yīng),但卻在長(zhǎng)窗口期內(nèi)做出顯著的正向反應(yīng),而投資者對(duì)負(fù)面語(yǔ)意無(wú)論是在短窗口還是長(zhǎng)窗口期內(nèi)都做出顯著的正向反應(yīng)。這些結(jié)果說(shuō)明,我國(guó)資本市場(chǎng)上的投資者能夠聽懂管理層所傳遞的“話里話、弦外音”,不過(guò)投資者對(duì)好消息的反應(yīng)存在一定滯后期,對(duì)壞消息的反應(yīng)更為及時(shí),驗(yàn)證了行為經(jīng)濟(jì)學(xué)領(lǐng)域的前景理論。此外也說(shuō)明作為一種新興的非財(cái)務(wù)信息披露渠道,管理層業(yè)績(jī)說(shuō)明會(huì)確實(shí)具有信息含量,是一種行之有效的實(shí)踐操作方式。 不同于前期文獻(xiàn)普遍采用的詞袋文本分析法,本文率先選用LSTM深度學(xué)習(xí)技術(shù),某種程度上可以避免詞袋法存在的不同學(xué)科詞典不兼容、無(wú)法捕捉文本因果關(guān)系以及詞義誤判等缺陷,正如Leuz and Wysocki(2016)[21]所指出,文本應(yīng)當(dāng)是試圖反映所屬行業(yè)領(lǐng)域的經(jīng)濟(jì)現(xiàn)實(shí),倘若將文本與行業(yè)背景相分離,那將是影響所有會(huì)計(jì)質(zhì)量指標(biāo)的基本問(wèn)題。而LSTM深度學(xué)習(xí)是基于前期管理層業(yè)績(jī)說(shuō)明會(huì)自身文本信息,最少損失地提取文本特征并用于分析后期業(yè)績(jī)說(shuō)明會(huì)文本信息,既可以消除了詞典的兼容問(wèn)題,又可以捕捉文本因果關(guān)系,最終降低詞義誤判,提高回歸準(zhǔn)確率。該方法具有良好的普適性,可以推廣到其他非財(cái)務(wù)信息披露研究領(lǐng)域,但是必須指出的是,對(duì)語(yǔ)料庫(kù)的準(zhǔn)確標(biāo)注是決定LSTM深度學(xué)習(xí)成功的關(guān)鍵因素。 未來(lái)在研究方法和研究領(lǐng)域方面可做進(jìn)一步拓展:(1)在文本分析法基礎(chǔ)上,結(jié)合聲音軟件(比如測(cè)謊軟件)、圖像識(shí)別技術(shù)等測(cè)量管理層語(yǔ)氣和相貌等特征,捕捉全方位、多維度的非財(cái)務(wù)信息;(2)可借助剛剛興起的“從微觀數(shù)據(jù)到宏觀經(jīng)濟(jì)”理論框架,以管理層語(yǔ)意為切入點(diǎn),研究其在宏觀經(jīng)濟(jì)預(yù)測(cè)中的應(yīng)用價(jià)值及作用機(jī)制,服務(wù)于經(jīng)濟(jì)政策制定和微觀企業(yè)實(shí)踐。(二)樣本與數(shù)據(jù)
(三)研究模型與變量
四、實(shí)證結(jié)果及分析
(一)描述性統(tǒng)計(jì)
(二)多元回歸分析
(三)基于三因子模型的進(jìn)一步分析
(四)穩(wěn)健性檢驗(yàn)
五、結(jié) 論
——基于異質(zhì)型規(guī)制工具的視角
——“互聯(lián)網(wǎng)+慈善”模式對(duì)個(gè)體慈善行為影響機(jī)制研究
——基于管理者過(guò)度自信的視角
——基于A股上市公司的經(jīng)驗(yàn)證據(jù)
——來(lái)自上市公司2012~2016年參與PPP項(xiàng)目的經(jīng)驗(yàn)證據(jù)