馬藝珊 賓玉平 溫富先 伊加提·艾尼瓦
開發(fā)大學生情緒疏導機器人的重要性
據(jù)了解,我國高校大學生是抑郁癥高發(fā)的群體,他們因為課業(yè)、生活等種種問題導致抑郁。目前高校和國家針對青少年抑郁癥的全國范圍流行病學調(diào)查尚未完善,廣大群眾對于抑郁癥的了解仍浮于表面,通過“你是如何意識到自己可能有抑郁癥”的網(wǎng)絡調(diào)研可以發(fā)現(xiàn),患有抑郁癥的本人可能都未意識到自己患有抑郁癥,如圖1所示。
絕大多數(shù)抑郁癥患者都不愿意傾訴,因為他們害怕別人的不理解,擔心他人異樣的目光,而聊天機器人在一定程度上可以解決用戶的病恥感和不愿意誠實自我批露的問題,可以讓大學生們敞開心扉進行傾訴。希望通過本項目能夠幫助大學生群體緩解焦慮、緊張、抑郁及失眠等狀況,將心理健康問題“遏制”在萌芽狀態(tài),不能任其發(fā)展到嚴重的心理問題或者危機問題。
具體方法
基于Python技術開發(fā)一款名為“傾心”的智能對話機器人,其非普通的人機對話系統(tǒng),而是面向心理健康領域的心理疏導工具,對用戶有著精神陪伴和情感慰藉等作用。
通過以下幾個步驟進行開發(fā),可驗證其技術可行性:微信聊天機器人構建、構建知識圖譜、語義理解和對話生成四大核心模塊。
微信聊天機器人構建
使用Python實現(xiàn)聊天機器人的方案有多種:AIML、chatterBot以及圖靈聊天機器人和微軟小冰等??紤]到本項目是面向心理健康領域,有很多專業(yè)的心理健康知識,可以選擇聊天機器人框架chatterBot。這是一款Python接口的,基于一系列規(guī)則和機器學習算法完成的聊天機器人。具有結構清晰、可擴展性好、簡單實用等特點。chatterBot的工作流程如圖2所示。
首先,輸入模塊從終端或者API等輸入源獲取數(shù)據(jù)。輸入源會被指定的邏輯處理模塊分別處理,邏輯處理模塊會匹配訓練集中已知的最接近輸入數(shù)據(jù)句子A,然后根據(jù)句子A去找到相關度最高的結果B,如果有多個邏輯處理模塊返回了不同的結果,會返回一個相關度最高的結果。
然后,輸出模塊(output adapter)將匹配到的結果返回給終端或者API。接入微信公眾號。首先在微信公眾號上開始服務器配置,填寫token和EncodingAESKey,選擇兼容模式,既有明文方便調(diào)試,又有信息加密。
構建知識圖譜
要想實現(xiàn)針對心理健康特定領域的自動問答,需要在chatterbot中添加領域內(nèi)的訓練數(shù)據(jù),chatterBot通過調(diào)用train函數(shù)訓練。知識圖譜是訓練數(shù)據(jù)中很重要的一部分。原始數(shù)據(jù),按照數(shù)據(jù)的結構化程度來分,可以分為結構化數(shù)據(jù)、半結構化數(shù)據(jù)和非結構化數(shù)據(jù),根據(jù)數(shù)據(jù)的不同結構化形式,采用不同的方法,將數(shù)據(jù)轉換為三元組的形式,抽取心理健康領域知識本體三元組(實體、關系、屬性),然后對三元組的數(shù)據(jù)進行知識融合,主要是實體對齊以及和數(shù)據(jù)模型進行結合,經(jīng)過融合之后,會形成標準的數(shù)據(jù)表示。為了發(fā)現(xiàn)新知識,可以依據(jù)一定的推理規(guī)則,產(chǎn)生隱含的知識,所有形成的知識經(jīng)過一定的質(zhì)量評估,最終進入知識圖譜。知識圖譜的構建過程如圖3所示。
語義理解
語義理解(NLU)是通過一系列的AI算法,將文本解析為結構化的、機器可讀的意圖與詞槽信息,便于互聯(lián)網(wǎng)開發(fā)者更好地理解并滿足用戶需求。通常來說,語義理解一般分為基于統(tǒng)計的方法與基于規(guī)則的方法?;谝?guī)則的方法通過事先制定的各種各樣的規(guī)則進行解析,并且不依賴數(shù)據(jù)量。同時基于規(guī)則的方法缺點也很明顯,由于語言的復雜性,解析自然語言就需要指定大量的解析規(guī)則。所以要將規(guī)則定義在心理健康領域,這方面需要大量的心理專業(yè)知識,無疑會增加很大難度?;诮y(tǒng)計的方法具有較強的魯棒性,一般來講,數(shù)據(jù)量越大訓練出的模型的表現(xiàn)就會越好,其缺點就是需要大量訓練模型,而大量優(yōu)質(zhì)數(shù)據(jù)的獲取有一定難度。
對話生成
對話生成是根據(jù)執(zhí)行一些語法以及語義規(guī)則生成自然語言的過程。通過自動化語義理解,將用戶對話映射到對應的知識本體,使用自然語言文本生成技術,給出自然、準確的答復。對話生成在聊天機器人系統(tǒng)中起到至關重要的作用,相當于人類的大腦,可以根據(jù)歷史對話內(nèi)容對當前狀態(tài)進行決策。將背景知識通過編碼融入到傳統(tǒng)模型中,可提高模型生成對話的豐富程度,在與人交互的過程中能夠記憶上下文話題語境。在生成答復時充分考慮語境,解決了目前聊天機器人中普遍存在的前后回復不一致、回復內(nèi)容與聊天語境大相徑庭等問題。
“傾心”的智能對話機器人特點和創(chuàng)新點
特點
本項目不同于其他心理健康機器人,是專門針對青少年群體的。利用與人工與智能相結合的方式對使用者進行問答分析,拉近與用戶之間的距離,積極引導青少年群體進行獨立思考,而非沉浸在自我情緒中,自我拉扯無法排解。通過如朋友般的聊天方式使用戶身心往健康樂觀的狀態(tài)發(fā)展,減少焦慮、抑郁情緒的產(chǎn)生。用戶在平臺上所傾訴的一些心理情緒、壓力等,軟件后端會定時刪除數(shù)據(jù)來保護用戶的隱私,不用擔心個人信息及情況泄露等問題,真正做到信息安全,用戶放心。
創(chuàng)新點
比起校內(nèi)開設的心理咨詢室,機器人更能使得青少年放下“戒備”,并且能集結專家的解答和疏導,滿足大學生線上心理健康問題的咨詢需要。目前絕大部分來聊天機器人都是基于人工規(guī)則,“傾心”建立的心理知識問答庫,從語料庫和對話記錄中自動學習,建立知識圖譜和實體關聯(lián)。運用深度學習技術,對文本信息達到深層次的語義分析和理解,極大地降低了人力成本。整合多種深度學習、自然語言理解技術,能夠準確理解用戶意圖、快速察覺用戶情緒,從而生成相應的答復,進一步降低“答非所問”的出現(xiàn)幾率。
利用Python技術進行機器人開發(fā),除幫助緩解相關人群的病癥問題,還能夠有效推進我國在此領域的相關研究,從而朝著更為人性化的社會前進。相信在情緒疏導機器人的幫助下,終有一日,抑郁癥患者的癥狀會被大眾所接納,他們對于自己的情緒也會有個正向的排解,這才是研發(fā)情緒疏導機器人的根本意義。