曹樹金 閆欣陽(yáng)
摘 要:[目的/意義]研究的目的在于揭示社會(huì)化問答網(wǎng)站用戶糖尿病相關(guān)信息需求,以及隨時(shí)間的推移這些信息需求的演變。[方法/過程]以中文社會(huì)化問答網(wǎng)站糖尿病相關(guān)提問文本為基礎(chǔ),構(gòu)造共詞網(wǎng)絡(luò),運(yùn)用詞頻分析、社會(huì)網(wǎng)絡(luò)分析和社區(qū)發(fā)現(xiàn)的方法,確定網(wǎng)絡(luò)社區(qū)演變路徑,以可視化的形式呈現(xiàn)信息需求的特征及演變。[結(jié)果/結(jié)論]10年間用戶表達(dá)出來的信息需求趨于集中,用戶對(duì)健康管理的信息需求有較大增長(zhǎng),但這部分仍未成為核心關(guān)注點(diǎn)。建議用戶更多地對(duì)健康管理給予關(guān)注,公共衛(wèi)生部門加強(qiáng)糖尿病預(yù)防內(nèi)容的科普,并對(duì)相關(guān)并發(fā)癥加強(qiáng)防控和管理。
關(guān)鍵詞:健康信息需求;糖尿病;社會(huì)化問答網(wǎng)站;社會(huì)網(wǎng)絡(luò)分析
DOI:10.3969/j.issn.1008-0821.2019.06.001
〔中圖分類號(hào)〕G252.0 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2019)06-0003-13
Abstract:[Purpose/Significance]The research aimed to reveal the diabetes-related information needs of users in social Q&A websites and the evolution of these information needs over time.[Method/Process]Based on the diabetes-related question texts from a Chinese social Q&A website,a co-word network was constructed,then word frequency analysis,social network analysis and community detection methods were applied to determine the evolution path of the network communities,and meanwhile the characteristics and evolution of information needs were visually represented.[Result/Conclusion]The information needs expressed by users tended to be concentrated in the past decade.Information need for health management has increased greatly,but has not become a core concern yet.Users were advised to pay more attention to health management,and the public health department should do more to promote diabetes prevention,and strengthen prevention and control of complications.
Key words:health information needs;diabetes;social Q&A website;social network analysis
生命健康權(quán)是公民最基本的人格權(quán)。隨著經(jīng)濟(jì)發(fā)展水平提高,人民生活水平不斷改善,健康問題越來越得到人們的重視,人們對(duì)健康信息的需求也隨之增加。隨著Web2.0時(shí)代的不斷發(fā)展和社交媒體的普及,越來越多的用戶不僅從互聯(lián)網(wǎng)獲取健康信息,也通過互聯(lián)網(wǎng)表達(dá)健康信息需求。其中糖尿病作為一種常見慢性病,患者基數(shù)大,信息需求更是豐富而廣泛。2017年發(fā)布的《第八版全球糖尿病概覽》數(shù)據(jù)顯示,全球每11位成人中就有1位患糖尿病,患病人數(shù)達(dá)4.25億,較2015年多1 000萬人。至2045年,這一數(shù)字將增至6.29億。2017年中國(guó)有1.144億名糖尿病患者,位居全球第一[1]。而Wilson V[2]在2013年就通過電子郵件調(diào)查了22~64歲之間的Ⅰ型和Ⅱ型糖尿病患者,認(rèn)為互聯(lián)網(wǎng)是尋找一般糖尿病健康問題答案的首選。然而國(guó)內(nèi)對(duì)糖尿病信息需求的研究多為問卷調(diào)查法[3-5],樣本范圍狹窄,且采用已有的分類體系而忽略了用戶信息需求的表達(dá)。中國(guó)糖尿病患者的信息需求表達(dá)需要被關(guān)注和研究。
根據(jù)貝爾金提出的知識(shí)非常態(tài)理論(Anomalous State of Knowledge,ASK),用戶之所以有信息需求產(chǎn)生,是因?yàn)橛脩粽J(rèn)識(shí)到自己存在關(guān)于某個(gè)主題或情境的知識(shí)非常態(tài),而且一般也無法精確描述需要什么來解決這種非常態(tài)[6]。由于信息需求表達(dá)的是用戶所不知道的,因而貝爾金認(rèn)為研究的焦點(diǎn)應(yīng)放在用戶信息需求的問題陳述上,通過獲得問題的陳述,構(gòu)建用戶知識(shí)非常態(tài)的表達(dá)。社會(huì)化問答網(wǎng)站是網(wǎng)絡(luò)用戶信息需求表達(dá)的集中地之一。作為用戶生成的內(nèi)容,Anderson C提出,許多用戶構(gòu)建的知識(shí)結(jié)構(gòu)的長(zhǎng)尾效應(yīng)將產(chǎn)生不可估量的價(jià)值[7]。社會(huì)化問答網(wǎng)站是Web2.0用戶生成內(nèi)容的典范。任何人都可以提出和回答問題,對(duì)他人提交的內(nèi)容進(jìn)行評(píng)分[8],并查看其他人的問題和答案。以其作為研究數(shù)據(jù)來源,最大的優(yōu)勢(shì)就是可以獲取用戶相對(duì)真實(shí)完整的信息需求表達(dá),超越了問卷調(diào)查、檢索日志等數(shù)據(jù)的局限。因此,研究試圖從社會(huì)化問答網(wǎng)站用戶的提問文本入手,突破先驗(yàn)式分類框架,結(jié)合社會(huì)網(wǎng)絡(luò)分析和社區(qū)發(fā)現(xiàn)等研究方法對(duì)文本進(jìn)行挖掘,從宏觀和微觀上客觀地揭示糖尿病患者的信息需求以及隨著時(shí)間的推移這些信息需求的演變,總結(jié)社會(huì)化問答網(wǎng)站用戶糖尿病相關(guān)信息需求特征和規(guī)律。研究首次從中文社會(huì)化問答網(wǎng)站獲取數(shù)據(jù)分析用戶健康信息需求,能夠從實(shí)證角度豐富和拓展日常信息尋求理論,推進(jìn)認(rèn)知觀意義下動(dòng)態(tài)健康信息需求研究的深入,并為健康知識(shí)組織、知識(shí)服務(wù)研究提供理論依據(jù)。研究也力圖為社會(huì)化問答網(wǎng)站提供優(yōu)化方向,更好地組織信息資源。同時(shí)為用戶提供提問參考和建議,幫助公共衛(wèi)生部門為有效的健康教育活動(dòng)修改和定制健康信息,提供更好的健康信息服務(wù)。了解用戶信息需求和信息來源的相關(guān)性如何隨時(shí)間變化還可以提高慢性病管理的質(zhì)量,引領(lǐng)醫(yī)療保健系統(tǒng)向更加為患者量身定制的醫(yī)療服務(wù)轉(zhuǎn)變。
2019年6月第39卷第6期現(xiàn)代情報(bào)Journal of Modern InformationJune,2019Vol.39 No.6
2019年6月第39卷第6期社會(huì)化問答網(wǎng)站用戶健康信息需求的演變研究
June,2019Vol.39 No.6
1 相關(guān)研究現(xiàn)狀
1.1 用戶健康信息需求
健康信息需求是長(zhǎng)期以來信息需求領(lǐng)域的研究熱點(diǎn)之一。由于“信息需求”本身的定義就有多種且尚未達(dá)成一致,因此健康信息需求的定義也存在爭(zhēng)議。Timmins F[9]認(rèn)為,在健康領(lǐng)域,信息需求可以被簡(jiǎn)單解釋為病人需要知道的東西。然而,從最廣泛的意義上講,它被廣泛用于代表病人/家庭的知識(shí)中可能通過信息和/或教育提供糾正的差距或不足。Ormandy P[10]認(rèn)為,信息需求意味著處于特定時(shí)間點(diǎn)的情境中,對(duì)于知識(shí)不足以滿足目標(biāo)的一種認(rèn)識(shí)。我國(guó)有學(xué)者認(rèn)為,健康信息需求即當(dāng)個(gè)體出現(xiàn)自我感覺身體不適或曾有高危行為導(dǎo)致其對(duì)健康狀況表示懷疑或不確定時(shí),主動(dòng)尋求相關(guān)健康知識(shí)或經(jīng)過醫(yī)生確診以獲取所需健康信息,以確定癥狀,排除憂慮[11]。綜合上述研究,本文將用戶健康信息需求定義為:個(gè)體主動(dòng)尋求相關(guān)健康信息以獲取所需健康知識(shí),以彌補(bǔ)健康知識(shí)的不足,排除憂慮的愿望和渴望。本文研究所指?jìng)€(gè)體僅限于患者及家人等相關(guān)人員,不包括專業(yè)醫(yī)療衛(wèi)生提供者。
關(guān)于健康信息需求的研究既有整體性的,也有針對(duì)某種或幾種疾病類型的研究。整體性研究如張洪武等[12]基于網(wǎng)絡(luò)用戶搜索行為,利用百度指數(shù)分析網(wǎng)絡(luò)用戶健康信息需求。Pieper D等[13]通過系統(tǒng)性綜述的方法調(diào)查2000-2012年期間以德語(yǔ)或英語(yǔ)出版的德國(guó)患者,親屬和一般人群的健康相關(guān)信息需求研究??偨Y(jié)認(rèn)為研究使用的方法是高度異質(zhì)的,年齡越小,病程越短,健康狀況越差,焦慮和抑郁評(píng)分越高,信息需求越高。Pian W等[14]探討了用戶健康信息需求情境的自動(dòng)分類問題。他們認(rèn)為用戶的健康信息需求情境(即為自己、為他人搜索或沒有健康問題的瀏覽),只要用戶點(diǎn)擊鼠標(biāo),就可以通過Web應(yīng)用程序檢測(cè)合理準(zhǔn)確地識(shí)別。癌癥一直是健康信息需求研究中最受關(guān)注的疾病之一。Schmidt A等[15]通過多中心方法描述乳腺癌門診患者的信息需求,劉倩雯等[16]采用信息需求自評(píng)量表探討了肝癌患者的健康信息需求。李重陽(yáng)等[17]以在線問答社區(qū)中癌癥信息為例,對(duì)信息需求從時(shí)間和主題兩個(gè)角度進(jìn)行綜合測(cè)度。Vetsch J等[18]通過問卷和訪談評(píng)估了癌癥幸存者和父母的信息需求及未滿足的信息需求與臨床和社會(huì)人口學(xué)特征之間的關(guān)聯(lián)。結(jié)果認(rèn)為幸存者對(duì)醫(yī)療信息的需求更加不滿足,而父母在性問題和生活方式方面的需求明顯更多。作為父母,對(duì)隨訪護(hù)理不滿意,整體健康狀況降低,晚期效應(yīng)感知風(fēng)險(xiǎn)較高,焦慮/抑郁程度較高與更多未滿足的需求顯著相關(guān)。其他疾病方面,Pier C等[19]采用半結(jié)構(gòu)化訪談的專題分析對(duì)伴或不伴抑郁癥患者的冠心?。–HD)患者的健康和心理健康信息需求進(jìn)行研究。結(jié)果認(rèn)為最突出的信息需求包括識(shí)別和管理與風(fēng)險(xiǎn)有關(guān)的身體癥狀,以及心理社會(huì)信息,特別是提高患者的社會(huì)支持方面的心理社會(huì)信息?;颊哒J(rèn)為這些信息對(duì)緩解健康焦慮和消極影響很重要。Cappelletti E等[20]采用問卷的方法探討受兩種慢性病——高血壓和冠狀病影響的患者的信息需求的演變。調(diào)查結(jié)果認(rèn)為,隨著時(shí)間的推移,專家被認(rèn)為是最值得信賴的信息來源。
關(guān)于糖尿病的健康信息需求研究也已有一些積累。研究方法方面,Jean B S[21]在對(duì)Ⅱ型糖尿病患者的信息需求和信息尋求和使用實(shí)踐進(jìn)行調(diào)查時(shí),開發(fā)了縱向研究設(shè)計(jì),其中包括傳統(tǒng)的數(shù)據(jù)收集方法(問卷調(diào)查和訪談)以及一種新型的卡片分類技術(shù),可以在不同時(shí)間點(diǎn)引發(fā)參與者對(duì)不同來源和類型的糖尿病相關(guān)信息的相對(duì)有用性的判斷。為滿足用戶對(duì)糖尿病相關(guān)信息的需求,Chen X等[22]提出了一個(gè)中文領(lǐng)域詞典,采用一些專業(yè)的糖尿病主題解釋作為領(lǐng)域知識(shí),并將其納入深度學(xué)習(xí)方法,形成主題分類框架。使用真實(shí)數(shù)據(jù)集的實(shí)驗(yàn)表明,與大多數(shù)最先進(jìn)的基準(zhǔn)測(cè)試方法相比,該框架在分類糖尿病相關(guān)主題方面顯著提高了效率和準(zhǔn)確性。實(shí)驗(yàn)分析還顯示,一些健康網(wǎng)站提供了一些不正確或誤導(dǎo)性的類別信息。信息需求內(nèi)容方面,Lamberts E J F等[23]通過半結(jié)構(gòu)化電話訪談和患者焦點(diǎn)小組討論了解最近開始接受口服抗糖尿病治療的患者的信息需求,并研究藥房為Ⅱ型糖尿病患者提供信息的機(jī)會(huì),發(fā)現(xiàn)全科醫(yī)生無法滿足所有信息需求,而藥劑師有機(jī)會(huì),因?yàn)榛颊咝枰畔⒉⑾矚g討論與藥物有關(guān)的問題。為了解消費(fèi)者對(duì)糖尿病信息的需求,金碧漪等[24]選取雅虎問答中糖尿病相關(guān)的8 762條提問記錄作為研究對(duì)象,根據(jù)糖尿病信息的類目體系及分類策略對(duì)其進(jìn)行人工編碼,再進(jìn)行文本處理,并通過多維尺度分析方法,對(duì)每個(gè)需求類目下的中心詞進(jìn)一步聚類發(fā)現(xiàn),消費(fèi)者對(duì)于糖尿病健康信息最大的關(guān)注點(diǎn)是日常疾病管理、疾病確診和治療,而對(duì)疾病預(yù)防缺乏應(yīng)有的關(guān)注度。Crangle C等[25]通過眾包平臺(tái),從120名門診糖尿病診所患者和100名市民中收集了164個(gè)問題,以分析患者和公眾對(duì)Ⅱ型糖尿病(T2DM)的信息需求。確定了23個(gè)一般和糖尿病特定主題和5個(gè)疾病進(jìn)展階段,并確定了哪些主題是患者或公眾提出的問題的重要預(yù)測(cè)因子。Grobosch S等[26]通過混合方法確定最近診斷為Ⅰ型或Ⅱ型糖尿病的人的信息需求及與糖尿病有關(guān)的信息需求相關(guān)的因素。結(jié)果認(rèn)為大多數(shù)參與者表示需要提供所有主題的信息,尤其是糖尿病研究和治療。關(guān)于這些主題,參與者希望獲得有關(guān)簡(jiǎn)化日常生活的新療法的信息。低現(xiàn)時(shí)信息水平(不夠或完全不知情)和抗高血糖藥物治療與更高的信息需求顯著相關(guān),糖尿病相關(guān)綜合癥和36項(xiàng)短期健康調(diào)查(SF-36)中較高的心理成分總分得分顯著相關(guān),信息需求較低。
1.2 信息需求演變
意義建構(gòu)理論認(rèn)為,意義建構(gòu)的能力不僅會(huì)超越時(shí)空的限制,而且也不會(huì)僅僅定位于一個(gè)點(diǎn)[27]。兩個(gè)面向不一致時(shí),意義建構(gòu)者在某一情境中停頓下來,由于某種認(rèn)知差距使其無法趨前,而此時(shí)意義建構(gòu)者就可能利用“橋梁”,即信息的搜尋、獲取和利用把其面對(duì)的鴻溝填平[28]。意義建構(gòu)者填平鴻溝、評(píng)估結(jié)果(新的認(rèn)知狀態(tài))后,再繼續(xù)移動(dòng)[29]。這啟示我們,用戶信息需求是一個(gè)動(dòng)態(tài)的對(duì)象,了解用戶的信息需求需要了解其所處的兩個(gè)面向及其變化規(guī)律[27]。因此,在識(shí)別用戶健康信息需求時(shí),需要運(yùn)用動(dòng)態(tài)的觀點(diǎn)進(jìn)行分析。近年,也有學(xué)者開始重視對(duì)信息需求演變的動(dòng)態(tài)過程的研究。
信息需求演變研究在健康方面有較多應(yīng)用。Douma K F L等[30]和Matsuyama R K等[31]都調(diào)查了癌癥患者的信息需求變化情況。結(jié)果都認(rèn)為盡管隨著時(shí)間的推移觀察到需求減少,但總體信息需求仍然很高。Brédart A等[32]和Sheehy E M等[33]都通過問卷調(diào)查了隨著診斷時(shí)間的推移,乳腺癌患者的信息需求是否存在差異。他們分別得出結(jié)論認(rèn)為盡管有些人持續(xù)存在,但信息需求會(huì)隨著時(shí)間的推移減少;以及診斷后1年、3年和5年的中位數(shù)分?jǐn)?shù)無差異,信息需求始終很高,并且疾病過程中是最高的。Halbach S M等[34]則通過前瞻性多中心隊(duì)列研究方法在乳腺癌手術(shù)后10周和40周后直接對(duì)新診斷的乳腺癌患者進(jìn)行了調(diào)查。采用了線性回歸模型,分析了未滿足的信息需求隨時(shí)間的變化及其與健康素養(yǎng)的關(guān)系。Kassianos A P等[35]通過在線調(diào)查問卷在治療過程的各個(gè)階段回顧性地探討前列腺癌患者及其伴侶的信息需求?;貞?yīng)顯示越接近診斷時(shí)間,對(duì)前列腺癌相關(guān)信息的需求就越大。Hsieh L Y等[36]用改良的多倫多信息需求問卷分析肺癌患者從診斷到首次治療隨訪的信息需求。用廣義估算方程比較信息需求隨時(shí)間的變化,結(jié)果認(rèn)為每個(gè)域的信息需求均隨著時(shí)間的推移而顯著下降。無論疾病階段如何,對(duì)“疾病相關(guān)信息”的需求仍然很高。Chernyak N等[37]制定了適用于評(píng)估不同醫(yī)療環(huán)境(例如初級(jí)保健或長(zhǎng)期護(hù)理)中Ⅰ型和Ⅱ型糖尿病患者以及疾病過程中不同時(shí)間點(diǎn)的信息需求的問卷。Greco A等[38]通過前瞻性觀察性研究探索急性冠狀動(dòng)脈綜合征后24個(gè)月內(nèi)患者不同信息來源的信息需求和感知相關(guān)性。Odlum M等[39]通過縱向追蹤,在不同的流行時(shí)間點(diǎn)評(píng)估有關(guān)埃博拉的健康信息需求。他們對(duì)推文進(jìn)行自然語(yǔ)言處理,并通過信息圖表進(jìn)行了分析和可視化來探索公眾對(duì)埃博拉病毒的反應(yīng)。結(jié)果發(fā)現(xiàn)隨著時(shí)間的推移,觀察到公眾對(duì)埃博拉的恐懼,沮喪和相關(guān)全球重點(diǎn)事項(xiàng)的健康信息尋求。縱向內(nèi)容分析顯示,由于持續(xù)的健康信息缺陷,導(dǎo)致恐懼和沮喪,社交媒體有時(shí)成為障礙,而不是支持健康信息需求的工具。Chen A T[40]采用K-means算法對(duì)3個(gè)在線論壇(乳腺癌,Ⅰ型糖尿病和纖維肌痛)討論內(nèi)容進(jìn)行聚類。結(jié)論認(rèn)為聚類得到的簇強(qiáng)調(diào)了患者信息需求的不斷變化。提供給患者的信息應(yīng)該適合他們?cè)诩膊∑陂g的各個(gè)階段滿足他們的需求。
綜上所述,國(guó)內(nèi)外對(duì)健康信息需求和信息需求演變研究都較為重視,既集中于信息需求的內(nèi)容,又有涉及研究方法、應(yīng)用等方面,但仍有不足之處。如雖然有些研究對(duì)網(wǎng)絡(luò)用戶健康信息需求有所涉及,但專門研究仍相對(duì)較少。健康信息需求的研究通常是以研究者構(gòu)建好的信息需求框架為基礎(chǔ),先驗(yàn)性過強(qiáng)。而在研究方法上多以問卷調(diào)查或訪談為主,較少有從文本信息的角度對(duì)用戶健康信息需求加以挖掘,與社會(huì)網(wǎng)絡(luò)分析結(jié)合的則更為少見,健康信息需求演變的研究也通常按照疾病階段劃分。因此,研究參考Zhao Y等[41]的研究思路,試圖以一個(gè)中文社會(huì)化問答網(wǎng)站糖尿病相關(guān)提問文本為基礎(chǔ),構(gòu)造共詞網(wǎng)絡(luò),運(yùn)用社會(huì)網(wǎng)絡(luò)分析和社區(qū)發(fā)現(xiàn)的方法,突破先驗(yàn)式分類框架,客觀地描述十年間用戶關(guān)于糖尿病信息需求的特點(diǎn)及演變。
2 研究方法
2.1 社會(huì)網(wǎng)絡(luò)分析
研究首先將提問進(jìn)行分詞處理,進(jìn)行詞頻統(tǒng)計(jì),并構(gòu)建共詞矩陣,繪制共詞網(wǎng)絡(luò)。共詞網(wǎng)絡(luò)是根據(jù)詞共現(xiàn)關(guān)系,采用不同的指數(shù)算法計(jì)算共現(xiàn)強(qiáng)度并繪制的共現(xiàn)網(wǎng)絡(luò)圖[42]。由于研究關(guān)注的是信息需求的整體特征和演變,而共詞網(wǎng)絡(luò)恰好符合研究需求。依據(jù)單獨(dú)的關(guān)鍵詞分析通常難以準(zhǔn)確判斷信息需求,共詞網(wǎng)絡(luò)則更能代表提問的內(nèi)容和思想,提供了一個(gè)更全面的視角。本文采用ROST CM6的社會(huì)網(wǎng)絡(luò)和語(yǔ)義網(wǎng)絡(luò)分析功能進(jìn)行共現(xiàn)分析,并用Gephi繪制了共詞網(wǎng)絡(luò)圖。共詞網(wǎng)絡(luò)不會(huì)對(duì)詞匯數(shù)量加以限制,偏向從宏觀角度描述由關(guān)鍵詞表征的用戶提問。共詞網(wǎng)絡(luò)通常與社會(huì)網(wǎng)絡(luò)分析法結(jié)合使用以揭示主題的分布、關(guān)聯(lián)及演化[42]。
社會(huì)網(wǎng)絡(luò)分析方法在情報(bào)學(xué)的合著網(wǎng)絡(luò)、引文網(wǎng)絡(luò)、競(jìng)爭(zhēng)情報(bào)、隱性知識(shí)共享等方面都有廣泛的應(yīng)用,尤其是研究領(lǐng)域識(shí)別方面。社會(huì)網(wǎng)絡(luò)是社會(huì)行動(dòng)者及他們之間關(guān)系的集合[43]。社會(huì)網(wǎng)絡(luò)分析處理的是關(guān)系數(shù)據(jù),其分析單位是“關(guān)系”,社會(huì)網(wǎng)絡(luò)分析的核心價(jià)值就在于從“關(guān)系”角度出發(fā)研究社會(huì)行動(dòng)者及其社會(huì)結(jié)構(gòu)[44]。共詞網(wǎng)絡(luò)中詞便是社會(huì)行動(dòng)者,由詞間關(guān)系構(gòu)成的網(wǎng)絡(luò)便是社會(huì)結(jié)構(gòu)。社會(huì)關(guān)系圖所提供的數(shù)據(jù)可視化顯示經(jīng)常能讓研究者發(fā)現(xiàn)不如此就難以發(fā)現(xiàn)的模式[45]。因此研究將以可視化方式呈現(xiàn)共詞網(wǎng)絡(luò),以圖論思想為基礎(chǔ),采用社會(huì)網(wǎng)絡(luò)分析中典型的網(wǎng)絡(luò)度量方法,包括平均度、圖密度、平均聚類系數(shù)等對(duì)共詞網(wǎng)絡(luò)進(jìn)行分析對(duì)比,揭示用戶關(guān)于糖尿病的信息需求及變化。
2.2 社區(qū)發(fā)現(xiàn)與演變
社區(qū)發(fā)現(xiàn)(Community Detection)研究是復(fù)雜網(wǎng)絡(luò)領(lǐng)域的研究熱點(diǎn)和重要研究方向[46]。Newman M E[47]認(rèn)為,在頂點(diǎn)群中,連接是密集的,但它們之間的連接比較稀疏,這樣的結(jié)構(gòu)就是社區(qū)結(jié)構(gòu)。整個(gè)網(wǎng)絡(luò)可以看作是由多個(gè)社區(qū)組成,社區(qū)是社會(huì)網(wǎng)絡(luò)的一個(gè)重要結(jié)構(gòu)特征,也是中觀尺度觀察和理解網(wǎng)絡(luò)拓?fù)涞囊环N重要結(jié)構(gòu)。相關(guān)術(shù)語(yǔ)還有社區(qū)、聚團(tuán)或群組結(jié)構(gòu)等[48]。運(yùn)用社區(qū)發(fā)現(xiàn)方法能發(fā)現(xiàn)復(fù)雜網(wǎng)絡(luò)里潛在的、隱藏的子社區(qū)。針對(duì)社區(qū)發(fā)現(xiàn)已有多種技術(shù)及相應(yīng)算法被提出,如以GN算法[49]為代表的層次聚類方法、以LPA算法[50]為代表的標(biāo)簽傳播方法、直接進(jìn)行圖劃分的SCD算法[51]、用于團(tuán)滲透方法的SCP算法[52]、以抽取網(wǎng)絡(luò)中稠密子圖為目標(biāo)的OQC算法[53]、基于模塊度優(yōu)化(Modularity Optimization)的Fast Unfolding算法[53]等。
基于運(yùn)算速度、運(yùn)行效果、數(shù)據(jù)規(guī)模等因素考慮,本文利用Gephi內(nèi)置的Fast Unfolding算法進(jìn)行社區(qū)發(fā)現(xiàn)。Fast Unfolding算法原理分為兩個(gè)階段,首先將每個(gè)節(jié)點(diǎn)指定到唯一的一個(gè)社區(qū),然后按順序?qū)⒐?jié)點(diǎn)在這些社區(qū)間進(jìn)行移動(dòng),并計(jì)算相應(yīng)的模塊度變化值,哪個(gè)變化值最大就將節(jié)點(diǎn)移動(dòng)到相應(yīng)的社區(qū)中去,按照這個(gè)方法反復(fù)迭代,直到網(wǎng)絡(luò)中任何節(jié)點(diǎn)的移動(dòng)都不能再改善總的模塊度值為止。第二個(gè)階段是將第一個(gè)階段得到的社區(qū)視為新的“節(jié)點(diǎn)”(一個(gè)社區(qū)對(duì)應(yīng)一個(gè)),重新構(gòu)造子圖,兩個(gè)新“節(jié)點(diǎn)”之間邊的權(quán)值為相應(yīng)兩個(gè)社區(qū)之間各邊的權(quán)值的總和[55]。
公式中,kisi代表在模塊s中節(jié)點(diǎn)i的度數(shù),si代表節(jié)點(diǎn)i所屬的模塊,〈…〉j∈s表示平均數(shù)。根據(jù)經(jīng)驗(yàn),在一個(gè)社區(qū)中,Z-value值大于2.5的節(jié)點(diǎn)為核心節(jié)點(diǎn),被用來代表社區(qū)[56]。研究對(duì)聚類得到的每個(gè)社區(qū)中每個(gè)節(jié)點(diǎn)的Z-value進(jìn)行計(jì)算和排序,以找到能表征整個(gè)社區(qū)的核心節(jié)點(diǎn)。
在共詞網(wǎng)絡(luò)中,網(wǎng)絡(luò)社區(qū)不是一成不變的。網(wǎng)絡(luò)社區(qū)的屬性可能會(huì)隨時(shí)間發(fā)生變化,網(wǎng)絡(luò)社區(qū)的演化既包括社區(qū)自身內(nèi)部節(jié)點(diǎn)、關(guān)系和結(jié)構(gòu)的變化,也包括社區(qū)間關(guān)系和位置的變化[58]。共詞網(wǎng)絡(luò)的演變研究在各學(xué)科研究進(jìn)展的分析中有著比較多的應(yīng)用[59-62]。網(wǎng)絡(luò)社區(qū)演變問題可以簡(jiǎn)單理解為為t時(shí)段的所有網(wǎng)絡(luò)社區(qū)尋找前驅(qū)和后繼。尋找一個(gè)網(wǎng)絡(luò)社區(qū)前驅(qū)后繼的常用方法有3種,分別為分類方法、語(yǔ)言模型方法、相似度模型方法[58],本研究采用相似度模型方法,引入包含指數(shù)(inclusion index)計(jì)算相似度。包含指數(shù)的基本思想如下:設(shè)Tt為子周期t的主題集合,U∈Tt表示子周期中每個(gè)檢測(cè)到的主題(社區(qū))。令V∈Tt+1為下一個(gè)子時(shí)段t+1中的每個(gè)檢測(cè)到的主題。如果在兩個(gè)相關(guān)的社區(qū)中都存在相同的關(guān)鍵詞,則說社區(qū)U到社區(qū)V存在演變[63]。包含指數(shù)表示如下:
與Jaccard或余弦指數(shù)相比,包含指數(shù)在衡量相似集合方面更有優(yōu)勢(shì),因?yàn)樗皇軘?shù)量影響[63]。研究通過這種方法確定網(wǎng)絡(luò)社區(qū)演變路徑,并以可視化的方式進(jìn)行分析和呈現(xiàn)。
3 數(shù)據(jù)獲取與預(yù)處理
3.1 數(shù)據(jù)源的選擇
研究選取尋醫(yī)問藥網(wǎng)作為數(shù)據(jù)來源,原因在于:其一,作為專業(yè)健康社會(huì)化問答網(wǎng)站,用戶信息需求不會(huì)過于分散,噪音較少。其二,尋醫(yī)問藥網(wǎng)成立于2004年,是中國(guó)較早探索和實(shí)踐互聯(lián)網(wǎng)醫(yī)療服務(wù)的平臺(tái)之一。截至2016年,尋醫(yī)問藥網(wǎng)注冊(cè)用戶超過1.2億,日獨(dú)立訪客超過2 200萬,月獨(dú)立訪客超過3.2億,位居醫(yī)療健康服務(wù)行業(yè)第一[64]。其提供的問答服務(wù)“有問必答”中,問答模式是以醫(yī)生回答提問為主,也有普通用戶回答的情況。一般社會(huì)化問答網(wǎng)站是用戶提問用戶回答,其缺陷是回答問題的人往往不具有嚴(yán)格的專業(yè)性。因?yàn)檎l(shuí)都可以成為回答者,對(duì)回答的內(nèi)容判別要交給提問者,當(dāng)面對(duì)醫(yī)學(xué)健康這種嚴(yán)謹(jǐn)?shù)膯栴}時(shí)就面臨著難以得到專業(yè)回答的尷尬境地。可以說,“有問必答”屬于已經(jīng)進(jìn)行了專家發(fā)現(xiàn)的社會(huì)化問答社區(qū),積累了比較豐富的用戶提問,是比較成熟的、適合進(jìn)行研究的健康類社會(huì)化問答網(wǎng)站。
尋醫(yī)問藥網(wǎng)“有問必答”(http://club.xywy.com/)下的所有問題以日期為單位呈現(xiàn),每天被提出的所有問題作為一個(gè)集合形成一個(gè)鏈接歸檔(如圖1)。因此,數(shù)據(jù)獲取以時(shí)間為單位,保證完整性。采集工具為八爪魚采集器,以“糖尿病”為關(guān)鍵詞對(duì)提問進(jìn)行篩選。對(duì)于每條提問采集3個(gè)字段:標(biāo)題、問題描述和時(shí)間。如果某一項(xiàng)或幾項(xiàng)用戶沒有填寫則置空。采集的提問時(shí)間段為2007年12月至2008年12月以及2017年12月至2018年12月。
3.2 文本預(yù)處理
對(duì)采集到的問題文本進(jìn)行清洗,處理內(nèi)容包括以下情況:
1)問題描述中的引導(dǎo)語(yǔ)。網(wǎng)站提問框中提供了如下引導(dǎo)語(yǔ):病情描述(發(fā)病時(shí)間、主要癥狀、癥狀變化等)。一些用戶直接將這部分寫入了自己的問題描述。由于可能對(duì)關(guān)鍵詞提取產(chǎn)生影響,因此將這部分文字去除。
2)文本內(nèi)容去重。針對(duì)文本內(nèi)部的無意義內(nèi)容進(jìn)行去重,如“糖尿病怎么辦糖尿病怎么辦”,使用最大公共子序列算法,將公共序列中重復(fù)部分去除,只保留1個(gè)。
3)圖片。對(duì)于問題描述中帶有圖片的,將圖片網(wǎng)址去除。
4)對(duì)疑似水軍的灌水提問進(jìn)行清理。
完成以上處理后,將文檔進(jìn)行編碼和格式轉(zhuǎn)換,并采用ICTCLAS分詞模塊對(duì)得到的提問數(shù)據(jù)進(jìn)行分詞處理。最終用于研究的有效數(shù)據(jù)分別為2007年12月至2008年12月(下簡(jiǎn)稱“2007-2008年”)7 555條,以及2017年12月至2018年12月(下簡(jiǎn)稱“2017-2018年”)13 328條,問題描述的平均字?jǐn)?shù)分別為58.4和64.5。
4 結(jié)果與討論
4.1 高頻詞分析
對(duì)所有文本進(jìn)行分詞后,采用ICTCLAS語(yǔ)言統(tǒng)計(jì)模塊對(duì)已分詞的提問文本進(jìn)行單篇——批量詞頻統(tǒng)計(jì),不統(tǒng)計(jì)虛詞,得到2007-2008年實(shí)義詞7 436個(gè),2017-2018年8 928個(gè)??梢钥闯觯m然10年間提問數(shù)將近翻了1倍,但所用詞數(shù)增長(zhǎng)得并沒有那么多。而其中有共現(xiàn)關(guān)系、參與構(gòu)成共詞矩陣的詞則分別為395個(gè)和301個(gè),這個(gè)比例與劉知遠(yuǎn)等[65]的實(shí)驗(yàn)結(jié)果大體一致。核心語(yǔ)詞減少這一點(diǎn)則與Zhao Y等[41]得出的結(jié)論一致。Zhao Y等對(duì)2005-2006年及2013-2014年雅虎問答網(wǎng)站用戶關(guān)于糖尿病的問答日志進(jìn)行了分析,認(rèn)為在提問數(shù)增加的情況下,核心詞數(shù)量有所減少并趨于集中。這也反映了用戶信息需求的集中趨勢(shì)。
如表1和表2所示,從具體的高頻詞及其變化可以初步對(duì)用戶糖尿病相關(guān)信息需求有一個(gè)直觀的認(rèn)識(shí)。通用詞變化較小,關(guān)于“治療”、“醫(yī)院”、“醫(yī)生”等信息需求一直處于較高的水平?!把恰?、“胰島素”等基本專有詞排名一直靠前,“高血壓”是被提問最多的并發(fā)癥。10年間用戶對(duì)健康管理(飲食、運(yùn)動(dòng))的信息需求有較大增長(zhǎng),“運(yùn)動(dòng)”的增長(zhǎng)最為顯著。相對(duì)于關(guān)于“藥”的排名有所下降,“中藥”和“中醫(yī)”的信息需求則有所上升。此外,并發(fā)癥腎病以及妊娠糖尿病相關(guān)信息需求都有增長(zhǎng),同時(shí)也更注重糖尿病及其并發(fā)癥的預(yù)防。提問者表現(xiàn)出更多的焦慮情緒(“擔(dān)心”),更多關(guān)注是否能治愈及遺傳因素。由于代謝病外科手術(shù)技術(shù)的不斷成熟,對(duì)這種治療方法的信息需求也隨之增加。
4.2 共詞網(wǎng)絡(luò)整體屬性分析
兩個(gè)時(shí)間段的共詞網(wǎng)絡(luò)整體屬性對(duì)比如表3所示。頂點(diǎn)的度是指與頂點(diǎn)相關(guān)聯(lián)的邊數(shù),從圖2和圖3中可以看出,度序列散點(diǎn)呈明顯的冪律分布,部分節(jié)點(diǎn)具有極高的連接度(110以上),而大量節(jié)點(diǎn)的連接度很低,體現(xiàn)出了非均勻性。也就是說,網(wǎng)絡(luò)中存在大量度值相對(duì)較小的邊緣詞,也存在少量度值相對(duì)非常大的核心詞[66],這與齊夫定律的結(jié)論相符。核心詞的存在使得很多不相關(guān)的關(guān)鍵詞產(chǎn)生了間接聯(lián)系,進(jìn)而產(chǎn)生社區(qū)。2007-2008年平均度為4.66,而2017-2018年增長(zhǎng)到6.759,圖密度則從0.022增長(zhǎng)為0.029。這兩個(gè)指標(biāo)的同步增長(zhǎng)表明隨著時(shí)間的變化,網(wǎng)絡(luò)的相關(guān)性和連通性都在提高。也就是說,核心詞數(shù)量減少的情況下,其聯(lián)系是有所增加的。網(wǎng)絡(luò)的平均路徑長(zhǎng)度是指所有可達(dá)節(jié)點(diǎn)對(duì)最短路徑的加權(quán)平均值[67],平均聚類系數(shù)是指所有節(jié)點(diǎn)聚類系數(shù)的平均值[68],根據(jù)圖論,聚集系數(shù)是表示1個(gè)圖形中節(jié)點(diǎn)聚集程度的系數(shù)。網(wǎng)絡(luò)的平均路徑保持在2左右,變化較小,網(wǎng)絡(luò)邊緣概念離核心概念的關(guān)聯(lián)步長(zhǎng)較短,網(wǎng)絡(luò)平均聚類系數(shù)遠(yuǎn)高于同等規(guī)模的隨機(jī)網(wǎng)絡(luò)(0.01左右)。小平均路徑長(zhǎng)度和大聚類系數(shù)即是小世界效應(yīng)的兩個(gè)顯著特點(diǎn)[69],因此可以認(rèn)為網(wǎng)絡(luò)具有小世界效應(yīng)。平均聚類系數(shù)在10年間有顯著提高,進(jìn)一步表明核心詞集中趨勢(shì)的加強(qiáng)。
4.3 社區(qū)發(fā)現(xiàn)與演變
經(jīng)上一節(jié)分析可知,2007-2008年和2017-2018年網(wǎng)絡(luò)度分布、聚類系數(shù)、平均路徑長(zhǎng)度的特點(diǎn)均符合社區(qū)劃分結(jié)構(gòu)。運(yùn)用Fast Unfolding算法對(duì)構(gòu)建的共詞網(wǎng)絡(luò)進(jìn)行社區(qū)發(fā)現(xiàn),分別劃分出7個(gè)和5個(gè)社區(qū),模塊度分別為0.355和0.311。社區(qū)數(shù)量減少,也反映了核心詞的集中趨勢(shì)。社區(qū)內(nèi)語(yǔ)詞數(shù)分布如圖4和圖5所示。
按照Z(yǔ)-value的計(jì)算公式,對(duì)所劃分的每個(gè)社區(qū)中的節(jié)點(diǎn)的Z-value進(jìn)行計(jì)算,并進(jìn)行排序,將Z-value大于等于2.5的節(jié)點(diǎn)提取出來作為每個(gè)社區(qū)的核心節(jié)點(diǎn)(剔除意義不大的中心節(jié)點(diǎn)“糖尿病”)。圖6和圖7為通過Gephi可視化呈現(xiàn)的結(jié)果,社區(qū)以不同顏色進(jìn)行了區(qū)分,核心節(jié)點(diǎn)放大標(biāo)出??梢钥吹?,有些社區(qū)Z-value大于等于2.5的節(jié)點(diǎn)有兩個(gè),而社區(qū)本身詞數(shù)小于等于3的也都用兩個(gè)詞作為核心節(jié)點(diǎn)。通過分析核心節(jié)點(diǎn)及社區(qū)內(nèi)的關(guān)聯(lián)關(guān)系,可以發(fā)現(xiàn)2007-2008年用戶關(guān)于糖尿病的提問包括癥狀(“疼痛”)、降糖(“血糖”)、治療、并發(fā)癥(糖尿病眼?。⒉∈穾讉€(gè)方面,而2017-2018年用戶提問則包括就診、治療、并發(fā)癥(高血壓)、檢查、癥狀(“無力”)幾個(gè)方面。對(duì)比之下,可以看到用戶對(duì)高血壓這種并發(fā)癥的信息需求增加,而眼病則相對(duì)下降。此外,用戶對(duì)身體檢查更加重視,也體現(xiàn)了用戶健康素養(yǎng)和生活水平的不斷提高。
為從一個(gè)更微觀的角度研究用戶信息需求的演變,將2017-2018年的數(shù)據(jù)劃分為4段,大體與季節(jié)對(duì)應(yīng),記做t1、t2、t3和t4。對(duì)4部分?jǐn)?shù)據(jù)進(jìn)行上述同樣的共詞網(wǎng)絡(luò)構(gòu)建和社區(qū)發(fā)現(xiàn)操作,基于相似度找出社區(qū)的前驅(qū)后繼關(guān)系,用?;鶊D的形式呈現(xiàn)演變結(jié)果如圖8所示。可以看到,4個(gè)時(shí)間段社區(qū)發(fā)現(xiàn)的結(jié)果與全年結(jié)果基本一致,治療、癥狀信息需求表現(xiàn)穩(wěn)定,反映了最近一段時(shí)間用戶糖尿病相關(guān)的主要信息需求。時(shí)段t1的“并發(fā)癥”在t2時(shí)段分化為“血壓”和其他,而在t3時(shí)段“血壓”社區(qū)消失,由其他3個(gè)社區(qū)演化出了1個(gè)新的社區(qū)“眼病”。與t1時(shí)段“血糖”社區(qū)結(jié)合分析,可以看出糖尿病及并發(fā)癥具有一定的季節(jié)性規(guī)律。冬季是糖尿病病情最易加重和高血壓多發(fā)的季節(jié),因此時(shí)段1和時(shí)段2用戶關(guān)于“血糖”和“血壓”的信息需求明顯集中。t3時(shí)段社區(qū)“檢查”出現(xiàn),結(jié)合全年社區(qū)發(fā)現(xiàn)結(jié)果,可以認(rèn)為用戶從t3時(shí)段開始對(duì)檢查的信息需求增加,且增長(zhǎng)顯著。
5 結(jié)論與展望
研究通過詞頻分析、共詞社會(huì)網(wǎng)絡(luò)分析以及社區(qū)發(fā)現(xiàn)和演變的方法,以社會(huì)化問答網(wǎng)站“尋醫(yī)問藥網(wǎng)”為例,總結(jié)了中文用戶糖尿病相關(guān)信息需求的特點(diǎn):1)10年間用戶表達(dá)出來的信息需求趨于集中是最突出的特點(diǎn),這一點(diǎn)在采用的各種研究方法得出的結(jié)論中都有體現(xiàn)。與PubMed等醫(yī)學(xué)權(quán)威機(jī)構(gòu)或組織所使用的分類體系相比,用戶實(shí)際信息需求集中于特定的幾個(gè)方面,治療和癥狀一直屬于用戶的核心信息需求,這與Zhao Y等[41]以及金碧漪等[24]的研究結(jié)果基本一致。2)10年間用戶對(duì)健康管理(飲食、運(yùn)動(dòng))的相關(guān)關(guān)鍵詞數(shù)有較大增長(zhǎng),但在社區(qū)發(fā)現(xiàn)與演變研究中則表現(xiàn)不顯著。這一結(jié)果則與上述兩組學(xué)者的研究結(jié)果不一致,分析認(rèn)為是由于數(shù)據(jù)源不同導(dǎo)致的。Zhao Y等[41]以及金碧漪等[24]所采用的都是來自雅虎問答的英文數(shù)據(jù),各方面的差異使得健康管理仍未成為中文用戶的核心關(guān)注點(diǎn)。3)10年間“中藥”和“中醫(yī)”的信息需求有所上升,體現(xiàn)了用戶的求醫(yī)問藥轉(zhuǎn)向。而的確有研究證明中藥在調(diào)理糖尿病方面的潛力,尤其是中西藥物聯(lián)用與單用西藥比較有較顯著的優(yōu)勢(shì)[70]。4)“高血壓”是被提問最多,增長(zhǎng)也最明顯的并發(fā)癥,并遵循一定的季節(jié)性規(guī)律。盡管研究方法和數(shù)據(jù)都不同,但研究結(jié)論與Grobosch S等[26]對(duì)德國(guó)糖尿病患者的研究大體一致。
結(jié)合上述結(jié)論,建議用戶更多地對(duì)健康管理給予關(guān)注。雖然10年間相關(guān)信息需求有所增長(zhǎng),對(duì)比之下仍有差距。世界衛(wèi)生組織認(rèn)為,定期進(jìn)行中等強(qiáng)度的身體活動(dòng)可幫助預(yù)防并治療糖尿病。Ⅱ型糖尿病占總病例數(shù)的90%,主要是由于體重超重和缺乏身體活動(dòng)造成[71]。因此,用戶有必要對(duì)相關(guān)問題給予更多關(guān)注,以從本質(zhì)上調(diào)節(jié)自己或親人的病癥。研究的詞頻分析及共詞網(wǎng)絡(luò)揭示了糖尿病消費(fèi)者在表達(dá)具體健康信息需求時(shí)的用詞習(xí)慣、詞匯間的語(yǔ)義關(guān)聯(lián)等[24],社會(huì)化問答網(wǎng)站、搜索引擎等可以據(jù)此優(yōu)化信息組織、信息推薦、查詢補(bǔ)全等功能,使之更貼近用戶需求和使用習(xí)慣。對(duì)公共衛(wèi)生部門來說,則應(yīng)該加強(qiáng)糖尿病及其并發(fā)癥預(yù)防內(nèi)容的科普。整體來看,提問用戶雖然對(duì)如何預(yù)防關(guān)注度有所提高,但通常仍是患病或疑似患病才求助各信息源,說明用戶還需要提高對(duì)疾病預(yù)防的重視程度。作為一個(gè)糖尿病大國(guó),糖尿病又是通過日常生活方式的改變就容易預(yù)防的慢性病,公共衛(wèi)生部門有責(zé)任和義務(wù)進(jìn)行糖尿病預(yù)防內(nèi)容的科普。同時(shí)應(yīng)根據(jù)用戶信息需求將預(yù)防策略細(xì)化,如怎樣健康飲食、如何預(yù)防各種并發(fā)癥等。針對(duì)提問較多的眼病、高血壓等并發(fā)癥,還可以建立并發(fā)癥防控篩查制度和平臺(tái),加強(qiáng)防控和管理,定期檢查并獲取相關(guān)數(shù)據(jù),形成檔案,建立一個(gè)中長(zhǎng)期、多維度的健康管理體系,為干預(yù)方法多樣性和有效性提供大數(shù)據(jù)支持[72]。
研究還有一些不足之處。首先,研究只選擇一特定社會(huì)化問答網(wǎng)站為例,可能存在數(shù)據(jù)偏見。其次,進(jìn)行社區(qū)發(fā)現(xiàn)和演變分析時(shí)沒有考慮重疊社區(qū)。實(shí)際上在演變可視化結(jié)果中可以看到,核心節(jié)點(diǎn)相同的社區(qū)存在相互分化的現(xiàn)象,也就是說各社區(qū)有重疊部分存在。
鑒于以上局限和不足,后續(xù)研究還可以從以下方面進(jìn)行改進(jìn)和突破:1)考察更多其他不同疾病、不同社會(huì)化問答網(wǎng)站的用戶提問,與本文得出的結(jié)論進(jìn)行比較,以驗(yàn)證其普遍性;2)考慮騎墻節(jié)點(diǎn)因素,發(fā)現(xiàn)重疊社區(qū)并進(jìn)行研究;3)力圖補(bǔ)齊10年間數(shù)據(jù),更為細(xì)致地分析用戶糖尿病相關(guān)信息需求的演變。
參考文獻(xiàn)
[1]IDF.Diabetes Atlas:Eighth Edition[R/OL].https://www.idf.org/e-library/epidemiology-research/diabetes-atlas/134-idf-diabetes-atlas-8th-edition.html,2018-10-21.
[2]Wilson V.Patient Use of the Internet for Diabetes Information[J].Nursing Times,2013,109(23):18.
[3]曲振瑞,丁麗.糖尿病患者健康信息需求調(diào)查[J].中國(guó)誤診學(xué)雜志,2007,(3):660.
[4]高改云,王霞.糖尿病患者健康信息需求分析與對(duì)策[J].醫(yī)學(xué)信息,2007,(1):149-150.
[5]郭光霞.糖尿病患者健康信息需求調(diào)查分析及護(hù)理對(duì)策[J].基層醫(yī)學(xué)論壇,2008,(21):628-629.
[6]Belkin N J,Oddy R N,Brooks H M.ASK for Information Retrieval.Part I:Background and Theory[J].Journal of Documentation,1982,38(2):61-71.
[7]Anderson C.The Long Tail:Why the Future of Business Is Selling Less of More[M].NY,US:Hachette Books,2006.
[8]Gazan R.Social Q&A[J].Journal of the Association for Information Science & Technology,2014,62(12):2301-2312.
[9]Timmins F.Exploring the Concept of‘Information Need[J].International Journal of Nursing Practice,2006,12(6):375-381.
[10]Ormandy P.Defining Information Need in Health-assimilating Complex Theories Derived from Information Science[J].Health Expectations,2011,14(1):92-104.
[11]張馨遙.健康信息需求研究的內(nèi)容與意義[J].醫(yī)學(xué)與社會(huì),2010,23(1):51-53.
[12]張洪武,馮思佳,趙文龍,等.基于網(wǎng)絡(luò)用戶搜索行為的健康信息需求分析[J].醫(yī)學(xué)信息學(xué)雜志,2011,32(5):13-18.
[13]Pieper D,F(xiàn)abian Jülich,Antoine S L,et al.Studies Analysing the Need for Health-related Information in Germany-A Systematic Review[J].BMC Health Services Research,2015,15(1):407.
[14]Pian W,Khoo C S,Chi J.Automatic Classification of Users Health Information Need Context:Logistic Regression Analysis of Mouse-Click and Eye-Tracker Data[J].Journal of Medical Internet Research,2017,19(12):e424.
[15]Schmidt A,Ernstmann N,Wesselmann S,et al.After Initial Treatment for Primary Breast Cancer:Information Needs,Health Literacy,and the Role of Health Care Workers.[J].Supportive Care in Cancer,2016,24(2):563-571.
[16]劉倩雯,張美芬,陳梅先.肝癌患者栓塞化療術(shù)前疾病不確定感與信息需求水平及相關(guān)性[J].護(hù)理學(xué)報(bào),2013,20(22):73-76.
[17]李重陽(yáng),翟?shī)檴?,鄭?網(wǎng)絡(luò)健康社區(qū)信息需求特征測(cè)度——基于時(shí)間和主題視角的實(shí)證分析[J].數(shù)字圖書館論壇,2016,(9):34-42.
[18]Vetsch J,F(xiàn)ardell J E,Wakefield C E,et al.“Forewarned and Forearmed”:Long-term Childhood Cancer Survivors and Parents Information Needs and Implications for Survivorship Models of Care[J].Patient Education & Counseling,2017,100(2):355-363.
[19]Pier C,Shandley K A,F(xiàn)isher J L,et al.Identifying the Health and Mental Health Information Needs of People with Coronary Heart Disease,with and Without Depression[J].Medical Journal of Australia,2008,188(12):142-4.
[20]Cappelletti E,DAddario M,Steca P,et al.Evolution of Information Needs in Patients Affected By Coronaropathy and Hypertension[C]//Conference of the European Health Psychology Society.“Well-being,Quality of Life and Caregiving”.Bordeaux,F(xiàn)rance:European Health Psychology Society,2013.
[21]Jean B S.Devising and Implementing a Card-sorting Technique for a Longitudinal Investigation of the Information Behavior of People with Type 2 Diabetes[J].Library & Information Science Research,2014,36(1):16-26.
[22]Chen X,Zhang Y,Zhao K,et al.Domain Supervised Deep Learning Framework for Detecting Chinese Diabetes-Related Topics[C]//International Conference on Database Systems for Advanced Applications.Berlin,German:Springer,Cham,2018:53-71.
[23]Lamberts E J F,Bouvy M L,Hulten R P V.The Role of the Community Pharmacist in Fulfilling Information Needs of Patients Starting Oral Antidiabetics[J].Research in Social and Administrative Pharmacy,2010,6(4):354-364.
[24]金碧漪,許鑫.社會(huì)化問答社區(qū)中糖尿病健康信息的需求分析[J].中華醫(yī)學(xué)圖書情報(bào)雜志,2014,23(12):37-42.
[25]Crangle C,Bradley C P,Carlin P,et al.Exploring Patient Information Needs in Type 2 Diabetes:A Cross Sectional Study of Questions[J].PLOS ONE,2018,13(11):e0203429.
[26]Grobosch S,Kuske S,Linnenkamp U,et al.What Information Needs Do People with Recently Diagnosed Diabetes Mellitus Have and what Are the Associated Factors?A Cross-sectional Study in Germany[J].BMJ open,2018,8(10):e017895.
[27]馬費(fèi)成,宋恩梅編著.信息管理學(xué)基礎(chǔ)(第2版)[M].武漢:武漢大學(xué)出版社,2011
[28]顏端武.信息獲取與用戶服務(wù)[M].北京:科學(xué)出版社,2010:61.
[29]Dervin B.Sense-making Theory and Practice:An Overview of User Interests in Knowledge Seeking and Use[J].Journal of Knowledge Management,1998,2(2):36-46.
[30]Douma K F L,Koning C C E,Zandbelt L C,et al.Do Patients Information Needs Decrease Over the Course of Radiotherapy?[J].Supportive Care in Cancer,2012,20(9):2167-2176.
[31]Matsuyama R K,Kuhn L A,Molisani A,et al.Cancer Patients Information Needs the First Nine Months After Diagnosis[J].Patient Education & Counseling,2013,90(1):96-102.
[32]Brédart A,Kop J L,F(xiàn)iszer C,et al.Breast Cancer Survivors Perceived Medical Communication Competence and Satisfaction with Care at the End of Treatment[J].Psycho-Oncology,2015,24(12):1670-1678.
[33]Sheehy E M,Lehane E A,Quinn E M,et al.The Information Needs of Patients with Breast Cancer at Years One,Three and Five Post Diagnosis[J].Clinical Breast Cancer,2018,92:S26.
[34]Halbach S M,Ernstmann N,Kowalski C,et al.Unmet Information Needs and Limited Health Literacy in Newly Diagnosed Breast Cancer Patients Over the Course of Cancer Treatment[J].Patient Education and Counseling,2016:S0738399116302932.
[35]Kassianos A P,Raats M M,Gage H.An Exploratory Study on the Information Needs of Prostate Cancer Patients and Their Partners[J].Health Psychology Research,2016,4(1):4786.
[36]Hsieh L Y,Chou F J,Guo S E.Information Needs of Patients with Lung Cancer from Diagnosis Until first Treatment Follow-up[J].PloS One,2018,13(6):e0199515.
[37]Chernyak N,Stephan A,Bchle C,et al.Assessment of Information Needs in Diabetes:Development and Evaluation of a Questionnaire[J].Primary Care Diabetes,2016,10(4):287-292.
[38]Greco A,Cappelletti E R,Monzani D,et al.A Longitudinal Study on the Information Needs and Preferences of Patients After an Acute Coronary Syndrome[J].BMC Family Practice,2016,17(1):136.
[39]Odlum M,Yoon S.Health Information Needs and Health Seeking Behavior During the 2014-2016 Ebola Outbreak:A Twitter Content Analysis[J].PLoS Currents,2018,10.
[40]Chen A T.Exploring Online Support Spaces:Using Cluster Analysis to Examine Breast Cancer,Diabetes and Fibromyalgia Support Groups[J].Patient Education & Counseling,2012,87(2):250-257.
[41]Zhao Y,Chen B,Zhang J,et al.An Investigation on the Evolution of Diabetes Data in Social Q&A Logs[J].Data and Information Management,2018,1(ahead-of-print).
[42]隗玲,許海云,劉春江,等.技術(shù)領(lǐng)域主題發(fā)現(xiàn)研究——以基因工程疫苗領(lǐng)域?yàn)槔齕J].數(shù)字圖書館論壇,2017,(1):37-45.
[43]葉春蕾,冷伏海.基于社會(huì)網(wǎng)絡(luò)分析的技術(shù)主題演化方法研究[J].情報(bào)理論與實(shí)踐,2014,37(1):126-130,140.
[44]劉軍.整體網(wǎng)分析:UCINET軟件實(shí)用指南[M].上海:格致出版社,2014.
[45]斯坦利·沃瑟曼,凱瑟琳·福斯特.社會(huì)網(wǎng)絡(luò)分析:方法與應(yīng)用[M].陳禹,孫彩虹,譯.北京:中國(guó)人民大學(xué)出版社,2012.
[46]陽(yáng)廣元,曹霞,甯佐斌,等.國(guó)內(nèi)社區(qū)發(fā)現(xiàn)研究進(jìn)展[J].情報(bào)資料工作,2014,(2):29-33.
[47]Newman M E.Detecting Community Structure in Networks[J].European Physical Journal B,2004,38(2):321-330.
[48]王莉,程學(xué)旗.在線社會(huì)網(wǎng)絡(luò)的動(dòng)態(tài)社區(qū)發(fā)現(xiàn)及演化[J].計(jì)算機(jī)學(xué)報(bào),2015,38(2):219-237.
[49]Newman M E,Girvan M.Finding and Evaluating Community Structure in Networks[J].Physical Review E,2004,69(2):026113.
[50]Raghavan U N,Albert R,Kumara S.Near Linear Time Algorithm to Detect Community Structures in Large-scale Networks[J].Physical Review E,2007,76(3):036106.
[51]Prat-Pérez A,Dominguez-Sal D,Larriba-Pey J L.High Quality,Scalable and Parallel Community Detection for Large Real Graphs[C]//Proceedings of the 23rd International Conference on World Wide Web.New York:ACM,2014:225-236.
[52]Kumpula J M,Kivel M,Kaski K,et al.Sequential Algorithm for Fast Clique Percolation[J].Physical Review E,2008,78(2):026109.
[53]Tsourakakis C,Bonchi F,Gionis A,et al.Denser Than the Densest Subgraph:Extracting Optimal Quasi-cliques with Quality Guarantees[C]//Proceedings of the 19th International Conference on Knowledge Discovery and Data mining.New York:ACM,2013:104-112.
[54]Blondel V D,Guillaume J,Lambiotte R,et al.Fast Unfolding of Communities in Large Networks[J].Journal of Statistical Mechanics:Theory and Experiment,2008,2008(10):P10008.
[55]劉自強(qiáng),王效岳,白如江.語(yǔ)義分類的學(xué)科主題演化分析方法研究——以我國(guó)圖書情報(bào)領(lǐng)域大數(shù)據(jù)研究為例[J].圖書情報(bào)工作,2016,60(15):76-85,93.
[56]朱夢(mèng)嫻,程齊凱,陸偉.基于社會(huì)網(wǎng)絡(luò)的學(xué)科主題聚類研究[J].情報(bào)雜志,2012,31(11):40-44,39.
[57]Guimera R,Sales-Pardo M,Amaral L A N.Classes of Complex Networks Defined By Role-to-role Connectivity Profiles[J].Nature Physics,2006,3(1):63.
[58]程齊凱,王曉光.一種基于共詞網(wǎng)絡(luò)社區(qū)的科研主題演化分析框架[J].圖書情報(bào)工作,2013,57(8):91-96.
[59]Cui P,Zhang W.Co-word Analysis of Domestic Network Virtual Society Research Hotspots and Evolution[C]//International Conference on Management of E-commerce & E-government.Piscataway,NJ:IEEE,2012.
[60]王宇燦,李一飛,袁勤儉.國(guó)際大數(shù)據(jù)研究熱點(diǎn)及前沿演化可視化分析[J].工程研究-跨學(xué)科視野中的工程,2014,6(3):282-293.
[61]Li W,Liu Y,Xiao S,et al.An Investigation of the Underlying Evolution of Shale Gas Researchs Domain Based on the Co-Word Network[J].Sustainability,2018,10(1).
[62]Sohn E,Noh K,Lee B,et al.Bibliometric Network Analysis and Visualization of Research and Development Trends in Precision Medicine[C]//2018 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining(ASONAM).Piscataway,NJ:IEEE,2018:727-730.
[63]Cobo M J,López-Herrera A G,Herrera-Viedma E,et al.An Approach for Detecting,Quantifying,and Visualizing the Evolution of a Research Field:A Practical Application to the Fuzzy Sets Theory Field[J].Journal of Informetrics,2011,5(1):146-166.
[64]尋醫(yī)問藥網(wǎng).關(guān)于我們[EB/OL].http://www.xywy.com/about/index.html,2018-10-21.
[65]劉知遠(yuǎn),孫茂松.漢語(yǔ)詞同現(xiàn)網(wǎng)絡(luò)的小世界效應(yīng)和無標(biāo)度特性[J].中文信息學(xué)報(bào),2007,(6):52-58.
[66]張斌.共詞網(wǎng)絡(luò)的結(jié)構(gòu)與演化:概念與理論進(jìn)展[J].情報(bào)雜志,2014,33(7):103-109.
[67]Albert R,Barabási A L.Statistical Mechanics of Complex Networks[J].Reviews of Modern Physics,2002,74(1):47-97.
[68]Watts D J,Strogatz S H.Collective Dynamics of‘SmallworldNetworks[J].Nature,1998,393(6684):440-442.
[69]周云龍.復(fù)雜網(wǎng)絡(luò)平均路徑長(zhǎng)度的研究[D].合肥:合肥工業(yè)大學(xué),2013.
[70]胡佳卉.基于信息處理的中醫(yī)藥治療Ⅱ型糖尿病方藥數(shù)據(jù)挖掘與分析研究[D].北京:北京中醫(yī)藥大學(xué),2017.
[71]世界衛(wèi)生組織.2016年世界衛(wèi)生日宣傳活動(dòng)[EB/OL].https://www.who.int/campaigns/world-health-day/2016/zh/,2018-11-23.
[72]新華網(wǎng).貴州省首個(gè)基層糖尿病眼底篩查防控平臺(tái)揭牌[EB/OL].http://www.gz.xinhuanet.com/2019-03/16/c_1124241961.htm,2019-03-19.
(責(zé)任編輯:孫國(guó)雷)