韋可盤 何旻 郭家泰
摘 要:藥物濫用現(xiàn)象現(xiàn)如今已經(jīng)成為世界一個(gè)不可忽視的重大社會問題,如果不及時(shí)采取一些必要的措施,將在全球的部分地區(qū)爆發(fā)阿片類藥物濫用危機(jī)。針對這類問題,我們先使用多項(xiàng)式回歸的方法,借助支持向量機(jī)確定了多項(xiàng)式具體參數(shù),從而預(yù)測了各個(gè)縣阿片類藥物濫用率。
關(guān)鍵詞:多項(xiàng)式回歸;支持向量機(jī);阿片類藥物濫用傳播
阿片類藥物是治療中度至重度疼痛的最有效方法,并且已被世界衛(wèi)生組織認(rèn)可為癌癥疼痛的常規(guī)治療方法。然而,近年來阿片類藥物在治療慢性非癌性疼痛中的應(yīng)用一直存在爭議。隨著阿片類藥物使用的增加,濫用造成的社會問題在世界上也變得更加突出。
1 問題分析
首先,通過使用獲得的數(shù)據(jù),我們需要建立一個(gè)數(shù)學(xué)模型,描述美國五個(gè)州與其縣之間的合成阿片類藥物和海洛因事件的傳播和特征并 確定可能已開始使用特定阿片類藥物的五個(gè)州中的任何可能位置。然后考慮一下美國政府應(yīng)該關(guān)注的具體問題。其次,考慮各縣的多維指標(biāo),全面分析藥物濫用的深層原因和影響,完善我們之前建立的模型。
藥物濫用擴(kuò)散和預(yù)測模型。通過調(diào)查每個(gè)縣的人口并估算阿片類藥物濫用的比例。首先從數(shù)據(jù)中篩選出來幾個(gè)阿片類藥物濫用現(xiàn)象十分嚴(yán)重的縣,以協(xié)助建立模型。我們發(fā)現(xiàn)隨著時(shí)間的推移,合成阿片類藥物和海洛因事件的傳播與傳染病非常相似,藥物上癮治療后仍有可能復(fù)發(fā),因此首先選擇擴(kuò)散模型來模擬藥物濫用的傳播并預(yù)測危機(jī)。通過多項(xiàng)式回歸方法預(yù)測了由模型計(jì)算的擴(kuò)散閾值,以及幾個(gè)具有高阿片類藥物濫用率的縣的發(fā)展趨勢。最后,通過軟件模擬傳輸過程。
2 模型建立
我們建立了具有免疫消除和飽和感染的藥物濫用傳播模型。[3]
dSdt=βSI1+1αS-θS+ωRdIdt=βSI1+1αS-rIdRdt=rI+θS-ω
通過計(jì)算上述模型的全局穩(wěn)定性,藥物濫用率的臨界閾值可確定為10%。當(dāng)藥物濫用率在一段時(shí)間內(nèi)低于臨界閾值時(shí),該領(lǐng)域的藥物濫用將逐漸減少。[1,2] 當(dāng)藥物濫用率在一定時(shí)間內(nèi)達(dá)到并超過臨界閾值時(shí),藥物濫用現(xiàn)象將在短時(shí)間內(nèi)爆發(fā),形成藥物濫用危機(jī)。
在確定藥物濫用的臨界閾值后,考慮到每個(gè)縣的藥物濫用率和時(shí)間變量之間的非線性關(guān)系,我們選擇使用多項(xiàng)式來計(jì)算五個(gè)縣中每個(gè)縣的藥物濫用率。在確定擬合多項(xiàng)式的階常數(shù)的過程中,我們選擇支持向量機(jī)來確定最優(yōu)情況。支持向量機(jī)(SVM)在解決小樣本,非線性和高維模式識別方面具有許多獨(dú)特的優(yōu)勢。它可以應(yīng)用于其他機(jī)器學(xué)習(xí)問題,如功能配置。我們最終決定使用最小二乘SVM(LS-SVM)來求解參數(shù)對于軟邊距SVM。[4]
3 模型測試
通過使用我們的模型計(jì)算閾值并預(yù)測在開始時(shí)選擇的具有高阿片類藥物濫用率的幾個(gè)縣如果我們確定的模式和特征繼續(xù)存在,那么美國政府應(yīng)該有以下問題:
(1)隨著阿片類藥物使用的增加,藥物濫用和濫用造成的社會問題將發(fā)生在美國的各個(gè)地區(qū):我們的模型預(yù)測,如果美國政府不采取任何有效的措施來防止藥物濫用,大約50年之后。美國本土85%左右的地區(qū)將發(fā)生藥物濫用危機(jī)。
(2)那些已經(jīng)吸毒成癮的人可能無法通過合法手段獲得止痛藥或替代藥物。這種需求可能被迫進(jìn)入地下,并將在一定程度上助長毒品走私的蔓延。
(3)藥物濫用危機(jī)正在美國本地蔓延,鄰國也在蔓延。我們的模型預(yù)測,如果不采取任何措施,50年后,受美國毒品危機(jī)感染的國家數(shù)量將達(dá)到25個(gè)左右。
4 模型優(yōu)化
在第一部分中,預(yù)測和傳播模型只是根據(jù)數(shù)值變化的趨勢進(jìn)行預(yù)測,而不考慮實(shí)際中的許多因素。實(shí)踐中,如果我們了解影響變化趨勢的因素,我們只能制定相關(guān)策略并解決相關(guān)問題。因此,我們開始使用2010-2016年間各種實(shí)際影響指標(biāo)來衡量其對藥物濫用傳播的影響。第二部分的原始數(shù)據(jù)包含每年每個(gè)縣500多個(gè)統(tǒng)計(jì)指標(biāo)。不能直接使用,主要有三個(gè)問題:數(shù)據(jù)格式不正確;數(shù)據(jù)丟失;統(tǒng)計(jì)指標(biāo)太多最終選擇基于模型的統(tǒng)計(jì)方法與隨機(jī)森林進(jìn)行特征選擇。在完成數(shù)據(jù)的清理和填充之后,我們還需要在數(shù)據(jù)中添加標(biāo)簽欄,以區(qū)分藥物濫用和正常使用藥物的縣。之后,原始數(shù)據(jù)成為典型的分類問題數(shù)據(jù)集。我們使用隨機(jī)森林來訓(xùn)練和找到相關(guān)的主要特征。
通過分析2010-2016年影響因素的特征,我們發(fā)現(xiàn)以下因素對藥物濫用的傳播有影響:人口的教育水平;家庭結(jié)構(gòu);文化背景。
5 結(jié)語
阿片類藥物危機(jī)已經(jīng)成為世界一個(gè)急需解決的問題。我們通過數(shù)據(jù)分析,以解決問題為導(dǎo)向,建立了模擬預(yù)測模型。通過使用該模型,能有效模擬藥物濫用實(shí)際情況。但模型仍然有改進(jìn)的地方:我們的模型沒有引入反饋機(jī)制。在預(yù)測過程中,精確度可能會在一段時(shí)間后降低。該模型不適用于一些嘈雜的分類或回歸問題。
參考文獻(xiàn):
[1]徐為堅(jiān).具有免疫接種及飽和傳染率的傳染病SIRS模型[J].玉林師范學(xué)院學(xué)報(bào),2007,28(5).
[2]朱春娟,原三領(lǐng).具有免疫具有飽和傳染率,免疫接種和垂直傳染的SIR傳染病模型的穩(wěn)定性[J].數(shù)學(xué)的實(shí)踐與認(rèn)識,2015,45(13).
[3]史銳峰劉迎東.具有擴(kuò)散項(xiàng)SIRS模型常數(shù)平衡解的全局穩(wěn)定性[J].北京交通大學(xué)學(xué)報(bào),2006,30(6).
[4]杰克.范德普拉斯.python數(shù)據(jù)科學(xué)手冊[M].北京:人民郵報(bào)出版社,2018.
新