• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      miRNA與疾病關(guān)系中分類預(yù)測(cè)方法研究

      2017-07-29 22:49:28孫華張燕施偉
      電腦知識(shí)與技術(shù) 2017年12期
      關(guān)鍵詞:支持向量機(jī)

      孫華 張燕 施偉

      摘要:由于miRNA的復(fù)雜性,只在調(diào)控時(shí)袁征出來(lái),因此對(duì)于miRNA的識(shí)別工作難度很大。事實(shí)上,在miRNA分類問(wèn)題中,有多種分類方法,如支持向量機(jī)、馬爾科夫鏈模型、非負(fù)矩陣分解、KNN算法等,該文對(duì)前期研究報(bào)告中用到的分類方法做比較,找出各類方法的特點(diǎn)及使用環(huán)境,為后續(xù)研究做準(zhǔn)備。

      關(guān)鍵詞:miRNA;支持向量機(jī);馬爾科夫鏈模型;非負(fù)矩陣分解;KNN算法

      miRNA是真核生物中的一組內(nèi)源性非編碼序列RNA分子,個(gè)體很小,只有不到24m,因?yàn)殡y被發(fā)現(xiàn),所以也被稱為真核生物體內(nèi)的“暗物質(zhì)”。但它能在細(xì)胞發(fā)育、生物細(xì)胞的凋亡與增殖,器官形成過(guò)程中起重要作用,具備調(diào)控功能。因此,miRNA的研究對(duì)疾病防治以及生物進(jìn)化等都具有重要意義。也因此有越來(lái)越多的生物學(xué)家對(duì)miRNA在各種疾病的診斷和治療等方面的應(yīng)用寄予了極高的期望。對(duì)于miRNA的識(shí)別主要有兩個(gè)階段:尋找有效的特征選擇方法一尋找分類效率高的分類器。以下就對(duì)目前研究識(shí)別工作的分類器進(jìn)行一一比較。

      1支持向量機(jī)(SVM)方法

      發(fā)現(xiàn)miRNA的方法主要有計(jì)算預(yù)測(cè)和eDNA克隆測(cè)序兩種,支持向量機(jī)(SVM)法已經(jīng)被廣泛應(yīng)用在miRNA預(yù)測(cè)中,通過(guò)合理的特征提取與編碼,SVM分類器可以達(dá)到較高的分類精度,但以往的模型通過(guò)單物種的miRNA序列或前體序列建立模型,在對(duì)其他物種的預(yù)測(cè)中分類精度往往會(huì)有所降低,并且沒(méi)有形成一套從前體結(jié)構(gòu)預(yù)測(cè)到成熟miRNA預(yù)測(cè)的完整流程。2012年孫超等人基于支持向量機(jī)分類算法的番茄miRNA預(yù)測(cè),利用SVM方法構(gòu)建sly_pre_SVM模型和sly_SVM模型,并以已發(fā)現(xiàn)的miRNA特征為基礎(chǔ),預(yù)測(cè)番茄前體miRNA序列和成熟miRNA序列。研究miRNA特征向量的編碼、miRNA特征選擇和參數(shù)的優(yōu)化。從測(cè)試集的分類精度、敏感性和特異性上看,分別達(dá)到99.69%、100%和99.66%。

      另外,馬靜等人基于數(shù)據(jù)不平衡的方法預(yù)測(cè)miRNA,文中提出了綜合SVM-RFE和RelieW兩種特征的選擇方法,在每次迭代過(guò)程中,參照特征的評(píng)價(jià)標(biāo)準(zhǔn),利用ReliefF算法計(jì)算的特征權(quán)重值,同時(shí),利用SVM-RFE算法刪除冗余特征,并對(duì)特征子集的樣本集合使用K折交叉驗(yàn)證方法,最終從準(zhǔn)確率最高的集合中選擇最優(yōu)特征子集。

      2隱馬爾科夫鏈(HMM)模型

      高松等人研究指出,傳統(tǒng)的HMM方法最大的優(yōu)點(diǎn)是有可靠的概率統(tǒng)計(jì)理論,但也存在缺陷,如一階HMM無(wú)法表示遠(yuǎn)距離的依賴關(guān)系,從而忽略了部分有用的統(tǒng)計(jì)特征。因此,他們提出采用高階HMM方法,并對(duì)方法做出改進(jìn),提出“前向一后向”算法和Baum-Weleh訓(xùn)練算法使得模型更易于理解和實(shí)現(xiàn)。

      劉麗云等人研究針HMM,指出高階馬爾科夫鏈模型存在維數(shù)多和存儲(chǔ)量大的缺點(diǎn),并提出可變長(zhǎng)的馬爾科夫鏈模型,用于預(yù)測(cè)可趨近交互位點(diǎn)的算法。該算法通過(guò)比對(duì)原miRNA和可趨近性的miRNA位點(diǎn),從而形成具有二聚體的新序列。新序列中對(duì)不同的堿基配采用不同的符號(hào),以代表不同類型。再用可變長(zhǎng)HMM模擬新序列,并在概率后綴樹上加入平滑化技術(shù)改進(jìn)模型。通過(guò)比較正、負(fù)分類上新序列概率的大小判斷新序列所屬類別。

      Wei Shen等人提出基于二級(jí)結(jié)構(gòu)模式的固定階馬爾可夫模型方法對(duì)mieroRNA進(jìn)行預(yù)測(cè),建立了一個(gè)閥桿凸出間隙符號(hào)描述發(fā)夾的二級(jí)結(jié)構(gòu),成功地從發(fā)夾序列直接實(shí)現(xiàn)了成熟miRNAs的全功能識(shí)別。

      3非負(fù)矩陣分解算法

      2013年尤燕玲等人利用非負(fù)矩陣分解算法和粒子群優(yōu)化算法對(duì)miRNA與基因的互作關(guān)系展開了深入的探索。他們的研究得出了50對(duì)新的miRNA與基因互作關(guān)系對(duì),并對(duì)這50個(gè)關(guān)系對(duì)的生物學(xué)意義做部分闡述。具體做法是:在給定的基因與基因互作數(shù)據(jù),及已知的miRNA與基因互作關(guān)系上,同時(shí)用收斂圖檢測(cè)算法的收斂有效性;同時(shí),考慮到非負(fù)矩陣分解算法在對(duì)miRNA與基因整合時(shí),并沒(méi)有注意到基因與miRNA互作關(guān)系的生物學(xué)統(tǒng)計(jì)意義。因此,引入粒子群優(yōu)化算法,對(duì)非負(fù)矩陣分解算法中的目標(biāo)函數(shù)參數(shù)值進(jìn)行優(yōu)化,并以miRNA與基因數(shù)據(jù)矩陣的皮爾森系數(shù)值作適應(yīng)值。

      4混合分類器

      2016年梅端等人提出一種改進(jìn)的SVM算法對(duì)miRNA表達(dá)譜的分析,文章提出了一種新的數(shù)據(jù)挖掘算法——SVM-KNN.該算法的思想是:首先采用統(tǒng)計(jì)量法對(duì)該數(shù)據(jù)集進(jìn)行特征初選,其次將融合了支持向量機(jī)和k-最近鄰判別法思想的SVM-KNN算法作為分類器,最后輸出分類結(jié)果,SVM-KNN分類器的分類效果,比分另4單獨(dú)運(yùn)行SVM-KNN分類器和SVM-KNN分類器的分類效果都要好㈣。

      5小結(jié)

      miRNA的研究仍有許多問(wèn)題需要解決,目前所采用的支持向量機(jī)、馬爾科夫鏈模型、非負(fù)矩陣分解、KNN算法等熱點(diǎn)分類方法,在識(shí)別過(guò)程中起著重要作用,但仍然有很多不足,如數(shù)據(jù)的單一值特征選取,生物數(shù)據(jù)庫(kù)的基因組、代謝基因組、蛋白質(zhì)組數(shù)據(jù)多特征分類,還有很大的研究空間。

      猜你喜歡
      支持向量機(jī)
      基于支持向量回歸機(jī)的電能質(zhì)量評(píng)估
      基于智能優(yōu)化算法選擇特征的網(wǎng)絡(luò)入侵檢測(cè)
      數(shù)據(jù)挖掘技術(shù)在電廠經(jīng)濟(jì)性分析系統(tǒng)中的應(yīng)用Q
      基于改進(jìn)支持向量機(jī)的船舶縱搖預(yù)報(bào)模型
      基于SVM的煙草銷售量預(yù)測(cè)
      動(dòng)態(tài)場(chǎng)景中的視覺(jué)目標(biāo)識(shí)別方法分析
      論提高裝備故障預(yù)測(cè)準(zhǔn)確度的方法途徑
      基于熵技術(shù)的公共事業(yè)費(fèi)最優(yōu)組合預(yù)測(cè)
      基于支持向量機(jī)的金融數(shù)據(jù)分析研究
      管理類研究生支持向量機(jī)預(yù)測(cè)決策實(shí)驗(yàn)教學(xué)研究
      考試周刊(2016年53期)2016-07-15 09:08:21
      正定县| 呈贡县| 辽宁省| 静宁县| 昭通市| 海晏县| 宣恩县| 航空| 天水市| 临清市| 仙居县| 安西县| 安吉县| 平阳县| 宁都县| 朝阳县| 深水埗区| 乌什县| 德兴市| 迭部县| 沭阳县| 乌鲁木齐县| 博白县| 六盘水市| 丹棱县| 沈丘县| 托克托县| 墨江| 盱眙县| 兴业县| 嵊泗县| 达尔| 缙云县| 库车县| 普陀区| 达孜县| 金山区| 青海省| 阜平县| 三江| 三门县|