• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    高錯誤率長序列的高敏感度比對

    2020-12-10 10:05:38羅賢橦
    小型微型計算機系統(tǒng) 2020年11期
    關鍵詞:查全率錯誤率基因組

    羅賢橦,鐘 誠,黎 瑤

    (廣西大學 計算機與電子信息學院 廣西高校并行分布式計算技術重點實驗室,南寧 530004)

    1 引 言

    以單分子實時測序技術(SMRT)[1]和Oxford Nanopore技術(ONT)[2]為代表的第三代測序平臺(Third Generation Sequencing,TGS)極大地降低了測序的成本[3],可以解決人類基因組中具有復雜區(qū)域的測序問題[4].另一方面,第三代測序平臺產(chǎn)生錯誤率超過15%、長度超過10k bp的長序列.測序序列長度的增加,使得一個長序列中可能包含一個完整的結構變異區(qū)域,序列比對問題從僅需要處理較短長度的錯誤(例如SNP錯誤和較短的“indel”錯誤),演變到需要處理較長的結構變異(轉置、易位、重復和長度超過50bp的“indel”)錯誤,從而增加了序列比對的難度,降低了序列比對的敏感度.

    針對這類錯誤率較高且包含錯誤類型較復雜的長序列比對方法有BWA-MEM[5]、BLASR[6]、Kart[7]、YAHA[8]、LAMSA[9]、Minimap2[10]和LordFAST[11]等.以BWA-MEM[5]、Kart[7]和Minimap2[10]為代表的長序列比對算法使用了雙端映射(paired-end mapping,PEM)的方法,它依賴于精確匹配將種子定位到結構變異錯誤的任意一側,且將種子擴展到序列全部堿基.第三代測序數(shù)據(jù)中的高錯誤率會導致比對算法難以找到長度較長的精確匹配,且序列長度的增長將會導致產(chǎn)生許多假陽性的較短的精確匹配結果,這將影響種子搜索的效率以及長序列比對的敏感度和查全率.隨著第三代測序技術的發(fā)展和序列組裝算法的改進[12],分割序列映射(split-read mapping,SRM)[8]成為長序列比對的一種有效策略.它更易于發(fā)現(xiàn)序列中的結構變異錯誤,且可在比對過程中減少結構變異錯誤對比對結果的影響.比對方法STAR[13]、YAHA[8]、LAMSA[9]、LordFAST[11]采用了該種策略.其思想是:首先將長序列分割成等長的若干片段,并將片段映射到參考基因組,生成片段定位的侯選位置,然后以片段侯選位置為依據(jù),根據(jù)片段間可能存在的“錯誤”關系將片段侯選位置依次連接起來,從而獲得長序列的比對結果.其中片段定位的過程將片段與參考基因比對,生成一組滿足給定編輯距離的片段侯選位置.這些比對算法在處理高錯誤率的長序列比對時,查全率有所降低,且對錯誤率高的真實數(shù)據(jù)集比對的敏感度較低.

    為解決現(xiàn)有序列比對算法對長度更長、錯誤率更高的第三代測序數(shù)據(jù)比對敏感度不夠高的問題,本文研究使用對高編輯距離閾值更敏感的基于Hash索引的變長種子擴展方法,通過在種子驗證階段特殊處理新型錯誤“均聚物”[14],以提高算法對第三代測序長序列比對的查全率,在連接序列片段前,加入對片段侯選位置的質(zhì)量評估,以過濾質(zhì)量不高的侯選位置、提高連接效率,且在連接片段候選位置時,對不同錯誤類型賦予不同罰分,計算比對相似度,以減少假陽性的結果,獲得高準確度和提高敏感度.

    2 方 法

    將高錯誤率長序列與參考基因組進行比對的第一步是將每條長序列劃分為若干較短的片段.第二步以基于Hash索引的變長種子擴展算法定位序列片段在參考基因組中的候選位置,在種子驗證過程中將連續(xù)“插入刪除”相同堿基錯誤所帶來的編輯距離設置為1,使種子擴展算法可以有效處理第三代測序長序列中的新類型錯誤“均聚物”[14],以使得片段定位時可提升查全率;采用全映射比對思想,尋找所有滿足編輯距離閾值的片段侯選位置.第三步連接序列片段的侯選位置,對片段侯選位置進行評分,以去除質(zhì)量不高的侯選位置,然后將片段連接以構建長序列比對結果的基本骨架.第四步,補全片段間的空隙,在補全過程中引入Z-drop[5]方法,以避免連接兩條不相關的片段而帶來的假陽性結果.本文給出的基于分割-全映射-篩選-連接-補全的高錯誤率長序列比對方法的執(zhí)行過程如圖1所示.

    下面詳細地闡述基于分割-全映射-篩選-連接-補全的高錯誤率長序列比對方法.

    2.1 片段定位

    已有的種子擴展方法被設計用于長度較短且錯誤率較低的短序列比對(short-read alignment)[15].這類種子擴展方法一般采用BWT索引結構[16]或FM索引結構[17]儲存參考基因組序列信息,這兩種索引結構沒有存儲全部的序列信息.因此,對于高編輯距離閾值的比對敏感度較低.為了提升對高編輯距離閾值的序列比對的敏感度,本文采用對編輯距離閾值更加敏感的Hash索引結構[18],通過儲存參考基因組的k階子串k-mers出現(xiàn)的所有位置,來實現(xiàn)快速搜索大量的序列[22].與BWT[16]、FM-index[17]等索引機制相比,Hash索引對高編輯距離閾值和長度更長的序列比對具有更高的敏感度,可以找到更多的符合閾值的比對結果.但隨著編輯距離閾值的增大,會出現(xiàn)更多的假陽性的侯選位置,此外,Hash索引結構的不足是難以處理序列中存在的“插入刪除(indel)”錯誤.為解決上述問題,本文采用變長種子選擇算法[19,20]處理“插入刪除(indel)”錯誤,且在種子驗證過程中,將連續(xù)“插入刪除”多個相同堿基的錯誤的編輯距離設置為1,以使得在種子擴展時可以處理第三代測序長序列存在的新型“均聚物”錯誤[14],同時采用附加k-mer算法[21]去除可能產(chǎn)生的假陽性錯誤.

    圖1 基于分割-全映射-篩選-連接-補全的高錯誤率長序列比對過程Fig.1 Process of aligning long reads with high error rate based on split-all mapping-filter-linking-completion

    2.1.1 變長種子生成

    與第二代測序數(shù)據(jù)主要存在“替換”錯誤相比,第三代測序數(shù)據(jù)中存在的錯誤類型還有“插入刪除”錯誤,以往使用漢明距離確定種子候選位置的方式,并不適用于第三代測序數(shù)據(jù).為使得比對算法既支持處理“替換”錯誤,又支持處理“插入刪除”錯誤,本文采用可以處理“插入刪除”錯誤的變長種子篩選方法[19,20],并執(zhí)行附加k-mer算法[21]以去除假陽性的侯選位置.

    設測序序列片段和參考基因組之間允許的編輯距離為e,根據(jù)鴿巢原理[5],則至少選取序列片段的e+1個非重疊的k-mers,才能確保至少有一個k-mer與參考基因組的精確匹配是正確的.因此,通過將一組e+1個不重疊的固定長度的k-mer與參考基因組比對,即可獲得一組侯選位置集合Seed.為了使得算法可以處理“插入刪除”錯誤,采用充分利用不重疊的k-mer之間堿基的變長種子算法,通過將固定長度k-mer進行擴展,獲得一組新的變長種子侯選位置集合BSeed.在擴展時為了提高侯選位置驗證階段的效率,優(yōu)先擴展出現(xiàn)頻率較高的k-mer,以降低變長種子候選集BSeed中候選位置的數(shù)量.經(jīng)過這樣處理,可以最大程度地利用待比對片段上的所有堿基進行種子的生成,使得算法可以處理“插入刪除”錯誤,提高片段比對的準確度.圖2展示了一組3-mer的變長種子的生成過程實例,其中圖2(a)展示找到一組不重疊的固定長度的k-mer與參考基因組進行精確匹配所獲得的一組侯選位置,其中3-mer GGG在參考基因組中有5個侯選位置.圖2(b)展示對固定長度的k-mer進行擴展,通過將3-mer GGG擴展為GAGGG,得到長度為5的精確匹配,獲得一組假陽性較少的侯選位置.

    圖2 變長種子生成過程實例Fig.2 Example of generating variable-length seeds

    同時,為增加種子定位的準確度,采用附加k-mer的方法[21],將選取比對片段的e+2個非重疊的k-mers,作為一組候選種子,以確保其中至少有2個k-mer與參考基因組的精確匹配是正確的,進一步減少假陽性的種子侯選位置.

    2.1.2 種子驗證

    在確定候選位置之后,對種子候選位置進行驗證,僅保留所有滿足編輯距離閾值小于等于e的侯選位置,作為最終的片段位置.第三代測序平臺產(chǎn)生的測序數(shù)據(jù)中可能含有新型的 “均聚物”錯誤[16],即出現(xiàn)連續(xù)“插入或刪除多個相同堿基”的錯誤.當遇到這種錯誤時,驗證操作會將原本定位正確的種子過濾掉,從而降低比對的查全率.針對這種新類型的錯誤,本文方法在驗證種子時,將“連續(xù)插入或刪除同一個堿基的錯誤”作為一個編輯錯誤處理,即在驗證種子階段,當發(fā)現(xiàn)連續(xù)出現(xiàn)相同堿基的“插入/刪除“錯誤時,則將其編輯距離定義為1,即將該種錯誤所造成的不匹配作為1個編輯操作,以增加片段定位的查全率,從而提升長序列比對的敏感度.

    2.2 骨架構建

    2.2.1 篩選片段侯選

    在種子定位過程中,通過增大編輯距離來增加序列片段的比對侯選位置數(shù)量,這將導致假陽性侯選位置增多.因此,在骨架構建之前,對片段侯選位置進行篩選,以去除質(zhì)量不高的序列片段比對的結果.

    對于含有許多重復的相同堿基的序列片段,將其定位到同樣具有大量重復相同堿基的參考基因組(例如人類基因組)位置上,會導致將片段定位到參考基因組中多個基因的多個不同位置上.這種片段定位得到的比對結果質(zhì)量不高,會造成最終比對的假陽性結果的上升,從而影響最終比對準確度.通過統(tǒng)計長序列分割出的片段侯選位置,可以計算得到片段Pi的比對質(zhì)量:

    (1)

    其中sumi為片段Pi的全部比對結果數(shù)量,sij為片段Pi在參考基因組中第j條參考基因上的比對結果數(shù)量.當Qi小于給定閾值時,舍棄該片段在第j條參考基因的比對結果.

    2.2.2 片段連接

    根據(jù)片段間的相互關系,將篩選后的片段進行連接,以進一步減少片段定位候選區(qū)域中的假陽性區(qū)域.從序列P0開始依次將片段的侯選位置Mi與其之前所有已連接的片段相連接,選取其中連接得分最高的連接結果,作為Mi的連接得分f(i),直至所有侯選位置均被連接到至少一條骨架上為止.本文改進后的連接得分f(i)的計算公式如下:

    (2)

    其中scorei為片段的侯選位置Mi與參考基因組的匹配得分,f(j)是片段Pj之前的j-1條片段的候選位置的連接得分,a(j,i)是片段Pi與它相連的片段Pj之間的關系罰分.測序序列共存在4種錯誤情況(如圖3所示):

    4)當Mi與Mj在參考基因組上的匹配方向相反時,片段Mi與Mj之間存在轉置錯誤;其中ε是用于計算“插入刪除”錯誤長度的參數(shù),τ,θ是用于計算給定“復制”結構變異錯誤長度的參數(shù)[9].

    圖3 測序序列的4種錯誤類型Fig.3 Four error types of sequencing sequences

    將所有測序序列片段侯選位置連接生成一個有向無環(huán)圖(DAG),從圖的起點到終點的一條路徑,即為一條長序列比對的連接結果,將生成的所有連接的得分進行排序,找到連接得分較大排序在前面的那些連接結果.

    2.3 空隙填補

    當片段連接完成后,對每條長序列的前幾個連接結果執(zhí)行最終比對.為了完成候選區(qū)域的堿基到堿基的對準,它以連接得分從高到低將連接好的片段之間的空隙進行匹配,匹配過程使用動態(tài)規(guī)劃全局比對方法[23],將序列片段間的堿基一一對應到參考基因組侯選位置上.設定閾值,當兩個片段對準得分(匹配為0,不匹配為-1)超過閾值時,則認為該條連接結果無效,這樣減少將兩個不相關的片段連接到一起而得到假陽性的連接結果.

    長序列比對算法主要由兩大部分工作組成,第一部分工作為分割序列及片段定位,通過將長序列分割為若干片段,以更快地得到較短的精確匹配的種子,對種子進行驗證,得到所有滿足編輯距離閾值的片段侯選位置.第二部分工作首先通過片段質(zhì)量評分,去除質(zhì)量不高的片段候選位置,通過片段間的連接關系去除假陽性片段侯選位置,以確保比對結果的準確度.詳細比對過程如算法1所示.

    算法1.基于分割-全映射-過濾-連接-補全的比對算法

    輸入:編輯距離閾值e,測序序列ri,i=0,1,…,rnum

    輸出:序列ri比對結果Si,i=,1,…,rnum

    1.Begin

    2.fori=1 tornumdo

    3. 將序列ri以固定間距l(xiāng)en分割為n個片段P1,…,Pn;

    4.forj=1tondo

    //找到所有滿足編輯距離閾值e的片段候選位置選擇

    //Pj的e+2個非重疊k-mer作為變長種子侯選集Seed;

    5.Seed[1].start←1;//種子的起始位置

    6.Seed[e].end←|Pj|-1;//種子的結束位置

    7.fork=1toe+2do

    //將e+2個種子中出現(xiàn)最多的種子擴展,f為種子出現(xiàn)數(shù)

    8.ifSeed[k].f>=Seed[k-1].fthen

    9.Seed[k].start←Seed[k-1].end+1;

    10.else

    11.Seed[k-1].end←Seed[k].start-1;

    12.endif

    13.endfor

    14.BSeed←Seed[1:e+2];

    //將擴展后的種子Seed[1..e+1]作為新侯選集BSeed

    //在Hash索引中搜索BSeed中所有種子的位置,將其存

    //入片段侯選位置List[1..num]中

    15.forl=1tonumdo

    //驗證侯選位置,篩選出符合編輯距離e的侯選位置

    16.edit←0;

    17.forp=1tolendo//驗證

    18.if片段中第p位堿基與參考基因中List[l]+p和List[l]+p-1位堿基均不同then

    19.edit←edit+1;

    20.endif

    21.endfor

    22.endfor

    23. Ifedit<=ethen//編輯距離小于閾值

    24.scorei←|Pj|-edit;

    26.endif

    27.endfor

    28.fork=1 tondo

    //統(tǒng)計Pk在參考基因j上的候選位置數(shù)量sij

    29.sumk←0;//篩選過程sumk為片段候選結果

    30.forj=1 to mdo

    31.sumk←sk+sij;

    32.endfor

    33.ifskj/sumk

    34. 舍棄Pk中所有在參考基因j上的比對結果

    35.endif

    36.endfor

    37.forl=1 tomdo

    //遍歷所有片段,連接侯選位置Mi生成無環(huán)圖

    //計算候選位置Ml的最佳連接得分

    39.endfor

    40.根據(jù)連接得分將ri的所有連接結果進行排序;

    41.選擇得分最高的前幾個連接結果進行片段間的空隙填補,計算序 列ri與參考基因組的匹配得分;

    42.將填補后的序列匹配得分排序;

    43.將最高匹配得分的結果序列在參考基因組上的起始位置,作為序 列ri最終的比對結果集合S;

    44.endfor

    45.end

    與同類的序列比對算法LAMSA[9]和LordFAST[11]相比,本文算法采用對高編輯距離更敏感的Hash索引結構存儲參考基因組,在定位序列分割片段時,通過變長種子算法[13]使得基于Hash索引的種子擴展可以處理“插入刪除(indel)”錯誤的編輯距離,且將“連續(xù)插入/刪除多個相同堿基”錯誤作為1個編輯距離,處理第三代測序序列特有的新型“均聚物”錯誤,以獲得更全的片段侯選位置,確保片段定位的查全率,根據(jù)片段間的關系過濾掉片段定位侯選位置中的假陽性結果,在確保比對準確度的同時,提升查全率和敏感度.

    3 實 驗

    實驗使用的計算機為4核Intel(r)Xeon CPU E5-2600 V2處理器、內(nèi)存容量128GB.運行操作系統(tǒng)Ubuntu 16.04.采用C語言編程實現(xiàn)算法.通過網(wǎng)站NCBI(1)https://www.ncbi.nlm.nih.gov/home/download/下載了公共的人類基因組數(shù)據(jù)集hg19進行比對實驗.

    3.1 模擬數(shù)據(jù)實驗

    模擬實驗數(shù)據(jù)采用Wgsim(2)https://github.com/lh3/wgsim以人類基因組hg19作為參考基因組生成錯誤率分別為5%和10%的模擬序列數(shù)據(jù),采用PBsim[23]以hg19作為參考基因組生成錯誤率分別為15%、20%和25%的含有“插入刪除”和結構變異錯誤的長度大于等于5000bp的模擬序列.

    對于生成的每條模擬序列,Wgsim和PBsim[23]都提供了模擬序列在參考基因組上的映射位置.一個模擬序列在參考基因組上的“真正”映射位置是已知的,當比對序列得出的比對位置與其模擬映射位置差值在30bp以內(nèi),則認定為該序列被比對到參考基因組中正確的位置上[7].

    序列比對準確度precision和查全率recall的計算[24]:

    (3)

    (4)

    其中TP為正確映射到參考基因上的序列數(shù)量,RN為被映射到參考基因組的序列數(shù)量,N為參加映射比對的序列數(shù)量.

    在模擬數(shù)據(jù)上的實驗主要是為了評估序列比對算法的準確度和查全率.隨著測序序列錯誤率的上升,比對算法采用的編輯距離也需隨之增加,以獲得更多的侯選位置.為此,首先對不同錯誤率下編輯距離閾值的選擇進行實驗:對10000條長度為5000bp的錯誤率分別為5%、10%、15%、20%和25%的模擬序列數(shù)據(jù)進行實驗,測試不同的編輯距離閾值對算法的比對準確度和查全率的影響.錯誤率低于15%的模擬序列屬于低錯誤率數(shù)據(jù),選取編輯距離閾值小于5進行實驗,結果如表1所示.而錯誤率大于等于15%的模擬序列屬于高錯誤率數(shù)據(jù),需要更高的編輯距離閾值,選取編輯距離閾值為5、10和15進行對比試驗,結果如表2所示.

    表1和表2的實驗結果表明,測序序列的錯誤率越高,片段中所含的錯誤個數(shù)也就越多.此時,如果不提高編輯距離的閾值,那么將會導致丟失許多的真陽性位置,從而導致比對準確度和查全率的下降.當測序序列中錯誤率小于15%時,比對準確度變化不大,考慮算法處理時間,編輯距離閾值選擇2即可.當錯誤率大于等于15%時,編輯距離閾值應選擇15以獲得更高的比對準確度和查全率.

    表1 不同編輯距離閾值、低錯誤率模擬長序列比對的準確度與查全率Table 1 Accuracy and recall of simulated long-read alignment with different edit distance threshold and low error rate

    表2 不同編輯距離閾值、高錯誤率模擬長序列比對的準確度與查全率Table 2 Accuracy and recall of simulated long-read alignment for different edit distance threshold and high error rate

    下面,通過對模擬序列數(shù)據(jù)進行兩組實驗以評估不同序列比對算法的性能.

    第一組比對實驗:對長度相同、錯誤率不同的模擬測序序列進行實驗,測試了LAMSA、LordFAST和本文算法HSSM的比對準確度和查全率.LAMSA和LordFAST算法中閾值參數(shù)選擇其論文中的給定值(錯誤率小于15%時,容忍錯誤率為4%,錯誤率大于等于15%,容忍錯誤率30%),本文算法HSSM對于錯誤率分別為5%和10%的序列比對編輯距離閾值取值為2,對于錯誤率分別為15%、20%和25%的序列比對編輯距離閾值取值為15.實驗結果如表3所示.

    表3 不同錯誤率下算法比對10000條長度為5000bp的序列準確度和查全率Table 3 Accuracy and recall rate of aligning 10,000 longreads with length of 5000bp for different error rates

    表3結果表明,算法HSSM采用了對高編輯距離閾值更加敏感的Hash索引方式,且在片段定位過程中針對第三代測序序列中的新錯誤類型“均聚物”進行處理,將所有滿足編輯距離閾值的片段比對結果作為片段連接時的侯選位置,整體上獲得更高的比對準確度,且獲得了更多的片段候選位置,提升了定位片段的查全率,從而使得最終比對結果的查全率也隨之提高.

    第2組比對實驗選取錯誤率分別為5%、10%、15%、20%和25%的10000條序列.對于錯誤率為5%和10%的情形,選取長度分別為1000bp、2000bp、5000bp和10000bp的4組模擬序列進行實驗,實驗結果見表4和表5.對于錯誤率為15%、20%和25%的情形,由于是模擬第三代測序的長序列數(shù)據(jù),所以選取長度為5000bp和10000bp的模擬長序列進行對比,結果如表6、表7和表8所示.

    從表4-表8的結果看,與LAMSA和LordFAST算法相比,在錯誤率相同且錯誤率較低的情形下,總體而言,本文算法HSSM的準確度和查全率有所提升.隨著錯誤率的升高,HSSM算法獲得的比對查全率高于其他兩種算法.這是由于本文算法HSSM采用了基于Hash索引結構的變長種子算法,更加適應高編輯距離閾值的序列比對,可以獲得更多的侯選位置,提升了片段定位的查全率,進而提升了長序列比對的查全率,且通過侯選位置的篩選和片段間可能存在的錯誤關系的罰分,有效去除部分假陽性錯誤的結果,使得長序列比對保持高的準確度.另一方面,隨著模擬序列長度的增長,將長序列分割成了更多的片段,獲得了更多的侯選位置,可以有效地根據(jù)片段侯選位置之間的位置關系,去除錯誤的比對結果,使得算法準確度隨著測序序列長度的上升而提高.

    表4 錯誤率為5%的10000條序列比對的準確度和查全率Table 4 Accuracy and recall of aligning 10,000 long readswith error rate 5%

    表5 錯誤率為10%的10000條序列比對的準確度和查全率Table 5 Accuracy and recall of aligning 10,000 long readswith error rate 10%

    表6 錯誤率為15%的10000條長序列比對準確度和查全率Table 6 Accuracy and recall of aligning 10,000 long readswith error rate 15%

    表7 錯誤率為20%的10000條長序列比對準確度和查全率Table 7 Accuracy and recall of aligning 10,000 long readswith error rate 20%

    表8 錯誤率為25%的10000條長序列比對準確度和查全率Table 8 Accuracy and recall of aligning 10,000 long readswith error rate 25%

    3.2 真實數(shù)據(jù)上的實驗

    對于真實數(shù)據(jù)集上的實驗,采用比對敏感度sensitivity來評估序列比對算法[24]:

    (5)

    其中N為匹配對準的序列條數(shù),RN為測序數(shù)據(jù)集的序列總數(shù).

    采用PacBio測序平臺產(chǎn)生的M130929數(shù)據(jù)集中的幾組真實數(shù)據(jù)進行測試實驗,結果如表9所示.

    表9 真實數(shù)據(jù)集上算法的比對敏感度(%)Table 9 Sensitivity (%)of alignment algorithms on real dataset

    表9的結果表明,算法HSSM使用了對高錯誤率更加敏感的基于hash索引結構的變長種子算法,使得hash索引可以處理“插入/刪除”的錯誤類型,并針對第三代測序序列中新出現(xiàn)的“均聚物”錯誤類型設定其編輯距離為1進行比對,獲得了更多片段候選區(qū)域,從而獲得更多的比對結果,且通過采用附加k-mer算法減少了產(chǎn)生假陽性的比對結果,進而獲得更高的比對敏感度.

    綜合在模擬和真實序列數(shù)據(jù)上的實驗結果表明,本文算法HSSM針對第三代測序數(shù)據(jù)的特點設計改進,在獲得更多侯選位置的同時,去除了假陽性的比對結果,既確保獲得高的比對準確度,又獲得了更高的查全率和敏感度.

    4 總 結

    通過基于Hash索引結構的變長種子算法,采用全映射思想定位長序列分割出的序列片段,可以最大程度地確保分割出的序列片段比對的查全率.分割映射的序列比對方法可以更好地處理第三代測序數(shù)據(jù)中的結構變異帶來的“插入/刪除”和“均聚物”錯誤,且通過篩選和動態(tài)連接片段侯選位置,可以得到更高的比對準確率和敏感度.高錯誤率的長序列比對算法中,編輯距離閾值的提高會增加種子候選數(shù)量,且隨著第三代測序序列的長度越來越長,也會導致種子候選位置增加,從而使得種子驗證成本增加,算法的時間開銷也隨之上升.第三代測序數(shù)據(jù)的高錯誤率的長序列比對是一個計算復雜問題.下一步工作將在借鑒全映射比對并行算法[25]的基礎上,研究設計求解高錯誤率長序列比對問題的CPU/GPU混合并行算法,以確保比對準確度、查全率和敏感度的同時,顯著加速比對完成.

    猜你喜歡
    查全率錯誤率基因組
    限制性隨機試驗中選擇偏倚導致的一類錯誤率膨脹*
    牛參考基因組中發(fā)現(xiàn)被忽視基因
    海量圖書館檔案信息的快速檢索方法
    基于詞嵌入語義的精準檢索式構建方法
    正視錯誤,尋求策略
    教師·中(2017年3期)2017-04-20 21:49:49
    解析小學高段學生英語單詞抄寫作業(yè)錯誤原因
    降低學生計算錯誤率的有效策略
    基因組DNA甲基化及組蛋白甲基化
    遺傳(2014年3期)2014-02-28 20:58:49
    有趣的植物基因組
    世界科學(2014年8期)2014-02-28 14:58:31
    中文分詞技術對中文搜索引擎的查準率及查全率的影響
    欧美日韩福利视频一区二区| 国产一区二区三区在线臀色熟女 | 在线播放国产精品三级| 精品电影一区二区在线| 色综合欧美亚洲国产小说| 成人三级黄色视频| 夜夜夜夜夜久久久久| 天天躁狠狠躁夜夜躁狠狠躁| 亚洲 国产 在线| 欧美另类亚洲清纯唯美| 日韩视频一区二区在线观看| 亚洲 欧美 日韩 在线 免费| 精品日产1卡2卡| 在线天堂中文资源库| 啦啦啦免费观看视频1| 精品久久久久久成人av| 国产精品 国内视频| 午夜精品国产一区二区电影| 久久午夜综合久久蜜桃| 热99re8久久精品国产| 亚洲男人天堂网一区| 国产免费av片在线观看野外av| 91麻豆精品激情在线观看国产 | 黑人猛操日本美女一级片| 国产成人av教育| 午夜精品久久久久久毛片777| 丝袜人妻中文字幕| 在线观看免费日韩欧美大片| 国产色视频综合| 99热国产这里只有精品6| 日本黄色日本黄色录像| 午夜久久久在线观看| 国产一区二区激情短视频| 欧美日本中文国产一区发布| 久久午夜综合久久蜜桃| 一级毛片女人18水好多| 亚洲欧美一区二区三区黑人| 天堂俺去俺来也www色官网| 精品无人区乱码1区二区| 岛国视频午夜一区免费看| 欧美国产精品va在线观看不卡| 欧美成狂野欧美在线观看| 一区二区日韩欧美中文字幕| 精品卡一卡二卡四卡免费| 国产欧美日韩一区二区精品| a级片在线免费高清观看视频| 欧美激情久久久久久爽电影 | 亚洲一码二码三码区别大吗| 十八禁网站免费在线| 在线免费观看的www视频| 亚洲熟妇中文字幕五十中出 | 欧美日韩福利视频一区二区| 成年人黄色毛片网站| 中文字幕人妻熟女乱码| aaaaa片日本免费| 欧美日韩亚洲国产一区二区在线观看| 亚洲第一欧美日韩一区二区三区| 午夜福利影视在线免费观看| 激情视频va一区二区三区| 亚洲美女黄片视频| 在线天堂中文资源库| 在线观看免费日韩欧美大片| 国产成人啪精品午夜网站| 在线国产一区二区在线| 夜夜看夜夜爽夜夜摸 | 成人免费观看视频高清| 久久性视频一级片| 色综合欧美亚洲国产小说| 国产亚洲精品综合一区在线观看 | 亚洲狠狠婷婷综合久久图片| 69精品国产乱码久久久| 午夜久久久在线观看| 亚洲av成人一区二区三| 久久精品91蜜桃| 亚洲第一av免费看| 成在线人永久免费视频| 久久香蕉激情| 最近最新中文字幕大全电影3 | 久久久久久久精品吃奶| 如日韩欧美国产精品一区二区三区| av福利片在线| 夜夜夜夜夜久久久久| 欧美久久黑人一区二区| 久热爱精品视频在线9| 国产精品久久久av美女十八| 黄色视频不卡| 一级,二级,三级黄色视频| 一进一出抽搐动态| 精品久久久久久成人av| 一本大道久久a久久精品| 岛国在线观看网站| 午夜精品国产一区二区电影| 国产精品久久久人人做人人爽| 大陆偷拍与自拍| 超色免费av| 国产成人欧美在线观看| 99精品在免费线老司机午夜| 国产精品98久久久久久宅男小说| 亚洲精品在线观看二区| 欧美黄色片欧美黄色片| 大型av网站在线播放| 麻豆国产av国片精品| 十分钟在线观看高清视频www| 亚洲男人的天堂狠狠| 国产99久久九九免费精品| 无限看片的www在线观看| 国产精品亚洲一级av第二区| 国产精品综合久久久久久久免费 | 亚洲精品av麻豆狂野| 老司机靠b影院| 欧美日本中文国产一区发布| 美女 人体艺术 gogo| 男男h啪啪无遮挡| 乱人伦中国视频| 国内毛片毛片毛片毛片毛片| 久久精品国产99精品国产亚洲性色 | 制服诱惑二区| 麻豆一二三区av精品| 亚洲精品一区av在线观看| 国产伦人伦偷精品视频| 精品久久久久久成人av| 一边摸一边做爽爽视频免费| www.999成人在线观看| 成年人黄色毛片网站| 中文字幕av电影在线播放| 久久人人97超碰香蕉20202| 黄色视频,在线免费观看| 中出人妻视频一区二区| 一级黄色大片毛片| 长腿黑丝高跟| 日本wwww免费看| 欧美人与性动交α欧美软件| 男女下面进入的视频免费午夜 | www.自偷自拍.com| 免费女性裸体啪啪无遮挡网站| 国产亚洲欧美精品永久| 黑人巨大精品欧美一区二区mp4| 亚洲第一青青草原| 午夜精品久久久久久毛片777| 精品卡一卡二卡四卡免费| 亚洲国产精品sss在线观看 | 日韩免费高清中文字幕av| 天天影视国产精品| 久久精品成人免费网站| 人妻丰满熟妇av一区二区三区| 91字幕亚洲| 国产有黄有色有爽视频| 日韩欧美在线二视频| 国产亚洲av高清不卡| 国产欧美日韩精品亚洲av| 桃红色精品国产亚洲av| 中文字幕色久视频| 亚洲专区国产一区二区| 国产黄a三级三级三级人| av片东京热男人的天堂| 成年版毛片免费区| 深夜精品福利| 久久这里只有精品19| 两性午夜刺激爽爽歪歪视频在线观看 | 国产黄色免费在线视频| 精品国内亚洲2022精品成人| 女人高潮潮喷娇喘18禁视频| 亚洲一码二码三码区别大吗| 亚洲在线自拍视频| av天堂在线播放| 一级片免费观看大全| 黄片播放在线免费| 婷婷精品国产亚洲av在线| 18禁美女被吸乳视频| www.精华液| 999精品在线视频| 99精国产麻豆久久婷婷| www.精华液| 成人av一区二区三区在线看| 国产有黄有色有爽视频| 正在播放国产对白刺激| 亚洲 国产 在线| 99国产精品一区二区蜜桃av| 久久人人爽av亚洲精品天堂| 国产av在哪里看| 一个人观看的视频www高清免费观看 | 日韩一卡2卡3卡4卡2021年| 老熟妇乱子伦视频在线观看| 国产精品一区二区三区四区久久 | 久久中文字幕一级| 日本三级黄在线观看| 欧美亚洲日本最大视频资源| 国产av精品麻豆| 人妻久久中文字幕网| 欧美日韩黄片免| 极品教师在线免费播放| 高清在线国产一区| 大型黄色视频在线免费观看| av网站免费在线观看视频| 精品国内亚洲2022精品成人| 国产成人系列免费观看| 大香蕉久久成人网| netflix在线观看网站| 精品人妻在线不人妻| 日韩大码丰满熟妇| 亚洲成av片中文字幕在线观看| 国产av一区二区精品久久| 搡老岳熟女国产| 亚洲精品一卡2卡三卡4卡5卡| 成人亚洲精品av一区二区 | 男女下面进入的视频免费午夜 | 亚洲精品一二三| 亚洲国产精品sss在线观看 | 国产一区二区激情短视频| 91麻豆精品激情在线观看国产 | 国产精品偷伦视频观看了| 日韩人妻精品一区2区三区| 成在线人永久免费视频| 国产欧美日韩一区二区三| 国产成人系列免费观看| 黄色视频不卡| 一二三四在线观看免费中文在| xxxhd国产人妻xxx| 久久亚洲真实| 久久香蕉国产精品| 国产高清激情床上av| 啦啦啦免费观看视频1| 母亲3免费完整高清在线观看| 色婷婷av一区二区三区视频| 成人18禁高潮啪啪吃奶动态图| 婷婷丁香在线五月| 国产亚洲欧美精品永久| 女人被狂操c到高潮| 日本一区二区免费在线视频| 中文字幕另类日韩欧美亚洲嫩草| av有码第一页| 99久久久亚洲精品蜜臀av| 精品国产超薄肉色丝袜足j| 精品一区二区三区视频在线观看免费 | 免费久久久久久久精品成人欧美视频| 日本一区二区免费在线视频| 久久性视频一级片| 在线观看午夜福利视频| 黄频高清免费视频| 欧美日韩乱码在线| 亚洲精品中文字幕一二三四区| 亚洲精品中文字幕一二三四区| 91av网站免费观看| 高清黄色对白视频在线免费看| 18禁美女被吸乳视频| 91国产中文字幕| 亚洲人成电影免费在线| 日韩大尺度精品在线看网址 | 黄色成人免费大全| 热re99久久精品国产66热6| 天天躁狠狠躁夜夜躁狠狠躁| 女生性感内裤真人,穿戴方法视频| 国产成人系列免费观看| 女人高潮潮喷娇喘18禁视频| 51午夜福利影视在线观看| 人妻久久中文字幕网| 少妇 在线观看| 国产精品一区二区三区四区久久 | 亚洲成人久久性| 国产精品影院久久| 成人三级黄色视频| 久久久久久久精品吃奶| 91大片在线观看| 久久久久久人人人人人| 一个人免费在线观看的高清视频| 久久精品国产99精品国产亚洲性色 | 热99re8久久精品国产| 久久精品国产综合久久久| 亚洲国产毛片av蜜桃av| 国产成人精品无人区| 成人影院久久| 国产成人欧美| 亚洲av成人不卡在线观看播放网| 一二三四社区在线视频社区8| 亚洲一码二码三码区别大吗| 成年女人毛片免费观看观看9| 岛国在线观看网站| 天天躁狠狠躁夜夜躁狠狠躁| 亚洲一码二码三码区别大吗| 亚洲欧洲精品一区二区精品久久久| 亚洲精品成人av观看孕妇| 国产精品一区二区三区四区久久 | 亚洲色图 男人天堂 中文字幕| 真人一进一出gif抽搐免费| 久久这里只有精品19| 精品久久蜜臀av无| 亚洲欧洲精品一区二区精品久久久| 亚洲欧洲精品一区二区精品久久久| 久久热在线av| 午夜91福利影院| 在线十欧美十亚洲十日本专区| 国产精品一区二区精品视频观看| 欧美精品啪啪一区二区三区| 欧美成人午夜精品| 97碰自拍视频| 国产又爽黄色视频| 国产精品国产av在线观看| 亚洲第一青青草原| 国产免费现黄频在线看| 99国产综合亚洲精品| 久久久久久久精品吃奶| 最近最新免费中文字幕在线| 国产色视频综合| 操美女的视频在线观看| 成熟少妇高潮喷水视频| 99久久99久久久精品蜜桃| 老熟妇乱子伦视频在线观看| 美女午夜性视频免费| 啪啪无遮挡十八禁网站| 一级片'在线观看视频| 一边摸一边抽搐一进一出视频| 999精品在线视频| 欧美黑人欧美精品刺激| 亚洲精华国产精华精| 夜夜夜夜夜久久久久| 欧美人与性动交α欧美软件| 精品福利观看| 丰满饥渴人妻一区二区三| 国产亚洲精品第一综合不卡| 亚洲视频免费观看视频| 国产精品av久久久久免费| 久久99一区二区三区| 日韩有码中文字幕| 日本三级黄在线观看| 久久 成人 亚洲| 欧美精品啪啪一区二区三区| 91麻豆精品激情在线观看国产 | 国产欧美日韩一区二区三区在线| 悠悠久久av| 国产91精品成人一区二区三区| 日本wwww免费看| 手机成人av网站| 长腿黑丝高跟| 亚洲一区高清亚洲精品| 久久人妻av系列| 91字幕亚洲| 久久天堂一区二区三区四区| 国产精品国产高清国产av| 一级a爱片免费观看的视频| 视频区欧美日本亚洲| 欧美黄色淫秽网站| 亚洲精品国产区一区二| 国产亚洲欧美在线一区二区| 亚洲一区二区三区欧美精品| av国产精品久久久久影院| 女人爽到高潮嗷嗷叫在线视频| 亚洲全国av大片| 18禁美女被吸乳视频| 人人澡人人妻人| 亚洲国产看品久久| 久久这里只有精品19| 亚洲欧美日韩另类电影网站| 在线永久观看黄色视频| a级毛片黄视频| 国产高清激情床上av| 99精品久久久久人妻精品| 热99国产精品久久久久久7| 日韩欧美一区视频在线观看| 两性夫妻黄色片| 韩国av一区二区三区四区| 亚洲成人久久性| 超碰成人久久| 国产高清videossex| 亚洲一码二码三码区别大吗| 极品教师在线免费播放| 十八禁人妻一区二区| 操美女的视频在线观看| 中文字幕最新亚洲高清| 麻豆一二三区av精品| 在线观看66精品国产| 日韩成人在线观看一区二区三区| 久久久水蜜桃国产精品网| 亚洲国产欧美一区二区综合| 18禁黄网站禁片午夜丰满| 男女高潮啪啪啪动态图| 精品卡一卡二卡四卡免费| 久久国产精品影院| 国产亚洲精品第一综合不卡| www.999成人在线观看| 很黄的视频免费| 岛国在线观看网站| 国产精品免费一区二区三区在线| 国产精品秋霞免费鲁丝片| 午夜福利影视在线免费观看| 久久香蕉精品热| 色综合站精品国产| 欧美中文综合在线视频| 亚洲中文字幕日韩| 一二三四社区在线视频社区8| 性少妇av在线| 好看av亚洲va欧美ⅴa在| 亚洲第一av免费看| 国产精品爽爽va在线观看网站 | 午夜精品久久久久久毛片777| 国产精品 欧美亚洲| 亚洲国产精品合色在线| 久久久久亚洲av毛片大全| 免费高清视频大片| 啪啪无遮挡十八禁网站| 久久草成人影院| 欧美激情久久久久久爽电影 | 亚洲成人久久性| 欧美黑人欧美精品刺激| 一区二区三区精品91| 亚洲国产中文字幕在线视频| 老司机亚洲免费影院| 国产成人系列免费观看| 欧美在线一区亚洲| 国产区一区二久久| 久久国产亚洲av麻豆专区| 自线自在国产av| 久久精品人人爽人人爽视色| 欧美日韩一级在线毛片| 精品国内亚洲2022精品成人| 国产成人欧美| 免费高清视频大片| 波多野结衣一区麻豆| 淫妇啪啪啪对白视频| 丰满饥渴人妻一区二区三| 欧美日韩亚洲综合一区二区三区_| 日韩有码中文字幕| 一本大道久久a久久精品| 宅男免费午夜| 午夜老司机福利片| 麻豆成人av在线观看| 黄色视频不卡| 精品日产1卡2卡| 精品国产亚洲在线| 黄色视频,在线免费观看| 日韩一卡2卡3卡4卡2021年| 亚洲专区国产一区二区| 丝袜美腿诱惑在线| 中文字幕av电影在线播放| 成人永久免费在线观看视频| 日韩精品免费视频一区二区三区| 国产精品九九99| 久久午夜综合久久蜜桃| 国产亚洲精品第一综合不卡| 18美女黄网站色大片免费观看| 国产欧美日韩一区二区三| 久久久精品国产亚洲av高清涩受| 欧美中文综合在线视频| 日韩欧美国产一区二区入口| 波多野结衣一区麻豆| 色老头精品视频在线观看| 国产一区二区在线av高清观看| 欧美另类亚洲清纯唯美| 91字幕亚洲| a级毛片在线看网站| 色综合婷婷激情| 99在线人妻在线中文字幕| 正在播放国产对白刺激| 亚洲第一av免费看| 久久这里只有精品19| 女人被躁到高潮嗷嗷叫费观| 交换朋友夫妻互换小说| 色播在线永久视频| 欧美黑人欧美精品刺激| 精品午夜福利视频在线观看一区| 天天躁夜夜躁狠狠躁躁| 1024视频免费在线观看| 国产熟女xx| 久久精品国产清高在天天线| 亚洲免费av在线视频| 成年版毛片免费区| 一二三四社区在线视频社区8| 国产高清国产精品国产三级| 又紧又爽又黄一区二区| 99在线人妻在线中文字幕| 日本wwww免费看| 国产成人精品久久二区二区免费| 久久精品aⅴ一区二区三区四区| 黄色片一级片一级黄色片| 国产成人免费无遮挡视频| 搡老岳熟女国产| bbb黄色大片| 午夜两性在线视频| 香蕉丝袜av| 亚洲色图综合在线观看| 国产av在哪里看| 久久九九热精品免费| 97人妻天天添夜夜摸| 大型av网站在线播放| av国产精品久久久久影院| 天天躁夜夜躁狠狠躁躁| 91国产中文字幕| 欧美日韩瑟瑟在线播放| 叶爱在线成人免费视频播放| 亚洲av片天天在线观看| 亚洲熟妇熟女久久| 制服人妻中文乱码| 亚洲国产毛片av蜜桃av| 69精品国产乱码久久久| 97人妻天天添夜夜摸| 一夜夜www| 99精品欧美一区二区三区四区| 亚洲人成电影免费在线| 黄网站色视频无遮挡免费观看| 人成视频在线观看免费观看| 欧美日韩精品网址| 日本a在线网址| 免费日韩欧美在线观看| 丝袜美腿诱惑在线| 老司机深夜福利视频在线观看| 国产精品av久久久久免费| 9191精品国产免费久久| 免费观看人在逋| 欧美不卡视频在线免费观看 | 女生性感内裤真人,穿戴方法视频| 久久人人爽av亚洲精品天堂| 99在线人妻在线中文字幕| 亚洲欧美日韩高清在线视频| 人人妻人人爽人人添夜夜欢视频| 黄色丝袜av网址大全| 亚洲第一青青草原| 淫妇啪啪啪对白视频| 在线天堂中文资源库| 中文字幕高清在线视频| 五月开心婷婷网| 精品高清国产在线一区| 午夜福利免费观看在线| 欧美乱码精品一区二区三区| 极品教师在线免费播放| 老司机深夜福利视频在线观看| 久久99一区二区三区| 亚洲五月色婷婷综合| 亚洲 欧美 日韩 在线 免费| 午夜91福利影院| 精品国产乱码久久久久久男人| 国产伦一二天堂av在线观看| 大陆偷拍与自拍| 窝窝影院91人妻| 久久久久久久午夜电影 | avwww免费| 久久精品国产99精品国产亚洲性色 | 这个男人来自地球电影免费观看| 两性午夜刺激爽爽歪歪视频在线观看 | 在线观看一区二区三区激情| 操出白浆在线播放| 久久久久久人人人人人| 欧美乱妇无乱码| 老汉色∧v一级毛片| av福利片在线| 成人av一区二区三区在线看| a级毛片在线看网站| 91精品国产国语对白视频| 精品一品国产午夜福利视频| 亚洲avbb在线观看| 国产蜜桃级精品一区二区三区| √禁漫天堂资源中文www| 亚洲激情在线av| 夜夜躁狠狠躁天天躁| 丰满的人妻完整版| 成人亚洲精品av一区二区 | 国产色视频综合| 90打野战视频偷拍视频| 色综合欧美亚洲国产小说| 女人高潮潮喷娇喘18禁视频| 十分钟在线观看高清视频www| 搡老岳熟女国产| 色综合欧美亚洲国产小说| 亚洲激情在线av| 一级毛片精品| 国产成人精品在线电影| 高清欧美精品videossex| cao死你这个sao货| 麻豆成人av在线观看| 欧美成狂野欧美在线观看| 少妇粗大呻吟视频| 女警被强在线播放| 午夜影院日韩av| 欧美丝袜亚洲另类 | 日本黄色日本黄色录像| 中文字幕av电影在线播放| 色综合站精品国产| 精品国内亚洲2022精品成人| 亚洲成av片中文字幕在线观看| 成人影院久久| 欧美日韩中文字幕国产精品一区二区三区 | 日本a在线网址| 欧美人与性动交α欧美软件| 国产免费现黄频在线看| 搡老熟女国产l中国老女人| 欧美激情高清一区二区三区| 一本大道久久a久久精品| 电影成人av| 一区二区三区激情视频| 国产欧美日韩综合在线一区二区| 新久久久久国产一级毛片| 亚洲第一欧美日韩一区二区三区| 国产又色又爽无遮挡免费看| 亚洲成国产人片在线观看| 午夜福利欧美成人| www.熟女人妻精品国产| 国产精品二区激情视频| 一级毛片女人18水好多| 19禁男女啪啪无遮挡网站| 亚洲午夜理论影院| av在线天堂中文字幕 | 啦啦啦免费观看视频1| 黄色丝袜av网址大全| 欧美日本中文国产一区发布| 在线国产一区二区在线| 亚洲一码二码三码区别大吗| 亚洲成人免费电影在线观看| 国产欧美日韩综合在线一区二区| 欧美av亚洲av综合av国产av| 国产成人啪精品午夜网站| 久久精品国产清高在天天线| 最新美女视频免费是黄的| 国产一区二区三区综合在线观看| 91九色精品人成在线观看| 亚洲精品中文字幕一二三四区| 亚洲av五月六月丁香网| 国产成人精品无人区|