• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于增加最優(yōu)優(yōu)先搜索多樣性的研究

    2013-09-10 01:17:24李偉生
    關(guān)鍵詞:后繼代價(jià)列表

    李偉生,代 飛

    (重慶郵電大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,重慶400065)

    0 引 言

    智能規(guī)劃是尋找一個(gè)有效動(dòng)作序列,將某個(gè)現(xiàn)實(shí)問(wèn)題從一個(gè)已知的初始狀態(tài)轉(zhuǎn)換成滿(mǎn)足特定條件的目標(biāo)狀態(tài)的過(guò)程,這種有效動(dòng)作序列稱(chēng)為規(guī)劃解。目前解決規(guī)劃問(wèn)題主要有3種方法:第一種是規(guī)劃圖方法;第二種方法是約束可滿(mǎn)足方法;第三種方法是啟發(fā)式搜索方法,用啟發(fā)式函數(shù)產(chǎn)生規(guī)劃實(shí)例的估價(jià),用該估價(jià)來(lái)指導(dǎo)規(guī)劃在狀態(tài)空間中的搜索。在以上3種方法中,以啟發(fā)式搜索的效率最好,并且可以結(jié)合其它方法。所以現(xiàn)今大多數(shù)的規(guī)劃器都采用了啟發(fā)式搜索技術(shù),它通過(guò)將規(guī)劃問(wèn)題轉(zhuǎn)化為狀態(tài)空間上的路徑來(lái)搜索規(guī)劃解。規(guī)劃大賽中表現(xiàn)較好的規(guī)劃器如:Fast-Downward[1]、LAMA[2]等都采用了啟發(fā)式搜索策略。盡管,最優(yōu)優(yōu)先是一個(gè)相對(duì)有效的啟發(fā)式搜索策略。但當(dāng)啟發(fā)式函數(shù)對(duì)狀態(tài)節(jié)點(diǎn)估計(jì)有誤時(shí),最優(yōu)優(yōu)先搜索的效率將會(huì)降低。比如啟發(fā)式函數(shù)將一些無(wú)利狀態(tài)節(jié)點(diǎn)的啟發(fā)式值估計(jì)為最小,然后,最優(yōu)優(yōu)先算法就會(huì)先去擴(kuò)展這些無(wú)利的狀態(tài)節(jié)點(diǎn),以至于搜索到的規(guī)劃解質(zhì)量不高。還有一種情況是在搜索狀態(tài)節(jié)點(diǎn)過(guò)程中會(huì)產(chǎn)生一種狀態(tài)節(jié)點(diǎn)啟發(fā)式值不再減少的高原現(xiàn)象[3-4],如果還是單一依賴(lài)啟發(fā)式函數(shù)估計(jì)的最優(yōu)狀態(tài)節(jié)點(diǎn)進(jìn)行搜索,不采用別的方法避免這種高原狀態(tài)的話(huà),會(huì)導(dǎo)致規(guī)劃代價(jià)較大。

    本文以主流的規(guī)劃器LAMA[2]為研究對(duì)象。深入分析了最優(yōu)優(yōu)先搜索策略的優(yōu)缺點(diǎn),提出了一種增加狀態(tài)節(jié)點(diǎn)選擇多樣性的方法,通過(guò)對(duì)不同路徑執(zhí)行盡量多的搜索,能夠避免由于啟發(fā)式函數(shù)地估計(jì)錯(cuò)誤和高原狀態(tài)而導(dǎo)致搜索到的規(guī)劃解的最優(yōu)度不高的問(wèn)題。

    1 相關(guān)的啟發(fā)式搜索策略

    隨時(shí)修復(fù) A* (anytime repairing A*)[5]。它在搜索到一個(gè)規(guī)劃解時(shí),利用此次規(guī)劃解的代價(jià)進(jìn)行剪枝,力求得到代價(jià)更小的解。在Anytime Repairing A*迭代搜索中,上次搜索成功后產(chǎn)生的節(jié)狀態(tài)節(jié)點(diǎn)繼續(xù)保留為下次使用。但在這里就存在一個(gè)問(wèn)題,由于啟發(fā)式函數(shù)的估計(jì)并不準(zhǔn)確,如果不清空,當(dāng)上次搜索到一個(gè)質(zhì)量較差的規(guī)劃解時(shí),下次搜索規(guī)劃解時(shí)會(huì)受到上次搜索時(shí)所產(chǎn)生的狀態(tài)節(jié)點(diǎn)的影響,不利于改善規(guī)劃質(zhì)量[6]。

    KBFS (K-best-first-search)[7]。KBFS是最優(yōu)優(yōu)先搜索和廣度優(yōu)先搜索[8]的結(jié)合。KBFS選擇節(jié)點(diǎn)擴(kuò)展時(shí),先從開(kāi)列表中選擇K (K>1)個(gè)最優(yōu)狀體節(jié)點(diǎn)擴(kuò)展,然后才產(chǎn)生后繼狀態(tài)節(jié)點(diǎn)。該算法通過(guò)延遲檢測(cè)后繼狀態(tài)節(jié)點(diǎn)的啟發(fā)式信息,來(lái)增加搜索的多樣性。參數(shù)K用于增加狀態(tài)節(jié)點(diǎn)選擇的范圍,K越大,搜索中擴(kuò)展的狀態(tài)節(jié)點(diǎn)越多,就能在狀態(tài)空間中搜索到不同的路徑,進(jìn)而選擇最優(yōu)路徑。KBFS能夠在一定程度上避免由于啟發(fā)式函數(shù)估計(jì)錯(cuò)誤而導(dǎo)致的高原狀態(tài)和局部最優(yōu)先現(xiàn)象。但是,如果它所選擇的這K個(gè)狀態(tài)節(jié)點(diǎn)被錯(cuò)誤的估計(jì)為有利狀態(tài)節(jié)點(diǎn)的話(huà),就會(huì)導(dǎo)致搜索到的規(guī)劃解最有度不高??梢酝ㄟ^(guò)增加K值來(lái)避免這種情況,但是隨著K值變大,KBFS的搜索類(lèi)似于廣度優(yōu)先搜索,無(wú)法利用啟發(fā)式信息指導(dǎo)搜索,導(dǎo)致整個(gè)搜索過(guò)程效率低下。

    自由走步 (random-walk)策略[9-10]。它采用了一種探測(cè)策略,在一定的搜索步長(zhǎng)范圍內(nèi),隨機(jī)擴(kuò)展一些狀態(tài)節(jié)點(diǎn),從而在一定程度上避免了單一依賴(lài)啟發(fā)式函數(shù)指導(dǎo)搜索導(dǎo)致的問(wèn)題,增加了選擇的多樣性。但是這種方法有一個(gè)問(wèn)題,它會(huì)忽略已搜索到的狀態(tài)空間,使得相同的狀態(tài)節(jié)點(diǎn)在不同的路徑上被重復(fù)估計(jì)。

    2 BBFS (better-best-first-search)算法

    2.1 最好優(yōu)先搜索存在的問(wèn)題

    圖1中英文字母代表狀態(tài)節(jié)點(diǎn),括號(hào)中的數(shù)字代表每個(gè)狀態(tài)節(jié)點(diǎn)的啟發(fā)式值,大寫(xiě)字母G代表目標(biāo)狀態(tài)節(jié)點(diǎn),實(shí)線代表搜索中的路徑,括號(hào)中的數(shù)字代表狀態(tài)節(jié)點(diǎn)的啟發(fā)式值。如圖1所示,如果采用最優(yōu)優(yōu)先搜索策略,最開(kāi)始擴(kuò)展?fàn)顟B(tài)節(jié)點(diǎn)B,然后,產(chǎn)生其后繼狀態(tài)節(jié)點(diǎn),由于其后繼狀態(tài)節(jié)點(diǎn)的啟發(fā)式值都比較小,所以會(huì)不斷的擴(kuò)展這些啟發(fā)式值最小的狀態(tài)節(jié)點(diǎn),但這些后繼狀態(tài)節(jié)點(diǎn)并不是在目標(biāo)路徑上。如果,不單一地依賴(lài)最優(yōu)狀態(tài)節(jié)點(diǎn),考慮更多的次優(yōu)狀態(tài)節(jié)點(diǎn),那么在搜索過(guò)程中就有可能避免由于過(guò)度啟發(fā)式函數(shù)指導(dǎo)搜索而導(dǎo)致的局部最優(yōu)和高原狀態(tài)。

    如圖1所示,通過(guò)增加狀態(tài)節(jié)點(diǎn)選擇的多樣性,能夠找 {A,C,J,O,T,G},{A,D,K,P,G},{A,E,G}這幾個(gè)質(zhì)量較高的規(guī)劃解。

    2.2 算法基本思想

    通過(guò)對(duì)最優(yōu)優(yōu)先搜索策略中存在問(wèn)題的分析。我們可以從兩方面來(lái)改善搜索策略:①將最優(yōu)優(yōu)先搜索中的開(kāi)列表細(xì)化為多個(gè)包含不同啟發(fā)式信息的列表,然后通過(guò)一定的概率來(lái)選擇細(xì)化后的開(kāi)列表,進(jìn)而增加鏈表選擇的多樣;②每次選擇多個(gè)狀態(tài)節(jié)點(diǎn)進(jìn)行擴(kuò)展,而不僅僅只選擇最優(yōu)狀態(tài)節(jié)點(diǎn)進(jìn)行擴(kuò)展。

    圖1 局部最優(yōu)和高原狀態(tài)

    相對(duì)于KBFS(K),本算法不僅僅選擇單個(gè)列表中最優(yōu)的K個(gè)狀態(tài)節(jié)點(diǎn),而是在多個(gè)列表中選擇狀態(tài)節(jié)點(diǎn),BBFS能夠有更大的可能來(lái)選擇那些被錯(cuò)誤估計(jì)為無(wú)利狀態(tài)的節(jié)點(diǎn)。相對(duì)于自由走步,BBFS會(huì)將已經(jīng)擴(kuò)展的狀態(tài)節(jié)點(diǎn)保存在關(guān)列表中,所以它可以有效地使用已經(jīng)搜索到的狀態(tài)空間。比如,當(dāng)擴(kuò)展的狀態(tài)節(jié)點(diǎn)在多條不同的搜索路徑上時(shí),就可以直接利用以前的啟發(fā)式值,而不再重復(fù)計(jì)算。BBFS是一個(gè)完備的算法。換句話(huà)說(shuō),就是在給定的時(shí)間和內(nèi)存限制下,當(dāng)存在規(guī)劃解的時(shí)候,他可以返回一個(gè)規(guī)劃解,當(dāng)無(wú)法找到規(guī)劃解時(shí),它可以正確的退出。

    2.3 算法實(shí)現(xiàn)步驟

    算法1和算法2給出了BBFS的偽代碼。算法1用于狀態(tài)節(jié)點(diǎn)的擴(kuò)展;算法2用于獲取狀態(tài)節(jié)點(diǎn)。BBFS整個(gè)算法的流程比較簡(jiǎn)單:從包含不同啟發(fā)式信息的開(kāi)列表中選擇多個(gè)狀態(tài)節(jié)點(diǎn)進(jìn)行擴(kuò)展后,再生成這些擴(kuò)展?fàn)顟B(tài)節(jié)點(diǎn)的后繼節(jié)點(diǎn),直到找到規(guī)劃解或者發(fā)現(xiàn)規(guī)劃解不存在為止。BBFS旨在一定的范圍內(nèi)增加狀態(tài)節(jié)點(diǎn)的多樣性,而不是通過(guò)完全丟棄啟發(fā)式信息來(lái)增加狀態(tài)空間搜索的多樣性,所以BBFS每次擴(kuò)展的狀態(tài)節(jié)點(diǎn)數(shù)即K值設(shè)置為5,這里的K值設(shè)定為5并不是必須的,在內(nèi)存可以的情況下,K值可以適當(dāng)設(shè)置大一點(diǎn),比如K=10。BBFS通過(guò)一個(gè)關(guān)列表保存所有已經(jīng)擴(kuò)展的狀態(tài)節(jié)點(diǎn),從而使得這些狀態(tài)節(jié)點(diǎn)再次被擴(kuò)展時(shí),不再重新估計(jì)它們的啟發(fā)式值,避免了自由走步的問(wèn)題。當(dāng)K個(gè)狀態(tài)節(jié)點(diǎn)被擴(kuò)展后,它們所產(chǎn)生的后繼狀態(tài)節(jié)點(diǎn)將放入包含不同啟發(fā)式信息的開(kāi)列表中。

    算法1 Better-Best-First-Search

    算法2get the K nodes from all of the open_lists

    算法1中,將初始狀態(tài)節(jié)點(diǎn)放入任意的一個(gè)開(kāi)列表中,然后進(jìn)行擴(kuò)展 (第1行)。全局變量gpselectsum用于表示所有開(kāi)列表優(yōu)先級(jí)的總和,gpselectopen_list1用于表示包含F(xiàn)F啟發(fā)式信息開(kāi)列表的優(yōu)先級(jí),gpselectopen_list2用于表示包含路標(biāo)啟發(fā)式信息開(kāi)列表的優(yōu)先級(jí) (第4行~第6行)。開(kāi)列表可以根據(jù)不同的規(guī)劃器包含的啟發(fā)式信息類(lèi)型而設(shè)置,由于LAMA包含了FF和路標(biāo)啟發(fā)式信息,所以這里的開(kāi)列表設(shè)置了兩個(gè):open_list1,open_list2。如果被擴(kuò)展的狀態(tài)節(jié)點(diǎn)是目標(biāo)狀態(tài)節(jié)點(diǎn)則返回規(guī)劃解 (第12行~第14行)。每次擴(kuò)展一個(gè)狀態(tài)節(jié)點(diǎn),如果該狀態(tài)節(jié)點(diǎn)在open_list1被發(fā)現(xiàn)且其啟發(fā)式值比以前狀態(tài)節(jié)點(diǎn)的啟發(fā)式值小,則提高包含該狀態(tài)節(jié)點(diǎn)列表的優(yōu)先級(jí),以期發(fā)現(xiàn)更多的有利狀態(tài)節(jié)點(diǎn),并修改gpselectsum的值 (第17行~第19行)。如果該狀態(tài)節(jié)點(diǎn)在open_list2被搜索到且其啟發(fā)式值以前發(fā)現(xiàn)的啟發(fā)式值小,則提高包含該有利狀態(tài)節(jié)點(diǎn)列表的優(yōu)先級(jí),并修改gpselectsum的值 (第21行~第23行)。如果所有的開(kāi)列表都搜索完成,還是沒(méi)有搜索到規(guī)劃解則返回失敗信息。(第27行)。

    算法2中,每從一個(gè)開(kāi)列表中獲取一個(gè)狀態(tài)節(jié)點(diǎn)就降低該列表的優(yōu)先級(jí) (第7行)。主要是為了防止算法1中過(guò)度的增加單個(gè)列表的優(yōu)先級(jí),使得搜索多次在同一個(gè)列表中選擇狀態(tài)節(jié)點(diǎn),不利于增加節(jié)點(diǎn)選擇的多樣性。同時(shí),當(dāng)在某個(gè)開(kāi)列表出現(xiàn)了高原現(xiàn)象之后,通過(guò)減少該列表的優(yōu)先級(jí),選擇另外的開(kāi)列表,可以在一定程度避免這種高原狀態(tài)。

    參數(shù)Y (Y>1)主要用于控制在不同開(kāi)列表中狀態(tài)節(jié)點(diǎn)被選中的可能性。BFS通常將所有產(chǎn)生的狀態(tài)節(jié)點(diǎn)放在單個(gè)開(kāi)列表中,然后再選擇啟發(fā)式值最小的狀態(tài)節(jié)點(diǎn)進(jìn)行擴(kuò)展。BBFS通過(guò)將包含不同啟發(fā)式信息的節(jié)點(diǎn)進(jìn)行分類(lèi),歸納在多個(gè)開(kāi)列表中。然后,每次擴(kuò)展和獲取狀態(tài)節(jié)點(diǎn)時(shí),就更新這些開(kāi)列表的優(yōu)先級(jí),每個(gè)開(kāi)列表以最高概率YP1/P2被選中,其中P1=gpselectopen_list1,P2=gpselectopen_list2。

    如果BFS選中了一個(gè)無(wú)利狀態(tài)節(jié)點(diǎn),該無(wú)利狀態(tài)節(jié)點(diǎn)的后繼節(jié)點(diǎn)有一個(gè)較小的啟發(fā)式值,它將會(huì)繼續(xù)擴(kuò)展該無(wú)利狀態(tài)節(jié)點(diǎn)的后繼,使得搜索的方向出現(xiàn)偏差。但是,當(dāng)BBFS選中一個(gè)無(wú)利狀態(tài)節(jié)點(diǎn),即使該狀態(tài)節(jié)點(diǎn)的后繼的啟發(fā)式值較小,它也不會(huì)立即擴(kuò)展該狀態(tài)節(jié)點(diǎn)的后繼,而是選擇另外的非該狀態(tài)節(jié)點(diǎn)的后繼狀態(tài)節(jié)點(diǎn),進(jìn)行擴(kuò)展。這樣就在一定程度上避免了搜索陷入局部最優(yōu)的問(wèn)題。

    3 實(shí)驗(yàn)結(jié)果分析

    本文選取了問(wèn)題規(guī)模較大的openstacks、nomystery規(guī)劃域進(jìn)行實(shí)驗(yàn)驗(yàn)證,其中每個(gè)規(guī)劃域里面包含20個(gè)問(wèn)題。這些規(guī)劃問(wèn)題全部來(lái)自2011國(guó)際規(guī)劃大賽。實(shí)驗(yàn)環(huán)境是在單核處理器2.80Ghz AMD Athlon (tm)II X2 2400,內(nèi)存2GB,Ubuntn-10.10 (Linux kernel 2.6.35-22-generic),編譯器為g++4.4.5的環(huán)境下進(jìn)行地測(cè)試。設(shè)定規(guī)劃超時(shí)限為規(guī)劃大賽規(guī)定的30分鐘 (1800s)。在LAMA中采用了兩種啟發(fā)式搜索算法,一種是最優(yōu)優(yōu)先,另一種的加權(quán)A*,兩種算法的搜索的基本流程差不多,差別在于啟發(fā)式函數(shù)的代價(jià)計(jì)算方式不同。所以BBFS可以很好的與加權(quán)A*結(jié)合。此次實(shí)驗(yàn)也將BBFS加入到加權(quán)A*中。如圖2所示,在狀態(tài)空間較大的openstack領(lǐng)域,本文通過(guò)增加LAMA中狀態(tài)節(jié)點(diǎn)選擇的多樣性,減少搜索對(duì)于啟發(fā)式函數(shù)的依賴(lài),縮短了規(guī)劃解長(zhǎng)度,DLAMA (Diversity-LAMA)表示在LAMA中采用了BBFS算法增加搜索中的多樣性。這說(shuō)明本方法在一定程度上避免了搜索中的局部最優(yōu)和高原狀態(tài),改善了規(guī)劃解的質(zhì)量。

    圖2 DLAMA和LAMA規(guī)劃長(zhǎng)度和規(guī)劃待代價(jià)對(duì)比,x軸代表規(guī)劃問(wèn)題的編號(hào)

    表1和表2列出的是本文方法和LAMA對(duì)規(guī)劃大賽中openstack和normstery領(lǐng)域?qū)嶒?yàn)的規(guī)劃代價(jià)和規(guī)劃步長(zhǎng)。如表1所示,在大規(guī)模規(guī)劃領(lǐng)域openstack中,雖然前3個(gè)規(guī)劃問(wèn)題DLAMA搜索到的規(guī)劃代價(jià)比LAMA的高,但是其規(guī)劃步長(zhǎng)較比LAMA短,說(shuō)明其在一定程度上避免了搜索中高原狀態(tài)的出現(xiàn),減少了規(guī)劃步長(zhǎng)。在后17個(gè)規(guī)劃問(wèn)題中,本方法搜索到的規(guī)劃解在代價(jià)開(kāi)銷(xiāo)和規(guī)劃步長(zhǎng)方面都比LAMA好,主要原因在于:隨著問(wèn)題規(guī)模的逐步擴(kuò)大,啟發(fā)式函數(shù)對(duì)狀態(tài)節(jié)點(diǎn)的估計(jì)變得越來(lái)越不準(zhǔn)確,LAMA單一依賴(lài)啟發(fā)函數(shù)進(jìn)行搜索就會(huì)出現(xiàn)偏差,本方法通過(guò)增加狀態(tài)節(jié)點(diǎn)選擇的多樣性,在一定程度上降低搜索對(duì)啟發(fā)式函數(shù)的依賴(lài),使得在搜索目標(biāo)狀態(tài)過(guò)程中能過(guò)糾正啟發(fā)函數(shù)估計(jì)錯(cuò)誤而導(dǎo)致的問(wèn)題。由表2可知,在normstery領(lǐng)域中,LAMA的平均規(guī)劃代價(jià)和規(guī)劃步長(zhǎng)為29.9,本方法的平均規(guī)劃代價(jià)開(kāi)銷(xiāo)和規(guī)劃長(zhǎng)度為25.2。從上面的實(shí)驗(yàn)結(jié)果可以看出,本文提出的方法改善了規(guī)劃解的質(zhì)量。

    表1 openstack領(lǐng)域規(guī)劃長(zhǎng)度和規(guī)劃代價(jià)比較

    表2 normstery領(lǐng)域規(guī)劃長(zhǎng)度和規(guī)劃代價(jià)比較

    4 結(jié)束語(yǔ)

    本文通過(guò)分析最優(yōu)優(yōu)先搜索策略單一依賴(lài)啟發(fā)式函數(shù)指導(dǎo)搜索而導(dǎo)致的問(wèn)題。提出了增加開(kāi)列表多樣性和狀態(tài)節(jié)點(diǎn)選擇多樣性的方法,減少搜索對(duì)啟發(fā)式函數(shù)的依賴(lài),進(jìn)而避免由于啟發(fā)式函數(shù)估計(jì)錯(cuò)誤而導(dǎo)致的局部最優(yōu)和高原狀態(tài)。該方法立足于在搜索過(guò)程中發(fā)現(xiàn)更多的路徑,使得搜索不單一地選擇估計(jì)的最優(yōu)路徑方向進(jìn)行搜索,從而實(shí)現(xiàn)對(duì)規(guī)劃質(zhì)量的改善。實(shí)驗(yàn)結(jié)果表明,該方法是可行的。

    然而,現(xiàn)實(shí)規(guī)劃問(wèn)題多種多樣,本文所提出的方法只是在一定范圍內(nèi)增加了狀態(tài)節(jié)點(diǎn)選擇的多樣性,隨著更多復(fù)雜規(guī)劃問(wèn)題的出現(xiàn),本方法在增加多樣性方面也就有了進(jìn)一步擴(kuò)展的空間??梢栽陂_(kāi)列表選擇方式中加入相關(guān)的啟發(fā)式值參數(shù),然后將參數(shù)Y的指數(shù)換成啟發(fā)式值和各個(gè)開(kāi)列表優(yōu)先級(jí)的一個(gè)加權(quán),通過(guò)這樣來(lái)進(jìn)一步增加搜索中選擇的多樣性,這是一個(gè)值得研究的方向。

    [1]Helmert M.The fast downward planning system [J].Journal of Artificial Intelligence Research,2006,26 (1):191-246.

    [2]Richter S,Westphal M.The LAMA planner:Guiding costbased anytime planning with landmarks [J].Journal of Artificial Intelligence Research,2010,39 (1):127-77.

    [3]Lu Q,Xu Y,Huang R,et al.The roamer planner randomwalk assisted best-first search [C]//Proc International Plan-ning Competition,2011:73-76.

    [4]Benton J,Talamadupula K,Eyerich P,et al.G-value plateaus:A challenge for planning[C]//Proceedings of the International Conference on Automated Planning and Scheduling,2010:259-262.

    [5]Eric A Hansen,Zhou Rong.Anytime heuristic search [J].Journal of Artificial Intelligence Research,2007,28 (1):267-297.

    [6]Richter S,Thayer J T,Ruml W.The joy of forgetting:Faster anytime search via restarting [C]//Proceedings of the Twentieth International Conference on Automated Planning and Scheduling,2010:137-144.

    [7]Carlos Linares,Daniel Borrajo.Adding diversity to classical heuristic planning [C]//Proceedings of the Third Annual Symposium on Combinatorial Search,2010:73-80.

    [8]Zhou R,Hansen E A.Breadth-first heuristic search [J].Artificial Intelligence,2006,170 (4-5):385-408.

    [9]Nakhost H,Müller M.Monte-Carlo explorationfor deterministic planning [C]//Proceedings of the Twenty-First International Joint Conference on Artificial Intelligence,2009:1766-1771.

    [10]Maxim Likhachev,Anthony Stentz.R*search [C]//Proceedings of the Twenty-Third AAAI Conference on Artificial Intelligence,2008:344-350.

    猜你喜歡
    后繼代價(jià)列表
    巧用列表來(lái)推理
    學(xué)習(xí)運(yùn)用列表法
    擴(kuò)列吧
    愛(ài)的代價(jià)
    海峽姐妹(2017年12期)2018-01-31 02:12:22
    代價(jià)
    皮亞諾公理體系下的自然數(shù)運(yùn)算(一)
    湖南教育(2017年3期)2017-02-14 03:37:33
    甘岑后繼式演算系統(tǒng)與其自然演繹系統(tǒng)的比較
    濾子與濾子圖
    成熟的代價(jià)
    不含3-圈的1-平面圖的列表邊染色與列表全染色
    临湘市| 乡城县| 凉城县| 郸城县| 元朗区| 文成县| 孙吴县| 南乐县| 高台县| 河曲县| 江阴市| 连城县| 盐边县| 兴和县| 扎赉特旗| 铜山县| 枣强县| 武山县| 手游| 依安县| 延安市| 北宁市| 九台市| 建湖县| 长子县| 花莲县| 石阡县| 郴州市| 萍乡市| 道真| 昭平县| 穆棱市| 昌平区| 措美县| 驻马店市| 富平县| 石景山区| 黑河市| 宁化县| 阿合奇县| 衡山县|