一種基于強(qiáng)化學(xué)習(xí)的路徑規(guī)劃方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN202011263430.4 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112507520A 公開(kāi)(公告)日 2021-03-16
申請(qǐng)公布號(hào) CN112507520A 申請(qǐng)公布日 2021-03-16
分類號(hào) G06F30/20(2020.01)I;G06F17/15(2006.01)I;G06N20/00(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 周銳;胡文;孫佳優(yōu);葉梓豪;郭浩文 申請(qǐng)(專利權(quán))人 深圳慧拓?zé)o限科技有限公司
代理機(jī)構(gòu) 北京力量專利代理事務(wù)所(特殊普通合伙) 代理人 毛雨田
地址 518057廣東省深圳市南山區(qū)粵海街道麻嶺社區(qū)深南大道9966號(hào)威盛科技大廈21層
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于強(qiáng)化學(xué)習(xí)的路徑規(guī)劃方法及裝置,通過(guò)建立環(huán)境勢(shì)能場(chǎng),利用目標(biāo)點(diǎn)的引力場(chǎng)和障礙物的斥力場(chǎng)對(duì)迭代路徑的引導(dǎo)作用,可以加快收斂的速度,并且可以根據(jù)環(huán)境勢(shì)能場(chǎng)優(yōu)化獎(jiǎng)勵(lì)函數(shù),從而實(shí)現(xiàn)獎(jiǎng)勵(lì)函數(shù)中也體現(xiàn)環(huán)境勢(shì)能,即綜合原獎(jiǎng)勵(lì)函數(shù)、目標(biāo)點(diǎn)的引力場(chǎng)和障礙物的斥力場(chǎng)所產(chǎn)生的作用力的合力,來(lái)更有目的性的選取迭代路徑,得到下一狀態(tài),從而在加快迭代搜索效率的同時(shí)也能夠更加容易找到目標(biāo)點(diǎn),從而提高學(xué)習(xí)能力。??