一種基于強(qiáng)化學(xué)習(xí)的路徑規(guī)劃方法及裝置
基本信息

| 申請(qǐng)?zhí)?/td> | CN202011263430.4 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN112507520A | 公開(kāi)(公告)日 | 2021-03-16 |
| 申請(qǐng)公布號(hào) | CN112507520A | 申請(qǐng)公布日 | 2021-03-16 |
| 分類號(hào) | G06F30/20(2020.01)I;G06F17/15(2006.01)I;G06N20/00(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 周銳;胡文;孫佳優(yōu);葉梓豪;郭浩文 | 申請(qǐng)(專利權(quán))人 | 深圳慧拓?zé)o限科技有限公司 |
| 代理機(jī)構(gòu) | 北京力量專利代理事務(wù)所(特殊普通合伙) | 代理人 | 毛雨田 |
| 地址 | 518057廣東省深圳市南山區(qū)粵海街道麻嶺社區(qū)深南大道9966號(hào)威盛科技大廈21層 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明提供了一種基于強(qiáng)化學(xué)習(xí)的路徑規(guī)劃方法及裝置,通過(guò)建立環(huán)境勢(shì)能場(chǎng),利用目標(biāo)點(diǎn)的引力場(chǎng)和障礙物的斥力場(chǎng)對(duì)迭代路徑的引導(dǎo)作用,可以加快收斂的速度,并且可以根據(jù)環(huán)境勢(shì)能場(chǎng)優(yōu)化獎(jiǎng)勵(lì)函數(shù),從而實(shí)現(xiàn)獎(jiǎng)勵(lì)函數(shù)中也體現(xiàn)環(huán)境勢(shì)能,即綜合原獎(jiǎng)勵(lì)函數(shù)、目標(biāo)點(diǎn)的引力場(chǎng)和障礙物的斥力場(chǎng)所產(chǎn)生的作用力的合力,來(lái)更有目的性的選取迭代路徑,得到下一狀態(tài),從而在加快迭代搜索效率的同時(shí)也能夠更加容易找到目標(biāo)點(diǎn),從而提高學(xué)習(xí)能力。?? |





