基于深度強化學(xué)習(xí)的自動駕駛行為決策方法
基本信息

| 申請?zhí)?/td> | CN202010381846.X | 申請日 | - |
| 公開(公告)號 | CN111605565A | 公開(公告)日 | 2020-09-01 |
| 申請公布號 | CN111605565A | 申請公布日 | 2020-09-01 |
| 分類號 | B60W60/00(2020.01)I | 分類 | 一般車輛; |
| 發(fā)明人 | 楊明珠;劉相偉;李卓犖 | 申請(專利權(quán))人 | 昆山小眼探索信息科技有限公司 |
| 代理機構(gòu) | 北京中索知識產(chǎn)權(quán)代理有限公司 | 代理人 | 胡大成 |
| 地址 | 215323江蘇省蘇州市昆山市張浦鎮(zhèn)尚明甸村村民委員會 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開了基于深度強化學(xué)習(xí)的自動駕駛行為決策方法,包括:獲取自動駕駛車輛周圍的當(dāng)前環(huán)境狀態(tài);根據(jù)輸入的當(dāng)前環(huán)境狀態(tài)和自動駕駛車輛的當(dāng)前行為狀態(tài),在經(jīng)驗池中選擇并輸出自動駕駛車輛的動作行為,如果經(jīng)驗池中沒有與當(dāng)前環(huán)境狀態(tài)對應(yīng)的動作行為,則由深度強化學(xué)習(xí)結(jié)構(gòu)計算并輸出自動駕駛車輛的動作行為。本發(fā)明的獲取當(dāng)前環(huán)境狀態(tài)采用RGB攝像頭、紅外攝像頭和固態(tài)激光雷達,減少了傳感器的使用。通過模仿學(xué)習(xí)人類駕駛員的駕駛經(jīng)驗形成經(jīng)驗池,使得自動駕駛車輛更接近人類的駕駛習(xí)慣,有利于解決有人車和無人車在路上并存的問題,更重要的是提升了安全性。?? |





