基于分布式強(qiáng)化學(xué)習(xí)的多小區(qū)協(xié)同波束賦形方法

基本信息

申請?zhí)?/td> CN202110768826.2 申請日 -
公開(公告)號 CN113472472A 公開(公告)日 2021-10-01
申請公布號 CN113472472A 申請公布日 2021-10-01
分類號 H04J11/00(2006.01)I;H04W16/28(2009.01)I;H04B7/06(2006.01)I;H04B7/08(2006.01)I;G06N20/00(2019.01)I 分類 電通信技術(shù);
發(fā)明人 高貞貞;廖學(xué)文;吳丹青;張金;羅偉 申請(專利權(quán))人 湖南國天電子科技有限公司
代理機(jī)構(gòu) 長沙大珂知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 伍志祥
地址 410000湖南省長沙市岳麓西大道芯城科技園3棟12層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了基于分布式強(qiáng)化學(xué)習(xí)的多小區(qū)協(xié)同波束賦形方法,包括以下步驟:為基站j建立一個權(quán)重為θj的訓(xùn)練DQN和一個權(quán)重為θ′j的目標(biāo)DQN以及一個空的經(jīng)驗池Mj;用隨機(jī)權(quán)重初始化訓(xùn)練DQN;每隔M個時隙重復(fù)以下步驟:基站之間交互自己到所有用戶的信道狀態(tài)信息;每個基站生成未來多組M個時隙的全局信道樣本;每個基站隨機(jī)采取行動,并將相應(yīng)的經(jīng)驗存儲在其經(jīng)驗池Mj中;每個基站進(jìn)行網(wǎng)絡(luò)訓(xùn)練。本發(fā)明能在極低開銷的情況下,性能優(yōu)于對比的貪婪方案和隨機(jī)方案,接近于需要全局信息的最優(yōu)方案。