當前位置:首頁 > 科技文檔 > 船舶工業(yè) > 正文

基于多智能體深度強化學習的多船協(xié)同避碰策略

計算機集成制造系統(tǒng) 頁數(shù): 17 2023-12-13
摘要: 為了提高多船會遇時智能避碰策略的協(xié)同性、安全性、實用性和節(jié)能性,在中心化訓練去中心化執(zhí)行框架下,結合優(yōu)先經驗回放機制提出一種多智能體Softmax深層雙確定性策略梯度PER-MASD3算法,用于解決多船協(xié)同避碰問題,該算法不僅解決了雙延遲確定策略梯度(TD3)算法存在的值估計偏差問題,還在模型訓練過程中引入熵正則項,以促進探索和控制隨機控制策略,采用自適應噪聲對不同階段的任務進... (共17頁)

開通會員,享受整站包年服務立即開通 >