基于優(yōu)化并行的四足機器人運動技能學習
清華大學學報(自然科學版)
頁數(shù): 10 2024-05-28
摘要: 動物對自然界的適應(yīng)能力是由環(huán)境選擇與適者生存決定的,四足哺乳動物可以通過種群的進化逐步適應(yīng)環(huán)境的變化,提高其對環(huán)境的適應(yīng)度和種群的生存率。基于上述啟發(fā),該文在軟演員-評論家(SAC)算法基礎(chǔ)上提出一種基于優(yōu)化并行強化學習的算法OP-SAC,該算法使用進化策略與強化學習交替訓練,通過知識共享和知識繼承優(yōu)化四足機器人學習效果,提高訓練效率。算法驗證結(jié)果顯示,OP-SAC算法能夠完成... (共10頁)