新一代信息技術
一種基于SAC的汽車自適應巡航控制優(yōu)化方法
一種基于SAC的汽車自適應巡航控制優(yōu)化方法,屬于自動駕駛領域,其特征在于,該方法包括以下模塊:駕駛環(huán)境、狀態(tài)信息處理模塊、SAC強化學習模塊、動態(tài)獎勵函數(shù)模塊、經驗分類模塊和經驗采樣模塊。首先,從駕駛環(huán)境中獲取兩個維度的融合信息,得到當前狀態(tài),然后,SAC強化學習模塊基于當前狀態(tài)決策控制動作并應用于駕駛環(huán)境,更新環(huán)境并獲取下一時刻的狀態(tài)。其中,動態(tài)獎勵函數(shù)模塊根據(jù)動作效果和重要性差異計算獎勵值;經驗分類模塊根據(jù)駕駛環(huán)境對經驗樣本進行分區(qū)域存儲;經驗采樣模塊采用固定經驗采樣和局部優(yōu)先經驗回放方法,對樣本進行采樣,用于訓練SAC強化學習模塊,并決策出最優(yōu)控制動作,實現(xiàn)自適應巡航控制。
長春工業(yè)大學
授權發(fā)明