專利名稱 一種融合經(jīng)驗價值動態(tài)評估的強化學習避撞控制方法
申請?zhí)?專利號 CN202510031632.2 專利權(quán)人(第一權(quán)利人) 長春工業(yè)大學
申請日 2025-01-09 授權(quán)日 2025-06-06
專利類別 授權(quán)發(fā)明 戰(zhàn)略新興產(chǎn)業(yè)分類 新一代信息技術
技術主題 樣本分類|風險評估|工業(yè)工程學|強化學習|仿真|實時計算
應用領域 內(nèi)燃活塞發(fā)動機|防撞系統(tǒng)|生物學模型|設計優(yōu)化/仿真|特殊數(shù)據(jù)處理應用|控制裝置
意向價格 具體面議
專利概述 一種融合經(jīng)驗價值動態(tài)評估的強化學習避撞控制方法,為解決當前智能駕駛控制策略樣本利用率差的等問題。本發(fā)明涉及智能駕駛領域。本發(fā)明包括風險評估模塊、經(jīng)驗樣本分類模塊、經(jīng)驗樣本價值評估模塊和經(jīng)驗池分配模塊。其中,風險評估模塊實時評估每個環(huán)境步的風險參數(shù),經(jīng)驗樣本分類模塊根據(jù)風險參數(shù)將經(jīng)驗樣本分類儲存在安全、待觀察和危險三個經(jīng)驗池中,經(jīng)驗價值評估模塊實時動態(tài)評估經(jīng)驗樣本的價值,并將三個經(jīng)驗池中的經(jīng)驗樣本分別進行排序,經(jīng)驗池分配模塊實時動態(tài)評估三個經(jīng)驗池的價值,確定三個經(jīng)驗池的抽取比例,傳至智能體進行經(jīng)驗回放,更新安全通行策略,重復上述過程,直至獲得最優(yōu)的安全通行策略。
圖片資料 一種融合經(jīng)驗價值動態(tài)評估的強化學習避撞控制方法
合作方式 具體面議
聯(lián)系人 戚梅宇 聯(lián)系電話 13074363281