| 專利名稱 |
一種融合經(jīng)驗價值動態(tài)評估的強化學習避撞控制方法 |
| 申請?zhí)?專利號 |
CN202510031632.2 |
專利權(quán)人(第一權(quán)利人) |
長春工業(yè)大學 |
| 申請日 |
2025-01-09 |
授權(quán)日 |
2025-06-06 |
| 專利類別 |
授權(quán)發(fā)明 |
戰(zhàn)略新興產(chǎn)業(yè)分類 |
新一代信息技術 |
| 技術主題 |
樣本分類|風險評估|工業(yè)工程學|強化學習|仿真|實時計算 |
| 應用領域 |
內(nèi)燃活塞發(fā)動機|防撞系統(tǒng)|生物學模型|設計優(yōu)化/仿真|特殊數(shù)據(jù)處理應用|控制裝置 |
| 意向價格 |
具體面議 |
| 專利概述 |
一種融合經(jīng)驗價值動態(tài)評估的強化學習避撞控制方法,為解決當前智能駕駛控制策略樣本利用率差的等問題。本發(fā)明涉及智能駕駛領域。本發(fā)明包括風險評估模塊、經(jīng)驗樣本分類模塊、經(jīng)驗樣本價值評估模塊和經(jīng)驗池分配模塊。其中,風險評估模塊實時評估每個環(huán)境步的風險參數(shù),經(jīng)驗樣本分類模塊根據(jù)風險參數(shù)將經(jīng)驗樣本分類儲存在安全、待觀察和危險三個經(jīng)驗池中,經(jīng)驗價值評估模塊實時動態(tài)評估經(jīng)驗樣本的價值,并將三個經(jīng)驗池中的經(jīng)驗樣本分別進行排序,經(jīng)驗池分配模塊實時動態(tài)評估三個經(jīng)驗池的價值,確定三個經(jīng)驗池的抽取比例,傳至智能體進行經(jīng)驗回放,更新安全通行策略,重復上述過程,直至獲得最優(yōu)的安全通行策略。 |
| 圖片資料 |
|
| 合作方式 |
具體面議 |
| 聯(lián)系人 |
戚梅宇 |
聯(lián)系電話 |
13074363281 |