智駕決策規(guī)劃算法(RL方向)-【自動(dòng)駕駛】(J21033)
40000-70000元
上海
應(yīng)屆畢業(yè)生
本科
上海
應(yīng)屆畢業(yè)生
本科
- 全勤獎(jiǎng)
- 節(jié)日福利
- 不加班
- 周末雙休
職位描述
該職位還未進(jìn)行加V認(rèn)證,請(qǐng)仔細(xì)了解后再進(jìn)行投遞!
Base地:北京望京SOHU或上海閔行莘莊
職責(zé)描述:
1. 負(fù)責(zé)基于強(qiáng)化學(xué)習(xí)(如Online/Offline RL、Model-based RL)的自動(dòng)駕駛行為決策與運(yùn)動(dòng)規(guī)劃算法研發(fā),重點(diǎn)解決結(jié)構(gòu)化道路(高速、城市快速路)及非結(jié)構(gòu)化場(chǎng)景(自動(dòng)泊車(chē))中的動(dòng)態(tài)交互與博弈問(wèn)題;
2. 針對(duì)復(fù)雜動(dòng)態(tài)場(chǎng)景(密集車(chē)流、無(wú)保護(hù)路口、人車(chē)混流),設(shè)計(jì)基于數(shù)據(jù)驅(qū)動(dòng)的決策規(guī)劃算法,通過(guò)大規(guī)模分布式訓(xùn)練系統(tǒng)提升策略的智能性、安全性及泛化能力;
3. 構(gòu)建與迭代仿真環(huán)境(如CARLA、NVIDIA Isaac)與世界模型,推動(dòng)強(qiáng)化學(xué)習(xí)策略的仿真訓(xùn)練與實(shí)車(chē)遷移(Sim2real),形成“真實(shí)數(shù)據(jù)→仿真訓(xùn)練→實(shí)車(chē)驗(yàn)證”的閉環(huán)優(yōu)化;
4. 參與全棧自動(dòng)駕駛決策控制系統(tǒng)的開(kāi)發(fā),對(duì)接感知、預(yù)測(cè)、端到端模塊,實(shí)現(xiàn)基于強(qiáng)化學(xué)習(xí)的決策規(guī)劃算法在車(chē)載平臺(tái)上的部署、性能優(yōu)化與實(shí)車(chē)路測(cè);
5. 跟蹤強(qiáng)化學(xué)習(xí)在自動(dòng)駕駛領(lǐng)域的前沿進(jìn)展(如大模型與RL結(jié)合、逆強(qiáng)化學(xué)習(xí)、多智能體博弈),進(jìn)行技術(shù)預(yù)研與算法創(chuàng)新,推動(dòng)研究成果在量產(chǎn)項(xiàng)目中的應(yīng)用與落地。
任職要求:
1. 計(jì)算機(jī)科學(xué)、自動(dòng)化、機(jī)器學(xué)習(xí)、機(jī)器人學(xué)等相關(guān)專(zhuān)業(yè)本科及以上學(xué)歷;
2. 具備扎實(shí)的強(qiáng)化學(xué)習(xí)理論基礎(chǔ),熟悉主流RL算法(PPO、SAC、TD3、IQL等),并至少在一項(xiàng)自動(dòng)駕駛或機(jī)器人項(xiàng)目中具有RL算法落地經(jīng)驗(yàn);
3. 熟練掌握Python/C ,熟悉PyTorch等深度學(xué)習(xí)框架,具備大規(guī)模強(qiáng)化學(xué)習(xí)分布式訓(xùn)練(如Ray、Kubernetes)或仿真平臺(tái)開(kāi)發(fā)經(jīng)驗(yàn)者優(yōu)先;
4. 熟悉自動(dòng)駕駛決策規(guī)劃常見(jiàn)方法(如MDP/POMDP、搜索與優(yōu)化算法),并能夠?qū)?qiáng)化學(xué)習(xí)與傳統(tǒng)規(guī)劃方法(如MPC、Lattice)結(jié)合解決實(shí)際問(wèn)題;
5. 具備良好的數(shù)學(xué)基礎(chǔ),熟悉優(yōu)化理論、概率論、車(chē)輛動(dòng)力學(xué)建模,能夠支撐RL算法中的獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)、策略優(yōu)化與安全約束處理。
加分項(xiàng):
1. 在NeurIPS、ICLR、ICML、ICRA、CoRL等會(huì)議或期刊發(fā)表過(guò)強(qiáng)化學(xué)習(xí)相關(guān)論文;
2. 具備自動(dòng)駕駛量產(chǎn)項(xiàng)目(如NOA、LCC)或L4級(jí)項(xiàng)目(Robotaxi、Robobus)中RL算法集成與調(diào)試經(jīng)驗(yàn);
3. 熟悉仿生學(xué)習(xí)、逆強(qiáng)化學(xué)習(xí)、世界模型等技術(shù),具備數(shù)據(jù)合成、評(píng)測(cè)基準(zhǔn)構(gòu)建或RL訓(xùn)練基礎(chǔ)設(shè)施開(kāi)發(fā)經(jīng)驗(yàn);
4. 熟悉ROS、Apollo等自動(dòng)駕駛框架,或具備CARLA、Isaac Gym等仿真工具鏈的使用和開(kāi)發(fā)能力。
工作地點(diǎn)
地址:上海閔行區(qū)上海-閔行區(qū)旭輝·莘莊中心-1號(hào)樓上海閔行區(qū)旭輝莘莊中心1號(hào)樓6層
??
點(diǎn)擊查看地圖
詳細(xì)位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財(cái)物(如體檢費(fèi)、置裝費(fèi)、押金、服裝費(fèi)、培訓(xùn)費(fèi)、身份證、畢業(yè)證等),均涉嫌違法,請(qǐng)求職者務(wù)必提高警惕。
職位發(fā)布者
孫先生HR
上海鈞正網(wǎng)絡(luò)科技有限公司
-
互聯(lián)網(wǎng)·電子商務(wù)
-
1000人以上
-
私營(yíng)·民營(yíng)企業(yè)
-
鼓樓街道
相似職位
-
儲(chǔ)備助理 6000元以下1年以上 大專(zhuān)跨越速運(yùn)集團(tuán)有限公司
-
電商倉(cāng)庫(kù)操作員 面議應(yīng)屆畢業(yè)生 高中祖名豆制品股份有限公司
-
新媒體短視頻拍攝剪輯 1元以上應(yīng)屆畢業(yè)生 不限東華汽車(chē)實(shí)業(yè)有限公司
-
招聘辦公室文員 3000-4000元應(yīng)屆畢業(yè)生 大專(zhuān)泰州市高港區(qū)迪新醫(yī)用設(shè)備有限公司
-
成本管理師 7元以上3年以上 本科慶鼎精密電子(淮安)有限公司
-
高級(jí)尋源采購(gòu)工程師 面議8年以上 本科蘇州益騰電子科技有限公司

2026-02-23 01:39:59
22人關(guān)注
注:聯(lián)系我時(shí),請(qǐng)說(shuō)是在江蘇人才網(wǎng)上看到的。
