Wayve利用強化學(xué)習(xí)技術(shù)及“獎懲制度” 實現(xiàn)雷諾Twizy的自動駕駛導(dǎo)航

作者：時間：2018-07-12 來源：蓋世汽車網(wǎng)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

　　據(jù)外媒報道，人工智能初創(chuàng)企業(yè)Wayve認(rèn)為，應(yīng)該尋找更好的方式來為自動駕駛汽車提供駕駛培訓(xùn)，而非致力于配置更為成熟的硬件及詳細(xì)的3D地圖。該公司于近日發(fā)布了一個視頻，展示了改款雷諾Twizy車型(雙座版電動車)是如何自學(xué)自動駕駛導(dǎo)航的。該車輛利用強化學(xué)習(xí)(機器學(xué)習(xí)技術(shù)的一種)，該系統(tǒng)在作出理想的操作后，會獲得“獎賞”，而作出不理想的操作后，將會受到“懲罰”。

本文引用地址：http://m.butianyuan.cn/article/201807/383134.htm

　　目前，大部分在研發(fā)的自動駕駛系統(tǒng)均依賴3D明細(xì)地圖來提供導(dǎo)航，全球各大公司競相創(chuàng)建新地圖，利用成熟的傳感器及攝像頭技術(shù)，繪制詳細(xì)的城市街道及高速地圖。換言之，自動駕駛系統(tǒng)需要其攝像頭及傳感器復(fù)雜體系的支持，從而實現(xiàn)導(dǎo)航操作。

　　不幸的是，3D地圖是一項勞動密集型的工作，需要頻繁更新地圖中的建筑物。從事3D地圖業(yè)務(wù)的各公司計劃優(yōu)先關(guān)注并繪制交通量高的道路，再繪制郊區(qū)地圖。

　　Wayve的技術(shù)或?qū)⑻蕴?D地圖。在視頻中，雷諾Twizy車型只搭載了一款前置攝像頭(大多數(shù)的自動駕駛車輛均配置了多款攝像頭。以特斯拉的Autopilot為例，其車型搭載了8個攝像頭)。相較之下，雷諾Twizy車型采用一個攝像頭向圖像處理單元(graphics processing unit，GPU)提供實時信息，該款GPU可運行Wayve公司的強化學(xué)習(xí)算法，可控制車輛的加速、制動及轉(zhuǎn)向。

　　在車輛學(xué)習(xí)過程中，后備駕駛員坐在駕駛座內(nèi)，每當(dāng)車輛偏離道路時，會“懲罰”一次系統(tǒng)。當(dāng)人為干預(yù)操作的間隔期越久，系統(tǒng)所獲得的“獎勵”就越多。

　　在近20分鐘時間里，車輛能夠指出應(yīng)如何解決多彎道路況的行駛問題。

　　若Wayve持續(xù)研發(fā)其強化學(xué)習(xí)算法，未來自動駕駛車輛似乎不再依賴3D地圖，這意味著所有人都將因自動駕駛車輛而獲益，享受出行樂趣。

新聞中心

Wayve利用強化學(xué)習(xí)技術(shù)及“獎懲制度” 實現(xiàn)雷諾Twizy的自動駕駛導(dǎo)航

評論

相關(guān)推薦

技術(shù)專區(qū)