亚洲精品少妇久久久久久海角社区,色婷婷亚洲一区二区综合,伊人蕉久中文字幕无码专区,日韩免费高清大片在线

羅戈網(wǎng)
搜  索
登陸成功

登陸成功

積分  

淺談自動駕駛中的行為風(fēng)險識別(一)

[羅戈導(dǎo)讀]無人車行為決策模塊面對的是高不確定性的動態(tài)場景。

引言

我們可以通過一個比喻來解釋什么是行為風(fēng)險識別:自動駕駛的機器大腦在參加一場考試,他遇到一道難題,在兩個答案之間猶豫不決。盡管這道難題他不會做,但我們可以通過許多方式得知他“拿不準”這件事本身,例如題目描述的場景復(fù)雜或者之前不熟悉,并進一步針對這道題目請求“人類教練”的幫助。

01自動駕駛的機器大腦如何工作?

我們?nèi)祟愒陂_車的時候,會由眼睛和耳朵等“傳感器”完成對環(huán)境信息的探測和感知,然后這些信息傳入我們的大腦,大腦經(jīng)過所有的處理之后,發(fā)出直接的動作指令給“控制器“——我們的手和腳。

對于人類大腦的工作過程,我們還所知有限。而在當前的自動駕駛技術(shù)中,有一種嘗試是“端到端”技術(shù),也就是完全模擬我們的大腦,試圖直接將傳感器獲得的環(huán)境信息輸入深度神經(jīng)網(wǎng)絡(luò),直接輸出對車輛的控制信號。

這類方法存在一個最大的問題就是深度神經(jīng)網(wǎng)絡(luò)缺乏可解釋性。當遇到未知的場景時,我們無法保障網(wǎng)絡(luò)輸出結(jié)果的安全性。因此,當前絕大部分自動駕駛企業(yè)還是采用分層和解耦的思路,來解決自動駕駛決策的問題。

在這種思路下,自動駕駛的大腦工作由決策規(guī)劃模塊來完成(更多詳細內(nèi)容可參考之前的技術(shù)文章):

圖1.  自動駕駛系統(tǒng)中的決策規(guī)劃模塊分層結(jié)構(gòu)

如圖1所示,典型的決策規(guī)劃模塊可以分為三個層次。其中,全局路徑規(guī)劃(Route Planning)在接收到一個給定的行駛目的地之后,結(jié)合地圖信息,生成一條全局的路徑,作為為后續(xù)具體路徑規(guī)劃的參考;行為決策層(Behavioral Layer)在接收到全局路徑后,結(jié)合從感知模塊得到的環(huán)境信息(包括其他車輛與行人,障礙物,以及道路上的交通規(guī)則信息),以及從預(yù)測模塊得到的障礙物未來可能行駛軌跡信息,作出具體的行為決策(例如選擇變道超車還是跟隨);最后,運動規(guī)劃(Motion Planning)層根據(jù)具體的行為決策,規(guī)劃生成一條滿足特定約束條件(例如車輛本身的動力學(xué)約束、避免碰撞、乘客舒適性等)的軌跡,該軌跡作為控制模塊的輸入決定車輛最終行駛路徑。

02行為決策層的輸入輸出

通過上面的介紹我們已經(jīng)知道,機器大腦通過分層的方法來降低問題難度。在目前的技術(shù)發(fā)展階段,全局路徑規(guī)劃和運動規(guī)劃這兩個部分的方案已經(jīng)相對比較成熟。這一方面也是由于這兩層的任務(wù)目標十分明確(我們的行駛目的地是確定的;運動規(guī)劃需要滿足的約束條件也是確定的)。

而在行為決策層,我們需要面對的則是一系列不確定性的輸入信息。這種不確定性的來源主要有兩大部分:

  • 一部分來自環(huán)境,因為我們的物理世界本身就是在不斷變化的,環(huán)境中其他交通參與者未來的行為我們無法明確得知(預(yù)測模塊的任務(wù)就是降低這一類不確定性)

  • 另一部分來自傳感器在采集和處理環(huán)境信息的時候(將物理世界在數(shù)字世界中建模),不可避免地需要進行采樣等離散化處理,這樣就導(dǎo)致真實物理世界的連續(xù)信息有一部分損失,同時也會產(chǎn)生空間上的誤差和時間上的延遲。

與之相對的是,行為決策層的輸出卻必須是確定性的結(jié)果,具體來說,這些輸出通常包括:

  • 綜合決策(主車的綜合決策行為,如換道意圖和借道意圖)

  • 個體決策(主車對單個障礙物做出的決策,如繞行和減速避讓)

用嚴格一些的語言來說,下游運動規(guī)劃層需要生成具體的行駛軌跡,在數(shù)學(xué)上這是一個非凸優(yōu)化問題,難以直接求解,因此行為決策需要將運動規(guī)劃的解空間進行限定,保證運動規(guī)劃模塊的求解高效性和穩(wěn)定性。

03為什么需要行為風(fēng)險識別?

在處理這些輸入不確定性,并輸出確定性決策的過程中。我們需要考慮的目標是多樣化的,不僅僅包括安全性,還要考慮交通規(guī)則、決策穩(wěn)定性,車輛模型,甚至還要求無人車的行為需要符合人類駕駛習(xí)慣(環(huán)境中存在大量與人類參與者的交互)。

我們需要將這些多目標轉(zhuǎn)換為機器容易理解和處理的方式,具體手段包括:

  • 約束目標:將碰撞避免、交通規(guī)則等目標轉(zhuǎn)換為不可以違反的邊界條件。

  • 優(yōu)化目標:對一些軟性的目標(通行效率、舒適性等)設(shè)置不同權(quán)重的損失懲罰函數(shù)。

由于輸入信息的不確定性,我們的機器大腦在實際中常常面臨“兩難”的局面。例如下圖這樣十分常見的一種場景,選擇減速跟車還是換道超車。前者會影響通行效率,而后者則可能帶來更高的風(fēng)險(旁邊車道來車)。

圖2.  常見的一種行為決策場景:減速or變道

而實際的場景更為復(fù)雜多變,并且一定會出現(xiàn)長尾場景,每一種行為決策的選擇都不可能完全避免未來的風(fēng)險,決策輸出的多目標求解過程無法保證每次都得到最低風(fēng)險的結(jié)果。因此,我們需要在行為決策層增加一種以安全性為單目標的算法模型,希望能夠?qū)赡馨l(fā)生的風(fēng)險進行提前的識別,當安全性不滿足要求時采用人工接管或保守策略。

讀者可能提出的一個問題是:如果能夠建立這樣的風(fēng)險識別模型,那不就可以作出最安全的行為決策了嗎?這個問題的答案其實就是在“知道正確答案”和“知道不會做”二者之間其實是存在一個gap的。在預(yù)期功能安全國際標準(ISO/PAS 21448)中,場景(scenarios)被劃分為如下圖所示的4個區(qū)間,分別為(1)已知-安全、(2)已知-不安全、(3)未知-不安全和(4)未知-安全。最終的目標是盡可能縮小位于區(qū)間(2)和(3)中的場景(scenarios)比例,即將確保場景(scenarios)控制在安全的區(qū)間。而行為風(fēng)險識別希望達到的目的就是將區(qū)間(3)中的場景首先轉(zhuǎn)化為區(qū)間(2),即“know unknowns”。接下來,隨著行為決策本身算法能力的不斷提升(越來越見多識廣),才能夠?qū)⒏嗟膮^(qū)間(2)場景轉(zhuǎn)化為區(qū)間(1)。

圖3.  國際標準ISO/PAS 21448中對場景(scenarios)的分類

總結(jié)

無人車行為決策模塊面對的是高不確定性的動態(tài)場景。在當前技術(shù)階段,存在算法能力的覆蓋邊界。在邊界上存在的長尾問題是最難解決的一類問題,同時也是最危險的場景。在我們的自動駕駛算法不斷進步,不斷擴大能力邊界的同時,我們也希望通過對行為決策模塊各種指標進行在線監(jiān)控,同時結(jié)合周圍環(huán)境信息,希望從這些“蛛絲馬跡”中提前識別出危險場景。然后對算法結(jié)果進行反饋,并向人類安全員發(fā)出提醒。

行為風(fēng)險識別的具體算法,以及識別后的處理方式,將在下次技術(shù)解析中詳細介紹。

免責聲明:羅戈網(wǎng)對轉(zhuǎn)載、分享、陳述、觀點、圖片、視頻保持中立,目的僅在于傳遞更多信息,版權(quán)歸原作者。如無意中侵犯了您的版權(quán),請第一時間聯(lián)系,核實后,我們將立即更正或刪除有關(guān)內(nèi)容,謝謝!
上一篇:2021 LOG 中國供應(yīng)鏈&物流科技創(chuàng)新企業(yè)-蕪湖安得智聯(lián)科技有限公司
下一篇:美團分布式自動駕駛引擎
羅戈訂閱
周報
1元 2元 5元 10元

感謝您的打賞

登錄后才能發(fā)表評論

登錄

相關(guān)文章

2025-06-16
2025-06-15
2025-06-15
2025-06-06
2025-05-21
2025-04-18
活動/直播 更多

2025第四屆低碳供應(yīng)鏈&物流創(chuàng)新發(fā)展高峰論壇

  • 時間:2025-05-21 ~ 2025-06-20
  • 主辦方:羅戈網(wǎng)、物流沙龍、羅戈研究
  • 協(xié)辦方:億通國際、亞太碳中和創(chuàng)新示范社區(qū)
報告 更多

2025年5月物流行業(yè)月報-個人版

  • 作者:羅戈研究

¥:9.9元