我們可以通過(guò)一個(gè)比喻來(lái)解釋什么是行為風(fēng)險(xiǎn)識(shí)別:自動(dòng)駕駛的機(jī)器大腦在參加一場(chǎng)考試,他遇到一道難題,在兩個(gè)答案之間猶豫不決。盡管這道難題他不會(huì)做,但我們可以通過(guò)許多方式得知他“拿不準(zhǔn)”這件事本身,例如題目描述的場(chǎng)景復(fù)雜或者之前不熟悉,并進(jìn)一步針對(duì)這道題目請(qǐng)求“人類教練”的幫助。
我們?nèi)祟愒陂_(kāi)車(chē)的時(shí)候,會(huì)由眼睛和耳朵等“傳感器”完成對(duì)環(huán)境信息的探測(cè)和感知,然后這些信息傳入我們的大腦,大腦經(jīng)過(guò)所有的處理之后,發(fā)出直接的動(dòng)作指令給“控制器“——我們的手和腳。
對(duì)于人類大腦的工作過(guò)程,我們還所知有限。而在當(dāng)前的自動(dòng)駕駛技術(shù)中,有一種嘗試是“端到端”技術(shù),也就是完全模擬我們的大腦,試圖直接將傳感器獲得的環(huán)境信息輸入深度神經(jīng)網(wǎng)絡(luò),直接輸出對(duì)車(chē)輛的控制信號(hào)。
這類方法存在一個(gè)最大的問(wèn)題就是深度神經(jīng)網(wǎng)絡(luò)缺乏可解釋性。當(dāng)遇到未知的場(chǎng)景時(shí),我們無(wú)法保障網(wǎng)絡(luò)輸出結(jié)果的安全性。因此,當(dāng)前絕大部分自動(dòng)駕駛企業(yè)還是采用分層和解耦的思路,來(lái)解決自動(dòng)駕駛決策的問(wèn)題。
在這種思路下,自動(dòng)駕駛的大腦工作由決策規(guī)劃模塊來(lái)完成(更多詳細(xì)內(nèi)容可參考之前的技術(shù)文章):
圖1. 自動(dòng)駕駛系統(tǒng)中的決策規(guī)劃模塊分層結(jié)構(gòu)
如圖1所示,典型的決策規(guī)劃模塊可以分為三個(gè)層次。其中,全局路徑規(guī)劃(Route Planning)在接收到一個(gè)給定的行駛目的地之后,結(jié)合地圖信息,生成一條全局的路徑,作為為后續(xù)具體路徑規(guī)劃的參考;行為決策層(Behavioral Layer)在接收到全局路徑后,結(jié)合從感知模塊得到的環(huán)境信息(包括其他車(chē)輛與行人,障礙物,以及道路上的交通規(guī)則信息),以及從預(yù)測(cè)模塊得到的障礙物未來(lái)可能行駛軌跡信息,作出具體的行為決策(例如選擇變道超車(chē)還是跟隨);最后,運(yùn)動(dòng)規(guī)劃(Motion Planning)層根據(jù)具體的行為決策,規(guī)劃生成一條滿足特定約束條件(例如車(chē)輛本身的動(dòng)力學(xué)約束、避免碰撞、乘客舒適性等)的軌跡,該軌跡作為控制模塊的輸入決定車(chē)輛最終行駛路徑。
通過(guò)上面的介紹我們已經(jīng)知道,機(jī)器大腦通過(guò)分層的方法來(lái)降低問(wèn)題難度。在目前的技術(shù)發(fā)展階段,全局路徑規(guī)劃和運(yùn)動(dòng)規(guī)劃這兩個(gè)部分的方案已經(jīng)相對(duì)比較成熟。這一方面也是由于這兩層的任務(wù)目標(biāo)十分明確(我們的行駛目的地是確定的;運(yùn)動(dòng)規(guī)劃需要滿足的約束條件也是確定的)。
而在行為決策層,我們需要面對(duì)的則是一系列不確定性的輸入信息。這種不確定性的來(lái)源主要有兩大部分:
一部分來(lái)自環(huán)境,因?yàn)槲覀兊奈锢硎澜绫旧砭褪窃诓粩嘧兓模h(huán)境中其他交通參與者未來(lái)的行為我們無(wú)法明確得知(預(yù)測(cè)模塊的任務(wù)就是降低這一類不確定性)
另一部分來(lái)自傳感器在采集和處理環(huán)境信息的時(shí)候(將物理世界在數(shù)字世界中建模),不可避免地需要進(jìn)行采樣等離散化處理,這樣就導(dǎo)致真實(shí)物理世界的連續(xù)信息有一部分損失,同時(shí)也會(huì)產(chǎn)生空間上的誤差和時(shí)間上的延遲。
與之相對(duì)的是,行為決策層的輸出卻必須是確定性的結(jié)果,具體來(lái)說(shuō),這些輸出通常包括:
綜合決策(主車(chē)的綜合決策行為,如換道意圖和借道意圖)
個(gè)體決策(主車(chē)對(duì)單個(gè)障礙物做出的決策,如繞行和減速避讓)
用嚴(yán)格一些的語(yǔ)言來(lái)說(shuō),下游運(yùn)動(dòng)規(guī)劃層需要生成具體的行駛軌跡,在數(shù)學(xué)上這是一個(gè)非凸優(yōu)化問(wèn)題,難以直接求解,因此行為決策需要將運(yùn)動(dòng)規(guī)劃的解空間進(jìn)行限定,保證運(yùn)動(dòng)規(guī)劃模塊的求解高效性和穩(wěn)定性。
在處理這些輸入不確定性,并輸出確定性決策的過(guò)程中。我們需要考慮的目標(biāo)是多樣化的,不僅僅包括安全性,還要考慮交通規(guī)則、決策穩(wěn)定性,車(chē)輛模型,甚至還要求無(wú)人車(chē)的行為需要符合人類駕駛習(xí)慣(環(huán)境中存在大量與人類參與者的交互)。
我們需要將這些多目標(biāo)轉(zhuǎn)換為機(jī)器容易理解和處理的方式,具體手段包括:
約束目標(biāo):將碰撞避免、交通規(guī)則等目標(biāo)轉(zhuǎn)換為不可以違反的邊界條件。
優(yōu)化目標(biāo):對(duì)一些軟性的目標(biāo)(通行效率、舒適性等)設(shè)置不同權(quán)重的損失懲罰函數(shù)。
由于輸入信息的不確定性,我們的機(jī)器大腦在實(shí)際中常常面臨“兩難”的局面。例如下圖這樣十分常見(jiàn)的一種場(chǎng)景,選擇減速跟車(chē)還是換道超車(chē)。前者會(huì)影響通行效率,而后者則可能帶來(lái)更高的風(fēng)險(xiǎn)(旁邊車(chē)道來(lái)車(chē))。
圖2. 常見(jiàn)的一種行為決策場(chǎng)景:減速or變道
而實(shí)際的場(chǎng)景更為復(fù)雜多變,并且一定會(huì)出現(xiàn)長(zhǎng)尾場(chǎng)景,每一種行為決策的選擇都不可能完全避免未來(lái)的風(fēng)險(xiǎn),決策輸出的多目標(biāo)求解過(guò)程無(wú)法保證每次都得到最低風(fēng)險(xiǎn)的結(jié)果。因此,我們需要在行為決策層增加一種以安全性為單目標(biāo)的算法模型,希望能夠?qū)赡馨l(fā)生的風(fēng)險(xiǎn)進(jìn)行提前的識(shí)別,當(dāng)安全性不滿足要求時(shí)采用人工接管或保守策略。
讀者可能提出的一個(gè)問(wèn)題是:如果能夠建立這樣的風(fēng)險(xiǎn)識(shí)別模型,那不就可以作出最安全的行為決策了嗎?這個(gè)問(wèn)題的答案其實(shí)就是在“知道正確答案”和“知道不會(huì)做”二者之間其實(shí)是存在一個(gè)gap的。在預(yù)期功能安全國(guó)際標(biāo)準(zhǔn)(ISO/PAS 21448)中,場(chǎng)景(scenarios)被劃分為如下圖所示的4個(gè)區(qū)間,分別為(1)已知-安全、(2)已知-不安全、(3)未知-不安全和(4)未知-安全。最終的目標(biāo)是盡可能縮小位于區(qū)間(2)和(3)中的場(chǎng)景(scenarios)比例,即將確保場(chǎng)景(scenarios)控制在安全的區(qū)間。而行為風(fēng)險(xiǎn)識(shí)別希望達(dá)到的目的就是將區(qū)間(3)中的場(chǎng)景首先轉(zhuǎn)化為區(qū)間(2),即“know unknowns”。接下來(lái),隨著行為決策本身算法能力的不斷提升(越來(lái)越見(jiàn)多識(shí)廣),才能夠?qū)⒏嗟膮^(qū)間(2)場(chǎng)景轉(zhuǎn)化為區(qū)間(1)。
圖3. 國(guó)際標(biāo)準(zhǔn)ISO/PAS 21448中對(duì)場(chǎng)景(scenarios)的分類
無(wú)人車(chē)行為決策模塊面對(duì)的是高不確定性的動(dòng)態(tài)場(chǎng)景。在當(dāng)前技術(shù)階段,存在算法能力的覆蓋邊界。在邊界上存在的長(zhǎng)尾問(wèn)題是最難解決的一類問(wèn)題,同時(shí)也是最危險(xiǎn)的場(chǎng)景。在我們的自動(dòng)駕駛算法不斷進(jìn)步,不斷擴(kuò)大能力邊界的同時(shí),我們也希望通過(guò)對(duì)行為決策模塊各種指標(biāo)進(jìn)行在線監(jiān)控,同時(shí)結(jié)合周?chē)h(huán)境信息,希望從這些“蛛絲馬跡”中提前識(shí)別出危險(xiǎn)場(chǎng)景。然后對(duì)算法結(jié)果進(jìn)行反饋,并向人類安全員發(fā)出提醒。
行為風(fēng)險(xiǎn)識(shí)別的具體算法,以及識(shí)別后的處理方式,將在下次技術(shù)解析中詳細(xì)介紹。
瑪氏中國(guó)|2025年度瑪氏箭牌北京區(qū)域包材及原材料倉(cāng)儲(chǔ)(VMI)項(xiàng)目
2236 閱讀華為的物流“布局”,為何備受關(guān)注?
1495 閱讀北美倉(cāng)配一體機(jī)會(huì)和風(fēng)險(xiǎn)
1299 閱讀?年?duì)I收15億的跨境物流企業(yè)要上市
1182 閱讀解秘粵港澳大灣區(qū)規(guī)模最大的生產(chǎn)服務(wù)型國(guó)家物流樞紐——廣州東部公鐵聯(lián)運(yùn)樞紐
1099 閱讀縱騰集團(tuán)借殼上市,6.4億收購(gòu)A股上市公司綠康生化
1008 閱讀TEMU美區(qū)半托管即將開(kāi)放國(guó)內(nèi)發(fā)貨模式
869 閱讀京東物流一線員工日10周年:為5年、10年老員工授勛,為15000名標(biāo)桿頒獎(jiǎng)
829 閱讀15倍爆發(fā)式增長(zhǎng),網(wǎng)絡(luò)貨運(yùn)行業(yè)跑出了一匹黑馬
825 閱讀2024年快遞滿意度出爐:順豐、京東快遞排名最高
781 閱讀