亚洲精品少妇久久久久久海角社区,色婷婷亚洲一区二区综合,伊人蕉久中文字幕无码专区,日韩免费高清大片在线

羅戈網(wǎng)
搜  索
登陸成功

登陸成功

積分  

美團(tuán)智能配送系統(tǒng)的運(yùn)籌優(yōu)化實戰(zhàn)

[羅戈導(dǎo)讀]配送智能化就變得非常重要,而智能配送的核心就是做資源的優(yōu)化配置。

美團(tuán)配送業(yè)務(wù)場景復(fù)雜,單量規(guī)模大。更直觀的規(guī)模數(shù)字,可能是美團(tuán)每年給騎手支付的工資,目前已經(jīng)達(dá)到幾百億這個量級。所以,在如此大規(guī)模的業(yè)務(wù)場景下,配送智能化就變得非常重要,而智能配送的核心就是做資源的優(yōu)化配置。

美團(tuán)配送業(yè)務(wù)場景復(fù)雜,單量規(guī)模大。

更直觀的規(guī)模數(shù)字,可能是美團(tuán)每年給騎手支付的工資,目前已經(jīng)達(dá)到幾百億這個量級。所以,在如此大規(guī)模的業(yè)務(wù)場景下,配送智能化就變得非常重要,而智能配送的核心就是做資源的優(yōu)化配置。

資源優(yōu)化配置

外賣配送是一個典型的O2O場景。既有線上的業(yè)務(wù),也有線下的復(fù)雜運(yùn)營。配送連接訂單需求和運(yùn)力供給。為了達(dá)到需求和供給的平衡,不僅要在線下運(yùn)營商家、運(yùn)營騎手,還要在線上將這些需求和運(yùn)力供給做合理的配置,其目的是提高整體的效率。只有將配送效率最大化,才能帶來良好的顧客體驗,實現(xiàn)較低的配送成本。而做資源優(yōu)化配置的過程,實際上是有分層的。根據(jù)我們的理解,可以分為三層:

  1. 基礎(chǔ)層是結(jié)構(gòu)優(yōu)化,它直接決定了配送系統(tǒng)效率的上限。這種基礎(chǔ)結(jié)構(gòu)的優(yōu)化,周期比較長,頻率比較低,包括配送網(wǎng)絡(luò)規(guī)劃、運(yùn)力結(jié)構(gòu)規(guī)劃等等。

  2. 中間層是市場調(diào)節(jié),相對來說是中短期的,主要通過定價或者營銷手段,使供需達(dá)到一個相對理想的平衡狀態(tài)。

  3. 再上層是實時匹配,通過調(diào)度做實時的資源最優(yōu)匹配。實時匹配的頻率是最高的,決策的周期也最短。

智能配送系統(tǒng)架構(gòu)

根據(jù)智能配送的這三層體系,配送算法團(tuán)隊也針對性地進(jìn)行了運(yùn)作。如上圖所示,右邊三個子系統(tǒng)分別對應(yīng)這三層體系,最底層是規(guī)劃系統(tǒng),中間層是定價系統(tǒng),最上層是調(diào)度系統(tǒng)。同樣非常重要的還包括圖中另外四個子系統(tǒng),在配送過程中做精準(zhǔn)的數(shù)據(jù)采集、感知、預(yù)估,為優(yōu)化決策提供準(zhǔn)確的參數(shù)輸入,包括機(jī)器學(xué)習(xí)系統(tǒng)、IoT 和感知系統(tǒng)、LBS系統(tǒng),這都是配送系統(tǒng)中非常重要的環(huán)節(jié),涉及大量復(fù)雜的機(jī)器學(xué)習(xí)問題。

而運(yùn)籌優(yōu)化則是調(diào)度系統(tǒng)、定價系統(tǒng)、規(guī)劃系統(tǒng)的核心技術(shù)。接下來,將分享幾個典型的運(yùn)籌優(yōu)化案例。

實戰(zhàn)業(yè)務(wù)項目

智能區(qū)域規(guī)劃

為了幫助大家快速理解配送業(yè)務(wù)的基本背景,這里首先分享智能區(qū)域規(guī)劃項目中經(jīng)常遇到的問題及其解決方案。

配送網(wǎng)絡(luò)基本概念

配送連接的是商家、顧客、騎手三方,配送網(wǎng)絡(luò)決定了這三方的連接關(guān)系。當(dāng)用戶打開App,查看哪些商家可以點(diǎn)餐,這由商家配送范圍決定。每個商家的配送范圍不一樣,看似是商家粒度的決策,但實際上直接影響每個C端用戶得到的商流供給,這本身也是一個資源分配或者資源搶奪問題。商家配送范圍智能化也是一個組合優(yōu)化問題,但是我們這里講的是商家和騎手的連接關(guān)系。

用戶在美團(tuán)點(diǎn)外賣,為他服務(wù)的騎手是誰呢?又是怎么確定的呢?這些是由配送區(qū)域邊界來決定的。配送區(qū)域邊界指的是一些商家集合所對應(yīng)的范圍。為什么要劃分區(qū)域邊界呢?從優(yōu)化的角度來講,對于一個確定問題來說,約束條件越少,目標(biāo)函數(shù)值更優(yōu)的可能性就越大。做優(yōu)化的同學(xué)肯定都不喜歡約束條件,但是配送區(qū)域邊界實際上就是給配送系統(tǒng)強(qiáng)加的約束。

在傳統(tǒng)物流中,影響末端配送效率最關(guān)鍵的點(diǎn),是配送員對他所負(fù)責(zé)區(qū)域的熟悉程度。這也是為什么在傳統(tǒng)物流領(lǐng)域,配送站或配送員,都會固定負(fù)責(zé)某幾個小區(qū)的原因之一。因為越熟悉,配送效率就會越高。

即時配送場景也類似,每個騎手需要盡量固定地去熟悉一片商家或者配送區(qū)域。同時,對于管理者而言,站點(diǎn)的管理范圍也比較明確。另外,如果有新商家上線,也很容易確定由哪個配送站來提供服務(wù)。所以,這個問題有很多運(yùn)營管理的訴求在其中。

區(qū)域規(guī)劃影響配送效率

當(dāng)然,區(qū)域規(guī)劃項目的發(fā)起,存在很多問題需要解決。主要包括以下三種情況:

  1. 配送區(qū)域里的商家不聚合。這是一個典型站點(diǎn),商家主要集中在左下角和右上角,造成騎手在區(qū)域里取餐、送餐時執(zhí)行任務(wù)的地理位置非常分散,需要不停往返兩個商圈,無效跑動非常多。

  2. 區(qū)域奇形怪狀,空駛嚴(yán)重。之前在門店上線外賣平臺的發(fā)展過程中,很多地方原本沒有商家,后來上線的商家多了,就單獨(dú)作為一個配送區(qū)域。這樣的區(qū)域形狀可能就會不規(guī)則,導(dǎo)致騎手很多時候在區(qū)域外跑。而商家和騎手都有綁定關(guān)系,騎手只能服務(wù)自己區(qū)域內(nèi)的商家,因此騎手無法接到配送區(qū)域外的取餐任務(wù),空駛率非常高。很多時候騎手送完餐之后,只能空跑回來才可能接到新任務(wù)。

  3. 站點(diǎn)的大小不合理。圖三這個站點(diǎn),每天的單量只有一二百單。如果從騎手平均單量的角度去配置騎手的話,只能配置3~4個騎手。如果某一兩個人突然有事要請假,可想而知,站點(diǎn)的配送體驗一定會變得非常差,運(yùn)營管理難度會很高。反之,如果某一個站點(diǎn)變得非常大,站長也不可能管得了那么多的騎手,這也是一個問題。所以,需要給每個站點(diǎn)規(guī)劃一個合理的單量規(guī)模。

既然存在這么多的問題,那么做區(qū)域規(guī)劃項目就變得非常有必要。那么,什么是好的區(qū)域規(guī)劃方案?基于統(tǒng)計分析的優(yōu)化目標(biāo)設(shè)定。

多目標(biāo)優(yōu)化問題

優(yōu)化的三要素是:目標(biāo)、約束、決策變量。

第一點(diǎn),首先要確定優(yōu)化目標(biāo)。在很多比較穩(wěn)定或者傳統(tǒng)的業(yè)務(wù)場景中,目標(biāo)非常確定。而在區(qū)域規(guī)劃這個場景中,怎么定義優(yōu)化目標(biāo)呢?首先,我們要思考的是區(qū)域規(guī)劃主要影響的是什么。從剛才幾類問題的分析可以發(fā)現(xiàn),影響的主要是騎手的順路性、空駛率,也就是騎手平均為每一單付出的路程成本。所以,我們將問題的業(yè)務(wù)目標(biāo)定為優(yōu)化騎手的單均行駛距離?;诂F(xiàn)有的大量區(qū)域和站點(diǎn)積累的數(shù)據(jù),做大量的統(tǒng)計分析后,可以定義出這樣幾個指標(biāo):商家聚合度、訂單的聚合度、訂單重心和商家重心的偏離程度。數(shù)據(jù)分析結(jié)果說明,這幾個指標(biāo)和單均行駛距離的相關(guān)性很強(qiáng)。經(jīng)過這一層的建模轉(zhuǎn)化,問題明確為優(yōu)化這三個指標(biāo)。

第二點(diǎn),需要梳理業(yè)務(wù)約束。在這方面,我們花費(fèi)了大量的時間和精力。比如:區(qū)域單量有上限和下限。區(qū)域之間不能有重合,不能有商家歸多個區(qū)域負(fù)責(zé)。所有的AOI不能有遺漏,都要被某個區(qū)域覆蓋到,不能出現(xiàn)商家沒有站點(diǎn)的服務(wù)。

基于業(yè)務(wù)場景的約束條件梳理

最難的一個問題,其實是要求區(qū)域邊界必須沿路網(wǎng)。起初我們很難理解,因為本質(zhì)上區(qū)域規(guī)劃只是對商家進(jìn)行分類,它只是一個商家集合的概念,為什么要畫出邊界,還要求邊界沿路網(wǎng)呢?其實剛才介紹過,區(qū)域邊界是為了回答如果有新商家上線到底屬于哪個站點(diǎn)的問題。而且,從一線管理成本來講,更習(xí)慣于哪條路以東、哪條路以南這樣的表述方式,便于記憶和理解,提高管理效率。所以,就有了這樣的訴求,我們希望區(qū)域邊界更“便于理解”。

整體方案設(shè)計

在目標(biāo)和約束條件確定了之后,整體技術(shù)方案分成三部分:

  1. 首先,根據(jù)三個目標(biāo)函數(shù),確定商家最優(yōu)集合。這一步比較簡單,做運(yùn)籌優(yōu)化的同學(xué)都可以快速地解決這樣一個多目標(biāo)組合優(yōu)化問題。

  2. 后面的步驟比較難,怎么把區(qū)域邊界畫出來呢?為了解決這個問題,配送團(tuán)隊和美團(tuán)地圖團(tuán)隊進(jìn)行合作。先利用路網(wǎng)信息,把城市切成若干互不重疊的多邊形,然后根據(jù)計算幾何,將一批商家對應(yīng)的多邊形拼成完整的區(qū)域邊界。

  3. 最后,用美團(tuán)自主研發(fā)的配送仿真系統(tǒng),評測這樣的區(qū)域規(guī)劃對應(yīng)的單均行駛距離和體驗指標(biāo)是否符合預(yù)期。因為一線直接變動的成本非常高,仿真系統(tǒng)就起到了非常好的作用。

下面是一個實際案例,我們用算法把一個城市做了重新的區(qū)域規(guī)劃。當(dāng)然,這里必須要強(qiáng)調(diào)的是,在這個過程中,人工介入還是非常必要的。對于一些算法很難處理好的邊角場景,需要人工進(jìn)行微調(diào),使整個規(guī)劃方案更加合理。中間的圖是算法規(guī)劃的結(jié)果。

經(jīng)過試點(diǎn)后,測試城市整體的單均行駛距離下降了5%,平均每一單騎手的行駛距離節(jié)省超過100米??梢韵胂笠幌?,在這么龐大的單量規(guī)模下,每單平均減少100米,總節(jié)省的路程、節(jié)省的電瓶車電量,都是一個非??捎^的數(shù)字。更重要的是,可以讓騎手自己明顯感覺到自己的效率得到了提升。

落地應(yīng)用效果顯著

智能騎手排班

業(yè)務(wù)背景

這是隨著外賣配送的營業(yè)時間越來越長而衍生出的一個項目。早期,外賣只服務(wù)午高峰到晚高峰,后來大家慢慢可以點(diǎn)夜宵、點(diǎn)早餐。到如今,很多配送站點(diǎn)已經(jīng)提供了24小時服務(wù)。但是,騎手不可能全天24小時開工,勞動法對每天的工作時長也有規(guī)定,所以這一項目勢在必行。

另外,外賣配送場景的訂單“峰谷效應(yīng)”非常明顯。上圖是一個實際的進(jìn)單曲線??梢钥吹饺?4小時內(nèi),午晚高峰兩個時段單量非常高,而閑時和夜宵相對來說單量又少一些。因此,系統(tǒng)也沒辦法把一天24小時根據(jù)每個人的工作時長做平均切分,也需要進(jìn)行排班。

對于排班,存在兩類方案的選型問題。很多業(yè)務(wù)的排班是基于人的維度,好處是配置的粒度非常精細(xì),每個人的工作時段都是個性化的,可以考慮到每個人的訴求。但是,在配送場景的缺點(diǎn)也顯而易見。如果站長需要為每個人去規(guī)劃工作時段,其難度可想而知,也很難保證分配的公平性。

排班方案選型

配送團(tuán)隊最終選用的是按組排班的方式,把所有騎手分成幾組,規(guī)定每個組的開工時段。然后大家可以按組輪崗,每個人的每個班次都會輪到。

這個問題最大的挑戰(zhàn)是,我們并不是在做一項業(yè)務(wù)工具,而是在設(shè)計算法。而算法要有自己的優(yōu)化目標(biāo),那么排班的目標(biāo)是什么呢?如果你要問站長,怎么樣的排班是好的,可能他只會說,要讓需要用人的時候有人。但這不是算法語言,更不能變成模型語言。

決策變量及目標(biāo)設(shè)計

為了解決這個問題,首先要做設(shè)計決策變量,決策變量并沒有選用班次的起止時刻和結(jié)束時刻,那樣做的話,決策空間太大。我們把時間做了離散化,以半小時為粒度。對于一天來講,只有48個時間單元,決策空間大幅縮減。然后,目標(biāo)定為運(yùn)力需求滿足訂單量的時間單元最多。這是因為,并不能保證站點(diǎn)的人數(shù)在對應(yīng)的進(jìn)單曲線情況下可以滿足每個單元的運(yùn)力需求。所以,我們把業(yè)務(wù)約束轉(zhuǎn)化為帶懲罰的目標(biāo)函數(shù)。這樣做還有一個好處,那就是沒必要知道站點(diǎn)的總?cè)藬?shù)是多少。

在建模層面,標(biāo)準(zhǔn)化和通用的模型才是最優(yōu)選。所以,我們把人數(shù)做了歸一化,算法分配每個班次的騎手比例,但不分人數(shù)。最終只需要輸入站點(diǎn)的總?cè)藬?shù),就得到每個班次的人數(shù)。在算法決策的時候,不決策人數(shù)、只決策比例,這樣也可以把單量進(jìn)行歸一化。每個時間單元的進(jìn)單量除以每天峰值時間單元的單量,也變成了0~1之間的數(shù)字。這樣就可以認(rèn)為,如果某個時間單元內(nèi)人數(shù)比例大于單量比例,那么叫作運(yùn)力得到滿足。這樣,通過各種歸一化,變成了一個通用的問題,而不需要對每種場景單獨(dú)處理。

另外,這個問題涉及大量復(fù)雜的強(qiáng)約束,涉及各種管理的訴求、騎手的體驗。約束有很多,比如每個工作時段盡量連續(xù)、每個工作時段持續(xù)的時間不過短、不同工作時段之間休息的時間不過短等等,有很多這樣的業(yè)務(wù)約束。梳理之后可以發(fā)現(xiàn),這個問題的約束太多了,求最優(yōu)解甚至可行解的難度太大了。另外,站長在使用排班工具的時候,希望能馬上給出系統(tǒng)排班方案,再快速做后續(xù)微調(diào),因此對算法運(yùn)行時間要求也比較高。

算法核心思想

基于約束條件的構(gòu)造算法與局部搜索

綜合考慮以上因素,我們最終基于約束條件,根據(jù)啟發(fā)式算法構(gòu)造初始方案,再用局部搜索迭代優(yōu)化。使用這樣的方式,求解速度能夠達(dá)到毫秒級,而且可以給出任意站點(diǎn)的排班方案。整體的優(yōu)化指標(biāo)還不錯。當(dāng)然,不保證是最優(yōu)解,只是可以接受的滿意解。

落地應(yīng)用效果

  • 站點(diǎn)體驗指標(biāo)良好,一線接受度高。

  • 排班時間節(jié)?。?h/每站點(diǎn)每次。

這種算法也在自營場景做了落地應(yīng)用,跟那些排班經(jīng)驗豐富的站長相比,效果基本持平,一線的接受程度也比較高。最重要的是帶來排班時間的節(jié)省,每次排班幾分鐘就搞定了,這樣可以讓站長有更多的時間去做其它的管理工作。

騎手路徑規(guī)劃

具體到騎手的路徑規(guī)劃問題,不是簡單的路線規(guī)劃,不是從a到b該走哪條路的問題。這個場景是,一個騎手身上有很多配送任務(wù),這些配送任務(wù)存在各種約束,怎樣選擇最優(yōu)配送順序去完成所有任務(wù)。這是一個NP難問題,當(dāng)有5個訂單、10個任務(wù)點(diǎn)的時候,就存在11萬多條可能的順序。而在高峰期的時候,騎手往往背負(fù)的不止5單,甚至有時候一個騎手會同時接到十幾單,這時候可行的取送順序就變成了一個天文數(shù)字。

算法應(yīng)用場景

再看算法的應(yīng)用場景,這是智能調(diào)度系統(tǒng)中最為重要的一個環(huán)節(jié)。系統(tǒng)派單、系統(tǒng)改派,都依賴路徑規(guī)劃算法。在騎手端,給每個騎手推薦任務(wù)執(zhí)行順序。另外,用戶點(diǎn)了外賣之后,美團(tuán)會實時展示騎手當(dāng)前任務(wù)還需要執(zhí)行幾分鐘,要給用戶提供更多預(yù)估信息。這么多應(yīng)用場景,共同的訴求是對時效的要求非常高,算法運(yùn)行時間要越短越好。

但是,算法僅僅是快就可以嗎?并不是。因為這是派單、改派這些環(huán)節(jié)的核心模塊,所以算法的優(yōu)化求解能力也非常重要。如果路徑規(guī)劃算法不能給出較優(yōu)路徑,可想而知,上層的指派和改派很難做出更好的決策。

所以,對這個問題做明確的梳理,核心的訴求是優(yōu)化效果必須是穩(wěn)定的好。不能這次的優(yōu)化結(jié)果好,下次就不好。另外,運(yùn)行時間一定要短。

核心設(shè)計思想

在求解路徑規(guī)劃這類問題上,很多公司的技術(shù)團(tuán)隊,都經(jīng)歷過這樣的階段:起初,采用類似遺傳算法的迭代搜索算法,但是隨著業(yè)務(wù)的單量變大,發(fā)現(xiàn)算法耗時太慢,根本不可接受。然后,改為大規(guī)模鄰域搜索算法,但算法依然有很強(qiáng)的隨機(jī)性,因為沒有隨機(jī)性在就沒辦法得到比較好的解。而這種基于隨機(jī)迭代的搜索策略,帶來很強(qiáng)的不確定性,在問題規(guī)模大的場景會出現(xiàn)非常多的Bad Case。

另外,迭代搜索耗時太長了。主要的原因是,隨機(jī)迭代算法是把組合優(yōu)化問題當(dāng)成一個單純的Permutation問題去求解,很少用到問題結(jié)構(gòu)特征。這些算法,求解TSP時這樣操作,求解VRP時也這樣操作,求解Scheduling還是這樣操作,這種類似“無腦”的方式很難有出色的優(yōu)化效果。

所以,在這個項目中,基本可以確定這樣的技術(shù)路線。首先,只能做啟發(fā)式定向搜索,不能在算法中加隨機(jī)擾動。不能允許同樣的輸入在不同運(yùn)行時刻給出不一樣的優(yōu)化結(jié)果。然后,不能用普通迭代搜索,必須把這個問題結(jié)構(gòu)特性挖掘出來,做基于知識的定制化搜索。

說起來容易,具體要怎么做呢?我們認(rèn)為,最重要的是看待這個問題的視角。這里的路徑規(guī)劃問題,對應(yīng)的經(jīng)典問題模型,是開環(huán)TSP問題,或是開環(huán)VRP的變種么?可以是,也可以不是。我們做了一個有意思的建模轉(zhuǎn)換,把它看作流水線調(diào)度問題:每個訂單可以認(rèn)為是job;一個訂單的兩個任務(wù)取餐和送餐,可以認(rèn)為是一個job的operation。任意兩個任務(wù)點(diǎn)之間的通行時間,可以認(rèn)為是序列相關(guān)的準(zhǔn)備時間。每一單承諾的送達(dá)時間,包括預(yù)訂單和即時單,可以映射到流水線調(diào)度問題中的提前和拖期懲罰上。

算法應(yīng)用效果

做了這樣的建模轉(zhuǎn)換之后,流水線調(diào)度問題就有了大量的啟發(fā)式算法可以借鑒。我們把一個經(jīng)典的基于問題特征的啟發(fā)式算法做了適配和改進(jìn),就可以得到非常好的效果。相比于之前的算法,耗時下降70%,整體優(yōu)化效果不錯。因為這是一個確定性算法,所以運(yùn)行多少次的結(jié)果都一樣。我們的算法運(yùn)行一次,跟其它算法運(yùn)行10次的最優(yōu)結(jié)果相比,優(yōu)化效果是持平的。

訂單智能調(diào)度

配送調(diào)度場景,可以用數(shù)學(xué)語言描述。它不僅是一個業(yè)務(wù)問題,更是一個標(biāo)準(zhǔn)的組合優(yōu)化問題,并且是一個“馬爾可夫決策”過程。

調(diào)度問題的數(shù)學(xué)描述

并非對于某個時刻的一批訂單做最優(yōu)分配就足夠,還需要考慮整個時間窗維度,每一次指派對后面的影響。每一次訂單分配,都影響了每個騎手后續(xù)時段的位置分布和行進(jìn)方向。如果騎手的分布和方向不適合未來的訂單結(jié)構(gòu),相當(dāng)于降低了后續(xù)調(diào)度時刻最優(yōu)性的天花板。所以,要考慮長周期的優(yōu)化,而不是一個靜態(tài)優(yōu)化問題。

問題簡化分析

為了便于理解,我們還是先看某個調(diào)度時刻的靜態(tài)優(yōu)化問題。它不僅僅是一個算法問題,還需要我們對工程架構(gòu)有非常深刻的理解。因為,在對問題輸入數(shù)據(jù)進(jìn)行拆解的時候,會發(fā)現(xiàn)算法的輸入數(shù)據(jù)太龐大了。比如說,我們需要任意兩個任務(wù)點(diǎn)的導(dǎo)航距離數(shù)據(jù)。

而我們面臨的問題規(guī)模,前幾年只是區(qū)域維度的調(diào)度粒度,一個商圈一分鐘峰值100多單,匹配幾百個騎手,但是這種乘積關(guān)系對應(yīng)的數(shù)據(jù)已經(jīng)非常大了?,F(xiàn)在,由于美團(tuán)有更多業(yè)務(wù)場景,比如跑腿和全城送,會跨非常多的商圈,甚至跨越半個城市,所以只能做城市級的全局優(yōu)化匹配。目前,調(diào)度系統(tǒng)處理的問題的峰值規(guī)模,是1萬多單和幾萬名騎手的匹配。而算法允許的運(yùn)行時間只有幾秒鐘,同時對內(nèi)存的消耗也非常大。

另外,配送和網(wǎng)約車派單場景不太一樣。打車的調(diào)度是做司機(jī)和乘客的匹配,本質(zhì)是個二分圖匹配問題,有多項式時間的最優(yōu)算法:KM算法。打車場景的難點(diǎn)在于,如何刻畫每對匹配的權(quán)重。而配送場景還需要解決,對于沒有多項式時間最優(yōu)算法的情況下,如何在指數(shù)級的解空間,短時間得到優(yōu)化解。如果認(rèn)為每一單和每個騎手的匹配有不同的適應(yīng)度,那么這個適應(yīng)度并不是可線性疊加的。也就意味著多單對多人的匹配方案中,任意一種匹配都只能重新運(yùn)算適應(yīng)度,其計算量可想而知。

總結(jié)一下,這個問題有三類挑戰(zhàn):

  1. 性能要求極高,要做到萬單對萬人的秒級求解。我們之前做了一些比較有意思的工作,比如基于歷史最優(yōu)指派的結(jié)果,用機(jī)器學(xué)習(xí)模型做剪枝?;诖罅康臍v史數(shù)據(jù),可以幫助我們節(jié)省很多無用的匹配方案評價。

  2. 動態(tài)性。作為一個MDP問題,需要考慮動態(tài)優(yōu)化場景,這涉及大量的預(yù)估環(huán)節(jié)。在只有當(dāng)前未完成訂單的情況下,騎手如何執(zhí)行、每一單的完成時刻如何預(yù)估、未來時段會進(jìn)哪些結(jié)構(gòu)的訂單、對業(yè)務(wù)指標(biāo)和效率指標(biāo)產(chǎn)生怎樣的影響……你可能會覺得這是一個典型的強(qiáng)化學(xué)習(xí)場景,但它的難點(diǎn)在于決策空間太大,甚至可以認(rèn)為是無限大的。目前我們的思路,是通過其它的建模轉(zhuǎn)換手段進(jìn)行解決。

  3. 配送業(yè)務(wù)的隨機(jī)因素多。比如商家的出餐時間,也許是很長時間內(nèi)都無法解決的隨機(jī)性。就連歷史上每一個已完成的訂單,商家出餐時間的真值都很難獲得,因為人為點(diǎn)擊的數(shù)據(jù)并不能保證準(zhǔn)確和完整。商家出餐時刻不確定,這個隨機(jī)因素永遠(yuǎn)存在,并且非常制約配送效率的提升。另外,在顧客位置交付的時間也不確定。寫字樓工作日的午高峰,上電梯、下電梯的時間,很難準(zhǔn)確進(jìn)行預(yù)估。當(dāng)然,我們也在不斷努力讓預(yù)估變得更精準(zhǔn),但隨機(jī)性永遠(yuǎn)存在。對于騎手來說,平臺沒法規(guī)定每個騎手的任務(wù)執(zhí)行順序。騎手在配送過程中可以自由發(fā)揮,所以騎手執(zhí)行順序的不確定性也一直存在。

    為了解決這些問題,我們嘗試用魯棒優(yōu)化或是隨機(jī)規(guī)劃的思想。但是,如果基于隨機(jī)場景采樣的方式,運(yùn)算量又會大幅增加。所以,我們需要進(jìn)行基于學(xué)習(xí)的優(yōu)化,優(yōu)化不是單純的機(jī)器學(xué)習(xí)模型,也不是單純的啟發(fā)式規(guī)則,優(yōu)化算法是結(jié)合真實數(shù)據(jù)和算法設(shè)計者的經(jīng)驗,學(xué)習(xí)和演進(jìn)而得。只有這樣,才能在性能要求極高的業(yè)務(wù)場景下,快速地得到魯棒的優(yōu)化方案。

免責(zé)聲明:羅戈網(wǎng)對轉(zhuǎn)載、分享、陳述、觀點(diǎn)、圖片、視頻保持中立,目的僅在于傳遞更多信息,版權(quán)歸原作者。如無意中侵犯了您的版權(quán),請第一時間聯(lián)系,核實后,我們將立即更正或刪除有關(guān)內(nèi)容,謝謝!
上一篇:夯實家電家裝主陣地 雙十一蘇寧易購家裝物流“顯身手”
下一篇:抖音公布本地生活成績單:交易額一年增長30多倍
羅戈訂閱
周報
1元 2元 5元 10元

感謝您的打賞

登錄后才能發(fā)表評論

登錄

相關(guān)文章

2025-05-01
2025-04-18
2025-04-14
2025-04-14
2025-04-11
2025-04-09
活動/直播 更多

倉儲管理之全局視角:從入門到精通

  • 時間:2025-04-24 ~ 2025-05-16
  • 主辦方:馮銀川
  • 協(xié)辦方:羅戈網(wǎng)

¥:2080.0元起

報告 更多

2025年3月物流行業(yè)月報-個人版

  • 作者:羅戈研究

¥:9.9元