決策智能技術(shù)浪潮襲來(lái),數(shù)智商業(yè)領(lǐng)域如何變革?來(lái)聽(tīng)聽(tīng)三位專家怎么說(shuō)(2)
蔡少偉研究員:一種求解大規(guī)模稀疏組合優(yōu)化問(wèn)題的高效方法
大家好,今天我分享的題目是大規(guī)模稀疏組合優(yōu)化的高效方法。很多決策問(wèn)題的核心都涉及組合優(yōu)化問(wèn)題,人們很關(guān)注如何選擇合適的組合方案來(lái)達(dá)到目標(biāo)最優(yōu)化。
求解組合優(yōu)化主要有兩類方法:一類是啟發(fā)式方法,包括啟發(fā)式搜索和啟發(fā)式構(gòu)造,比如大家經(jīng)常用的貪心算法就可以看作啟發(fā)式構(gòu)造的一種,貪心準(zhǔn)則就是啟發(fā)式(heuristics);另外一種是分支限界(brand-and-bound)為代表的精確算法。
啟發(fā)式方法的好處是對(duì)規(guī)模不敏感,所以可以用近似求解大規(guī)模的問(wèn)題,缺點(diǎn)是往往不知道求出的解離最優(yōu)解有多大的差距,也可能已經(jīng)找到最優(yōu)解了,但是你不知道。Branch And Bound 是完備性的,如果你給它充足時(shí)間算到停下來(lái),可以求出最優(yōu)解并且證明這是最優(yōu)解。但這個(gè)方法是有代價(jià)的,會(huì)對(duì)規(guī)模比較敏感,因?yàn)檫@類算法是指數(shù)爆炸的,往往不適用于大規(guī)模問(wèn)題。
不管是做搜索還是做構(gòu)造,啟發(fā)式算法框架大多很簡(jiǎn)單,主要是依賴于啟發(fā)式怎么設(shè)計(jì),要根據(jù)哪個(gè)準(zhǔn)則去做。分支限界方法主要在于怎么做「界」,大家看論文也會(huì)發(fā)現(xiàn),很多 Branch And Bound 的論文在做 bounding 技術(shù),怎么把這個(gè)界做得更緊,可以更好對(duì)解空間進(jìn)行剪枝。
后來(lái)我想,可不可以把這兩個(gè)結(jié)合一下?也就是說(shuō),既能夠保持對(duì)規(guī)模不敏感,又能把 bounding 技術(shù)加進(jìn)去。大家很容易想到,可以用預(yù)處理的方法,或者先做 Heuristics 再做 Branch And Bound,把 Heuristics 結(jié)果作為初始解等等。我們?cè)谶@方面提出了一個(gè)新的方法 —— 嵌套地在 Heuristics 和 Branch And Bound 中去迭代。
簡(jiǎn)單來(lái)說(shuō),這個(gè)方法先粗糙地做一個(gè) Heuristic solving,求一個(gè)初步結(jié)果。一般來(lái)說(shuō),做 bounding 需要上下界,Heuristics 會(huì)粗糙得到一個(gè)下界,接下來(lái)通過(guò)設(shè)計(jì)上界的函數(shù)。假設(shè)這個(gè)問(wèn)題規(guī)模比較大,包括很多元素,我們可以淘汰一些,使得問(wèn)題縮小一圈。之后再精致一點(diǎn),繼續(xù)做 Heuristic solving,這樣可能改進(jìn)下界。在這個(gè)基礎(chǔ)上,算法可以再做一些 bounding,一直嵌套地做下去。于是這個(gè)算法就變成半精確算法,有可能可以證明這是最優(yōu)解的,因?yàn)樵谀骋徊桨l(fā)現(xiàn)問(wèn)題空間足夠小,不需要 Heuristic solving 而是可以直接精確求解。另外,如果沒(méi)有求出最優(yōu)解,也可以知道最優(yōu)解的區(qū)間在哪里。
接下來(lái)舉兩個(gè)例子解釋這個(gè)方法。
第一個(gè)是「最大團(tuán)問(wèn)題」。團(tuán)是圖論里很經(jīng)典的概念,在一個(gè)圖里,點(diǎn)和點(diǎn)之間都有邊相連的子圖,就稱為團(tuán),最大團(tuán)問(wèn)題是找到最大規(guī)模的團(tuán)。如果給它一個(gè)加權(quán),對(duì)每個(gè)頂點(diǎn)賦予一個(gè)權(quán)重,這樣的最大加權(quán)團(tuán)問(wèn)題是要找到總權(quán)重最大的團(tuán)。下圖這個(gè)例子中,分別是四團(tuán)、三團(tuán),三團(tuán)的權(quán)重更大一些,也就是這個(gè)圖的最大加權(quán)團(tuán)。
按照該框架來(lái)做這個(gè)事情,我們需要兩個(gè)子算法,一個(gè)做啟發(fā)式求解,在團(tuán)里稱為 FindClique,另外一個(gè)是化簡(jiǎn)算法,稱為 ReduceGraph。我們可以用 FindClique 找到一個(gè)團(tuán),這個(gè)團(tuán)會(huì)比之前找到的要好。當(dāng)這個(gè)更好的團(tuán)走到 Reduce Graph,我們知道的是:最大團(tuán)至少有這么大。也是在這一步做化簡(jiǎn),如果圖經(jīng)過(guò)化簡(jiǎn)變?yōu)榭眨敲凑f(shuō)明找到的團(tuán)就是最優(yōu)解;如果沒(méi)有變?yōu)榭眨敲纯梢詼p少一些點(diǎn),再回去調(diào)整找團(tuán)的算法。這里的算法不一定是固定的算法,可以動(dòng)態(tài)地變化。
我們的一項(xiàng)工作選了「construct and cut」的方法,可以理解為多次貪心的算法。
多次貪心的作用在于,每一次貪心構(gòu)造可以很快,可以從不同的起點(diǎn)出發(fā),而且如果在某次構(gòu)造過(guò)程中算出來(lái),當(dāng)前的團(tuán)再怎么擴(kuò)展都不可能超過(guò)之前找到的團(tuán),我們就可以停止。最終目的是希望找到比以前大一些的團(tuán),啟發(fā)式要不要做得更精致以及順序如何調(diào)整,依賴于圖的規(guī)模,就像剝洋蔥一樣,剝到某一層再精化,以便有更大精力把更好的團(tuán)找出來(lái)。當(dāng)圖不能再化簡(jiǎn)的時(shí)候,我們可以采取精確的算法,比如 Branch And Bound。找到一個(gè)團(tuán)之后,根據(jù)我們的方法,我們要做 bounding 把一些點(diǎn)扔掉,方法在于估計(jì)點(diǎn)所能發(fā)展出來(lái)的團(tuán)有多大,可以有不同方案去解決。
這兩個(gè)估界技術(shù)是作為例子,大家可以利用不同的技術(shù)去做。在實(shí)驗(yàn)方面,可以參考下表,對(duì)比 FastWClq、LSCC+BMS、MaxWClq 這些方法,求解到相同精度的時(shí)間相差十幾倍甚至上百倍。
接下來(lái)看第二個(gè)問(wèn)題:「圖著色問(wèn)題」。所謂著色是給圖的每個(gè)點(diǎn)涂一個(gè)顏色,相鄰兩個(gè)點(diǎn)不能為同一個(gè)顏色,圖著色問(wèn)題討論的是一個(gè)圖最少可以用多少種顏色來(lái)著色,最少顏色數(shù)叫做圖的色數(shù)。圖著色問(wèn)題有很多應(yīng)用,特別是在沒(méi)有沖突情況下分配資源。
這個(gè)問(wèn)題大思路是一樣的 —— 啟發(fā)式求解加一些 bounding 的技術(shù)。不同的是,圖著色問(wèn)題并不要求子集合,由于要對(duì)整張圖進(jìn)行著色,所以沒(méi)有「永遠(yuǎn)扔掉」這個(gè)概念,每個(gè)點(diǎn)最后都要返回去,這個(gè)點(diǎn)一定要有一個(gè)顏色。這里的 reduce 是把圖分解為 Kernel 和 Margin:
有一個(gè)很簡(jiǎn)單的規(guī)則,還是與獨(dú)立集有關(guān),我如果知道這個(gè)圖至少需要用多少種顏色,就是顏色下界(記為?),則可以找到?-degree bound 的獨(dú)立集。這個(gè)獨(dú)立集的點(diǎn)的度數(shù)都比?小,所以叫做?-degree bound。如果找到這樣的獨(dú)立集,可以放心移到 Margin 里面。如果把 kernel 的 solution 找出來(lái)之后,我們可以很方便把 Margin 合并進(jìn)來(lái),如果 kernel 是最優(yōu)解,合起來(lái)一定也是最優(yōu)解,這個(gè)規(guī)則可以迭代地去使用。
我們看一個(gè)例子,這個(gè)例子里面灰色的四個(gè)點(diǎn)是 kernel,可以看到至少需要 4 種顏色。旁邊的三個(gè)點(diǎn)放到邊緣上,因?yàn)槿齻€(gè)點(diǎn)的度數(shù)都比 4 小,我們放心把這三個(gè)點(diǎn)挪到旁邊先不管。然后發(fā)現(xiàn)剩下這個(gè)子圖分解不動(dòng),已經(jīng)很硬核了,可以直接求解出來(lái)。稀疏圖的硬核一般都不大,所以可以考慮精確算法求解。如果把核心找出來(lái),因?yàn)橐阎诵闹辽儆盟膫€(gè)顏色,對(duì)于邊緣中的點(diǎn),每個(gè)點(diǎn)的度數(shù)小于 4,怎么樣都留有一個(gè)顏色給它,走一遍就可以了,線性的時(shí)間就可以了。
直到最后,每一次剝離的 Margin 都要保留下來(lái),而且要標(biāo)記清楚是第幾層,這是與第一個(gè)問(wèn)題稍微不同的地方。我們要用額外數(shù)據(jù)結(jié)構(gòu)把這些邊緣圖保留下來(lái),最后一個(gè)剝不動(dòng)的 Kernel 精確化解決之后,就可以用倒序的方法,先把最后一個(gè) Margin 給合并進(jìn)來(lái),根據(jù)剛才的規(guī)則保留最優(yōu)性,Kernel 是最優(yōu)的話,合并一個(gè)邊緣還會(huì)是最優(yōu),一路回溯上去,那原圖的解也一定是最優(yōu)的。
當(dāng)這個(gè)問(wèn)題變成有框架的之后,就只剩下考慮如何找 lower bound 和 upper bound。算法的大致思路是:一開(kāi)始 kernel 是原圖,需要用到最大團(tuán)算法找一個(gè) lower bound;剝掉邊緣之后,可以采取貪心圖著色算法,找一個(gè) upper bound。
這里其實(shí)用到了三種算法。實(shí)踐中比較常見(jiàn)組合拳打法,具體到做 kernel 著色,當(dāng)這個(gè)圖比較大的時(shí)候,我們可能通過(guò)某種貪心或者比較快的方法去做,最后有可能變成精確算法去做。整個(gè)流程中,lower bound 和 upper bound 都是全局的,如果這兩個(gè)相等,就可以停下了。
上圖是實(shí)驗(yàn)結(jié)果,可以看出在稀疏大圖上面的效果更好,144 個(gè)中里有 97 個(gè)可以在一分鐘內(nèi)證明最優(yōu)解。跟同類算法相比,我們的算法對(duì)比時(shí)間也比較快,在比較稀疏大圖上面有特殊方法可以很快求解。大家以前認(rèn)為,幾百萬(wàn)頂點(diǎn)的 NP 難問(wèn)題肯定要算很久,其實(shí),如果這些圖很大但有一定特點(diǎn)的話,我們還是可以在秒級(jí)和分鐘級(jí)的時(shí)間內(nèi)解決的。
阿里媽媽 CTO 鄭波:阿里媽媽持續(xù)升級(jí)的決策智能技術(shù)體系
大家好,作為阿里媽媽技術(shù)負(fù)責(zé)人,我將從業(yè)界視角分享一下過(guò)去幾年阿里媽媽在決策智能技術(shù)上的進(jìn)展。
阿里媽媽創(chuàng)立于 2007 年,是阿里巴巴集團(tuán)的核心商業(yè)化部門(mén),也就是在線廣告部門(mén)。經(jīng)過(guò)了十幾年的發(fā)展,阿里媽媽打造過(guò)「搜索廣告淘寶直通車」這樣有影響力的產(chǎn)品,2009 年有了展示廣告、Ad Exchange 廣告交易平臺(tái),2014 年又出現(xiàn)了數(shù)據(jù)管理平臺(tái)達(dá)摩盤(pán),2016 年開(kāi)始做全域營(yíng)銷。
從技術(shù)上看的話,在 2015 年、2016 年前后,阿里媽媽全面擁抱深度學(xué)習(xí),從智能營(yíng)銷引擎 OCPX 到自研 CTR 預(yù)估核心算法 MLR 模型,都是隨著深度學(xué)習(xí)的方法不斷演進(jìn)的。2018 年,深度學(xué)習(xí)框架 X-Deep Learning 開(kāi)源。2019 年,Euler 圖學(xué)習(xí)框架開(kāi)源,信息流產(chǎn)品超級(jí)推薦也上線了,「人找貨」進(jìn)化到了「貨找人」。2020 年開(kāi)始,阿里媽媽針對(duì)直播類型的廣告上線,同時(shí)開(kāi)始推出互動(dòng)激勵(lì)廣告,比如大家玩得比較多的互動(dòng)游戲「雙十一」疊貓貓。曲率空間學(xué)習(xí)框架也在這一年開(kāi)源。
2022 年,阿里媽媽將整個(gè)廣告引擎做了重大升級(jí)。廣告引擎平臺(tái) EADS 和多媒體生產(chǎn)與理解平臺(tái) MDL 都上線了;在消費(fèi)者隱私保護(hù)上,阿里媽媽的隱私計(jì)算技術(shù)能力獲得了中國(guó)信通院認(rèn)證?;仡櫚⒗飲寢屵^(guò)去十五年的發(fā)展,可以看出,我們是一家「根正苗紅」做計(jì)算廣告的公司。
阿里媽媽有什么優(yōu)勢(shì)呢?在非常專業(yè)的電商場(chǎng)域,我們對(duì)用戶和電商理解是非常強(qiáng)的,業(yè)務(wù)場(chǎng)景也非常豐富,除了傳統(tǒng)的搜索推薦是傳統(tǒng),在直播推廣、互動(dòng)、新形態(tài)等數(shù)智業(yè)務(wù)場(chǎng)景上都有涉獵。此外我們的客戶規(guī)模屬于全球領(lǐng)先,幾百萬(wàn)的商家都是阿里媽媽平臺(tái)的廣告客戶。這些客戶有非常多的需求,除了商家對(duì)經(jīng)營(yíng)的需求,還有各種各樣的生態(tài)角色涉及其中,比如主播、達(dá)人或者代理商、服務(wù)商,他們以不同角色在這個(gè)平臺(tái)里活躍。
我們?cè)?AI 方面也有比較多的研究。這里介紹一下廣告場(chǎng)景算法技術(shù)的特色。如上圖,左邊的倒漏斗型結(jié)構(gòu),很多做搜索或者推薦同學(xué)非常熟悉,這一部分廣告和搜索推薦非常相似,包括廣告召回、粗排序、精排序到機(jī)制策略的打分,涉及到信息檢索等大量 AI 技術(shù),特別是匹配上的 TDM 等召回模型都用了深度學(xué)習(xí)的技術(shù)。
其中包括決策智能,鑒于平臺(tái)包含非常多的角色,各有各的博弈的關(guān)系,在多方關(guān)系和優(yōu)化平衡之間,決策智能就派上了用場(chǎng)。用戶體驗(yàn)、流量成本、預(yù)期收益、預(yù)算控制、跨域的融合,這些都是需要去博弈平衡的。
在這里我講講典型三個(gè)博弈 player。平臺(tái)上博弈方有非常多,主要有三類:媒體、廣告主、廣告平臺(tái)。
這三部分的核心技術(shù)可以總結(jié)為:從媒體角度,關(guān)注釋放哪些媒體資源能夠最好地平衡用戶體驗(yàn)和商業(yè)化收入;從廣告主角度,要優(yōu)化什么,如何用最小的代價(jià)實(shí)現(xiàn)營(yíng)銷目標(biāo)。那么,廣告平臺(tái)的最大目標(biāo)是什么?長(zhǎng)遠(yuǎn)來(lái)說(shuō),廣告平臺(tái)更底層的追求目標(biāo)是讓整個(gè)平臺(tái)更加地繁榮,賺錢(qián)只是短期的事情,讓這個(gè)平臺(tái)長(zhǎng)期繁榮才是最終目標(biāo),所以平臺(tái)要平衡各方的關(guān)系,讓各方的 player 在平臺(tái)上很好地玩下去。
廣告平臺(tái)所要優(yōu)化的目標(biāo)涉及到很多機(jī)制設(shè)計(jì)。我今天會(huì)簡(jiǎn)單講一下智能拍賣機(jī)制設(shè)計(jì)、智能出價(jià)策略、智能商業(yè)化策略三個(gè)方向,主要以科普的方式講一講阿里媽媽在這幾年這上面的工作,供大家探討。
智能拍賣機(jī)制設(shè)計(jì)。
先講講智能拍賣機(jī)制設(shè)計(jì),這是很有趣的課題, 已經(jīng)好多位前輩、大牛得了諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。我們所談的經(jīng)典拍賣機(jī)制,從時(shí)間來(lái)看都是上世紀(jì) 70 年代之前出現(xiàn)的,那時(shí)候在線廣告還沒(méi)有出現(xiàn),大家研究了很多關(guān)于單次拍賣或者靜態(tài)拍賣的優(yōu)化。這些機(jī)制通常都是單目標(biāo)的,而且是針對(duì)單次拍賣。
無(wú)論是廣告平臺(tái)還是媒體,需要平衡用戶體驗(yàn)和廣告收入,典型的業(yè)界問(wèn)題都是多目標(biāo)優(yōu)化,如果平臺(tái)上涉及業(yè)務(wù)比較多,不同業(yè)務(wù)之間可能有平臺(tái)策略和意志在里面,這也是多目標(biāo)的優(yōu)化。
從最開(kāi)始用經(jīng)典拍賣理論,比如用 GSP 或者 UGSP 方式去做流量分發(fā)和定價(jià),業(yè)界逐漸演進(jìn)到深度學(xué)習(xí)去解決這個(gè)問(wèn)題。這些經(jīng)典算法通過(guò)公式去計(jì)算平臺(tái)對(duì)某個(gè)目標(biāo)最優(yōu)化的一些參數(shù),有了深度學(xué)習(xí)的工具之后,拍賣機(jī)制設(shè)計(jì)本身也是一個(gè)可決策問(wèn)題,其本身是解決決策問(wèn)題的算法,但生產(chǎn)決策算法也是決策問(wèn)題。
三年前,我們基于深度學(xué)習(xí)設(shè)計(jì)了一個(gè) Deep GSP 拍賣機(jī)制,在滿足機(jī)制良好性質(zhì)的前提下提升;餓平臺(tái)的效果,所謂機(jī)制性質(zhì)良好是指激勵(lì)兼容,廣告主不用通過(guò)鉆牛角尖或者是黑灰產(chǎn)方式獲利,真實(shí)表達(dá)自己的意愿就能夠拿到符合出價(jià)的流量。保持了激勵(lì)兼容性質(zhì)做的 Deep GSP,把原來(lái)靜態(tài)公式換成了可學(xué)習(xí)的深度網(wǎng)絡(luò),這是第一階段的工作。
到了第二階段,拍賣機(jī)制網(wǎng)絡(luò)里很多參數(shù),我們通過(guò)訓(xùn)練優(yōu)化的方式算出來(lái)。但實(shí)際上在整個(gè)過(guò)程中,除了參數(shù)計(jì)算還有排序,以及廣告分配的過(guò)程,是整個(gè)系統(tǒng)完整的組成部分。部分模塊其實(shí)是不可微的,比如排序模塊,因此深度學(xué)習(xí)網(wǎng)絡(luò)很難模擬它,為了端到端進(jìn)行拍賣機(jī)制設(shè)計(jì),我們把拍賣流程可微部分建模到神經(jīng)網(wǎng)絡(luò),這樣可以有梯度的反向傳導(dǎo),使得模型訓(xùn)練更加方便。
智能出價(jià)策略。
接下來(lái)講一下智能出價(jià)策略,這是廣告主用來(lái)調(diào)節(jié)效果或者博弈最主要的工具。中心化的分發(fā)無(wú)法表達(dá)訴求,但是在廣告場(chǎng)景中這是有辦法表達(dá)的。出價(jià)產(chǎn)品分為三個(gè)發(fā)展階段:
最初的經(jīng)典解法也是最古老的出價(jià),希望預(yù)算花得比較平滑,讓效果比較有保障,最初的時(shí)候業(yè)界是通過(guò)類似 PID 的控制算法,這是非常簡(jiǎn)單的算法,效果也比較有限。
等到了 2014、2015 年,再到 AlphaGo 打敗人類之后,我們看到了強(qiáng)化學(xué)習(xí)的強(qiáng)大力量。智能出價(jià)是一個(gè)非常典型的序列決策問(wèn)題,在預(yù)算周期內(nèi),前面花的好不好會(huì)影響到后面的出價(jià)決策,而這正是強(qiáng)化學(xué)習(xí)的強(qiáng)項(xiàng),因此第二階段我們用了基于強(qiáng)化學(xué)習(xí)的 bidding,通過(guò) MDP 建模,直接用強(qiáng)化學(xué)習(xí)做這個(gè)事情。
第三個(gè)階段就演進(jìn)到了 SORL 這個(gè)平臺(tái),它的特點(diǎn)是針對(duì)強(qiáng)化學(xué)習(xí)中離線仿真環(huán)境與在線環(huán)境不一致。我們直接在在線環(huán)境中進(jìn)行可交互的學(xué)習(xí),這是工程設(shè)計(jì)和算法設(shè)計(jì)聯(lián)合的例子。SORL 上線之后,很大程度上解決了強(qiáng)化學(xué)習(xí)強(qiáng)依賴于仿真平臺(tái)的問(wèn)題。
其他的技術(shù)特色還有工程基建部分,包括智能出價(jià)模型的訓(xùn)練框架、流批一體調(diào)控系統(tǒng)以及多渠道的投放圖化在線引擎。工程體系和算法同樣重要,離交易中心越近、越實(shí)時(shí),越能夠得到好的反饋,對(duì)于智能出價(jià)來(lái)說(shuō),工程基建部分越先進(jìn),越能幫助廣告主獲得更好的效果。
智能商業(yè)化策略。
最后講講與媒體相關(guān)的智能商業(yè)化策略部分。在商業(yè)化策略優(yōu)化上,最初的嘗試是把廣告結(jié)果和自然結(jié)果進(jìn)行加權(quán)融合,然后混合起來(lái),根據(jù)不同的情況挑選去放。不合理的商業(yè)化機(jī)制對(duì)用戶體驗(yàn)傷害很大,大家開(kāi)始意識(shí)到這個(gè)問(wèn)題。最近一兩年,動(dòng)態(tài)展現(xiàn)的策略逐漸流行起來(lái)了,隨著深度學(xué)習(xí)等技術(shù)發(fā)展,我們可以通過(guò)優(yōu)化決策算法做到平衡用戶體驗(yàn)和商業(yè)化收入,在全域流量下去平衡用戶的體驗(yàn)。
總體而言,在這三大方面,阿里媽媽形成了一張決策智能體系圖,分為三個(gè)層面,智能拍賣機(jī)制是中間的橋梁,智能商業(yè)化策略解決的問(wèn)題是拿出什么樣的資源拍賣最高效,最能平衡好用戶體驗(yàn)和商業(yè)化收入,智能出價(jià)策略是面向流量精細(xì)化出價(jià)的決策過(guò)程,通過(guò)出價(jià)參數(shù)的優(yōu)化、基于真實(shí)環(huán)境的強(qiáng)化學(xué)習(xí)參數(shù)尋優(yōu),或 Target CPX、Max Return 等建模的范式進(jìn)行優(yōu)化。
面對(duì)現(xiàn)在的多輪拍賣和高頻拍賣,很多基礎(chǔ)理論有待進(jìn)一步突破。說(shuō)到基礎(chǔ)機(jī)制理論突破,鄧?yán)蠋熓沁@方面的專家,我們期待與鄧?yán)蠋熞黄鹪谶@方面做出前沿性的研究。從工程實(shí)際問(wèn)題的挑戰(zhàn)角度來(lái)看,實(shí)際環(huán)境要求在 200 毫秒返回結(jié)果,因此效率和效果上需要通過(guò)一些平衡,在工業(yè)界做得比較久對(duì)這個(gè)都有感觸。
廣告生態(tài)的優(yōu)化是相對(duì)獨(dú)立的,平臺(tái)的最終目標(biāo)是希望生態(tài)欣欣向榮、和平發(fā)展,做好了這幾個(gè),生態(tài)是否能達(dá)到預(yù)期呢?我想二者之間未必直接劃等號(hào)。對(duì)于生態(tài)優(yōu)化,仍然有很多理論和實(shí)際問(wèn)題需要解決,這也是希望業(yè)界朋友們未來(lái)能夠一起去探討和解決的。
過(guò)去三年,阿里媽媽決策智能方向在頂級(jí)國(guó)際會(huì)議(NeurIPS、ICML、KDD、WWW 等)共發(fā)表近 20 篇論文,并與北京大學(xué)、上海交大、中科院、浙江大學(xué)等多所高校及研究機(jī)構(gòu)展開(kāi)合作,相關(guān)成果得到了工業(yè)界和學(xué)術(shù)界的廣泛關(guān)注和跟進(jìn),在這個(gè)領(lǐng)域?qū)崿F(xiàn)從跟隨到逐步引領(lǐng)行業(yè)的技術(shù)發(fā)展。
相對(duì)于深度學(xué)習(xí),決策智能在業(yè)界和學(xué)術(shù)界受到關(guān)注并沒(méi)有那么多,所以借這個(gè)機(jī)會(huì)讓大家更多了解這個(gè)領(lǐng)域,這個(gè)領(lǐng)域是非常有趣且有前景的。以上是阿里媽媽在決策智能方面的思考和工作,希望跟業(yè)界和學(xué)術(shù)界朋友一起分享,未來(lái)能更多地討論,爭(zhēng)取在決策智能的理論研究和業(yè)界實(shí)際應(yīng)用上能夠形成一些突破性的發(fā)展。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。