多Agent在城市交通系統(tǒng)中的應用
1 引言
本文引用地址:http://m.butianyuan.cn/article/196215.htmAgent 是運行于動態(tài)環(huán)境中的具有較高自制能力的實體,具有自主性、分布性、協(xié)調性和一定學習、推理能力。多智能體系統(tǒng)通過Agent 間的通訊、合作、協(xié)調和控制表達系統(tǒng)功能及行為特性。城市交通系統(tǒng)是自然的、分布的、復雜的、動態(tài)的、規(guī)模龐大的系統(tǒng),采用多Agent 技術建模城市交通系統(tǒng)可為交通決策者和使用者提供良好的解決方案。從二十世紀80 年代末,就有學者將多Agent 技術引入到城市交通系統(tǒng)的建模中,利用其協(xié)作、存儲、智能性和自治性為使用者提供在線決策支持、實時交通控制,或利用其對客觀世界的準確描述進行交通系統(tǒng)運行仿真,發(fā)現(xiàn)交通系統(tǒng)中的問題、規(guī)律或驗證新的理論和算法。本文從ITS 框架中的先進的交通管理系統(tǒng)(ATMS)、先進的出行者信息系統(tǒng)(ATIS)、先進的公交系統(tǒng)(APTS)三個方面對Agent 技術在城市交通系統(tǒng)中的應用現(xiàn)狀展開論述,最后指出多Agent 技術在城市交通系統(tǒng)的應用中需解決的問題以及發(fā)展趨勢。
2 多Agent在ATMS中的應用
在ATMS 中,多Agent 技術主要用于提供實時的決策支持并進行適當?shù)墓芾砜刂?。根?jù)Agent 慎思型和反應型兩種模型結構,建構基于Agent 的城市交通管理系統(tǒng)也有兩種思路:分層遞階式和完全分布式。
2.1 分層遞階式結構
分層遞階式結構的每一級都由功能、結構類似的Agent 組成,同級Agent 間可相互協(xié)調,上級Agent可作為對應下級Agent 的協(xié)調單元,下級Agent 向所屬上級Agent 傳輸局部系統(tǒng)環(huán)境和系統(tǒng)控制的反饋信息,為上級Agent 提供決策依據(jù)。最早的分層遞階式系統(tǒng)就是KITS 和TRYS.
KITS 產(chǎn)生于在1992-1994 年間,將交通領域知識分解成與路網(wǎng)拓撲結構相匹配的單元集合,提供專門的推理機制進行交通決策和管理。如圖1 所示,底層的Agent 通過協(xié)作完成交通監(jiān)控和管理任務,Actor 是直接和問題區(qū)域對應的交通評價和管理單元,Supervisor 負責全局路況分析、解釋以及合成全局行動方案。KITS 的成功表明:基于知識的模型可以和多Agent 技術相集合來提高城市交通系統(tǒng)的監(jiān)控和管理能力。
圖 1 KITS 架構圖
TRYS 是在1991-1994 年間建立的實時自適應的交通管理決策系統(tǒng)。如圖2 所示,TRYS 的結構與KITS 相似,通過Agent 訪問實時采集的路況數(shù)據(jù),并由Agent 內(nèi)部的知識庫和推理引擎對數(shù)據(jù)進行分析處理,coordinator 負責協(xié)調各Agent的工作以形成全局解決方案。與KITS 不同的是,TRYS 中的問題區(qū)域由獨立的、功能強大的Agent負責監(jiān)督。
圖 2 TRYS 架構圖。
翟高壽和Choy根據(jù)遞階控制結構理論及城市交通系統(tǒng)的結構特征,提出了四層的分層遞階式結構,分別是:決策層(城市交通控制決策系統(tǒng))、戰(zhàn)略控制層(若干區(qū)域協(xié)調控制系統(tǒng))、戰(zhàn)術控制層(若干路口控制系統(tǒng))、執(zhí)行層(檢測器、信號控制器和信號燈等)。
該結構的協(xié)調控制策略在TRYS 基礎上進一步下放到了路口級,建立了路口Agent,每個路口成了一個智能的知識系統(tǒng),可及時根據(jù)路口交通狀況進行控制策略的實時部署與調整,更好地適應了交通系統(tǒng)動態(tài)性、實時性強的特點,對突發(fā)性交通流的變化有很好的適應和調節(jié)能力。
2.2 完全分布式結構
在完全分布式結構的系統(tǒng)中,Agent 憑借自身的知識和智能與相鄰區(qū)域Agent 協(xié)調共同完成路口的管制。最初的應用就是西班牙的TRYSA2 系統(tǒng),如圖3 所示。TRYSA2 Agent 有一個控制計劃集,每個計劃都被賦予了能夠減輕交通壓力的效用值。系統(tǒng)可通過評估相關Agent 的計劃效用值合成系統(tǒng)最優(yōu)的解決方案。Oliveira 、承向軍、楊兆升等學者也先后提出了以路口Agent 為基本控制單元的完全分布式控制結構,系統(tǒng)中的Agent 都具備了一定的存儲、匹配和智能計算功能,可依靠良好的協(xié)調算法實現(xiàn)多Agent 之間的協(xié)調與合作以達到整體優(yōu)化和控制的目的。
圖 3 TRYSA2 架構圖。
2.3 兩種架構的性能比較
分層遞階式充分體現(xiàn)了集中和分散控制的有機結合,考慮到了全局利益,可使協(xié)調有目的地進行,但是區(qū)域Agent 和主控Agent 的實現(xiàn)稍顯復雜。完全分布式具有反應快速、靈活性強等特點,可充分發(fā)揮Agent 的自治性、協(xié)調性,但由于Agent 自身能力有限、系統(tǒng)的知識又過于分散,解決全局問題的能力略顯不足,Agent 間的協(xié)調機制會對系統(tǒng)性能產(chǎn)生較大影響。在擴展性上,完全分布式只需把新Agent 注冊到其他Agent 中并修改相應的方案和知識庫即可將新Agent 擴充到當前的Agent 群體中,而分層遞階式需要整合區(qū)域控制中心和主控中心,重新賦予各Agent優(yōu)先權關系。在協(xié)作復雜度上,分層遞階式從每一個Agent 控制方案中選擇一個本地最優(yōu)的方案,完全分布式在所有的Agent 中通過搜索策略來查找最佳方案,因此后者工作量較大。
2.4 多Agent 的協(xié)調控制與優(yōu)化
多Agent 通過協(xié)調實現(xiàn)系統(tǒng)的分布式并行運行,提高任務的執(zhí)行效率。在基于多Agent 的ATMS 中,有三種協(xié)調方式:①建立專門的協(xié)調Agent;②將協(xié)調行為分散至各Agent 中,由Agent 自主地完成;③集中與分布相結合的方法,Agent 自身即可以完成某些協(xié)調行為,又可以接受高層Agent 制定的規(guī)劃。當前常用的協(xié)調方法有黑板模型、博弈模型、協(xié)調器、交換意見等。
黑板模型信息傳輸量大,對信息傳輸?shù)姆€(wěn)定性也有一定的要求,適用于簡單的分布式多路口控制。博弈論模型適用于分層遞階結構的上下級Agent 間和完全分布結構的同級Agent 間的協(xié)調,但由于重復博弈過程中需要進行復雜的均衡點收斂控制,所以基于交通信息博弈的計算量較大。協(xié)調器可基于一定的目標將同級和下級Agent 產(chǎn)生的提案合成全局的提案。協(xié)調器降低了系統(tǒng)的通信量和其他Agent 的實現(xiàn)復雜度,但卻增加了協(xié)調器Agent 自身的設計復雜度和計算量。交換意見法對系統(tǒng)通信的穩(wěn)定性有很大的要求,當單個Agent 節(jié)點出現(xiàn)通信故障時,系統(tǒng)將無法正常工作。
從上述幾種方法的分析中可以看到,協(xié)調過程需要傳輸大量數(shù)據(jù),因此容易造成傳輸網(wǎng)絡的擁塞。目前,很多學者都采用強化學習的方法來優(yōu)化本地的交通信息。強化學習方法是以環(huán)境提供的加強信號作為性能評價的反饋,完成從狀態(tài)到行為的映射的學習,特別適合處理不斷變化的路網(wǎng)環(huán)境。Baher、歐海濤等都基于強化學習研究了實時自適應的交通信號控制,減少路口節(jié)點間的大量通訊需求,增強了決策的可靠性。
2.5 相關應用研究
Ronald通過將分離獨立的交通設施建模成能互相協(xié)作的Agent,研究了動態(tài)交通管理設備互相協(xié)作的可能性。Filippo實現(xiàn)了一種基于多Agent 架構的交通管理系統(tǒng)CARTESIUS,在分析偶發(fā)性阻塞和在線制定集成控制方案過程中展示了良好的協(xié)作推理和解決沖突的能力,可為交通管理人員協(xié)調多區(qū)域間的快車道和地面街道的路網(wǎng)阻塞提供實時決策支持。
Bo Chen等人將移動Agent 技術融入到交通管理系統(tǒng)中,增強了處理不確定事件和環(huán)境動態(tài)變化的能力,提出了一種基于柔性Agent 的實時交通檢測和管理系統(tǒng)。
3 多Agent在ATIS中的應用
ATIS 可以影響出行行為,增強路網(wǎng)性能。當前采用Agent 技術研究ATIS 主要是針對不同的出行需求構建各式智能的出行信息系統(tǒng),為出行者提供高質量的出行信息和導航服務;另外是研究ATIS 條件下的出行者行為以及ATIS 對城市交通的影響。
3.1 基于Agent 的典型出行信息系統(tǒng)框架
為實現(xiàn)路網(wǎng)管理者和出行者之間的有效協(xié)調,需要在不嚴重影響個體出行者的使用偏好(出行類型、路徑選擇、離開/到達時間等)基礎上有效地基于時空二維分配路網(wǎng)?;诖?,Adler 和Blue 研究了智能出行信息系統(tǒng)(IT IS),專為出行者提供出行計劃和導航輔助信息,提出一種代表出行者的車載智能導航Agent,可以學習、定義并校準路徑和出行計劃偏好。在此基礎上,他們又提出基于多Agent 的交通管理和路徑導航協(xié)作系統(tǒng)(CTMRGS)的概念框架,使路網(wǎng)管理者、信息提供者和出行者之間能有效的協(xié)調和溝通。系統(tǒng)采用原則協(xié)商指導出行者Agent 和信息提供者Agent 之間的交互,找到一個時最優(yōu)的出行方案,最后指出更多的智能將會被用來捕捉和呈現(xiàn)出行者的真實意圖和行為。
3.2 ATIS 影響下的基于多Agent 仿真的出行者行為研究
ATIS 的有效性取決于系統(tǒng)提供信息的能力以及出行者對出行信息的反應。因此,了解出行者的行為及其在出行信息下的決策過程便顯得尤為重要,這將有助于設計出高效的ATIS.目前,國內(nèi)外很多學者都采用Agent 仿真方法研究ATIS 環(huán)境下的出行者行為。
Dia首先提出利用多Agent 仿真來研究實時交通信息影響下的駕駛員行為。通過對駕駛員行為(特性、心理、知識、偏好等)的調查采用BDI(信念-渴望-意圖)結構建模,配合交通仿真組件評價交通實時信息對駕駛員行為的影響。Rossetti基于BDI 架構提出了基于DRACULA(一種結合用戶學習和微觀模擬的動態(tài)路徑分配模型)的多Agent 擴展模型對出行者進行建模,允許出行者對出行路徑和離開時間做出理性選擇。
駕駛員的行為會影響到ATIS 系統(tǒng)收益和系統(tǒng)的整體性能。Rossetti 基于謂詞邏輯表達方式對出行者Agent 建模,使決策過程中呈現(xiàn)了更多的出行者心理因素。仿真結果表明,系統(tǒng)的整體性能會受到出行信息需求和交通網(wǎng)絡拓撲結構的影響,當出行信息單獨向個體提供的時候,總體影響可以得到很大改善。
Joachim將出行者建模成Agent,基于兩條平行路徑的路網(wǎng)分析了ATIS 環(huán)境中的出行者路徑選擇行為,研究指出出行信息的特性很大程度上影響了ATIS的潛在收益。趙凜在Joachim 的基礎上,通過對系統(tǒng)中的微觀行為建立基于Agent 的仿真模型來觀察系統(tǒng)涌現(xiàn)出來的宏觀特征。仿真結果顯示ATIS對通勤者出行前的出行規(guī)劃有一定影響,隨著交通量的增加,交通系統(tǒng)的不確定性也隨之增加,ATIS 系統(tǒng)收益會有所提高。
3.3 相關應用研究
Zargayouna提出了一種基于Agent 的出行者信息服務中心架構,通過實例化大量的交通實體,建立了基于環(huán)境的服務、信息資源和出行者主動交互支持模型,允許實體間建立各自感興趣的交互。
Wahle提出了一個基于多Agent 的實時交通流在線仿真和預測框架,通過歷史數(shù)據(jù)的啟發(fā)結合當前動態(tài)數(shù)據(jù)可提供對路徑選擇行為和交通走向的短期預測。王健采用數(shù)據(jù)挖掘中的決策樹方法獲取出行者信息需求,使用Agent 技術建立了基于移動終端的信息服務網(wǎng)絡框架。Chou構建了基于多Agent的停車導航協(xié)商網(wǎng)絡,將汽車、停車場和導航系統(tǒng)建模成Agent,通過各Agent 的協(xié)作為駕駛員選擇價格和路線最優(yōu)的停車場。
4 多Agent在APTS中的應用
4.1 基于多Agent 的公交運行狀態(tài)檢測
公交運行狀態(tài)檢測對于確保公交系統(tǒng)的正點到站、運行具有重要的意義。采用AVM 系統(tǒng)獲取公交運行數(shù)據(jù)進行擾動(延遲和超行)檢測缺乏對全局路況的總覽而且穩(wěn)定性差,很難提供基于時空二維的路況進展狀態(tài)。因此,F(xiàn)lavien提出了采用多Agent 技術診斷公交擾動以及檢測定位數(shù)據(jù)傳輸?shù)倪B貫性。公交車和站點被建模成Agent,站點Agent 備有公交運行時間表,負責計算公交到站后的調度;公交車Agent負責向STOP Agent 報告路網(wǎng)實際狀態(tài),供STOPAgent 將車輛到達的理論時間和當前實際時間相比較以檢測公交擾動。在此基礎上,他們又對擾動的整個生命周期進行了動態(tài)建模,把擾動模型融合到多Agent 決策支持系統(tǒng)中,研究了擾動對路網(wǎng)活動的影響。模型包括三個信息區(qū)域:后繼區(qū)域(延遲公交車后繼站點),關鍵區(qū)域(延遲公交車所在的站點),先前區(qū)域(延遲公交車的前驅站點)。如圖4 所示,最底層的STOP Agent 接收BUS Agent 傳來的信息,中間層的STOPAREA Agent 負責從STOP Agent 中收集信息合成交通評價、客流信息、路況進展系數(shù)等,頂層的INCIDENT Agent 形成綜合的實時調度決策。
圖4 基于分級多Agent 公交擾動檢測框架圖。
4.2 基于多Agent 的公交系統(tǒng)運行仿真
公交系統(tǒng)的運行仿真可用于調整公交調度、評價公交路網(wǎng)結構以及制定策略。David采用多Agent仿真方法描述了公交系統(tǒng)運行,將公交車和出行者建模成Agent,所有的模型都結合了公交操作、出行者行為和道路交通負載。文中使用了多項logit 模型配備交通需求,評價了步行、汽車、公交模式的效用,并基于效用模型制定了出行者的出行路線和交通行為。仿真主要關注了公交乘客載荷和乘客等待時間。
仿真結果表明,通過將公交車和出行者建模成Agent,可方便地模擬公交車在運行過程中可能出現(xiàn)的各種狀況(飽和、不足),為特殊事件(事故、阻塞)的發(fā)生制定有效的調度策略。
5 結論與展望
ITS 的將來會被各式智能、自治的Agent 布滿整個交通系統(tǒng)中,通過互聯(lián)網(wǎng)、無線網(wǎng)絡或自組織網(wǎng)絡連接,不斷采集信息做出智能決策,最終使交通系統(tǒng)獲得徹底的智能。要使Agent 發(fā)揮更大的作用,還需要在實際應用中充分考慮城市交通系統(tǒng)及其內(nèi)含實體的特點(出行方式特征、交通規(guī)則、路網(wǎng)結構、出行心里),緩解通信需求、降低運算量及協(xié)調復雜度、優(yōu)化系統(tǒng)組織結構、增強系統(tǒng)的穩(wěn)定性和安全性。多Agent 今后在城市交通系統(tǒng)中的研究方向應主要集中在以下幾方面:
(1) 多個Agent 系統(tǒng)的信息融合,如在交通管理系統(tǒng)、出行信息系統(tǒng)、導航系統(tǒng)、停車系統(tǒng)間共享信息,通過協(xié)調多系統(tǒng)的工作,提高路網(wǎng)運行效率和出行信息服務質量;
(2) 針對城市交通系統(tǒng)存在的問題,研究面向特定應用領域的多Agent 系統(tǒng)結構、協(xié)調算法和組織優(yōu)化技術,形成規(guī)范的技術體系,包括通信環(huán)境、建模方法、評價方法等;
(3) 將更多Agent 新技術引入到城市交通系統(tǒng)設計當中,如移動Agent、Agent 規(guī)范、Agent 體系結構、Agent 通信和語言、Agent 組織與聯(lián)盟、Agent學習與規(guī)劃、Agent 協(xié)商與協(xié)調等方向上的新技術;
(4) Agent 技術理論研究在城市交通中的應用已形成一定的規(guī)模,如何更高效地發(fā)揮Agent 的特性使之與城市交通更緊密的結合與適應將會成為新的研究熱點;
(5) Agent 的廣泛應用會把更多的人工智能、系統(tǒng)工程、控制理論、優(yōu)化算法和分布式計算技術引入到實際的交通問題解決中來,為Agent 的具體應用提供更多的新思路。
評論