Agent在城市交通系統(tǒng)中的應用
該結構的協(xié)調控制策略在TRYS 基礎上進一步下放到了路口級,建立了路口Agent,每個路口成了一個智能的知識系統(tǒng),可及時根據(jù)路口交通狀況進行控制策略的實時部署與調整,更好地適應了交通系統(tǒng)動態(tài)性、實時性強的特點,對突發(fā)性交通流的變化有很好的適應和調節(jié)能力。
2.2 完全分布式結構
在完全分布式結構的系統(tǒng)中,Agent 憑借自身的知識和智能與相鄰區(qū)域Agent 協(xié)調共同完成路口的管制。最初的應用就是西班牙的TRYSA2 系統(tǒng),如圖3 所示。TRYSA2 Agent 有一個控制計劃集,每個計劃都被賦予了能夠減輕交通壓力的效用值。系統(tǒng)可通過評估相關Agent 的計劃效用值合成系統(tǒng)最優(yōu)的解決方案。Oliveira 、承向軍、楊兆升等學者也先后提出了以路口Agent 為基本控制單元的完全分布式控制結構,系統(tǒng)中的Agent 都具備了一定的存儲、匹配和智能計算功能,可依靠良好的協(xié)調算法實現(xiàn)多Agent 之間的協(xié)調與合作以達到整體優(yōu)化和控制的目的。
圖 3 TRYSA2 架構圖。
2.3 兩種架構的性能比較
分層遞階式充分體現(xiàn)了集中和分散控制的有機結合,考慮到了全局利益,可使協(xié)調有目的地進行,但是區(qū)域Agent 和主控Agent 的實現(xiàn)稍顯復雜。完全分布式具有反應快速、靈活性強等特點,可充分發(fā)揮Agent 的自治性、協(xié)調性,但由于Agent 自身能力有限、系統(tǒng)的知識又過于分散,解決全局問題的能力略顯不足,Agent 間的協(xié)調機制會對系統(tǒng)性能產生較大影響。在擴展性上,完全分布式只需把新Agent 注冊到其他Agent 中并修改相應的方案和知識庫即可將新Agent 擴充到當前的Agent 群體中,而分層遞階式需要整合區(qū)域控制中心和主控中心,重新賦予各Agent優(yōu)先權關系。在協(xié)作復雜度上,分層遞階式從每一個Agent 控制方案中選擇一個本地最優(yōu)的方案,完全分布式在所有的Agent 中通過搜索策略來查找最佳方案,因此后者工作量較大。
2.4 多Agent 的協(xié)調控制與優(yōu)化
多Agent 通過協(xié)調實現(xiàn)系統(tǒng)的分布式并行運行,提高任務的執(zhí)行效率。在基于多Agent 的ATMS 中,有三種協(xié)調方式:①建立專門的協(xié)調Agent;②將協(xié)調行為分散至各Agent 中,由Agent 自主地完成;③集中與分布相結合的方法,Agent 自身即可以完成某些協(xié)調行為,又可以接受高層Agent 制定的規(guī)劃。當前常用的協(xié)調方法有黑板模型、博弈模型、協(xié)調器、交換意見等。
黑板模型信息傳輸量大,對信息傳輸?shù)姆€(wěn)定性也有一定的要求,適用于簡單的分布式多路口控制。博弈論模型適用于分層遞階結構的上下級Agent 間和完全分布結構的同級Agent 間的協(xié)調,但由于重復博弈過程中需要進行復雜的均衡點收斂控制,所以基于交通信息博弈的計算量較大。協(xié)調器可基于一定的目標將同級和下級Agent 產生的提案合成全局的提案。協(xié)調器降低了系統(tǒng)的通信量和其他Agent 的實現(xiàn)復雜度,但卻增加了協(xié)調器Agent 自身的設計復雜度和計算量。交換意見法對系統(tǒng)通信的穩(wěn)定性有很大的要求,當單個Agent 節(jié)點出現(xiàn)通信故障時,系統(tǒng)將無法正常工作。
從上述幾種方法的分析中可以看到,協(xié)調過程需要傳輸大量數(shù)據(jù),因此容易造成傳輸網絡的擁塞。目前,很多學者都采用強化學習的方法來優(yōu)化本地的交通信息。強化學習方法是以環(huán)境提供的加強信號作為性能評價的反饋,完成從狀態(tài)到行為的映射的學習,特別適合處理不斷變化的路網環(huán)境。Baher、歐海濤等都基于強化學習研究了實時自適應的交通信號控制,減少路口節(jié)點間的大量通訊需求,增強了決策的可靠性。
2.5 相關應用研究
Ronald通過將分離獨立的交通設施建模成能互相協(xié)作的Agent,研究了動態(tài)交通管理設備互相協(xié)作的可能性。Filippo實現(xiàn)了一種基于多Agent 架構的交通管理系統(tǒng)CARTESIUS,在分析偶發(fā)性阻塞和在線制定集成控制方案過程中展示了良好的協(xié)作推理和解決沖突的能力,可為交通管理人員協(xié)調多區(qū)域間的快車道和地面街道的路網阻塞提供實時決策支持。
Bo Chen等人將移動Agent 技術融入到交通管理系統(tǒng)中,增強了處理不確定事件和環(huán)境動態(tài)變化的能力,提出了一種基于柔性Agent 的實時交通檢測和管理系統(tǒng)。
3 多Agent在ATIS中的應用
ATIS 可以影響出行行為,增強路網性能。當前采用Agent 技術研究ATIS 主要是針對不同的出行需求構建各式智能的出行信息系統(tǒng),為出行者提供高質量的出行信息和導航服務;另外是研究ATIS 條件下的出行者行為以及ATIS 對城市交通的影響。
3.1 基于Agent 的典型出行信息系統(tǒng)框架
為實現(xiàn)路網管理者和出行者之間的有效協(xié)調,需要在不嚴重影響個體出行者的使用偏好(出行類型、路徑選擇、離開/到達時間等)基礎上有效地基于時空二維分配路網。基于此,Adler 和Blue 研究了智能出行信息系統(tǒng)(IT IS),專為出行者提供出行計劃和導航輔助信息,提出一種代表出行者的車載智能導航Agent,可以學習、定義并校準路徑和出行計劃偏好。在此基礎上,他們又提出基于多Agent 的交通管理和路徑導航協(xié)作系統(tǒng)(CTMRGS)的概念框架,使路網管理者、信息提供者和出行者之間能有效的協(xié)調和溝通。系統(tǒng)采用原則協(xié)商指導出行者Agent 和信息提供者Agent 之間的交互,找到一個時最優(yōu)的出行方案,最后指出更多的智能將會被用來捕捉和呈現(xiàn)出行者的真實意圖和行為。
3.2 ATIS 影響下的基于多Agent 仿真的出行者行為研究
ATIS 的有效性取決于系統(tǒng)提供信息的能力以及出行者對出行信息的反應。因此,了解出行者的行為及其在出行信息下的決策過程便顯得尤為重要,這將有助于設計出高效的ATIS.目前,國內外很多學者都采用Agent 仿真方法研究ATIS 環(huán)境下的出行者行為。
Dia首先提出利用多Agent 仿真來研究實時交通信息影響下的駕駛員行為。通過對駕駛員行為(特性、心理、知識、偏好等)的調查采用BDI(信念-渴望-意圖)結構建模,配合交通仿真組件評價交通實時信息對駕駛員行為的影響。Rossetti基于BDI 架構提出了基于DRACULA(一種結合用戶學習和微觀模擬的動態(tài)路徑分配模型)的多Agent 擴展模型對出行者進行建模,允許出行者對出行路徑和離開時間做出理性選擇。
駕駛員的行為會影響到ATIS 系統(tǒng)收益和系統(tǒng)的整體性能。Rossetti 基于謂詞邏輯表達方式對出行者Agent 建模,使決策過程中呈現(xiàn)了更多的出行者心理因素。仿真結果表明,系統(tǒng)的整體性能會受到出行信息需求和交通網絡拓撲結構的影響,當出行信息單獨向個體提供的時候,總體影響可以得到很大改善。
評論