基于B/S模式的客流預(yù)測(cè)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
1 引言
在信息飛速發(fā)展的今天,我國(guó)各行各業(yè)都不同程度地推行了辦公自動(dòng)化,各種管理信息系統(tǒng)層出不窮。但是許多管理軟件仍然停留在面向當(dāng)前工作數(shù)據(jù)流的控制、報(bào)表的自動(dòng)生成和打印輸出以及簡(jiǎn)單的統(tǒng)計(jì)分析方面。而隨著數(shù)據(jù)挖掘理念的提出,也給管理信息系統(tǒng)帶來(lái)了新的發(fā)展空間。如何更有效地提取有用的信息資源,發(fā)掘其內(nèi)在的規(guī)律性,探索出有價(jià)值的發(fā)展趨勢(shì),是適應(yīng)市場(chǎng)需求、提高科學(xué)管理水平和領(lǐng)導(dǎo)決策能力的關(guān)鍵。
針對(duì)我國(guó)目前我國(guó)鐵路運(yùn)輸中的客票預(yù)定體系的還相當(dāng)不完善的現(xiàn)狀,特別是在節(jié)假日期間,出行人數(shù)相對(duì)平時(shí)有明顯增加,給客運(yùn)工作帶來(lái)很多不可預(yù)知的困難。如果能深入這部分的研究,為鐵路局開(kāi)發(fā)出一套方便有效的客流預(yù)測(cè)系統(tǒng),對(duì)每年各個(gè)時(shí)期的旅客人數(shù)做出較為準(zhǔn)確的預(yù)測(cè),最大可能地滿足旅客的乘車需求,對(duì)于鐵路運(yùn)輸?shù)慕ㄔO(shè)與發(fā)展具有重大意義。
客運(yùn)量定量預(yù)測(cè)的方法較多,大體上可分為相關(guān)模型預(yù)測(cè)法和時(shí)間模型預(yù)測(cè)法。相關(guān)模型預(yù)測(cè)法是找出影響客流量的因素(即相關(guān)因素),以這些因素為自變量、客流量為因變量建立函數(shù)關(guān)系,得出模型進(jìn)行預(yù)測(cè)。時(shí)間模型預(yù)測(cè)法是以時(shí)間為自變量建立模型進(jìn)行客流量預(yù)測(cè)。
在相關(guān)模型預(yù)測(cè)法中,影響客流量的因素很多,有經(jīng)濟(jì)發(fā)展水平、人口、旅游業(yè)等,這些因素之間有錯(cuò)綜復(fù)雜的關(guān)系,難以確定單個(gè)因素對(duì)客流量的影響,導(dǎo)致預(yù)測(cè)存在某些誤差。
時(shí)間模型如季節(jié)模型,表現(xiàn)為客流因季節(jié)不同而有顯著變化。例如在節(jié)假日及寒暑假期間,旅行人數(shù)激增,等級(jí)較低席位需求遠(yuǎn)遠(yuǎn)多于平常。由于季節(jié)性的變化,使得訂票需求呈不穩(wěn)定的變化,但每年的同一時(shí)間點(diǎn),有相同的變動(dòng)方向、甚至相同的變動(dòng)幅度,時(shí)間序列呈周期性的波動(dòng)。
然而,另一方面,由于任何現(xiàn)象從一個(gè)時(shí)期到另一個(gè)時(shí)期的運(yùn)動(dòng),總是受到諸多因素的影響,其中有些因素的影響不是瞬間即逝的,而是持續(xù)相當(dāng)長(zhǎng)的時(shí)間。就鐵路客運(yùn)自身來(lái)考慮,隨時(shí)間的不同,在其前后時(shí)間的數(shù)值之間也表現(xiàn)出一定的依賴關(guān)系。
2 建立模型
目前,南昌鐵路局在客流分析和統(tǒng)計(jì)上的工作尚未開(kāi)展,他們所具有的數(shù)據(jù)以紙質(zhì)材料的形式存放。為了實(shí)現(xiàn)客流分析的自動(dòng)化和客流預(yù)測(cè)功能,該軟件系統(tǒng)選擇了客流的幾個(gè)重要的指標(biāo)進(jìn)行分析和預(yù)測(cè),如各站上車人數(shù)、各站下車人數(shù)、各站到終點(diǎn)人數(shù)、車內(nèi)人數(shù)。這種分析的意義在于為車廂的調(diào)配和旅客的分流提供了預(yù)報(bào)。該軟件系統(tǒng)的開(kāi)發(fā)和研制將使南昌鐵路局在客流分析方面得到一個(gè)突破性的進(jìn)展。
由于平時(shí),即非常假日期間。連續(xù)幾天內(nèi)的客流量相差不大,考慮采用指數(shù)平滑法進(jìn)行相鄰幾天的客流預(yù)測(cè)。指數(shù)平滑法是一種加權(quán)移動(dòng)平均的預(yù)測(cè)方法,這種方法適用于短近趨勢(shì)的預(yù)測(cè)。他的原理是任一期的指數(shù)平滑值都是上一期以及其以前各期實(shí)際數(shù)值的加權(quán)平均數(shù),隨著時(shí)間的進(jìn)展,所平均的項(xiàng)數(shù)就不斷地增加,同時(shí)遠(yuǎn)期數(shù)值的權(quán)數(shù)迅速減小。既體現(xiàn)了重視近期數(shù)據(jù)的思想.也用到了老的平滑值,可以一定程度地抵掉新信息中包括的隨機(jī)干擾,起到了平滑數(shù)據(jù)、顯示規(guī)律的作用。
而在節(jié)假日期間及寒暑假期間,旅行人數(shù)激增,等級(jí)較低席位需求遠(yuǎn)多于平常。與相鄰時(shí)段的客流量比較在曲線上有較大的起伏,但相對(duì)于歷年的同一時(shí)段,具有相似的波動(dòng)幅度。針對(duì)這一特性,采用季節(jié)水平模型進(jìn)行預(yù)測(cè)。
季節(jié)水平模型:
yt=y*ft (2)
式中,y可以是預(yù)測(cè)期前兩年的某個(gè)時(shí)間段的平均水平,也可以是已知年份所有數(shù)據(jù)日的平均水平。ft稱為季節(jié)指數(shù)或季節(jié)系數(shù),他表示季節(jié)變動(dòng)的數(shù)量狀態(tài),ft=同日平均數(shù)/已知年份日總平均數(shù)。由于在一段時(shí)間內(nèi)的不確定因素很多,模型(2)只考慮縱向歷年同一時(shí)間點(diǎn)客流量的變化,未考慮這段時(shí)間前內(nèi)前幾天客流變化對(duì)后幾天的影響,還需根據(jù)前幾天的實(shí)際值對(duì)未來(lái)天數(shù)的預(yù)測(cè)值做出修正。
如果第i天的實(shí)際值比該天的預(yù)測(cè)值大,則修正后的預(yù)測(cè)曲線在第i天之前部分已為實(shí)際值,不發(fā)生變化;在第i天之后與第i天接近的部分受這一不確定因素影響較大,應(yīng)向上做相應(yīng)偏移。而與第i天相距較遠(yuǎn)的部分受其影響較小,基本不發(fā)生變化。這種變動(dòng)情況符合負(fù)指數(shù)曲線。
3 預(yù)測(cè)系統(tǒng)的體系結(jié)構(gòu)
該系統(tǒng)設(shè)計(jì)為browser/server結(jié)構(gòu).用戶通過(guò)瀏覽器向分布在網(wǎng)絡(luò)上的服務(wù)器發(fā)出請(qǐng)求。他以tcp/ip協(xié)議為基礎(chǔ),以web為核心應(yīng)用,構(gòu)成統(tǒng)一和方便的信息交換平臺(tái),既可以與internet互聯(lián),又可單獨(dú)使用,具有很大的靈活性。采用b/s結(jié)構(gòu)簡(jiǎn)化了客戶機(jī)的管理工作,客戶機(jī)上只需安裝配置少量的客戶端軟件。服務(wù)器將負(fù)擔(dān)較多的工作,對(duì)數(shù)據(jù)庫(kù)的訪問(wèn)和預(yù)測(cè)程序的執(zhí)行將在服務(wù)器上完成。
典型的基于b/s應(yīng)用系統(tǒng)的3層結(jié)構(gòu)模型包括表示層(presentation)、應(yīng)用邏輯層(businesslogic)和數(shù)據(jù)服務(wù)層(data)。用java技術(shù)開(kāi)發(fā)的鐵路預(yù)測(cè)系統(tǒng)的3層體系結(jié)構(gòu)如圖1所示。第1層(表示層)包括javaapplet和瀏覽器;第2層(應(yīng)用邏輯層)為預(yù)測(cè)服務(wù)器和web服務(wù)器;第3層(數(shù)據(jù)服務(wù)層)為數(shù)據(jù)庫(kù)服務(wù)器。第1層與第2層的通信采用http和socket技術(shù),第2層與第3層的通信采用基于jdbc一odbc的數(shù)據(jù)庫(kù)連接池技術(shù)。
4 數(shù)據(jù)庫(kù)同步控制
由于該客流預(yù)測(cè)系統(tǒng)的服務(wù)對(duì)象只是鐵路局的領(lǐng)導(dǎo)和部分決策人員,他是整個(gè)鐵路營(yíng)運(yùn)信息系統(tǒng)的一部分。出于安全的考慮,采用內(nèi)網(wǎng)和外網(wǎng)2個(gè)子系統(tǒng),分別對(duì)應(yīng)不同的web服務(wù)器和數(shù)據(jù)庫(kù)服務(wù)器。使用外網(wǎng)的為普通用戶,實(shí)現(xiàn)的服務(wù)內(nèi)容為一般的數(shù)據(jù)錄入、資料查詢和三維統(tǒng)計(jì)等。為了提高存取速度,更重要的是保證數(shù)據(jù)的完整性.外網(wǎng)的數(shù)據(jù)庫(kù)服務(wù)器采用磁盤(pán)陣列技術(shù)。由于外網(wǎng)上的數(shù)據(jù)是實(shí)時(shí)更新的,比如各個(gè)車次的上車人數(shù)、下車人數(shù)、到終點(diǎn)人數(shù)和往返客票進(jìn)款等,這些都是執(zhí)行預(yù)測(cè)所需要的原始數(shù)據(jù),于是很重要的一部分工作就是保持2個(gè)系統(tǒng)數(shù)據(jù)的完整性、一致性和安全性。
為此,設(shè)計(jì)了數(shù)據(jù)庫(kù)的實(shí)時(shí)更新功能,實(shí)現(xiàn)定期地將原始數(shù)據(jù)導(dǎo)入到預(yù)測(cè)系統(tǒng)所需的運(yùn)行數(shù)據(jù)庫(kù)中,用戶可以自定義數(shù)據(jù)庫(kù)的更新周期,一般為l~2天。并且定在夜間執(zhí)行。這樣既保證了預(yù)測(cè)系統(tǒng)對(duì)于數(shù)據(jù)的實(shí)時(shí)更新,又保證了內(nèi)部資源的安全訪問(wèn)。
5 結(jié)語(yǔ)
針對(duì)我國(guó)客流量變化的特點(diǎn),選取適當(dāng)?shù)目土髦笜?biāo)建立正確的預(yù)測(cè)模型是提高預(yù)測(cè)結(jié)果可靠性的關(guān)鍵。由于我國(guó)在各個(gè)時(shí)期的客流量有著不同的變化規(guī)律,提出了基于不同的影響因素建立不同的預(yù)測(cè)模型,使預(yù)測(cè)效果得到了顯著的提高,對(duì)于鐵路運(yùn)輸?shù)慕ㄔO(shè)與發(fā)展具有重大意義。
評(píng)論