基于ELM和LSSVM的客流量預(yù)測(cè)模型
作者 張克申1 安俊峰1 孫二杰1 趙帥1 蘆瀟1 盧萌萌2 1.濟(jì)南軌道交通集團(tuán)有限公司(山東 濟(jì)南 250000)2.山東勞動(dòng)職業(yè)技術(shù)學(xué)院(山東 濟(jì)南 250000)
本文引用地址:http://2s4d.com/article/201807/389582.htm張克申(1973),男,工程師,研究方向:自動(dòng)化。
摘要:涉及一種基于滾動(dòng)式地鐵人流量混合預(yù)測(cè)方法,采用的是雙預(yù)測(cè)算法,雙預(yù)測(cè)通道的模式;雙預(yù)測(cè)方法指的是預(yù)測(cè)用到了ELM神經(jīng)網(wǎng)絡(luò)和LSSVM兩種算法混合組成。雙預(yù)測(cè)通道指的是采用兩個(gè)不同的滾動(dòng)序列基數(shù)進(jìn)行預(yù)測(cè)。最后根據(jù)不同方式確定權(quán)重大小,并且得到混合預(yù)測(cè)數(shù)據(jù)模型。
0 引言
地鐵中,客流量分析是一個(gè)很重要的領(lǐng)域,客流量的多少直接影響到安全,城市的經(jīng)濟(jì)發(fā)展等重要因素。地鐵的客流量多少對(duì)乘客的出行有很大的警示作用。
AFC(自動(dòng)售檢票)系統(tǒng)可以獲得很大的客流量信息,可以進(jìn)行設(shè)置,獲得每分鐘、每小時(shí)、每天、每月、每季度、每年的數(shù)據(jù)信息,并且可以按照車(chē)站每類整理,形成龐大的數(shù)據(jù)信息,信息量的充足和龐大足夠支撐大家去進(jìn)行分析和預(yù)測(cè),并且因?yàn)閿?shù)據(jù)量的充足和龐大,可以對(duì)感興趣數(shù)據(jù)進(jìn)行分類整合,組成想要的數(shù)據(jù)信息進(jìn)行研究。
收集大量的客流量數(shù)據(jù)后,以每半年或者每年為單位作為數(shù)據(jù)統(tǒng)計(jì),有效地去預(yù)測(cè)未來(lái)五年或者未來(lái)十年,甚至未來(lái)二十年的數(shù)據(jù),對(duì)于地鐵線路的規(guī)劃,市政建設(shè)的布局都有著指導(dǎo)性的作用。
并且現(xiàn)有的預(yù)測(cè)算法都是針對(duì)于已知的數(shù)據(jù)進(jìn)行分析和預(yù)測(cè),進(jìn)而研究一種預(yù)測(cè)方法去預(yù)測(cè)未知數(shù)據(jù)是有必要的。目前存在的預(yù)測(cè)方法是用已知的數(shù)據(jù)做研究,即知道數(shù)輸入數(shù)據(jù)和輸出數(shù)據(jù),進(jìn)行研究和挖掘,但是往往未來(lái)的的輸入數(shù)據(jù)是未知的,那么帶來(lái)預(yù)測(cè)很大的不方便,但是預(yù)測(cè)有著很重要的作用。因此針對(duì)未知數(shù)據(jù)的預(yù)測(cè)是個(gè)有力的應(yīng)用。
本文提出一種基于滾動(dòng)式地鐵人流量混合預(yù)測(cè)方法,并且將數(shù)據(jù)傳遞給AFC系統(tǒng),由AFC系統(tǒng)來(lái)完成相關(guān)的預(yù)警信號(hào)。
1 原理簡(jiǎn)介
1.1 ELM神經(jīng)網(wǎng)絡(luò)
ELM是一個(gè)神經(jīng)網(wǎng)絡(luò)的形式,結(jié)構(gòu)由輸入層、隱含層和輸出層構(gòu)成,具有局部記憶模塊和局部反饋連接的前向形式的神經(jīng)網(wǎng)絡(luò)。具有訓(xùn)練速度快,誤差不大,不容易陷入到局部最優(yōu)值的特點(diǎn)。
其中帶有m個(gè)隱含層節(jié)點(diǎn)的ELM的網(wǎng)絡(luò)結(jié)構(gòu)式(1)所示:
其中pi、qi是學(xué)習(xí)參數(shù),ni是連接第i個(gè)隱含層節(jié)點(diǎn)與輸出層之間的權(quán)重,表示的是當(dāng)輸入是X的時(shí)候,第i個(gè)隱含層節(jié)點(diǎn)的輸出數(shù)值。
1.2 LSSVM介紹
LS-SVM和SVM有很重要的聯(lián)系和區(qū)別,下面有所比較。
(1)優(yōu)化問(wèn)題的構(gòu)造
SVM目標(biāo)函數(shù)采用了誤差因子的一次項(xiàng),LS-SVM采用了誤差因子的二次項(xiàng),同時(shí)約束條件的先定下,SVM采用不等式約束,LS-SVM采用等式約束形式。
(2)優(yōu)化問(wèn)題的求解
SVM求解QP問(wèn)題中,變量維數(shù)和訓(xùn)練樣本的個(gè)數(shù)是一樣的,而LS-SVM方法借助求解線性方程組達(dá)到了最終的決策函數(shù),在某些方面上降低了求解難度,提高速度。
(3)解的稀疏性
SVM中,需要解決QP問(wèn)題,目標(biāo)條件是達(dá)到全局最優(yōu)解,并且,大部分的Lagrange乘子均為0。在LS-SVM方法中,目標(biāo)函數(shù)采取了誤差平方項(xiàng),約束條件是等式,通過(guò)一定的處理方式,把SVM的QP問(wèn)題轉(zhuǎn)化成線性問(wèn)題,因此Lagrange乘子與誤差項(xiàng)成比例關(guān)系,但是LS-SVM方法通過(guò)對(duì)最終求解得到的Lagrange乘子進(jìn)行排序,同樣的情形下,可以實(shí)現(xiàn)解的稀疏性。
2 具體實(shí)施過(guò)程
2.1 整體構(gòu)架
本文主要涉及雙通道、雙預(yù)測(cè)模型,如圖1所示,主要包括以下步驟:
(1)從AFC(地鐵中的自動(dòng)售票系統(tǒng))獲得整理出人流量數(shù)據(jù)。
(2)雙通道預(yù)測(cè)的過(guò)程,具體操作如下:
(a)比如采樣頻率為1,組成序列為A,滾動(dòng)序列 [A1,A2,A3,..An],預(yù)測(cè)第(n+1)個(gè)數(shù)據(jù),然后用預(yù)測(cè)的結(jié)果A(n+1)與原來(lái)的序列[A1,A2,A3,..An]組成新的序列[A1,A2,A3,..An,A(n+1)],用新的序列預(yù)測(cè)第(n+2)個(gè)數(shù)據(jù)。以此類推,得到一個(gè)通道的預(yù)測(cè)數(shù)據(jù),此種方式記成通道1。
(b)開(kāi)始選擇的滾動(dòng)序列基數(shù)是[A2,A3,……An]一共(n-1)個(gè)數(shù)據(jù),預(yù)測(cè)第(n+1)個(gè)數(shù)據(jù),然后用預(yù)測(cè)的結(jié)果A(n+1)與原來(lái)的序列[A2,A3,..An]組成新的序列[A2,A3,..An,A(n+1)],用新的序列預(yù)測(cè)第(n+2)個(gè)數(shù)據(jù)。以此類推,得到一個(gè)通道的預(yù)測(cè)數(shù)據(jù),此種方式記成通道2。
值得一提的是,上述的(a)、(b)步驟中選擇的基數(shù)不一定是[A1,A2,A3,..An]、[A2,A3,..An]等這樣的數(shù)列,也可以采用別的[A2,A3,..An]、[A3,..An]等形式。
(3)進(jìn)行決策獲得未來(lái)預(yù)測(cè)數(shù)據(jù)的過(guò)程,具體操作如下:
通過(guò)上述步驟(2)的(a)、(b)兩個(gè)步驟,我們可以得到針對(duì)通道1 通道2的兩個(gè)預(yù)測(cè)數(shù)據(jù)序列。在這里,通道1的預(yù)測(cè)數(shù)據(jù)記成[A(n+1),A(n+2)……A(n+m)],通道2的預(yù)測(cè)數(shù)據(jù)記成[Ab(n+1),Ab(n+2)……Ab(n+m)];與上述的兩個(gè)通道的序列求加權(quán)平均作為最后的預(yù)測(cè)結(jié)果,即(w1*[Ab(n+1),Ab(n+2)……Ab(n+m)]+ w2*[A(n+1),A(n+2)……A(n+m)]),其中w1和w2是ELM神經(jīng)網(wǎng)絡(luò)和LSSVM的權(quán)重。
2.2 通道預(yù)測(cè)模型和確定
假設(shè)滾動(dòng)序列 [A1,A2,A3,..An]預(yù)測(cè)第(n+1)個(gè)數(shù)據(jù),用ELM得到的結(jié)果是AA(n+1),svm預(yù)測(cè)得到的是AB(n+1),取加權(quán)平均數(shù)作為第(n+1)個(gè)數(shù)據(jù)的預(yù)測(cè)結(jié)果,記A(n+1)=(AA(n+1)+ AB(n+1))/2),然后用預(yù)測(cè)的結(jié)果A(n+1)與原來(lái)的序列[A1,A2,A3,..An]組成新的序列[A1,A2,A3,..An,A(n+1)],用新的序列預(yù)測(cè)第n+2個(gè)數(shù)據(jù);用ELM得到的結(jié)果是AA(n+2),LSSVM預(yù)測(cè)得到的是AB(n+2)。那么取加權(quán)平均數(shù)作為第(n+2)個(gè)數(shù)據(jù)的預(yù)測(cè)結(jié)果,記A(n+2)=(AA(n+2)+ AB(n+2))/2),以此類推。
假設(shè)滾動(dòng)序列 [A2,A3,..An]預(yù)測(cè)第(n+1)個(gè)數(shù)據(jù),用ELM得到的結(jié)果是AA(n+1),LSSVM預(yù)測(cè)得到的是AB(n+1),那么取加權(quán)平均數(shù)作為第(n+1)個(gè)數(shù)據(jù)的預(yù)測(cè)結(jié)果,記A(n+1)=(AA(n+1)+ AB(n+1))/2),然后用預(yù)測(cè)的結(jié)果A(n+1)與原來(lái)的序列[A2,A3,..An]組成新的序列[A2,A3,..An,A(n+1)],用新的序列預(yù)測(cè)第(n+2)個(gè)數(shù)據(jù);用ELM得到的結(jié)果是AA(n+2),LSSVM預(yù)測(cè)得到的是AB(n+2),取加權(quán)平均數(shù)作為第(n+2)個(gè)數(shù)據(jù)的預(yù)測(cè)結(jié)果,記A(n+2)=(AA(n+2)+ AB(n+2))/2),以此類推。
通過(guò)上述兩個(gè)步驟,我們可以得到針對(duì)通道1 通道2得到的兩個(gè)預(yù)測(cè)數(shù)據(jù)序列,在這里通道1的預(yù)測(cè)數(shù)據(jù)記成[A(n+1),A(n+2)……A(n+m)];通道2的預(yù)測(cè)數(shù)據(jù)記成[Ab(n+1),Ab(n+2)……Ab(n+m)];與上述的兩個(gè)通道的序列求加權(quán)平均作為最后的預(yù)測(cè)結(jié)果,也就是(w1*[Ab(n+1),Ab(n+2)……Ab(n+m)]+ w2*[A(n+1),A(n+2)……A(n+m)])。其中,w1和w2是ELM神經(jīng)網(wǎng)絡(luò)和LSSVM的權(quán)重,其中本文按照2.3的方法,得出的權(quán)重w1=0.49,w2=0.51。
2.3 關(guān)于權(quán)重的確立方法
(1)標(biāo)準(zhǔn)差法確定權(quán)重:
本文確定權(quán)重的步驟如下:
(1)選取i個(gè)數(shù)據(jù)做訓(xùn)練,得到真實(shí)值和預(yù)測(cè)值,其中ELM的預(yù)測(cè)值看成E1,E2,…Ei,LSSVM的預(yù)測(cè)值看成l1,l2,…li,真實(shí)值為R1,R2,…Ri;
(2)按照公式(2),確定ELM和LSSVM的權(quán)重w1,w2;
(3)按照公式(4),確定ELM和LSSVM的權(quán)重w3,w4;
(4)計(jì)算混合模型的誤差平方和,按照公式(5):
(5)
其中按照w1,w2兩種權(quán)重得的混合模型的誤差平方和是f1,按照w3,w4兩個(gè)權(quán)重得到混合模型的誤差平方和是f2。
(5)比較上述步驟f1、f2,如果f1
2.4 預(yù)測(cè)結(jié)果
圖3、圖4、圖5是本文經(jīng)過(guò)編程預(yù)測(cè)得到的數(shù)據(jù)結(jié)果,分別是通道1、通道2及最終決策的預(yù)測(cè)結(jié)果。
3 結(jié)論
采用本文方案與現(xiàn)有技術(shù)相比,具有以下的優(yōu)點(diǎn)和積極效果:
(1)有AFC系統(tǒng)提供相應(yīng)的客流量數(shù)據(jù)信息,然后有預(yù)測(cè)方案進(jìn)行雙通道預(yù)測(cè),預(yù)測(cè)得到的信息傳遞給AFC系統(tǒng),并且如果客流量達(dá)到很大的高峰時(shí)候,進(jìn)而進(jìn)行相關(guān)的預(yù)警信息,由AFC系統(tǒng)提前告知乘客,或許有相關(guān)的擁擠預(yù)報(bào),請(qǐng)乘客提前選擇交通方式。
(2)本文采用網(wǎng)絡(luò)的數(shù)據(jù)流量進(jìn)行數(shù)據(jù)整合和挖掘,對(duì)于現(xiàn)有的數(shù)據(jù)進(jìn)行整理,然后用這些數(shù)據(jù)進(jìn)行對(duì)于未來(lái)未知的數(shù)據(jù)進(jìn)行預(yù)測(cè),是一個(gè)相當(dāng)可觀的使用方法。
(3)應(yīng)用本文方案可以對(duì)五年、十年乃至二十年的城市地鐵的人流量進(jìn)行預(yù)測(cè),提前做好規(guī)劃,對(duì)于地鐵設(shè)計(jì)和城市布置有著很重要的預(yù)測(cè)和導(dǎo)向作用。
本文所涉及的方法不是針對(duì)現(xiàn)在有的數(shù)據(jù)進(jìn)行試驗(yàn),而是對(duì)未來(lái)不知道的數(shù)據(jù)進(jìn)行預(yù)測(cè)和分析,同樣適用于相關(guān)的金融市場(chǎng),比如股票未來(lái)的走勢(shì)預(yù)測(cè)、基金的預(yù)測(cè)、未來(lái)人類的壽命預(yù)測(cè)等具有很大的參考價(jià)值和實(shí)際意義。
參考文獻(xiàn):
[1]Zhao Z, Chen Z, Chen Y, et al. A Class Incremental Extreme Learning Machine for Activity Recognition[J]. Cognitive Computation, 2014:1-9.
[2]Bueno-Crespo A, Garcia-Laencina P J, Sancho-Gomez J L. Neural architecture design based on extreme learning machine [J]. Neural Networks, 2013,48:1924 Sunday H, Silver D, Gagvani N, et al. Skeleton based shape matching and retrieval[C].Shape Modeling International, 2003,IEEE, 2003:130-139
[3]熊南,劉百芬.基于自適應(yīng)粒子群優(yōu)化LSSVM的網(wǎng)絡(luò)流量在線預(yù)測(cè)[J].計(jì)算機(jī)應(yīng)用與軟件,2013,30(9):21-24.
[4]葉美盈,汪曉東,張浩然.基于在線最小二乘支持向量機(jī)回歸的混沌時(shí)間序列預(yù)測(cè)[J].物理學(xué)報(bào),2005,54(6):2568-2573.
[5]張文金,許愛(ài)軍.混沌理論和LSSVM相結(jié)合的網(wǎng)絡(luò)流量預(yù)測(cè)[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(15):101-104.
[6]Huang G B,Siew C K. Extreme learning machine with randomly assigned RBF kernels[J]. International Journal of Information Technology,2005,11(1):16-24.
[7]李彬,李貽斌.基于ELM 學(xué)習(xí)算法的混沌時(shí)間序列預(yù)測(cè)[J],天津大學(xué)學(xué)報(bào), 2011,44(8):701-704.
[8]李海波,鄭秀萍,柴天佑.浮選工藝指標(biāo)KPCA-ELM 軟測(cè)量模型及應(yīng)用[J].化工學(xué)報(bào),2012,33(1):4-8.
[9]周傳世,劉永清.變權(quán)重組合預(yù)測(cè)模型的研究[J].預(yù)測(cè),1995,(4),47-48.
[10]王志勇,陳昊鵬.基于組合神經(jīng)網(wǎng)絡(luò)模型的函數(shù)逼近方法[J].計(jì)算機(jī)應(yīng)用與軟件,2008(7),137-139.
本文來(lái)源于《電子產(chǎn)品世界》2018年第8期第64頁(yè),歡迎您寫(xiě)論文時(shí)引用,并注明出處。
評(píng)論