基于ELM和LSSVM的客流量預(yù)測模型

作者：張克申安俊峰孫二杰趙帥蘆瀟盧萌萌時(shí)間：2018-07-26 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

編者按：涉及一種基于滾動(dòng)式地鐵人流量混合預(yù)測方法，采用的是雙預(yù)測算法，雙預(yù)測通道的模式;雙預(yù)測方法指的是預(yù)測用到了ELM神經(jīng)網(wǎng)絡(luò)和LSSVM兩種算法混合組成。雙預(yù)測通道指的是采用兩個(gè)不同的滾動(dòng)序列基數(shù)進(jìn)行預(yù)測。最后根據(jù)不同方式確定權(quán)重大小，并且得到混合預(yù)測數(shù)據(jù)模型。

作者　張克申¹ 安俊峰¹ 孫二杰¹ 趙帥¹ 蘆瀟¹ 盧萌萌² 1.濟(jì)南軌道交通集團(tuán)有限公司(山東濟(jì)南 250000)2.山東勞動(dòng)職業(yè)技術(shù)學(xué)院(山東濟(jì)南 250000)

本文引用地址：http://2s4d.com/article/201807/389582.htm

　　張克申(1973)，男，工程師，研究方向：自動(dòng)化。

摘要：涉及一種基于滾動(dòng)式地鐵人流量混合預(yù)測方法，采用的是雙預(yù)測算法，雙預(yù)測通道的模式;雙預(yù)測方法指的是預(yù)測用到了ELM神經(jīng)網(wǎng)絡(luò)和LSSVM兩種算法混合組成。雙預(yù)測通道指的是采用兩個(gè)不同的滾動(dòng)序列基數(shù)進(jìn)行預(yù)測。最后根據(jù)不同方式確定權(quán)重大小，并且得到混合預(yù)測數(shù)據(jù)模型。

0 引言

　　地鐵中，客流量分析是一個(gè)很重要的領(lǐng)域，客流量的多少直接影響到安全，城市的經(jīng)濟(jì)發(fā)展等重要因素。地鐵的客流量多少對(duì)乘客的出行有很大的警示作用。

　　AFC(自動(dòng)售檢票)系統(tǒng)可以獲得很大的客流量信息，可以進(jìn)行設(shè)置，獲得每分鐘、每小時(shí)、每天、每月、每季度、每年的數(shù)據(jù)信息，并且可以按照車站每類整理，形成龐大的數(shù)據(jù)信息，信息量的充足和龐大足夠支撐大家去進(jìn)行分析和預(yù)測，并且因?yàn)閿?shù)據(jù)量的充足和龐大，可以對(duì)感興趣數(shù)據(jù)進(jìn)行分類整合，組成想要的數(shù)據(jù)信息進(jìn)行研究。

　　收集大量的客流量數(shù)據(jù)后，以每半年或者每年為單位作為數(shù)據(jù)統(tǒng)計(jì)，有效地去預(yù)測未來五年或者未來十年，甚至未來二十年的數(shù)據(jù)，對(duì)于地鐵線路的規(guī)劃，市政建設(shè)的布局都有著指導(dǎo)性的作用。

　　并且現(xiàn)有的預(yù)測算法都是針對(duì)于已知的數(shù)據(jù)進(jìn)行分析和預(yù)測，進(jìn)而研究一種預(yù)測方法去預(yù)測未知數(shù)據(jù)是有必要的。目前存在的預(yù)測方法是用已知的數(shù)據(jù)做研究，即知道數(shù)輸入數(shù)據(jù)和輸出數(shù)據(jù)，進(jìn)行研究和挖掘，但是往往未來的的輸入數(shù)據(jù)是未知的，那么帶來預(yù)測很大的不方便，但是預(yù)測有著很重要的作用。因此針對(duì)未知數(shù)據(jù)的預(yù)測是個(gè)有力的應(yīng)用。

　　本文提出一種基于滾動(dòng)式地鐵人流量混合預(yù)測方法，并且將數(shù)據(jù)傳遞給AFC系統(tǒng)，由AFC系統(tǒng)來完成相關(guān)的預(yù)警信號(hào)。

1 原理簡介

1.1 ELM神經(jīng)網(wǎng)絡(luò)

　　ELM是一個(gè)神經(jīng)網(wǎng)絡(luò)的形式，結(jié)構(gòu)由輸入層、隱含層和輸出層構(gòu)成，具有局部記憶模塊和局部反饋連接的前向形式的神經(jīng)網(wǎng)絡(luò)。具有訓(xùn)練速度快，誤差不大，不容易陷入到局部最優(yōu)值的特點(diǎn)。

　　其中帶有m個(gè)隱含層節(jié)點(diǎn)的ELM的網(wǎng)絡(luò)結(jié)構(gòu)式(1)所示：

基于ELM公式1.jpg

　　其中pi、qi是學(xué)習(xí)參數(shù)，ni是連接第i個(gè)隱含層節(jié)點(diǎn)與輸出層之間的權(quán)重，表示的是當(dāng)輸入是X的時(shí)候，第i個(gè)隱含層節(jié)點(diǎn)的輸出數(shù)值。

1.2 LSSVM介紹

　　LS-SVM和SVM有很重要的聯(lián)系和區(qū)別，下面有所比較。

　　(1)優(yōu)化問題的構(gòu)造

　　SVM目標(biāo)函數(shù)采用了誤差因子的一次項(xiàng)，LS-SVM采用了誤差因子的二次項(xiàng)，同時(shí)約束條件的先定下，SVM采用不等式約束，LS-SVM采用等式約束形式。

　　(2)優(yōu)化問題的求解

　　SVM求解QP問題中，變量維數(shù)和訓(xùn)練樣本的個(gè)數(shù)是一樣的，而LS-SVM方法借助求解線性方程組達(dá)到了最終的決策函數(shù)，在某些方面上降低了求解難度，提高速度。

　　(3)解的稀疏性

　　SVM中，需要解決QP問題，目標(biāo)條件是達(dá)到全局最優(yōu)解，并且，大部分的Lagrange乘子均為0。在LS-SVM方法中，目標(biāo)函數(shù)采取了誤差平方項(xiàng)，約束條件是等式，通過一定的處理方式，把SVM的QP問題轉(zhuǎn)化成線性問題，因此Lagrange乘子與誤差項(xiàng)成比例關(guān)系，但是LS-SVM方法通過對(duì)最終求解得到的Lagrange乘子進(jìn)行排序，同樣的情形下，可以實(shí)現(xiàn)解的稀疏性。

2 具體實(shí)施過程

2.1 整體構(gòu)架

　　本文主要涉及雙通道、雙預(yù)測模型，如圖1所示，主要包括以下步驟：

基于ELM-1.jpg

　　(1)從AFC(地鐵中的自動(dòng)售票系統(tǒng))獲得整理出人流量數(shù)據(jù)。

　　(2)雙通道預(yù)測的過程，具體操作如下：

　　(a)比如采樣頻率為1，組成序列為A，滾動(dòng)序列 [A1,A2,A3,..An]，預(yù)測第(n+1)個(gè)數(shù)據(jù)，然后用預(yù)測的結(jié)果A(n+1)與原來的序列[A1,A2,A3,..An]組成新的序列[A1,A2,A3,..An，A(n+1)]，用新的序列預(yù)測第(n+2)個(gè)數(shù)據(jù)。以此類推，得到一個(gè)通道的預(yù)測數(shù)據(jù)，此種方式記成通道1。

　　(b)開始選擇的滾動(dòng)序列基數(shù)是[A2,A3,……An]一共(n-1)個(gè)數(shù)據(jù)，預(yù)測第(n+1)個(gè)數(shù)據(jù)，然后用預(yù)測的結(jié)果A(n+1)與原來的序列[A2,A3,..An]組成新的序列[A2,A3,..An，A(n+1)]，用新的序列預(yù)測第(n+2)個(gè)數(shù)據(jù)。以此類推，得到一個(gè)通道的預(yù)測數(shù)據(jù)，此種方式記成通道2。

　　值得一提的是，上述的(a)、(b)步驟中選擇的基數(shù)不一定是[A1,A2,A3,..An]、[A2,A3,..An]等這樣的數(shù)列，也可以采用別的[A2,A3,..An]、[A3,..An]等形式。

　　(3)進(jìn)行決策獲得未來預(yù)測數(shù)據(jù)的過程，具體操作如下：

　　通過上述步驟(2)的(a)、(b)兩個(gè)步驟，我們可以得到針對(duì)通道1 通道2的兩個(gè)預(yù)測數(shù)據(jù)序列。在這里，通道1的預(yù)測數(shù)據(jù)記成[A(n+1),A(n+2)……A(n+m)]，通道2的預(yù)測數(shù)據(jù)記成[Ab(n+1),Ab(n+2)……Ab(n+m)];與上述的兩個(gè)通道的序列求加權(quán)平均作為最后的預(yù)測結(jié)果，即(w1*[Ab(n+1),Ab(n+2)……Ab(n+m)]+ w2*[A(n+1),A(n+2)……A(n+m)]),其中w1和w2是ELM神經(jīng)網(wǎng)絡(luò)和LSSVM的權(quán)重。

2.2 通道預(yù)測模型和確定

基于ELM-2.jpg

　　假設(shè)滾動(dòng)序列 [A1,A2,A3,..An]預(yù)測第(n+1)個(gè)數(shù)據(jù)，用ELM得到的結(jié)果是AA(n+1)，svm預(yù)測得到的是AB(n+1)，取加權(quán)平均數(shù)作為第(n+1)個(gè)數(shù)據(jù)的預(yù)測結(jié)果，記A(n+1)=(AA(n+1)+ AB(n+1))/2)，然后用預(yù)測的結(jié)果A(n+1)與原來的序列[A1,A2,A3,..An]組成新的序列[A1,A2,A3,..An，A(n+1)]，用新的序列預(yù)測第n+2個(gè)數(shù)據(jù);用ELM得到的結(jié)果是AA(n+2)，LSSVM預(yù)測得到的是AB(n+2)。那么取加權(quán)平均數(shù)作為第(n+2)個(gè)數(shù)據(jù)的預(yù)測結(jié)果，記A(n+2)=(AA(n+2)+ AB(n+2))/2),以此類推。

　　假設(shè)滾動(dòng)序列 [A2,A3,..An]預(yù)測第(n+1)個(gè)數(shù)據(jù)，用ELM得到的結(jié)果是AA(n+1)，LSSVM預(yù)測得到的是AB(n+1)，那么取加權(quán)平均數(shù)作為第(n+1)個(gè)數(shù)據(jù)的預(yù)測結(jié)果，記A(n+1)=(AA(n+1)+ AB(n+1))/2)，然后用預(yù)測的結(jié)果A(n+1)與原來的序列[A2,A3,..An]組成新的序列[A2,A3,..An，A(n+1)]，用新的序列預(yù)測第(n+2)個(gè)數(shù)據(jù);用ELM得到的結(jié)果是AA(n+2)，LSSVM預(yù)測得到的是AB(n+2)，取加權(quán)平均數(shù)作為第(n+2)個(gè)數(shù)據(jù)的預(yù)測結(jié)果，記A(n+2)=(AA(n+2)+ AB(n+2))/2)，以此類推。

　　通過上述兩個(gè)步驟，我們可以得到針對(duì)通道1 通道2得到的兩個(gè)預(yù)測數(shù)據(jù)序列，在這里通道1的預(yù)測數(shù)據(jù)記成[A(n+1),A(n+2)……A(n+m)];通道2的預(yù)測數(shù)據(jù)記成[Ab(n+1),Ab(n+2)……Ab(n+m)];與上述的兩個(gè)通道的序列求加權(quán)平均作為最后的預(yù)測結(jié)果，也就是(w1*[Ab(n+1),Ab(n+2)……Ab(n+m)]+ w2*[A(n+1),A(n+2)……A(n+m)])。其中，w1和w2是ELM神經(jīng)網(wǎng)絡(luò)和LSSVM的權(quán)重，其中本文按照2.3的方法，得出的權(quán)重w1=0.49，w2=0.51。

2.3 關(guān)于權(quán)重的確立方法

　　(1)標(biāo)準(zhǔn)差法確定權(quán)重：

基于ELM公式2.jpg

　　本文確定權(quán)重的步驟如下：

　　(1)選取i個(gè)數(shù)據(jù)做訓(xùn)練，得到真實(shí)值和預(yù)測值，其中ELM的預(yù)測值看成E1,E2,…Ei，LSSVM的預(yù)測值看成l1,l2,…li,真實(shí)值為R1,R2,…Ri;

　　(2)按照公式(2)，確定ELM和LSSVM的權(quán)重w1,w2;

　　(3)按照公式(4)，確定ELM和LSSVM的權(quán)重w3,w4;

　　(4)計(jì)算混合模型的誤差平方和，按照公式(5)：

基于ELM公式3.jpg (5)

　　其中按照w1,w2兩種權(quán)重得的混合模型的誤差平方和是f1，按照w3,w4兩個(gè)權(quán)重得到混合模型的誤差平方和是f2。

　　(5)比較上述步驟f1、f2，如果f1f2，那么最后權(quán)重選擇w3、w4。

2.4 預(yù)測結(jié)果

　　圖3、圖4、圖5是本文經(jīng)過編程預(yù)測得到的數(shù)據(jù)結(jié)果，分別是通道1、通道2及最終決策的預(yù)測結(jié)果。

基于ELM-3.jpg

3 結(jié)論

　　采用本文方案與現(xiàn)有技術(shù)相比，具有以下的優(yōu)點(diǎn)和積極效果：

　　(1)有AFC系統(tǒng)提供相應(yīng)的客流量數(shù)據(jù)信息，然后有預(yù)測方案進(jìn)行雙通道預(yù)測，預(yù)測得到的信息傳遞給AFC系統(tǒng)，并且如果客流量達(dá)到很大的高峰時(shí)候，進(jìn)而進(jìn)行相關(guān)的預(yù)警信息，由AFC系統(tǒng)提前告知乘客，或許有相關(guān)的擁擠預(yù)報(bào)，請(qǐng)乘客提前選擇交通方式。

　　(2)本文采用網(wǎng)絡(luò)的數(shù)據(jù)流量進(jìn)行數(shù)據(jù)整合和挖掘，對(duì)于現(xiàn)有的數(shù)據(jù)進(jìn)行整理，然后用這些數(shù)據(jù)進(jìn)行對(duì)于未來未知的數(shù)據(jù)進(jìn)行預(yù)測，是一個(gè)相當(dāng)可觀的使用方法。

　　(3)應(yīng)用本文方案可以對(duì)五年、十年乃至二十年的城市地鐵的人流量進(jìn)行預(yù)測，提前做好規(guī)劃，對(duì)于地鐵設(shè)計(jì)和城市布置有著很重要的預(yù)測和導(dǎo)向作用。

　　本文所涉及的方法不是針對(duì)現(xiàn)在有的數(shù)據(jù)進(jìn)行試驗(yàn)，而是對(duì)未來不知道的數(shù)據(jù)進(jìn)行預(yù)測和分析，同樣適用于相關(guān)的金融市場，比如股票未來的走勢預(yù)測、基金的預(yù)測、未來人類的壽命預(yù)測等具有很大的參考價(jià)值和實(shí)際意義。

　　參考文獻(xiàn)：

[1]Zhao Z, Chen Z, Chen Y, et al. A Class Incremental Extreme Learning Machine for Activity Recognition[J]. Cognitive Computation, 2014:1-9.

　　[2]Bueno-Crespo A, Garcia-Laencina P J, Sancho-Gomez J L. Neural architecture design based on extreme learning machine [J]. Neural Networks, 2013，48:1924 Sunday H, Silver D, Gagvani N, et al. Skeleton based shape matching and retrieval[C].Shape Modeling International, 2003，IEEE, 2003:130-139

　　[3]熊南,劉百芬.基于自適應(yīng)粒子群優(yōu)化LSSVM的網(wǎng)絡(luò)流量在線預(yù)測[J].計(jì)算機(jī)應(yīng)用與軟件，2013，30(9)：21-24.

　　[4]葉美盈，汪曉東，張浩然.基于在線最小二乘支持向量機(jī)回歸的混沌時(shí)間序列預(yù)測[J].物理學(xué)報(bào)，2005，54(6):2568-2573.

　　[5]張文金,許愛軍.混沌理論和LSSVM相結(jié)合的網(wǎng)絡(luò)流量預(yù)測[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(15):101-104.

　　[6]Huang G B，Siew C K. Extreme learning machine with randomly assigned RBF kernels[J]. International Journal of Information Technology,2005,11(1):16-24.

　　[7]李彬,李貽斌.基于ELM 學(xué)習(xí)算法的混沌時(shí)間序列預(yù)測[J],天津大學(xué)學(xué)報(bào), 2011,44(8):701-704.

　　[8]李海波,鄭秀萍,柴天佑.浮選工藝指標(biāo)KPCA-ELM 軟測量模型及應(yīng)用[J].化工學(xué)報(bào),2012,33(1):4-8.

　　[9]周傳世,劉永清.變權(quán)重組合預(yù)測模型的研究[J].預(yù)測,1995,(4),47-48.

　　[10]王志勇,陳昊鵬.基于組合神經(jīng)網(wǎng)絡(luò)模型的函數(shù)逼近方法[J].計(jì)算機(jī)應(yīng)用與軟件,2008(7),137-139.

　　本文來源于《電子產(chǎn)品世界》2018年第8期第64頁，歡迎您寫論文時(shí)引用，并注明出處。