如何提高城域網(wǎng)路由器網(wǎng)絡(luò)層可靠性
網(wǎng)絡(luò)可靠性是城域網(wǎng)路由器可靠性保障的一個(gè)重要內(nèi)容,由于傳統(tǒng)的路由器協(xié)議收斂比較慢(IGP在秒級(jí),BGP在分鐘級(jí)),不能滿足承載實(shí)時(shí)業(yè)務(wù)的需求。網(wǎng)絡(luò)可靠性也是城域網(wǎng)路由器新技術(shù)比較活躍的領(lǐng)域。
目前新出現(xiàn)的網(wǎng)絡(luò)層可靠性技術(shù)主要有IP路由快速收斂、端到端LSP備份、MPLS快速重路由、平穩(wěn)重啟、RPRIPS等。
IP路由快速收斂
IP動(dòng)態(tài)路由是最基本的網(wǎng)絡(luò)層可靠性保障機(jī)制,是IP路由網(wǎng)絡(luò)與生俱來的功能。IP動(dòng)態(tài)路由協(xié)議負(fù)責(zé)進(jìn)行網(wǎng)絡(luò)層IP轉(zhuǎn)發(fā)路徑計(jì)算,在鏈路或者節(jié)點(diǎn)發(fā)生故障導(dǎo)致原數(shù)據(jù)轉(zhuǎn)發(fā)路徑中斷時(shí),路由協(xié)議對(duì)數(shù)據(jù)轉(zhuǎn)發(fā)路徑進(jìn)行動(dòng)態(tài)重新計(jì)算,雖然各種路由協(xié)議通過采用不同的機(jī)制,其響應(yīng)時(shí)間有差別,但是平均水平在秒一級(jí)。對(duì)于傳統(tǒng)IP業(yè)務(wù)這個(gè)恢復(fù)時(shí)間可以接受,但是對(duì)于承載實(shí)時(shí)業(yè)務(wù)等多業(yè)務(wù)的電信級(jí)IP網(wǎng)來說要求毫秒級(jí)恢復(fù)響應(yīng)時(shí)間,傳統(tǒng)IP動(dòng)態(tài)路由技術(shù)和這一要求有很大差距。
在傳統(tǒng)路由協(xié)議的基礎(chǔ)上,進(jìn)行改進(jìn)可以縮短IP路由協(xié)議的故障響應(yīng)時(shí)間,這些措施主要是加快路由協(xié)議的收斂。加快路由協(xié)議收斂速度可以分為鏈路故障檢測(cè)、路由重計(jì)算、路由信息更新等幾個(gè)方面考慮。通過加快鏈路之間Hello消息的發(fā)送頻率,加快SPF計(jì)算速度和為路由更新消息設(shè)定高優(yōu)先級(jí),路由協(xié)議可以快速發(fā)現(xiàn)、處理故障,并且準(zhǔn)確快速地進(jìn)行路由更新,加快路由協(xié)議的收斂,通過優(yōu)化IGP路由協(xié)議可以實(shí)現(xiàn)小于1s的收斂。
另一種加快路由協(xié)議收斂的方法是采用IGP和EGP對(duì)網(wǎng)絡(luò)進(jìn)行合理的層次規(guī)劃,IGP進(jìn)行域內(nèi)設(shè)備的路由,EGP(BGP4)承載外部路由,兩種路由之間進(jìn)行有效隔離,不相互進(jìn)行重分配。IGP和BGP的合理分工,形成了一個(gè)層次化的路由結(jié)構(gòu),域內(nèi)和域間路由協(xié)議的收斂相互獨(dú)立,互不影響,可以實(shí)現(xiàn)最快速度收斂。
LSP保護(hù)切換
保護(hù)切換是ITU-T采用的術(shù)語,保護(hù)切換技術(shù)對(duì)于提高MPLS網(wǎng)絡(luò)的可用性和穩(wěn)定性具有關(guān)鍵意義。保護(hù)切換一般對(duì)受保護(hù)LSP路由的預(yù)計(jì)算和資源的預(yù)分配,所以可以保證在LSP連接失效或者中斷后可以快速重新獲得網(wǎng)絡(luò)資源。
目前技術(shù)的發(fā)展只可以支持對(duì)點(diǎn)到點(diǎn)LSP的保護(hù)切換,保護(hù)可以采用兩種方式:1+1保護(hù)和1:1保護(hù)。
1+1保護(hù)使用一條專用的備份LSP作為主LSP保護(hù),在IngressLSR處,主LSP和備份LSP橋接在一起,主LSP上的流量復(fù)制到備份LSP上同時(shí)傳送到EgressLSR,EgressLSR根據(jù)故障指示參數(shù)的取值,選擇接收主備LSP上的流量。
1:1保護(hù)時(shí)也使用專用的備份LSP作為主LSP的保護(hù),但是主備LSP不同時(shí)傳送相同的流量,備份LSP在主LSP工作正常的前提下可以傳送其它流量,流量的保護(hù)切換裁決在IngressLSR進(jìn)行。
MPLS快速重路由(FRR)
為了滿足諸如像視頻會(huì)議電視這一類業(yè)務(wù)的實(shí)時(shí)應(yīng)用,必須對(duì)這些流量提供類似于傳統(tǒng)SDHAPS毫秒級(jí)的LSP保護(hù)能力。
LSP保護(hù)切換技術(shù),需要信令協(xié)議的介入,故障點(diǎn)到恢復(fù)點(diǎn)的故障指示信令傳遞引入了不必要的網(wǎng)絡(luò)恢復(fù)延時(shí)。MPLS快速重路由技術(shù)可以實(shí)現(xiàn)在沒有信令介入情況下,由故障檢測(cè)點(diǎn)直接對(duì)故障鏈路流量根據(jù)預(yù)先設(shè)定的保護(hù)路徑進(jìn)行重定向,恢復(fù)點(diǎn)即為故障點(diǎn)。多數(shù)的快速重路由方案依賴預(yù)先建立的備份通道,當(dāng)網(wǎng)絡(luò)恢復(fù)點(diǎn)檢測(cè)到網(wǎng)絡(luò)故障時(shí),它要做的工作就是簡(jiǎn)單地更新LSP交換表,使流量從故障端口的LSP切換到預(yù)先在正常端口建立的LSP內(nèi)。
快速重路由的優(yōu)勢(shì)除了可以提高保護(hù)恢復(fù)的速度外,通過有選擇的在網(wǎng)絡(luò)薄弱環(huán)節(jié)配置保護(hù)能力,避免了在可靠網(wǎng)絡(luò)重復(fù)保護(hù)、無謂消耗核心網(wǎng)絡(luò)資源。MPLS快速重路由技術(shù)提供50ms內(nèi)的保護(hù)切換,可以作為SDHAPS保護(hù)機(jī)制的替代。
MPLS快速重路由采用如下配置過程:
首先,在LSP的入口處即LSR1,使用一條用戶命令激活MPLS保護(hù)切換功能;LSR1向LSP路徑上的所有LSR發(fā)送信令,每個(gè)LSR都計(jì)算出一條旁路下一跳LSR的備份LSP,LSP快速重路由配置即完成。當(dāng)LSP路徑上的某個(gè)LSR檢測(cè)到下游故障時(shí),由該LSR在本地將流量切換到備份LSP內(nèi)。
在IETF中有多種快速重路由的方案,主流的兩種保護(hù)方式為鏈路保護(hù)和節(jié)點(diǎn)保護(hù),其解決問題的思路和復(fù)雜度各異,目前該技術(shù)還沒有形成正式的RFC。
平穩(wěn)重啟(Gracefulrestart)
引起控制平面重啟的可能因素包括:軟件升級(jí)、軟件Bug或者硬件故障,無中斷重啟可以做到控制平面重啟時(shí),數(shù)據(jù)平面無間斷轉(zhuǎn)發(fā)。但是如果控制平面故障,對(duì)等路由器將重新計(jì)算路由,旁路故障路由器,數(shù)據(jù)平面的不間斷轉(zhuǎn)發(fā)就沒有意義,而且故障路由會(huì)擴(kuò)散到整個(gè)網(wǎng)絡(luò)范圍。在MPLSVPNPE路由器上如果發(fā)生這種情形,其結(jié)果是災(zāi)難性的。
控制平面平穩(wěn)重啟技術(shù)可以有效解決這個(gè)難題,采用該技術(shù)的路由器在控制平面發(fā)生故障時(shí),可以通知鄰近路由器繼續(xù)使用原路徑進(jìn)行數(shù)據(jù)轉(zhuǎn)發(fā),同時(shí)重啟路由器重新和鄰近路由器建立路由狀態(tài),保證在重啟過程中業(yè)務(wù)可用性,最小化單個(gè)設(shè)備重啟對(duì)整個(gè)網(wǎng)絡(luò)的影響。
在平穩(wěn)重啟的過程中路由器不保存相關(guān)的協(xié)議狀態(tài),所以引起的重啟軟件故障不會(huì)延續(xù)到重啟后。
平穩(wěn)重啟是新特性,很多舊設(shè)備無法支持,所以可以在局部子網(wǎng)內(nèi)支持該特性的設(shè)備上使用。
在網(wǎng)絡(luò)邊界,運(yùn)營(yíng)商邊界路由器面對(duì)眾多客戶,而且一般都沒有冗余措施,最適合使用平穩(wěn)重啟技術(shù)。網(wǎng)絡(luò)核心一般都采用冗余路徑進(jìn)行保護(hù),而且?guī)I(yè)務(wù)重啟容易造成路由環(huán),所以不建議在網(wǎng)絡(luò)核心采用平穩(wěn)重啟技術(shù)。
評(píng)論