在高精度時間間隔測量中隔離位誤碼率突發(fā)事件
發(fā)現(xiàn)、識別和隔離罕見定時事件(rare timing event)、競爭狀態(tài)和非確定性抖動效應通常十分困難。隨著業(yè)界采用各種經(jīng)驗規(guī)則和近似方法來判斷設計方案的統(tǒng)計特性何時達到“足夠好”的水平,這一點在今天變得尤為突出。更重要的是,這個問題還很容易掩蓋潛在的重大設計缺陷。本文介紹一個簡單的案例研究,它不注重理論分析,而是嘗試展示如何通過逐周期的波形分析來大幅提高工程人員的能力,使他們對罕見事件更加了解,進而捕捉這些罕見事件并分析其實質(zhì),隔離其來源。
我們需要測試串行數(shù)據(jù)流的組成,它們與高性能數(shù)字視頻應用中的信號有些類似。我們采用HP 8133A精密數(shù)字信號發(fā)生器和取樣速率達20GSa/sec的安捷倫54855A實時示波器來激勵和捕捉一系列單次數(shù)字波形。8133A發(fā)生器廣泛用來產(chǎn)生數(shù)字信號流和時鐘。這種脈沖發(fā)生器的一些新款型功能更強,為用戶對已知數(shù)字信號進行精密抖動測量提供了最大的裕度。圖1顯示了8133A的抖動測試性能,在ASA公司的M1上測量時,小于800fs RMS。
可以想象,當某天發(fā)現(xiàn)8133A產(chǎn)生類型稍有不同的測量結(jié)果時,我們會有多么驚訝。圖2中左側(cè)圖形是一個很不尋常的結(jié)果,數(shù)據(jù)信號中的規(guī)則抖動應當與右側(cè)圖形相似才對。
實際上,我們在最初以及進行的所有研究取樣中從未見過這種“四模式”柱狀圖。這個柱狀圖是如此罕見,以至于在使用眼圖和柱狀圖進行數(shù)百次取樣(經(jīng)歷好幾天時間)和查找之后,我們再也沒有見到過與之相似的柱狀圖。當我們決心要找到和顯示同樣的柱狀圖,并為此做出了一番精心策劃的努力之后,對它的看法也相應發(fā)生了改變。
不過,假設在研究試驗中偶然捕捉到了類似“四模式”柱狀圖的一個瞬時、單次出現(xiàn)的波形取樣。果真如此,可能會想:“嗯,這可真是怪事,一定是哪兒出錯了,才會出現(xiàn)這種情況!”之后,我們很可能按下“運行/停止”按鈕再次取樣,特別是當覺得自己的設備吞吐率高、更新快速、非常令人滿意時。由于上面的“四模式”柱狀圖實際上是一個罕見事件時,因此下一個以及下幾百個取樣幾乎肯定不會再出現(xiàn)類似的結(jié)果。
事實上,在查找過程中我們一直沒有發(fā)現(xiàn)這種“四模式”柱狀圖。當我們認識到自己遇到的問題時,我們就必搜索這個圖形。但是,在搜索之前,我們必須知道它確實存在。而且,由于罕見事件如此稀少,捕捉它們的最佳途徑就是一開始就秉持正確的態(tài)度。
了解罕見事件
在ASA公司,我們很少認為統(tǒng)計方法能夠幫助找到罕見定時或抖動事件。我們相信罕見事件要比人們想象的普通得多。罕見事件有多種不同的形式,有些真正是非常難得發(fā)生一次的差錯,其他的是一些長周期事件,有些是以短時突發(fā)形式發(fā)生的。我們也了解所有測試設備的一些基本局限,人們應該具備相應的洞察力,可以理解測試設備表明的有關(guān)罕見事件的意義。本文后面將簡要概述一下測試設備的部分局限性。實時、逐周期的波形捕捉要遠比欠采樣方法好得多,我們傾向于取樣一次隨即就對它進行分析;而不是大量取樣,再通過運用測量算法對波形數(shù)據(jù)進行處理來得出結(jié)果。我們相信,查找罕見定時事件成功的一半在于如何設計查找方法。
發(fā)現(xiàn)罕見事件
不過,如何才能發(fā)現(xiàn)這種稍縱即逝的“四模式”柱狀圖呢?我們在串行數(shù)據(jù)流上測量RjDj。無論是RjDj數(shù)值本身,還是眼圖或波形都無法識別出這個罕見錯誤。在一次連續(xù)取樣過程中觀察M1時,注意到有時單次采樣的Rj/Dj/Tj數(shù)值突然“跳動”一個相當大的幅度,即使累加了 100次采樣之后仍然如此。這種現(xiàn)象非常特別,因為被測系統(tǒng)據(jù)信是非常穩(wěn)定的。這個現(xiàn)象也在收斂指示器上得到了證實,它們一直顯示處于收斂狀態(tài),只在罕見情況下才出現(xiàn)發(fā)散。這種現(xiàn)象令我們感到奇怪,測量儀器告訴我們發(fā)生了問題。
起初,我們分析肯定是自己在測量時出錯了,但在使用新的54850系列示波器時,感覺和使用8133A一樣。而這種示波器性能非常優(yōu)秀,不可能自己產(chǎn)生這種現(xiàn)象。一定是軟件中有什么錯誤!但是,我們什么也沒找到,于是開始審視自己的測量方法,但是也沒有找到想象中的錯誤。我們嘗試再次進行測量,卻無法復現(xiàn)先前的結(jié)果。
我們利用M1的“記錄到磁盤”特性,記錄下了20分鐘左右過程中進行的500次連續(xù)取樣所獲得的帶時間標記的數(shù)據(jù)。同時,利用M1的Rj/Dj ASM(針對特定應用的測量)屏幕上的“保存”功能,將每次取樣的Rj/Dj/Tj值保存到了一個文本文件。這個文本文件被加載到Excel,根據(jù)取樣序號繪出了Rj/Dj/Tj曲線,如圖3所示。Tj圖至少顯示出了三個明顯的“跳變”,對應的取樣序號約為63、106和280。
這時,我們開始意識到出現(xiàn)了一些奇怪的情況。毫無道理,Tj的值會在一次取樣中劇烈增加,一定是數(shù)據(jù)中出現(xiàn)了什么問題。
識別罕見事件
利用M1 的“自動加載”特性和早前保存的時間標記數(shù)據(jù),我們可以按多種視圖查看數(shù)據(jù),以便了解在兩次取樣之間它們是如何改變的,或者有無改變。查看信號沿抖動柱狀圖時,我們發(fā)現(xiàn)某些取樣的柱狀圖分布形狀與其他大部分取樣顯著不同,參見本文前面的頭兩幅柱狀圖。找到那些特定的取樣后,發(fā)現(xiàn)它們正是使Tj值發(fā)生跳變的那幾個取樣。
這時,我們開始把這三個事件看作罕見定時事件。我們認識到在500個取樣中只發(fā)現(xiàn)3了個奇怪的取樣,而且每個取樣記錄了大約3萬個周期的波形,總共有約1500萬個周期的波形信息。顯然,這是一個虛假事件,如果不是罕見事件的話。但它不是那種經(jīng)過15天數(shù)據(jù)傳輸之后才出現(xiàn)一個位誤碼的罕見事件。另外一點需要注意的是,柱狀圖的形狀很不相同,表明不止一位數(shù)據(jù)出現(xiàn)異常,而是有一系列數(shù)據(jù)位都發(fā)生了錯位。這次錯誤不是一個單獨的錯誤,而是偶然出現(xiàn)的一組錯誤。更專業(yè)的表述是,這次錯誤看來是罕見的、偶然性的和突發(fā)性的。
考察問題取樣數(shù)據(jù)所繪出的信號沿抖動圖和脈寬抖動圖中的尖峰位置時,可發(fā)現(xiàn)以下二者的位置之間有著很強的關(guān)聯(lián)性:1. 已知跳變位置;2. 與問題取樣相關(guān)的篩選信號沿抖動中的明顯變化。殘差與平均單位間隔時間的影響并不是根本性的。通過這個分析,有關(guān)M1的疑問基本上被排除了。因此我們得到的結(jié)論是,在發(fā)生跳變的取樣位置上很可能確實存在BER突發(fā)。
分離罕見事件
為了確定上述特性是確實存在于信號本身,還是M1或示波器所帶來的,我們用不同的示波器、不同的脈沖發(fā)生器和不同的抖動分析工具進行了很多次測試。結(jié)果表明,只有這個特定的信號發(fā)生器表現(xiàn)出了“跳變”的特性。這給了我們很大信心,問題應當出在信號源本身,或是某種環(huán)境因素對信號源產(chǎn)生了影響。
由此可見,一個簡單的方法就是將脈沖發(fā)生器與其所在的環(huán)境隔離開來。事實上,多年來ASA公司已經(jīng)發(fā)現(xiàn)有許多環(huán)境不適合進行精確的定時和抖動測量。一些日常的辦公環(huán)境會成為引起位誤碼的來源。有時,這些環(huán)境問題會影響信號發(fā)送源,就象本例中的情況一樣。大多數(shù)時候,它們影響的是接收器。
我們并不關(guān)心是8133A脈沖發(fā)生器對耦合進來的環(huán)境因素過于敏感,還是儀器本身產(chǎn)生了錯誤。我們關(guān)心的是,到現(xiàn)在可以推斷,我們多年來一直信賴的標準脈沖發(fā)生器看來至少容易受到一些(內(nèi)部或外部)激勵所引起的BER突發(fā)的影響。這是一個首先需要抓住的事實。
發(fā)現(xiàn)罕見事件的其他方法
發(fā)現(xiàn)罕見事件的方法很多。最常用的方法就是讓示波器以無限制持續(xù)模式整晚運行。這樣有可能在眼圖或柱狀圖中捕獲一些蛛絲馬跡。當然,我們同樣也有可能忽略這些數(shù)據(jù)。歸根到底,人們不可能真正知道在整個夜晚期間環(huán)境中到底發(fā)生了什么情況。更重要的是,許多示波器,尤其是那些不執(zhí)行逐周期波形取樣并在屏幕上顯示取樣存儲器中每一個周期數(shù)據(jù)的那些儀器,要以小于100波形/秒的更新速率在寬度為兩個周期的時間窗口中發(fā)現(xiàn)一個罕見事件(如10-12 BER)不是一件容易的事情,即使連續(xù)工作10小時也未必能做到。而且就算捕捉到了罕見事件,“四模式”柱狀圖又表明了誤碼來源的什么信息呢?回顧一下,現(xiàn)在已經(jīng)得到了“四模式”柱狀圖,但仍然無法確定僅憑這個柱狀圖本身能表明問題起源的任何信息。不過它確實表明出現(xiàn)了問題。
如果用PRBS波形通過硬件或軟件方式來進行同步,有些示波器可以追溯錯誤圖案的位置。這種方法使用方便,但實際上它只適用于示波器能夠與信號發(fā)生器進行同步的激勵/響應應用。這種系統(tǒng)無法用于實時設計中的真實數(shù)據(jù)。另外,使用PRBS信號源來調(diào)試設備對于查找由確定性時不變錯誤(如符號之間的干擾)引起的誤碼可能非常有幫助。但是,重復性的PRBS圖案測試對于實時信號并不足夠,除非采用一個很長的PRBS圖案,并且使用一個既能查看確定性時不變定時錯誤又能查看非確定性時變定時錯誤的實時示波器來捕捉這個圖案。一種理想的方法是使用一臺實時示波器和一個長PRBS圖案或一個由實際設計環(huán)境中部件的實時應用所產(chǎn)生的實時隨機數(shù)據(jù)流。
我們本來可以利用一個位誤碼率測試器(BERT)來幫助表征異常現(xiàn)象,它們對表征設計非常有益,但也非常昂貴(即使租用一個月也是代價不菲)。而且,雖然我們知道通過這種方法可以判定系統(tǒng)是否存在一些問題,但位誤碼率數(shù)值又表明了什么信息呢?位誤碼率測試器確實具有許多優(yōu)秀的功能可用來表征多種不同情形下的位誤碼率,但是在實踐中,我們很少看見系統(tǒng)設計人員用它來對設計方案進行調(diào)試。
本文小結(jié)
本文介紹了很多技巧,特別是在罕見事件的捕捉方面。首先,發(fā)現(xiàn)一個特殊的柱狀圖、一個無法解釋的測量結(jié)果,或者一個統(tǒng)計上的罕見曲線之后,你應該立即停止正在進行的工作,并相信它是真實的。不要再次按下示波器的“運行/停止”按鈕,希望消除這個現(xiàn)象。相反,你應該立即將波形保存到硬盤。這有可能是一個罕見事件。其次,在這個例子中,不考慮抖動特征中的非確定性現(xiàn)象可能是不對的。BER突發(fā)不是某種容易通過一次重復測試來表征的現(xiàn)象。第三,有些方法會忽略罕見事件,如欠采樣、等時波形捕捉、完全只注意RjDj的數(shù)值大小而忽視其在時間上的收斂性等,這些方法都會掩蓋潛在的罕見事件。
本例中的BER突發(fā)是在比較凈化的環(huán)境中發(fā)現(xiàn)的。在實時應用中,很少會有凈化的環(huán)境。實際系統(tǒng)的電路板上有許多不確定的抖動和虛假電子信號。ASA公司發(fā)現(xiàn),許多工程人員使用堆疊式裝置而希望產(chǎn)生或測量皮秒級的定時,這是不切實際的。
某些部件對于虛假外部激勵的影響具有較好的耐受性??上Ш苌儆胁考O計人員(甚或使用這些零部件的系統(tǒng)設計人員)花時間來了解外部虛假激勵的敏感性,這可能會給系統(tǒng)設計人員帶來后續(xù)的問題。
回頭再看,幾乎所有工具都可能遇到這些錯誤,任何方法也都可能發(fā)生這些錯誤。重要的是,在本例中,M1的幾項功能幫助我們更加迅速地掌握到了罕見事件的實質(zhì)。首先,我們采用了一種非統(tǒng)計的方法。M1的RjDj提取法建立在逐周期數(shù)據(jù)分析的基礎之上,它使非確定性BER的效果得以迅速地呈現(xiàn)出來。其次,我們使用M1的抖動頻域視圖來將取樣轉(zhuǎn)化到頻域,以了解問題采樣中是否有任何頻率分量導致誤碼發(fā)生。本例中雖然沒有出現(xiàn)這種情況,但在其他情況下,這是另一項特別有用的調(diào)試工具。再次,M1的“記錄到磁盤”功能以及全新的“自動加載”特性也對分析極其有用。新的RjDj文本保存特性也是如此。最后,在本例的調(diào)試過程中,通過繪出各個周期的RjDj曲線和觀察RjDj的收斂/發(fā)散情況來查看RjDj值的跳變情況也非常重要。相對任何欠取樣方法而言,實時、逐周期的取樣并不是一個微不足道的優(yōu)點?;谶@一分析,我們強烈推薦你采用M1,這不僅是為了表征串行數(shù)據(jù)設計方案,同時也是了解和調(diào)試它的需要。
作者:Greg Walz
產(chǎn)品市場經(jīng)理
Amherst Systems Associates
Email: greg_walz@amherst-systems.com
評論