基于多傳感器信息融合的智能交通信息語義描述
摘要:針對攝像頭采集交通信息時易受環(huán)境干擾且采集到的信息不夠全面的問題,提出智能交通多傳感器信息融合框架,對多種傳感器采集到的交通信息進行融合。另外由于攝像頭采集的視頻數(shù)據(jù)量巨大且多為底層視覺信息,不便于用戶信息檢索,提出智能交通信息語義描述框架,對交通視頻信息和傳感器信息進行語義描述。實驗結(jié)果表明,對多傳感器采集到的信息進行融合能有效提高信息采集的精度,同時對交通視頻信息進行語義描述將極大地方便用戶對感興趣信息的檢索。
關(guān)鍵詞:智能交通系統(tǒng);多傳感囂信息融合;MPEG-7;視頻語義描述
0 引言
攝像頭作為監(jiān)控、采集交通信息的有效手段被廣泛應(yīng)用于智能交通系統(tǒng)中。然而攝像頭由于其光學(xué)特性極易受到周圍環(huán)境的干擾,例如強光照射、雨雪霧等惡劣的氣候條件都會對攝像頭的正常工作產(chǎn)生很大的影響,因而僅僅通過攝像頭這一單一信息采集手段獲得的交通信息往往是不夠完整的,有時甚至是不可靠的。另外攝像頭采集到的視頻信息,信息量龐大,毫無結(jié)構(gòu)性,用戶如果希望在如此海量信息中檢索感興趣的內(nèi)容,例如用戶想查看某段黑色轎車闖紅燈的視頻,目前通常的做法是一幀幀地線性瀏覽整個視頻,顯然這個過程效率極其低下。
基于以上問題,本文首先提出了一個多傳感器信息融合框架,通過將攝像頭采集到的視頻信息與多種智能交通傳感器采集到的信息進行融合以彌補攝像頭作為單一信息采集手段的不足。然后在此基礎(chǔ)上提出了一個對攝像頭所采集的視頻信息和智能交通傳感器信息進行語義描述的框架,為用戶對交通信息進行高效檢索提供鋪墊。
1 智能交通多傳感器信息檢測與融合
1.1 多傳感器信息融合理論
多傳感器信息融合理論最早應(yīng)用于軍事領(lǐng)域,這一方面的研究首先起始于1973年的美國。20世紀80年代,隨著傳感器技術(shù)的進步,多傳感器信息融合理論開始飛速發(fā)展,其在非軍事領(lǐng)域的應(yīng)用也大規(guī)模展開,工業(yè)控制系統(tǒng)、智能交通、氣象監(jiān)測、資源探測、醫(yī)療診斷等多個領(lǐng)域都在朝著多傳感器方向發(fā)展。國內(nèi)多傳感器信息融合的研究也于20世紀90年代達到高潮,涌現(xiàn)了諸多理論和工程實踐成果。
多傳感器信息融合就是充分利用多個傳感器的資源,通過對多種傳感器信息按照某優(yōu)化規(guī)則進行組合處理,有效地提高各個傳感器信息之間的互補性,同時剔除不必要的冗余信息,提高整個系統(tǒng)的有效性。多傳感器信息融合按照信息處理層次可分為數(shù)據(jù)層信息融合、特征層信息融合、決策層信息融合。其中決策層信息融合是根據(jù)各個傳感器系統(tǒng)的判決進行優(yōu)化推理,做出最終的決策,靈活性高,通信負荷小,無需傳感器之間同質(zhì),但同時也對觀測信息的預(yù)處理提出了很高的要求。
1.2 智能交通多傳感器信息融合框架
智能交通傳感器種類繁多,功能各異。針對應(yīng)用場景以及結(jié)合前期的工程實踐,選擇磁敏傳感器、壓電式傳感器、微波雷達、RFID作為獲取交通信息的傳感器,這4種傳感器所采集的交通信息如表1所示。
此外,整個交通狀態(tài)會受到周圍環(huán)境的影響,因而需要根據(jù)環(huán)境變化調(diào)節(jié)多傳感器信息融合的策略,從而降低環(huán)境變化所帶來的影響。
到目前為止,需要進行信息融合的傳感器包括攝像頭、磁敏傳感器、壓電式傳感器、微波雷達、RFID。這5種傳感器彼此異質(zhì),原始觀測數(shù)據(jù)結(jié)構(gòu)、內(nèi)容差異巨大,例如攝像頭采集的是二維視頻信號,磁敏傳感器卻輸出一維模擬信號,而壓電式傳感器則輸出模擬脈沖信號。因此考慮在決策級對這幾種傳感器信息進行融合。每個傳感器節(jié)點對采集到的信息進行分析處理,其結(jié)果與視頻信息處理結(jié)果進行決策級融合,整個融合過程同時會受到氣象、光照條件的影響。多傳感器信息融合框架如圖1所示。
2 智能交通信息的語義描述
隨著多媒體技術(shù)的迅速發(fā)展,視頻信息量也呈現(xiàn)出爆炸性增長趨勢。面對如此海量的數(shù)據(jù),用戶更關(guān)注如何才能高效地檢索到自己所感興趣的信息,即如何實現(xiàn)基于內(nèi)容的視頻信息查詢(Content-Based Visual Queries,CBVQ)。這一問題已引起了研究者的廣泛興趣,一些原型系統(tǒng)相繼問世,如IBM的QBIC系統(tǒng),哥倫比亞大學(xué)的webseek系統(tǒng),清華大學(xué)的TV-FI系統(tǒng)等。
傳統(tǒng)視頻分析技術(shù)是對底層視覺信息進行分析處理,如顏色、紋理、輪廓。而用戶往往是從高層語義的角度理解整個視頻內(nèi)容,例如某段視頻出現(xiàn)了什么物體、發(fā)生了什么事情。這之間不可避免地存在著語義鴻溝(Semantic gaps)。要實現(xiàn)視頻內(nèi)容查詢,首先需要在底層視覺信息和高層語義之間搭建起一座橋梁。目前學(xué)術(shù)界對于該問題的研究工作已廣泛開展起來,其中比較著名的是運動圖像專家組提出的MPEG-7標準,即多媒體內(nèi)容描述接口(Multimedia Content Description Interface)。MPEG-7標準的目標就是定義一套靈活的可擴展的描述框架。該框架能夠?qū)Χ嗝襟w內(nèi)容提供高效的、準確的并且具有互操作特性的語義描述,以便于進一步對多媒體信息內(nèi)容進行語義檢索。MPEG-7對以下內(nèi)容標準化:描述符(Descriptors)、描述方案(Description Schemes)、描述定義語言(Description Definition Language)。其中描述定義語言基于XML語言,允許對描述符和描述方案進行靈活地定義和描述,并且具有極強的可擴展性。
評論