基于視頻的體育運動分析系統(tǒng)的研究與實現(xiàn)
近年來,利用運動員的訓練、比賽視頻圖像作為體育訓練的參考,進行體育運動分析是國內外普遍采用的一種行之有效方法。體育運動分析運用了當今流行的圖像處理、人體仿真學、計算機視覺等多領域的研究熱點,以運動員為研究對象,對其進行定性以及定量分析,達到科學輔助訓練的目的。
文中擬以體育運動視頻圖像為主要研究對象,以視頻處理技術為主要研究手段,設計并實現(xiàn)一種集合視頻控制、全景圖合成、靜態(tài)背景抑制、運動目標跟蹤及量化等功能為一體的體育運動分析系統(tǒng)。
1 系統(tǒng)設計需求分析
傳統(tǒng)的體育運動分析主要是基于經(jīng)驗和人眼的觀察和分析方法,顯然此類方法具有明顯的局限性和不足。
體育運動分析的主要目的就是通過分析運動員訓練和比賽的視頻圖像,利用視頻圖像在時間和空間上的相關性,得到各種人體運動學參數(shù)以及運動員和教練員感興趣的各類信息,實現(xiàn)科學指導訓練。
文中借助Visual C++.net 2003開發(fā)平臺,研究和設計了―個基于視頻的體育運動分析系統(tǒng),實現(xiàn)了對運動視頻的定性和定量分析,具有很強的實用性。
2 系統(tǒng)功能設計及其算法實現(xiàn)
2.1 系統(tǒng)總體功能設計
文中主要針對單目視頻進行人體運動分析,利用Directshow技術對運動視頻進行控制;利用基于馬賽克的圖像拼接技術,提取視頻中的背景信息,對視頻圖像進行時域分割,提取視頻中的運動目標,最后合成全景圖像;利用幀間差分法濾除靜態(tài)背景,實現(xiàn)背景抑制;結合卡爾曼濾波和色塊匹配技術,對運動關鍵部位進行自動跟蹤,并獲取人體運動學參數(shù)建立基于視頻的體育運動分析系統(tǒng)。
系統(tǒng)主要功能框架,如圖1所示。整個系統(tǒng)由4部分組成。
2.2 視頻控制
DirectShow使用一種叫Filter Graph的模型來管理整個數(shù)據(jù)流的處理過程;參與數(shù)據(jù)處理的各個功能模塊叫做。Filter;各個Fiher在Filter Graph中按一定的順序連接成一條“流水線”協(xié)同工作。本系統(tǒng)采用先進的DirectShow視頻播放技術,根據(jù)教練和運動員進行動作分析的需要,增加各種速率視頻播放、視頻圖像剪輯、逐幀圖像顯示等功能。
2.3 全景圖合成
相鄰幀間兩幅圖像的關系便歸結為初等坐標變換,即平移、旋轉、仿射、雙線性和透視變換的組合。實際上當攝像機的移動的幅度不是很大并且離景物很遠的情況下,對視頻圖像進行拼接時就可以不考慮圖像間的變形失真,此時兩圖像間的變換矩陣M由下式確定
對于8個參數(shù)的確定需要準確的確定4個匹配點,然后通過式(2)就可以確定變換矩陣M,M的確定,如圖2所示。
![]() |
![]() |
4組匹配點就可以完全確定含有8個未知數(shù)的8個方程。這些方程全是線性方程組,可以通過Gauss全選主元消去法進行求解。
假設已經(jīng)通過相關匹配到3組點(A,A'),(B,B'),(C,C'),由于幀間變化的漸變性,A點的位移幅度應該和B點及C點的位移幅度相近,否則就說明有誤匹配出現(xiàn)。取如下定義
rang(A)=| A-A'| (3)
若出現(xiàn)|rang(A)-rang(B)|>ε(此處ε為合適的閾值)說明出現(xiàn)了誤匹配,結合| rang(A)-rang(C)|就可以確定出哪個點出現(xiàn)了誤匹配,然后重新選取模板進行匹配;重復執(zhí)行以上過程直到A,B,C都滿足條件。
整個誤匹配的消除過程中采用的舉手表決的方式,對于4組點誤匹配的消除,選取模板的時至少選5組,只有這樣才不會出現(xiàn)類似于正確對錯誤為2:2的情況。
由于在重疊區(qū)域直接取兩幅圖像中其中的一幅進行圖像合成,很容易在重疊區(qū)域的邊界處形成明顯的拼縫,因此,需要采用圖像融合技術合成全景圖。
以左右拼接的兩幅圖像I1(i,j)和I2(i,j)為例,則重疊區(qū)域圖像的像素值I(x,y)可表示為
I(i,j)=d(i)I1(i,j)+(1-d(i))I2(i,j)(4)
其中,d(i)為融合系數(shù),它與離邊界的距離成正比關系,上述計算是按掃描線逐條進行的,因此該方法適用于任意形狀的兩幅圖像的融合。
圖3為全景圖合成結果。圖3(a)~圖3(d)為要合成的視頻圖像中提取的4幀,圖3(e)為合成的背景全景圖,圖3(f)為添加了運動目標后的全景圖。
評論