關(guān) 閉

新聞中心

EEPW首頁 > 工控自動化 > 設(shè)計應用 > 基于多特征SVMs分類器的手語識別*

基于多特征SVMs分類器的手語識別*

作者:楊全 西安文理學院 計算機科學系 彭進業(yè) 西北大學 信息科學與技術(shù)學院 時間:2009-04-14 來源:電子產(chǎn)品世界 收藏

  引言

本文引用地址:http://2s4d.com/article/93422.htm

  識別的目的就是通過計算機提供一種有效的、準確的機制將聾啞人常用的手勢識別出來,使得他們與健全人之間的交互變得更方便、快捷。同時,識別的應用還可以提供更自然的人機交互方式,方便聾啞人對計算機等常用信息設(shè)備的使用。目前手語識別可以分為基于視覺(圖像)的識別系統(tǒng)和基于數(shù)據(jù)手套(佩戴式設(shè)備)的識別系統(tǒng)?;谝曈X的手勢識別系統(tǒng)采用常見的視頻采集設(shè)備作為手勢感知輸入設(shè)備,價格便宜、便于安裝。鑒于基于視覺的手勢識別方法交互自然便利,適于普及應用,且更能反映機器模擬人類視覺的功能,所以目前是手勢識別的研究重點。

  手語識別的研究開始于1982年,Shantz和Poizner實現(xiàn)了一個合成美國手語的計算機程序。之后,中國、美國、日本、德國等許多國家都進行了自己國家的手語識別與合成研究,并取得了許多重要的研究成果。Triesch和Malsburg開發(fā)了一種彈性圖模板匹配技術(shù)對復雜背景下的手形進行分類[1],在相對復雜的背景下的識別率達到86.2%。Davis和Shah將戴上指間具有高亮標記的視覺手套的手勢作為系統(tǒng)的輸入,可識別7種手勢[2]。Starner[3]等在對美國手語中帶有詞性的40個詞匯隨機組成的短句子識別率達到99.2%。Yang等人采用7Hu不變矩特征量進行手語字母識別,最好識別率為90%[4]。

  本文采用 (Support Vector Machines,支持向量機)作為手語識別的分類器,提出了一種基于視覺的手語字母識別方法。在解決小樣本、非線性及高維模式識別問題中表現(xiàn)出許多特有的優(yōu)勢,并能夠推廣應用到函數(shù)擬合等其他機器學習問題中。采用作為圖像分類器首先要解決的問題是:如何用典型視覺特征來表征圖像的不同視覺特性[5]。

  在圖像特征提取方面,為了能夠同時表征圖像的全局特性和局部特性,需要同時提取圖像的全局特征和局部特征,并且這些特征中用以描述圖像整體形狀的特征應當具備平移、旋轉(zhuǎn)和尺度不變性。(Scale Invariant Feature Transform)是一種對尺度空間、圖像縮放、旋轉(zhuǎn)甚至仿射不變的圖像局部特征描述算子[6];而7Hu不變矩特征量具有平移、旋轉(zhuǎn)和尺度不變性的特點,具有很好的穩(wěn)定性,適合描述目標整體形狀。

  手語簡介

  手語是一種聾人使用的語言,是一種靠動作/視覺交際的特殊語言[7]。中國手語包括30個手指字母,大約5500個基本手勢詞。手指語是從字母語言發(fā)展起來的,是漢語手語的一種,用一個指式代表一個漢語拼音字母,按照漢語拼音方案拼成普通話。而手勢語則是由象形語言發(fā)展起來的。它充分利用人的手勢、表情和身體動作形象地表達物體和行動的最基本特征。

  中國文字改革委員會、教育部等單位于1963年聯(lián)合公布實施漢語手指字母方案[7]。方案中包括漢語拼音中26個單字母(A~ Z)和4個雙字母(ZH、CH、SH、NG)如圖1所示。


  圖1 中國手語字母表


上一頁 1 2 3 4 5 6 7 下一頁

評論


技術(shù)專區(qū)

關(guān)閉