高速手勢(shì)識(shí)別系統(tǒng)解決方案
1設(shè)計(jì)摘要
本文引用地址:http://m.butianyuan.cn/article/201808/387254.htm目前,研究自然化的人機(jī)交互是當(dāng)今計(jì)算機(jī)科學(xué)技術(shù)領(lǐng)域的主要研究熱點(diǎn)之一,手勢(shì)輸入作為一種自然、豐富、直接的交互手段在人機(jī)交互技術(shù)中占有重要的地位。本項(xiàng)目提出以Xilinx公司Spartan 6系列FPGA為核心器件的手勢(shì)識(shí)別系統(tǒng)設(shè)計(jì)的方案,采用FPGA芯片的內(nèi)置DSP硬核作為手勢(shì)識(shí)別模塊的核心,負(fù)責(zé)圖像識(shí)別算法的實(shí)現(xiàn),采用FPGA作為圖像采集模塊的控制中心,負(fù)責(zé)圖像的采集,完成預(yù)處理和攝像頭聚焦和云臺(tái)的控制工作,以FPGA高速?gòu)?qiáng)大的處理能力保證了系統(tǒng)的實(shí)時(shí)性。手勢(shì)識(shí)別部分融合人手顏色信息和手勢(shì)運(yùn)動(dòng)信息,利用種子算法對(duì)復(fù)雜背景下的手勢(shì)進(jìn)行分割。根據(jù)分割出的手勢(shì)區(qū)域大大加速了運(yùn)動(dòng)特征參數(shù)的提取,并結(jié)合手勢(shì)區(qū)域的形狀特征,建立手勢(shì)的時(shí)空表觀(guān)模型。識(shí)別時(shí),采用獨(dú)立分布的多狀態(tài)高斯概率模型,進(jìn)行時(shí)間規(guī)整,通過(guò)DSP和FPGA在處理不同結(jié)構(gòu)算法的優(yōu)勢(shì), 大大提高了手勢(shì)識(shí)別的處理速度和準(zhǔn)確性。高速性將是該手勢(shì)識(shí)別系統(tǒng)最突出的優(yōu)點(diǎn),可實(shí)現(xiàn)更高層次產(chǎn)品的開(kāi)發(fā)并擴(kuò)大應(yīng)用前景。
2項(xiàng)目背景
研究自然化的人機(jī)交互是當(dāng)今計(jì)算機(jī)科學(xué)技術(shù)領(lǐng)域的主要研究熱點(diǎn)之一,手勢(shì)是一種自然、直觀(guān)、易于學(xué)習(xí)的人機(jī)交互手段,手勢(shì)輸入是實(shí)現(xiàn)自然、直接人機(jī)交互不可缺少的關(guān)鍵技術(shù)。目前的手勢(shì)識(shí)別技術(shù)主要分為基于數(shù)據(jù)手套和基于視覺(jué)兩種?;谝曈X(jué)的動(dòng)態(tài)手勢(shì)識(shí)別系統(tǒng)更是當(dāng)前科學(xué)研究領(lǐng)域的熱點(diǎn)之一。手勢(shì)輸入作為一種自然、豐富、直接的交互手段在人機(jī)交互技術(shù)中占有重要的地位。
盡管手勢(shì)識(shí)別技術(shù)的起步比較早,但絕大多數(shù)只是簡(jiǎn)單的停留在軟件層次上,這些技術(shù)有的只是進(jìn)行簡(jiǎn)單的比對(duì),速度比較慢,實(shí)時(shí)性比較差,另外一些這是識(shí)別效率較低。因此需要一個(gè)從硬件上著手,專(zhuān)門(mén)用來(lái)識(shí)別手勢(shì)的設(shè)備,以彌補(bǔ)上述兩個(gè)方面的不足。
以現(xiàn)場(chǎng)可編程門(mén)陣列FPGA作為核心器件來(lái)完成圖像的采集和預(yù)處理系統(tǒng),該系統(tǒng)具有小型化、集成化且實(shí)時(shí)性好、靈活性高的特點(diǎn)。該系統(tǒng)將一些單調(diào)、不復(fù)雜、工作量大且耗費(fèi)時(shí)間的處理交給FPGA來(lái)完成,不僅能充分利用FPGA速度高的優(yōu)越性,也能為DSP提供更多的時(shí)間進(jìn)行更復(fù)雜的手勢(shì)圖像分析,使得手勢(shì)識(shí)別的結(jié)果更為可靠,提高了整個(gè)系統(tǒng)的性能。近幾年具有乘法器及內(nèi)存塊資源的大容量FPGA以及基于IP核嵌入的FPGA開(kāi)發(fā)技術(shù)的出現(xiàn),可以將嵌入式微處理器、專(zhuān)用字器件和高速DSP以IP核的形式方便地嵌FPGA,以硬件編程的方法實(shí)現(xiàn)高速信號(hào)處理算法。本文的目的在于如何利用DSP和FPGA各自的優(yōu)勢(shì),設(shè)計(jì)出滿(mǎn)足實(shí)時(shí)手勢(shì)識(shí)別處理要求的硬件平臺(tái)。
綜述,本文提出的高速基于DSP+FPGA架構(gòu)的手勢(shì)識(shí)別系統(tǒng)的設(shè)計(jì),它綜合了FPGA和DSP的優(yōu)點(diǎn),通過(guò)DSP和FPGA在處理不同結(jié)構(gòu)算法的優(yōu)勢(shì),大大提高了手勢(shì)識(shí)別的速度和準(zhǔn)確率。
3應(yīng)用前景
手勢(shì)識(shí)別技術(shù)的應(yīng)用范圍很廣泛,主要有以下幾個(gè)方面:
1、用于虛擬環(huán)境的交互。如虛擬制造和虛擬裝配、產(chǎn)品設(shè)計(jì)等。虛擬裝配通過(guò)手的運(yùn)動(dòng)直接進(jìn)行零件的裝配,同時(shí)通過(guò)手勢(shì)與語(yǔ)音的合成來(lái)靈活的定義零件之間的裝配關(guān)系。還可以將手勢(shì)識(shí)別用于復(fù)雜設(shè)計(jì)信息的輸入;2、智能家居、多媒體設(shè)備的控制。通過(guò)手勢(shì)識(shí)別可以是使用者通過(guò)簡(jiǎn)單的顯而易見(jiàn)的手勢(shì)對(duì)多媒體、家具設(shè)備實(shí)現(xiàn)控制,如開(kāi)關(guān)空調(diào)、多媒體展示等;
3、用于多通道、多媒體用戶(hù)界面。正如鼠標(biāo)沒(méi)有取代鍵盤(pán),手勢(shì)輸入也不能取代鍵盤(pán)、鼠標(biāo)等傳統(tǒng)交互設(shè)備,手勢(shì)非常適合于指點(diǎn)、表達(dá)形狀、幾何變換和裝配等任務(wù)。語(yǔ)音對(duì)于表達(dá)抽象概念及離散屬性(或命令)是具有絕對(duì)優(yōu)勢(shì)的,而且可以涉及視覺(jué)不及的對(duì)象。視線(xiàn)應(yīng)用于人機(jī)交互在目標(biāo)選擇等方面具有直接性、自然性和雙向性等特點(diǎn)。將手勢(shì)輸入和這些交互通道結(jié)合,將增強(qiáng)現(xiàn)有的人機(jī)交互模式,從而實(shí)現(xiàn)更為直接、自然、和諧的人機(jī)接口。這種多模式的人機(jī)交互技術(shù)已經(jīng)成為當(dāng)前研究的熱點(diǎn),多通道人機(jī)界面將在可預(yù)見(jiàn)的將來(lái)占主導(dǎo)地位,并進(jìn)一步促進(jìn)虛擬現(xiàn)實(shí)技術(shù)的發(fā)展;
4、聾啞患者與正常人的交流。手語(yǔ)是聾啞人使用,的語(yǔ)言,是由手型動(dòng)作輔之以表情姿勢(shì)由符號(hào)構(gòu)成的比較穩(wěn)定的表達(dá)系統(tǒng),是一種靠動(dòng)作/視覺(jué)交際的語(yǔ)言。手勢(shì)識(shí)別可以讓機(jī)器“看懂”聾人的手語(yǔ)。識(shí)別手語(yǔ)和手語(yǔ)合成相結(jié)合,構(gòu)成一個(gè)“人-機(jī)手語(yǔ)翻譯系統(tǒng)”便于聾人與周?chē)h(huán)境的交流;
4系統(tǒng)設(shè)計(jì)方案
通過(guò)攝像頭采集手勢(shì)圖像,將圖像數(shù)據(jù)存儲(chǔ)到SDRAM中, FPGA處理系統(tǒng)通過(guò)對(duì)SDRAM的控制,實(shí)現(xiàn)云臺(tái)控制和攝像頭聚焦,且將圖像數(shù)據(jù)按照所需時(shí)序從SDRAM中將數(shù)據(jù)讀出,并進(jìn)行銳化、與背景分離、消除噪聲以及等預(yù)處理,再將預(yù)處理后的數(shù)據(jù)送到MicroBlaze處理器中,在MicroBlaze處理器中對(duì)手勢(shì)圖像進(jìn)行復(fù)雜的手勢(shì)識(shí)別處理,完成手勢(shì)分割、手勢(shì)識(shí)別,并將識(shí)別出的手勢(shì)信息實(shí)時(shí)傳給FPGA,由FPGA實(shí)時(shí)顯示在顯示設(shè)備上。
4.1設(shè)計(jì)框圖
4.2系統(tǒng)設(shè)計(jì)
FPGA是整個(gè)系統(tǒng)的時(shí)序控制中心和數(shù)據(jù)交換橋梁,而且能夠?qū)崿F(xiàn)對(duì)底層的信號(hào)快速預(yù)處理。在很多信號(hào)處理系統(tǒng)中,底層的信號(hào)預(yù)處理算法要處理的數(shù)據(jù)量很大,對(duì)處理速度要求很高,但算法結(jié)構(gòu)相對(duì)比較簡(jiǎn)單,適于用FPGA進(jìn)行硬件編程實(shí)現(xiàn)。而高層處理算法的特點(diǎn)是數(shù)據(jù)量較低,但算法控制結(jié)構(gòu)復(fù)雜,適于用運(yùn)算速度快、尋址靈活、通信機(jī)制強(qiáng)大的DSP芯片來(lái)實(shí)現(xiàn)。
4.2.1圖像采集模塊
普通固定式攝像頭不能調(diào)整方向,難以對(duì)移動(dòng)中的目標(biāo)進(jìn)行實(shí)時(shí)的抓取、捕獲,不能滿(mǎn)足本項(xiàng)目對(duì)手勢(shì)圖像采集的要求。我們擬采用通過(guò)控制云臺(tái)來(lái)實(shí)現(xiàn)對(duì)手勢(shì)的實(shí)時(shí)精確抓取。先通過(guò)幾何人臉識(shí)別的方法識(shí)別出目標(biāo)者,然后通過(guò)調(diào)節(jié)云臺(tái)上的水平與垂直兩個(gè)電機(jī)來(lái)調(diào)節(jié)攝像頭的方向,最大限度的采集目標(biāo)者的圖像,然后再通過(guò)光學(xué)變焦,使目標(biāo)者清晰成像,這樣可以在更大范圍內(nèi)獲得包含手勢(shì)的目標(biāo)者的圖像,從而能夠更加精確的提取手勢(shì)圖像,進(jìn)行手勢(shì)分割,增加手勢(shì)識(shí)別的精度。
一體化攝像機(jī)內(nèi)置光學(xué)鏡頭,具有變倍、自動(dòng)聚焦功能的攝像機(jī),其結(jié)構(gòu)小巧、使用方便、監(jiān)控范圍廣。變焦控制可實(shí)現(xiàn)圖像的變倍、自動(dòng)聚焦,是一體化攝像機(jī)中的關(guān)鍵技術(shù)之一。步進(jìn)電機(jī)可將電脈沖信號(hào)轉(zhuǎn)換成角位移,每接收一個(gè)脈沖信號(hào)就可驅(qū)動(dòng)步進(jìn)電機(jī)轉(zhuǎn)動(dòng)一個(gè)固定角度,實(shí)現(xiàn)物體的準(zhǔn)確定位,通過(guò)控制脈沖的頻率可控制電機(jī)轉(zhuǎn)動(dòng)的速度,步進(jìn)電機(jī)已廣泛應(yīng)用于高精度控制系統(tǒng)中。一體化攝像機(jī)光學(xué)鏡頭中包含變倍步進(jìn)電機(jī)與聚焦步進(jìn)電機(jī),變倍電機(jī)轉(zhuǎn)動(dòng)時(shí),為使圖像聚焦清晰,聚焦電機(jī)也應(yīng)隨之轉(zhuǎn)動(dòng),具體轉(zhuǎn)動(dòng)步數(shù)與物距有關(guān),具體參數(shù)可由鏡頭生產(chǎn)廠(chǎng)家提供的變焦跟蹤曲線(xiàn)獲得。為了適應(yīng)不同物距的清晰成像,變倍跟蹤結(jié)束后,配合自動(dòng)聚焦,以顯示清晰的圖像。
可通過(guò)人臉幾何特征識(shí)別算法識(shí)別出目標(biāo)者,幾何特征的人臉識(shí)別方法:幾何特征可以是眼、鼻、嘴等的形狀和它們之間的幾何關(guān)系(如相互之間的距離)。這些算法識(shí)別速度快,需要的內(nèi)存小,識(shí)別率較低,但是可以滿(mǎn)足方向調(diào)節(jié)的需求。
4.2.2 FPGA預(yù)處理模塊
圖像計(jì)算模塊讀取參數(shù)表數(shù)據(jù),FPGA對(duì)采集模塊輸入并存儲(chǔ)在外部原始圖像SRAM中的原始圖像數(shù)據(jù)進(jìn)行計(jì)算處理,并將處理好的圖像數(shù)據(jù)存儲(chǔ)到結(jié)果圖像SDRAM中,最后,F(xiàn)PGA內(nèi)部的圖像輸出模塊從結(jié)果圖像SDRAM中將處理后的圖像數(shù)據(jù)讀出。
評(píng)論