小波變換和motion信號(hào)處理:第一篇
這是《小波變換和motion信號(hào)處理》系列的第一篇,基礎(chǔ)普及。第二篇我準(zhǔn)備寫深入小波的東西,第三篇講解應(yīng)用。
本文引用地址:http://m.butianyuan.cn/article/247253.htm記得我還在大四的時(shí)候,在申請(qǐng)出國(guó)和保研中猶豫了好一陣,骨子里的保守最后讓我選擇了先保研。當(dāng)然后來(lái)也退學(xué)了,不過(guò)這是后話。當(dāng)時(shí)保研就要找老板,實(shí)驗(yàn)室,自己運(yùn)氣還不錯(cuò),進(jìn)了一個(gè)在本校很牛逼的實(shí)驗(yàn)室干活路。我們實(shí)驗(yàn)室主要是搞圖像的,實(shí)力在全國(guó)也是很強(qiáng)的,進(jìn)去后和師兄師姐聊,大家都在搞什么小波變換,H264之類的。當(dāng)時(shí)的我心思都不在這方面,盡搞什么操作系統(tǒng)移植,ARM+FPGA這些東西了。對(duì)小波變換的認(rèn)識(shí)也就停留在神秘的“圖像視頻壓縮算法之王”上面。
后來(lái)我才發(fā)現(xiàn),在別的很廣泛的領(lǐng)域中,小波也逐漸開(kāi)始流行。比如話說(shuō)很早以前,我們接觸的信號(hào)頻域處理基本都是傅立葉和拉普拉斯的天下。但這些年,小波在信號(hào)分析中的逐漸興盛和普及。這讓人不得不感到好奇,是什么特性讓它在圖象壓縮,信號(hào)處理這些關(guān)鍵應(yīng)用中更得到信賴呢?說(shuō)實(shí)話,我還在國(guó)內(nèi)的時(shí)候,就開(kāi)始好奇這個(gè)問(wèn)題了,于是放狗搜,放毒搜,找遍了中文講小波變換的科普文章,發(fā)現(xiàn)沒(méi)幾個(gè)講得清楚的,當(dāng)時(shí)好奇心沒(méi)那么重,也不是搞這個(gè)研究的,懶得找英文大部頭論文了,于是作罷。后來(lái)來(lái)了這邊,有些項(xiàng)目要用信號(hào)處理,不得已接觸到一些小波變換的東西,才開(kāi)始硬著頭皮看??戳艘恍┎牧?,聽(tīng)了一些課,才發(fā)現(xiàn),還是那個(gè)老生常談的論調(diào):國(guó)外的技術(shù)資料和國(guó)內(nèi)真TNND不是一個(gè)檔次的。同樣的事情,別人說(shuō)得很清楚,連我這種并不聰明的人也看得懂; 國(guó)內(nèi)的材料則繞來(lái)繞去講得一塌糊涂,除了少數(shù)天才沒(méi)幾個(gè)人能在短時(shí)間掌握的。
牢騷就不繼續(xù)發(fā)揮了。在這個(gè)系列文章里,我希望能簡(jiǎn)單介紹一下小波變換,它和傅立葉變換的比較,以及它在移動(dòng)平臺(tái)做motion detection的應(yīng)用。如果不做特殊說(shuō)明,均以離散小波為例子??紤]到我以前看中文資料的痛苦程度,我會(huì)盡量用簡(jiǎn)單,但是直觀的方式去介紹。有些必要的公式是不能少的,但我盡量少用公式,多用圖。另外,我不是一個(gè)好的翻譯者,所以對(duì)于某些實(shí)在翻譯不清楚的術(shù)語(yǔ),我就會(huì)直接用英語(yǔ)。我并不claim我會(huì)把整個(gè)小波變換講清楚,這是不可能的事,我只能盡力去圍繞要點(diǎn)展開(kāi),比如小波變換相對(duì)傅立葉變換的好處,這些好處的原因是什么,小波變換的幾個(gè)根本性質(zhì)是什么,背后的推導(dǎo)是什么。我希望達(dá)到的目的就是一個(gè)小波變換的初學(xué)者在看完這個(gè)系列之后,就能用matlab或者別的工具對(duì)信號(hào)做小波變換的基本分析并且知道這個(gè)分析大概是怎么回事。
最后說(shuō)明,我不是研究信號(hào)處理的專業(yè)人士,所以文中必有疏漏或者錯(cuò)誤,如發(fā)現(xiàn)還請(qǐng)不吝賜教。
要講小波變換,我們必須了解傅立葉變換。要了解傅立葉變換,我們先要弄清楚什么是”變換“。很多處理,不管是壓縮也好,濾波也好,圖形處理也好,本質(zhì)都是變換。變換的是什么東西呢?是基,也就是basis。如果你暫時(shí)有些遺忘了basis的定義,那么簡(jiǎn)單說(shuō),在線性代數(shù)里,basis是指空間里一系列線性獨(dú)立的向量,而這個(gè)空間里的任何其他向量,都可以由這些個(gè)向量的線性組合來(lái)表示。那basis在變換里面啥用呢?比如說(shuō)吧,傅立葉展開(kāi)的本質(zhì),就是把一個(gè)空間中的信號(hào)用該空間的某個(gè)basis的線性組合表示出來(lái),要這樣表示的原因,是因?yàn)楦盗⑷~變換的本質(zhì),是。小波變換自然也不例外的和basis有關(guān)了。再比如你用Photoshop去處理圖像,里面的圖像拉伸,反轉(zhuǎn),等等一系列操作,都是和basis的改變有關(guān)。
既然這些變換都是在搞基,那我們自然就容易想到,這個(gè)basis的選取非常重要,因?yàn)閎asis的特點(diǎn)決定了具體的計(jì)算過(guò)程。一個(gè)空間中可能有很多種形式的basis,什么樣的basis比較好,很大程度上取決于這個(gè)basis服務(wù)于什么應(yīng)用。比如如果我們希望選取有利于壓縮的話,那么就希望這個(gè)basis能用其中很少的向量來(lái)最大程度地表示信號(hào),這樣即使把別的向量給砍了,信號(hào)也不會(huì)損失很多。而如果是圖形處理中常見(jiàn)的線性變換,最省計(jì)算量的完美basis就是eigenvector basis了,因?yàn)榇藭r(shí)變換矩陣T對(duì)它們的作用等同于對(duì)角矩陣( Tv_n = av_n,a是eigenvalue )??偟膩?lái)說(shuō),拋開(kāi)具體的應(yīng)用不談,所有的basis,我們都希望它們有一個(gè)共同的特點(diǎn),那就是,容易計(jì)算,用最簡(jiǎn)單的方式呈現(xiàn)最多的信號(hào)特性。
好,現(xiàn)在我們對(duì)變換有了基本的認(rèn)識(shí),知道他們其實(shí)就是在搞基。當(dāng)然,搞基也是分形式的,不同的變換,搞基的妙處各有不同。接下來(lái)先看看,傅立葉變換是在干嘛。
傅立葉級(jí)數(shù)最早是Joseph Fourier 這個(gè)人提出的,他發(fā)現(xiàn),這個(gè)basis不僅僅存在與vector space,還存在于function space。這個(gè)function space本質(zhì)上還是一個(gè)linear vector space,可以是有限的,可以是無(wú)限的,只不過(guò)在這個(gè)空間里,vector就是function了,而對(duì)應(yīng)的標(biāo)量就是實(shí)數(shù)或者復(fù)數(shù)。在vector space里,你有vector v可以寫成vector basis的線性組合,那在function space里,function f(x)也可以寫成對(duì)應(yīng)function basis的線性組合,也有norm。你的vector basis可以是正交的,我的function basis也可以是正交的(比如sin(t)和sin(2t))。唯一不同的是,我的function basis是無(wú)窮盡的,因?yàn)槲业膄unction space的維度是無(wú)窮的。好,具體來(lái)說(shuō),那就是現(xiàn)在我們有一個(gè)函數(shù),f(x)。我們希望將它寫成一些cos函數(shù)和一些sin函數(shù)的形式,像這樣
again,這是一個(gè)無(wú)限循環(huán)的函數(shù)。其中的1,cosx, sinx, cos2x …..這些,就是傅立葉級(jí)數(shù)。傅立葉級(jí)數(shù)應(yīng)用如此廣泛的主要原因之一,就是它們這幫子function basis是正交的,這就是有趣的地方了。為什么function basis正交如此重要呢?我們說(shuō)兩個(gè)vector正交,那就是他倆的內(nèi)積為0。那對(duì)于function basis呢?function basis怎么求內(nèi)積呢?
現(xiàn)在先復(fù)習(xí)一下vector正交的定義。我們說(shuō)兩個(gè)vector v,w如果正交的話,應(yīng)符合:
那什么是function正交呢?假設(shè)我們有兩個(gè)函數(shù)f(x)和g(x),那是什么?我們遵循vector的思路去想,兩個(gè)vector求內(nèi)積,就是把他們相同位置上對(duì)應(yīng)的點(diǎn)的乘積做一個(gè)累加。那移過(guò)來(lái),就是對(duì)每一個(gè)x點(diǎn),對(duì)應(yīng)的f和g做乘積,再累加。不過(guò)問(wèn)題是,f和g都是無(wú)限函數(shù)阿,x又是一個(gè)連續(xù)的值。怎么辦呢?向量是離散的,所以累加,函數(shù)是連續(xù)的,那就是…….積分!
我們知道函數(shù)內(nèi)積是這樣算的了,自然也就容易證明,按照這個(gè)形式去寫的傅立葉展開(kāi),這些級(jí)數(shù)確實(shí)都是兩兩正交的。證明過(guò)程這里就不展開(kāi)了。好,下一個(gè)問(wèn)題就是,為什么它們是正交basis如此重要呢?這就牽涉到系數(shù)的求解了。我們研究了函數(shù)f,研究了級(jí)數(shù),一堆三角函數(shù)和常數(shù)1,那系數(shù)呢?a0, a1, a2這些系數(shù)該怎么確定呢?好,比如我這里準(zhǔn)備求a1了。我現(xiàn)在知道什么?信號(hào)f(x)是已知的,傅立葉級(jí)數(shù)是已知的,我們?cè)趺辞骯1呢?很簡(jiǎn)單,把方程兩端的所有部分都求和cosx的內(nèi)積,即:
然后我們發(fā)現(xiàn),因?yàn)檎坏男再|(zhì),右邊所有非a1項(xiàng)全部消失了,因?yàn)樗麄兒蚦osx的內(nèi)積都是0!所有就簡(jiǎn)化為
這樣,a1就求解出來(lái)了。到這里,你就看出正交的奇妙性了吧:)
好,現(xiàn)在我們知道,傅立葉變換就是用一系列三角波來(lái)表示信號(hào)方程的展開(kāi),這個(gè)信號(hào)可以是連續(xù)的,可以是離散的。傅立葉所用的function basis是專門挑選的,是正交的,是利于計(jì)算coefficients的。但千萬(wàn)別誤解為展開(kāi)變換所用的basis都是正交的,這完全取決于具體的使用需求,比如泰勒展開(kāi)的basis就只是簡(jiǎn)單的非正交多項(xiàng)式。
有了傅立葉變換的基礎(chǔ),接下來(lái),我們就看看什么是小波變換。首先來(lái)說(shuō)說(shuō)什么是小波。所謂波,就是在時(shí)間域或者空間域的震蕩方程,比如正弦波,就是一種波。什么是波分析?針對(duì)波的分析拉(囧)。并不是說(shuō)小波分析才屬于波分析,傅立葉分析也是波分析,因?yàn)檎也ㄒ彩且环N波嘛。那什么是小波呢?這個(gè)”小“,是針對(duì)傅立葉波而言的。傅立葉所用的波是什么?正弦波,這玩意以有著無(wú)窮的能量,同樣的幅度在整個(gè)無(wú)窮大區(qū)間里面振蕩,像下面這樣:
那小波是什么呢?是一種能量在時(shí)域非常集中的波。它的能量是有限的,而且集中在某一點(diǎn)附近。比如下面這樣:
這種小波有什么好處呢?它對(duì)于分析瞬時(shí)時(shí)變信號(hào)非常有用。它有效的從信號(hào)中提取信息,通過(guò)伸縮和平移等運(yùn)算功能對(duì)函數(shù)或信號(hào)進(jìn)行多尺度細(xì)化分析,解決了傅立葉變換不能解決的許多困難問(wèn)題。恩,以上就是通常情況下你能在國(guó)內(nèi)網(wǎng)站上搜到的小波變換文章告訴你的。但為什么呢?這是我希望在這個(gè)系列文章中講清楚的。不過(guò)在這篇文章里,我先點(diǎn)到為止,把小波變換的重要特性以及優(yōu)點(diǎn)cover了,在下一篇文章中再具體推導(dǎo)這些特性。
小波變換的本質(zhì)和傅立葉變換類似,也是用精心挑選的basis來(lái)表示信號(hào)方程。每個(gè)小波變換都會(huì)有一個(gè)mother wavelet,我們稱之為母小波,同時(shí)還有一個(gè)scaling function,中文是尺度函數(shù),也被成為父小波。任何小波變換的basis函數(shù),其實(shí)就是對(duì)這個(gè)母小波和父小波縮放和平移后的集合。下面這附圖就是某種小波的示意圖:
從這里看出,這里的縮放倍數(shù)都是2的級(jí)數(shù),平移的大小和當(dāng)前其縮放的程度有關(guān)。這樣的好處是,小波的basis函數(shù)既有高頻又有低頻,同時(shí)還覆蓋了時(shí)域。對(duì)于這點(diǎn),我們會(huì)在之后詳細(xì)闡述。
小波展開(kāi)的形式通常都是這樣(注意,這個(gè)只是近似表達(dá),嚴(yán)謹(jǐn)?shù)恼归_(kāi)形式請(qǐng)參考第二篇):
其中的
模擬信號(hào)相關(guān)文章:什么是模擬信號(hào)
評(píng)論