基于s3c2410聲音頻譜分析系統(tǒng)設(shè)計_第1頁
已閱讀1頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、<p><b>  摘要</b></p><p>  頻譜分析是將信號表示成不同頻率的正弦分量或虛指數(shù)分量的疊加,即從頻率的角度分析信號,它在聲音處理、圖像處理、數(shù)字音頻、地震勘探等方面有著廣泛的應用??焖俑盗⑷~(FFT)算法和S3C2410芯片的出現(xiàn),為頻域分析的實時處理提供了有效的解決方案。</p><p>  本文對基于S3C2410的聲音信號頻譜分析

2、系統(tǒng)進行了開發(fā),主要工作如下:</p><p>  首先,對聲音信號的時域和頻域處理方法進行了分析,根據(jù)聲音信號短時平穩(wěn)的特點,詳細闡述了其短時分析方法,并探討了聲音信號的基音周期檢測方法。</p><p>  然后,詳細介紹了本系統(tǒng)采用的主要硬件設(shè)備的功能和特點,包括S3C2410芯片。在此基礎(chǔ)上,完成了系統(tǒng)的硬件和軟件設(shè)計,給出了核心程序?qū)崿F(xiàn)過程及部分原代碼,實現(xiàn)了一種基于S3C241

3、0的聲音頻譜分析系統(tǒng)。該系統(tǒng)結(jié)構(gòu)簡單、使用方便,可利用ARM9強大的數(shù)據(jù)處理功能對聲音信號進行頻譜分析。</p><p>  最后,對此設(shè)計方案進行了理論分析和仿真實驗,并在S3C2410上就一些相關(guān)問題做了實驗,取得較為滿意的結(jié)果,驗證了該系統(tǒng)的可行性。</p><p>  關(guān)鍵詞:聲音頻譜分析;聲音處理;快速傅立葉變換;S3C2410</p><p><b

4、>  Abstract</b></p><p>  Signal is regarded as superposition of different frequency sine component or virtual function component in spectrum analysis.Spectrum analysis is applied extensively in the

5、speech processing,image processing,digital audio,seismic exploration etc..Since fast Fourier transform(FFT)and S3C2410chip appeared,it provides effective solutions for real-time</p><p>  processing of spectr

6、um analysis.</p><p>  This thesis developed spectrum analysis system based on speechS3C2410.Major works areas follows:</p><p>  First,the time—domain processing and frequency-domain processing o

7、f speech signal are introduced in this thesis.According to short·term stationary characteristics of speech signal,the thesis exposition short—term analysis method in detail.And also discuss the pitch detection</p

8、><p>  method based on speech signal.</p><p>  Second.the functions and features of main hardware equipments are introduced.This system include S3C2410 .The systems hardware and software design are

9、 completed and part of source code about core procedure are provided.We developed the spectrum analysis system of speech signal based on S3C2410.The system has a simple structure and is easy to use.while we use the power

10、ful processing function of S3C2410 to analyze speech signal.</p><p>  Finally,the total scheme of this system is demonstrated in theory and is tested on the S3C2410,and results is satisfactory.Analysis resul

11、ts prove that the system is feasible.</p><p>  Key Words:Spectrum Analysis;Speech Processing;FFT;S3C2410</p><p><b>  目錄</b></p><p><b>  摘要1</b></p>&

12、lt;p>  Abstract2</p><p><b>  引言5</b></p><p><b>  1 緒論6</b></p><p>  1.1 課題研究的背景和意義6</p><p>  1.2頻譜分析系統(tǒng)的發(fā)展現(xiàn)狀7</p><p>  1.3本課

13、題的主要任務8</p><p>  2 聲音信號的時域分析9</p><p>  2.1 聲音信號的抽樣及其數(shù)字化9</p><p>  2.2聲音信號的時間依賴10</p><p>  2.3 短時自相關(guān)函數(shù)11</p><p>  2.3.1 自相關(guān)函數(shù)的定義和性質(zhì)11</p><p

14、>  2.3.2短時自相關(guān)函數(shù)12</p><p>  2.4基音周期估計方法12</p><p>  2.4.1 基音檢測預處理13</p><p>  2.4.2自相關(guān)法基音檢測算法13</p><p>  2.4.3基音檢測的后處理14</p><p>  3 聲音信號頻域分析15</p&

15、gt;<p>  3.1 頻譜分析原理與方法15</p><p>  3.1.1頻譜分析原理15</p><p>  3.1.2頻譜分析方法17</p><p>  3.2傅里葉變換的原理及算法18</p><p>  3.2.1 傅立葉變換的基本定義18</p><p>  3.2.2離散傅立

16、葉變換19</p><p>  3.2.3快速傅立葉變換20</p><p>  3.3短時傅立葉變換21</p><p>  3.4基于短時傅立葉變換的語譜圖22</p><p>  3.5基音同步分析方法23</p><p>  3.5.1 短時頻譜用于基音檢測23</p><p&g

17、t;  3.5.2基音同步頻譜分析24</p><p>  4 S3C2410微處理器簡介26</p><p><b>  4.1概述26</b></p><p>  4.2S3C2410芯片功能及內(nèi)部結(jié)構(gòu)26</p><p>  4.2.1S3C2410芯片功能單元26</p><p>

18、;  4.2.2S3C2410系統(tǒng)管理27</p><p>  4.3ADC和觸摸屏接口操作27</p><p>  4.3.1 結(jié)構(gòu)圖27</p><p>  4.3.2 觸摸屏接口舉例28</p><p>  4.4 功能描述29</p><p>  4.4.1 A/D 轉(zhuǎn)換時間29</p>

19、<p>  4.4.2 觸摸屏接口工作模式29</p><p>  5頻譜分析系統(tǒng)設(shè)計與實現(xiàn)31</p><p>  5.1聲音采集軟硬件設(shè)計方案31</p><p>  5.1.1聲音采集硬件系統(tǒng)設(shè)計方案31</p><p>  5.1.2聲音采集軟件系統(tǒng)設(shè)計32</p><p>  5.2基

20、于S3C2410聲音頻譜分析系統(tǒng)的軟件設(shè)計32</p><p>  5.2.1基于S3C2410處理器器的LCD顯示原理32</p><p>  5.2.2ADC驅(qū)動程序設(shè)計34</p><p>  5.2.3FFT的程序設(shè)計35</p><p>  5.3運行效率分析36</p><p><b>

21、  結(jié)論37</b></p><p><b>  參考文獻38</b></p><p><b>  致  謝39</b></p><p><b>  引言</b></p><p>  目前,嵌入式技術(shù)已經(jīng)廣泛深入的融入到了各行各業(yè)當中,日常生活的各個角落都可以

22、看到嵌入式技術(shù)的身影。相對于通用PC,嵌入式系統(tǒng)是專門針對某一特定領(lǐng)域進行優(yōu)化設(shè)計的系統(tǒng),具有軟硬件可裁剪,成本低,體積小,功耗低,可靠性高等特點。手機,PDA,傳真機,打印機,自動販賣機等都是典型的嵌入式系統(tǒng)。這里,簡單介紹一些嵌入式系統(tǒng)的定義。廣義來說,凡是不用于通用目的的可編程計算機設(shè)備,就可以算是嵌入式計算機系統(tǒng)。狹義而言,嵌入式系統(tǒng)是指以應用為核心,以計算機技術(shù)為基礎(chǔ),軟硬件可裁剪,適于應用系統(tǒng)對功能、可靠性、成本、體積和功耗

23、要求嚴格的專用計算機系統(tǒng)。嵌入式系統(tǒng)的核心部件是嵌入式處理器,嵌入式處理器目前主要有ARM,Aml86/88,386EX,SC一400,Power PC,68000,MIPS系列等。對于開發(fā)者而言,可以根據(jù)各自的實際需求選擇不同的嵌入式處理器。將嵌入式技術(shù)與頻譜分析相結(jié)合,其功能將更加強大。其中ARM處理器核中自帶了DSP功能,既可以執(zhí)行算法還可以進行事務處理,并且支持廣泛的操作系統(tǒng),適應于未來智能化發(fā)展方向。結(jié)合ARM技術(shù)的信號頻譜分

24、析模塊,集運算,顯示,良好的用戶界面為一體,</p><p><b>  1 緒論</b></p><p>  1.1 課題研究的背景和意義</p><p>  自然界的運動和變化都有它們的固有規(guī)律,其中很多規(guī)律表現(xiàn)為周期性。大至宇宙天體,小至基本粒子,它們的運動都有周期性。人類社會的發(fā)展也有周期性,這就是為什么很多歷史事件具有驚人的相似性。不

25、管是簡單的重復,還是螺旋式的上升,都是周期性的表現(xiàn)。人耳對聲音敏感的不是聲波本身而是聲波的頻率,例如男聲、女生和低音、高音;人眼對光敏感的不是光波本身,而是光波的頻率(顏色),例如紅光、綠光。所以,頻率的概念和時間的概念一樣重要。這就是為什么人們把頻域和時域相提并論。</p><p>  頻譜分析在生產(chǎn)實踐和科學研究中有著廣泛的應用。例如,對各類旋轉(zhuǎn)機械、電機、機床等機器的主體或部件進行實際運行狀態(tài)下的譜分析,可

26、以提供設(shè)計數(shù)據(jù)和檢驗設(shè)計結(jié)果,或者診斷故障,保證設(shè)備的安全運行等。在聲納系統(tǒng)中,為了尋找海洋水面船只或潛艇,需要對噪聲信號進行頻譜分析,以提供有用信息,判斷艦艇運行速度、方向、位置、大小等。因此,對頻譜分析方法的研究一直是信號處理技術(shù)中的一個重要課題。</p><p>  所謂頻譜分析就是頻域分析,頻譜估計就是周期性估計。頻譜分析和估計不僅是揭示信號特征的重要方法,也是處理信號的重要手段。這些方法和手段已經(jīng)廣泛地

27、應用于通信、雷達、地震、聲納、生物醫(yī)學、物理、化學、音樂、經(jīng)濟等領(lǐng)域。地震信號的處理和股票市場的預測就是其中兩個例子。如此廣泛的應用主要歸功于聲音處理理論和技術(shù)的進步,因為快速傅立葉變換FFT算法和S3C2410芯片的出現(xiàn),為各式各樣的頻域問題,提供了一個統(tǒng)一的、經(jīng)濟的、單片繼承的解決辦法。</p><p>  頻譜分析儀,顧名思義它的功能是確定一個變化過程(稱為信號)的頻率成份,以及各頻率成份之間的相對強弱關(guān)系

28、。頻譜儀是和示波器相對偶的,它們具有同樣的重要性。示波器在時域里顯示或表征(輸入)信號,而頻譜儀在頻域里顯示或表征(輸入)信號。</p><p>  傳統(tǒng)的頻譜分析儀主要依靠硬件來測量頻率成份,例如用濾波器來分開各頻率成份。對模擬濾波器設(shè)計制造有經(jīng)驗的人,不難想象制造高穩(wěn)定度、高精度的這種頻譜分析儀的困難程度。首先是設(shè)計所得的元件值,幾乎全是非標準的。而且必須先經(jīng)過“老化”。其次是濾波器中心頻率會隨時間、環(huán)境溫度

29、“漂移”,還有調(diào)試等問題。利用S3C2410芯片來設(shè)計頻譜分析系統(tǒng)則可以較好解決這些問題。因為頻譜分析主要是依靠軟件來計算頻率成份。</p><p>  1.2頻譜分析系統(tǒng)的發(fā)展現(xiàn)狀</p><p>  頻譜分析儀是以模擬或數(shù)字方式顯示信號頻譜的一類信號分析儀。頻譜分析儀大體可分為掃描調(diào)諧式頻譜儀及傅立葉分析儀兩大類。掃描調(diào)諧式頻譜儀如掃頻超外差接收機,能分別顯示復雜信號中各個不同頻率分量

30、的幅度,但不能提供相關(guān)相位信息。這類儀器主要用于連續(xù)信號和周期信號的頻譜分析。其優(yōu)點是具有大的動態(tài)范圍及寬的頻率范圍(5Hz~325kHz),但不適合做瞬態(tài)信號及超低頻信號的分析。傅立葉分析儀采用數(shù)字采樣及數(shù)學變換(以傅立葉變換為基礎(chǔ))技術(shù)得到被測信號的傅立葉頻譜。采用傅立葉分析儀能在被測信號存在的有限時間內(nèi),提取信號的全部頻譜信息,并能顯示頻率、幅值及相位。傅立葉分析儀基本上用于低頻信號(10uHz~l00kHz)的分析以及要求實時快

31、速測量的場合。與前一類頻譜儀相比,傅立葉分析儀可以十倍、百倍地提高測量速度并能在超低頻時保持頻率測量精度。由于采用傅立葉分析儀能同時測量每個頻率分量的幅值和相位,適合于分析暫態(tài)過程,測量多個信號的統(tǒng)計特性,評價兩個或多個信號之間的連接特性及相關(guān)性等。</p><p>  掃描調(diào)諧式頻譜分析儀己從早期的單通道頻率響應分析儀擴展到多通道,其典型代表是英國公司的1250頻響分析儀,它配上相應的擴展器可擴展到36通道。天

32、津電子儀器廠生產(chǎn)的TDl250具有類似的性能。與傅立葉(FFT)頻譜分析儀相比,這類頻響分析儀只局限于頻響分析,應用范圍較窄,其優(yōu)點是具有自動抑制噪聲能力,而且頻率范圍寬。目前生產(chǎn)傅立葉分析儀的國家較多,從占領(lǐng)世界市場的情況看,美國居首位,其次為同、法、英、丹麥、中國等。我國先后引進的這類產(chǎn)品HP3562A,HP35660A,HP3567A,CF.920,CF.930/940,B&K2034,SOLARTRONl220等幾十種。

33、具有代表性的是HP3567A多通道頻譜/網(wǎng)絡(luò)分析儀,頻率范圍可達102.4kHz,動態(tài)范圍80dB,精度0.1 dB,最高通道數(shù)可達16,可實現(xiàn)譜分析、波形分析及網(wǎng)絡(luò)分析。</p><p>  1965年庫利一圖基在《計算數(shù)學》雜志上發(fā)表了快速傅立葉變換(FFT)算法,F(xiàn)FT和頻譜分析很快發(fā)展成為機械設(shè)備故障診斷、震動分析、無線電通信、信息圖像處理和自動控制等多種學科重要的理論基礎(chǔ)。傅立葉分析儀的發(fā)展趨勢是:分析

34、頻段向高頻擴展,向多通道、高指標、多功能發(fā)展,核心處理芯片用S3C2410,體積更趨小型化。國內(nèi)自80年代初就有不少單位開始了基于FFT的頻譜分析儀的研制,但由于國內(nèi)在基本元器件、基本配套件和基本工藝三方面落后于發(fā)達國家,因而多數(shù)走的是“以軟件代替硬件”的道路,即以IBM PC/AT等微機為核心,配上A/D轉(zhuǎn)換板及S3C2410芯片,以微機軟件為主實現(xiàn)各種數(shù)字信號處理功能及顯示功能。因而,具有研制周期短、靈活性好、價格低的優(yōu)點;缺點是高

35、速實時性能較差,不適用于惡劣環(huán)境。國內(nèi)不少單位己生產(chǎn)出不同性能的動態(tài)信號分析系統(tǒng)、FFT信號分析儀等,在開發(fā)性能優(yōu)越的動態(tài)信號分析軟件包方面,國內(nèi)一些高等院校具有一定優(yōu)勢。</p><p>  雖然使用FFT技術(shù)對瞬態(tài)過程和平穩(wěn)過程的頻譜分析己有很長的歷史,但是,聲音過程與一個穩(wěn)定的元音和擦音不同。當激勵和聲道特性改變時,所得到的聲音信號特性隨時間發(fā)生變化。因此,適用于平穩(wěn)隨機信號的標準傅立葉變換不能直接用于聲音

36、信號。對聲音頻譜分析應能得到時變頻譜參數(shù)。但在相對短的時隙內(nèi),聲音信號可看作準周期性序列。將短時分析思想應用于聲音頻譜分析,可得到聲音時變頻譜。</p><p>  1.3本課題的主要任務</p><p>  從上面簡單的介紹可以看出,傳統(tǒng)的頻譜分析儀不能象通用計算機那樣,對過去記錄下來的信號進行非實時處理,它只有加上輸入信號才能進行分析。然而,基于S3C2410頻譜儀可以象通用計算機一樣

37、用作非實時處理。基于S3C2410頻譜儀的缺點是,在目前S3C2410芯片制造技術(shù)的條件下,可以實時處理的最高頻率只達到兆赫的數(shù)量級,更高頻率的信號可以進行非實時處理,實時處理有待于S3C2410芯片速度的進一步提高,或者增加測量手段。</p><p>  根據(jù)現(xiàn)有的條件,本文所要研究的是一個基于S3C2410的聲音信號頻譜分析系統(tǒng)。本系統(tǒng)以ARM9為基礎(chǔ),利用ARM9強大的數(shù)據(jù)處理能力來對采集到的聲音信號進行頻

38、譜分析。聲音信號是時變信號,然而,聲音信號的特性隨時間變化比較緩慢,大致可以認為在每10ms至30ms短時時間間隔內(nèi)信號的特性基本不變,可以認為是時不變的。女性的基音頻率從100Hz至500Hz,男性的基音頻率為50Hz至250Hz,頻率分辨率必須兼顧男女性。對于本頻譜分析系統(tǒng)軟件設(shè)計是非常重要的一環(huán),我們是基于這樣的思想來進行軟件設(shè)計的。軟件設(shè)計主要實現(xiàn)的功能有基音檢測、頻譜分析及分析結(jié)果在PC機屏上顯示。</p>&l

39、t;p>  2 聲音信號的時域分析</p><p>  語言是聲音的聲學表現(xiàn),是人類信息交流最自然、最有效、最方便的手段,也是人類進行思維的一種依托。人類開始進入了信息化時代,用現(xiàn)代手段研究聲音處理技術(shù),使人們能夠更加有效地產(chǎn)生、傳輸、存儲和獲取聲音信號,這對于促進社會的發(fā)展具有十分重要的意義。</p><p>  聲音信號是一個時間序列,進行聲音分析時,最直觀的就是它的時域波形。時

40、域分析直觀明了,計算簡單且運算量小(相比后面將要介紹的頻譜分析)。時域分析提供了最基本也是很重要的用于聲音分析的參數(shù),廣泛用于聲音的預處理等方面。</p><p>  2.1 聲音信號的抽樣及其數(shù)字化</p><p>  模擬聲音信號是連續(xù)信號,無法被DSP處理。因此聲音處理的第一步是將模擬信號轉(zhuǎn)化為數(shù)字信號,也就是常說的模/數(shù)轉(zhuǎn)換,這其中主要包括兩個步驟:采樣和量化。</p>

41、<p>  聲音信號是隨時間而變的信號,它所占據(jù)的頻率范圍可達10kHz以上,但是對聲音信號清晰度和可懂度有明顯影響的成份,最高頻率約為5.7kHz。但聲音信號本身冗余度是比較大的,少數(shù)輔音清晰度下降并不明顯影響語句的可懂度。</p><p>  一個正常人聲音的頻率一般在40Hz~4000Hz的范圍內(nèi),成年男子的聲音頻率較低,婦女和兒童的聲音頻率較高。電話聲音頻率范圍在60Hz~3400Hz左右。

42、現(xiàn)代的聲音合成或識別系統(tǒng)中,需將聲音頻率的上限提高到10kHz左右。根據(jù)奈奎斯特采樣定律(Nyquist Sampling Theorem),采樣頻率應為原始聲音頻率的兩倍以上,考慮到濾波器性能的影響,這個閾值還應該提高。一般來說,電話聲音的采樣率為8kHz(G.71 1標準),普通聲音的采樣率在15kHz~20kHz左右。否則,如果采樣率不滿足采樣定律,將會產(chǎn)生頻譜混疊,使信號中的高頻失真。</p><p> 

43、 考慮到高頻噪音的存在,為了防止頻率高于二分之一采樣頻率的高頻噪音產(chǎn)生頻譜混疊,通常聲音信號在采樣前要進行一次預濾波以濾掉高頻噪音。預濾波還有一個目的是避免50Hz的電源干擾,因此預濾波是一個帶通濾波器,其下截止頻率=50 Hz,上截止頻率根據(jù)需要定義。</p><p>  采樣后的聲音數(shù)據(jù)要能為DSP所存儲和處理還必須進行量化處理。量化過程中,不可避免地會引入誤差。量化時,如果采用較多的量化級數(shù)來記錄樣點的幅度

44、,量化誤差就較小,相應的比特(Bit)數(shù)就會增多。但是這是以增加存儲容量和處理時的計算量為代價的,因此必須根據(jù)應用場合合理地選擇量化字長。</p><p>  2.2聲音信號的時間依賴</p><p>  由于人自身的發(fā)音器官的運動,聲音信號是一種典型的非平穩(wěn)信號。但是,由于聲音的形成過程是與器官的運動密切相關(guān)的,這種物理運動比起聲音振動速度來要緩慢得多,因此聲音信號常常可假設(shè)為短時平穩(wěn)的

45、,即在10~30ms這樣的時間段內(nèi),其頻譜特性和某些物理特征參量可近似地看作是不變的。幾乎所有的聲音信號處理方法都是基于這個假設(shè)。這樣,我們就可以采用平穩(wěn)過程的分析處理方法來處理了。以后的幾乎所有的處理方法都立足于這種短時平穩(wěn)的假定。本章所要討論的短時能量、短時平均差幅度以及自相關(guān)函數(shù),都是在這種短時平穩(wěn)假設(shè)下從時域來分析一些物理參量。這種時間依賴處理的基本手段,是用一個長度有限的窗序列{w(m)}截取一段聲音信號來進行分析,并讓這個窗

46、滑動以便分析任一時刻附近的信號,其一般表達式為:</p><p> ?。?.1) </p><p>  其中T[·]表示某種運算,x(m)為輸入信號序列。幾種常用時間依賴處理方法是:</p><p>  當T[x(m)]為時,相應于短時能量;</p><p>  當T[x(m)]=|sgn[x(m)

47、]一sgn[x(m-1)]|時,就是短時平均過零率;</p><p>  當T[x(m)]為x(m)x(m+k)時,就是短時自相關(guān)函數(shù)。</p><p>  式(2.1)是卷積形式的,因此Q可以理解為離散信號T[x(m)]經(jīng)過一個單位沖激響應為{w(m)}的FIR低通濾波器產(chǎn)生的輸出,如圖2.1所示。</p><p><b> ?。?lt;/b>&l

48、t;/p><p>  圖2.1短時分析原理的一般表示</p><p>  由于窗函數(shù)一般取為(x,z)中間大兩頭小的光滑函數(shù),這樣的沖激響應所對應的濾波器具有低通特性。其帶寬和頻率響應取決于窗函數(shù)的選擇。用得最多的三種窗函數(shù)是矩形(Rectangular)窗、漢明(Hamming)窗和漢寧(Hanning)窗。</p><p><b>  1) 矩形窗 <

49、;/b></p><p>  矩形窗屬于時間變量的零次冪窗。矩形窗使用最多,習慣上不加窗就是使信號通過了矩形窗。這種窗的優(yōu)點是主瓣比較集中,缺點是旁瓣較高,并有負旁瓣,導致變換中帶進了高頻干擾和泄漏,甚至出現(xiàn)負譜現(xiàn)象。 </p><p><b>  2) 三角窗 </b></p><p>  三角窗亦稱費杰(Fejer)窗,是冪窗的一次方

50、形式。與矩形窗比較,主瓣寬約等于矩形窗的兩倍,但旁瓣小,而且無負旁瓣。 </p><p>  3) 漢寧(Hanning)窗 </p><p>  漢寧窗又稱升余弦窗,漢寧窗可以看作是3個矩形時間窗的頻譜之和,或者說是 3個sin(t)型函數(shù)之和,而括號中的兩項相對于第一個譜窗向左、右各移動了π/T,從而使旁瓣互相抵消,消去高頻干擾和漏能??梢钥闯?,漢寧窗主瓣加寬并降低,旁瓣則顯著減小,從

51、減小泄漏觀點出發(fā),漢寧窗優(yōu)于矩形窗.但漢寧窗主瓣加寬,相當于分析帶寬加寬,頻率分辨力下降。</p><p>  這些窗函數(shù)都有低通特性。矩形窗的主瓣寬度最小,但其旁瓣高度最高;漢明窗的主瓣最寬,而旁瓣高度最低。漢寧窗和漢明窗的差異在于前者隨頻率增加衰減很快,而后者基本保持一個常量。矩形窗的旁瓣太高,會產(chǎn)生嚴重的泄露現(xiàn)象(Gibbs),因此只在某些特殊場合中采用;漢寧窗衰減太快,低通特性不平滑;漢明窗旁瓣最低,可以

52、有效地克服泄露現(xiàn)象,具有更平滑的低通特性。漢明窗由于其平滑的低通特性和最低的旁瓣高度而得到最為廣泛的應用。</p><p>  長窗具有較高的頻率分辨率,但具有較低的時間分辨率;短窗的頻率分辨率低,但卻具有較高的時間分辨率。對于同一種窗函數(shù),主瓣寬度與窗長成反比,一般說來,窗長越長,它對信號的平滑作用越厲害,如果想要反映變化快的信息,應該縮短窗長。在對聲音信號進行短時傅立葉分析時,窗的長度的選擇必須折中進行考慮。

53、一方面,短窗具有較好的時間分辨率因而能夠提取出聲音信號中的短時變化,但同時卻損失了頻率分辨率。還應當注意到,聲音信號的基音周期是有一個覆蓋范圍的,因此,窗寬的選擇還應當考慮到這個因素。</p><p>  2.3 短時自相關(guān)函數(shù)</p><p>  2.3.1 自相關(guān)函數(shù)的定義和性質(zhì)</p><p>  能量有限信號{x(m,z)}的自相關(guān)函數(shù)定義為: </p

54、><p><b> ?。?.2)</b></p><p>  信號的自相關(guān)函數(shù)具有一些有用的性質(zhì):</p><p><b>  (1)偶性:</b></p><p>  (2),即零滯后自相關(guān)值最大。</p><p>  (3)若{x(n)}為能量有限信號,則其能量為;</

55、p><p>  2.3.2短時自相關(guān)函數(shù)</p><p>  這種修正自相關(guān)函數(shù)又稱為協(xié)方差函數(shù),它不具有偶對稱性,即。自相關(guān)函數(shù)的計算,除直接計算之外,還有多種快速算法。例如:快速傅立葉變換法、遞歸計算法等。目前,高速數(shù)字信號處理器可以在一個很短的指令周期內(nèi)做一次乘加運算,而且專為卷積運算、遞歸運算設(shè)計了一些效率很高的運算指令。所以,如果采用數(shù)字信號實現(xiàn)自相關(guān)運算,常常是直接進行計算反而更加

56、簡單有效,不必采用結(jié)構(gòu)復雜的快速算法。自相關(guān)計算在功率譜估計、線性預測分析和基音檢測等方面經(jīng)常用到。</p><p>  2.4基音周期估計方法</p><p>  基音周期(或基音頻率)是聲音信號的一個重要參數(shù),在聲音產(chǎn)生的數(shù)字模型中它也是激勵源的一個重要參數(shù)。在聲音分析、聲音合成和聲音識別中,估計基音周期都是一個重要任務。</p><p>  濁音信號是一種準周

57、期性信號,其周期稱為基音周期。由于它只是準周期性的,所以只能采用短時平均方法估計其周期,基音周期估計也常稱為基音周期檢鋇,t](PitchDetection)。</p><p>  前兩節(jié)介紹的自相關(guān)函數(shù)和短時平均幅度差函數(shù)都能反映原信號的周期,因此它們可構(gòu)成兩種最常用的基音檢測方法。聲音信號包含十分豐富的諧波分量,基音頻率最低可達80Hz左右,最高可達500Hz左右,但基音頻率處在100Hz~200Hz的情況占

58、多數(shù)。因此,濁音信號可能包含有三四十次諧波分量,而其基波分量往往不是最強的分量。因為聲音信號的第一共振峰通常在300Hz~lkHz范圍內(nèi),這就是說,2~8次諧波成份常常比基波分量還強。豐富的諧波成份使聲音信號的波形變得非常復雜,給基音檢測帶來了困難,經(jīng)常發(fā)生基頻估計結(jié)果為其實際基音頻率的二、三次倍頻或二次分頻的情況。加之還有清濁混雜等情況,使基音檢測和清濁判別成為一大難題??梢哉f,至今沒有一種萬能的方法在任何情況下都能準確可靠地估計出基

59、音周期。</p><p>  值得注意的是,從估計基音周期的角度來看,短時自相關(guān)函數(shù)所包含的信息有許多是多余的。真正反映基音周期的只是其中少數(shù)幾個峰值,而其余大多數(shù)都是由于聲道的諧振特性引起的。因此,為了突出反映基音周期的信息同時壓縮與此無關(guān)的信息,就應該對聲音信號進行適當?shù)念A處理。</p><p>  2.4.1 基音檢測預處理</p><p>  由于聲道的共振

60、峰特性會對基音周期造成干擾,為了提高自相關(guān)法和平均幅度差函數(shù)法檢測基音周期的可靠性,采用兩種預處理方法對原始信號進行預處理:</p><p>  (1)中心削波處理。對于估計基音周期真正有用的只是出現(xiàn)在基音周期處的自相關(guān)峰,其余較低的峰都是多余的。有用的自相關(guān)峰是由于聲音信號中的一些最高峰形成的,這些最高峰是由于準周期激勵脈沖產(chǎn)生的;無關(guān)的峰是聲道對激勵脈沖產(chǎn)生的響應?;谶@種認識,完全有理由采用中心削波處理去掉

61、聲音信號中所有低振幅部分而僅保留高振幅的峰值。</p><p>  (2)先對聲音信號進行低通濾波,然后計算短時自相關(guān)函數(shù)。這樣處理的依據(jù)是,聲音信號的基音頻率一般都在500Hz以下,即使女高音升C調(diào)最高也不會超過lkHz。因此,從只保留基音頻率的角度出發(fā),用低通濾波器事先對聲音信號進行濾波是有好處的。用一個通帶為900Hz的線性相位低通濾波器濾除高次諧波分量,這樣處理以后的信號,基本上只含有第一共振峰以下的基波

62、和諧波分量。實驗表明,用這種方法作預處理,對改善自相關(guān)法和平均幅度差函數(shù)法的基音檢測都有明顯的效果。</p><p>  2.4.2自相關(guān)法基音檢測算法</p><p>  由短時自相關(guān)函數(shù)的定義可知,對于準周期信號,短時自相關(guān)函數(shù)在基音周期的各個整數(shù)倍點上有很大的峰值。如果我們能求得第一最大峰值點并計算其與零點的距離,該距離就是估計出來的基音周期。</p><p>

63、;  下面結(jié)合L.R.Rabiner一篇論文中介紹的具體例子來敘述這種自相關(guān)基音檢測算法計算步驟。這里設(shè)信號的采樣率10kHz,窗序列采用300點長的矩形窗,連續(xù)分析信號時采有10ms(且P 100個樣點)的幀問隔,即每相鄰兩幀重疊200個樣點。截止頻率為900Hz的低通濾波器是一個20階線性相位的有限沖激響應濾波器。下面是對每一幀進行基音周期估計的計算步驟:</p><p>  (1)用900Hz低通濾波器對一

64、幀聲音信號{x(n)}進行濾波,并去掉開頭20個輸出值不用(置0),得到{x(n)};</p><p>  (2)分別求{ x(n)}的前部100個樣點和后部100個樣點的最大幅度,并取其中較小的一個,乘以因子0.68作為門限電平;</p><p>  2.4.3基音檢測的后處理</p><p>  聲音信號的周期性從波形上觀察可以看得很明顯,但是其形狀表現(xiàn)得比較復

65、雜,自動基音檢測算法很難做到處處準確可靠?;糁芷诠乐德湓谄鋵嶋H基音的倍頻或分頻所對應的周期等情況時有發(fā)生。沒有任何一種預測方法能夠準確計算出所有的基音周期。往往大部分的點是比較準確的,但是也有一部分偏離到標準值的兩倍或一半的點,好在聲音信號的基音頻率通常是連續(xù)地緩慢變化的,因此可以采用某種平滑技術(shù)來糾正個別估值的錯誤。常用的平滑技術(shù)有三種:</p><p>  (1)中值濾波平滑處理</p>&l

66、t;p>  中值平滑處理是一種采用滑動窗的直方圖統(tǒng)計處理的方法。其基本原理是:設(shè){x(n)}為輸入信號,{y(n)}為中值濾波器的輸出,窗長為2L+l,那么此處的輸出值y()就是將窗的中心移到處時窗內(nèi)輸入樣點的中值。所謂中值就是將窗內(nèi)的2L+1個輸入樣本進行統(tǒng)計,求出一個累計直方圖,其中1/2分位數(shù)就是中值。</p><p>  例如五點窗,若窗中心處于處時,相應的五個輸入樣本值依次為:x(2),x(-1)

67、,x(),x(+1),x (+2)=4,5,0,6,6。顯然,它們的中值為5,那么中值濾波器的輸出值Y()就是5,而原輸入信號X()=0,通過中值濾波得到了糾正。然后濾波窗向后平移一個樣點,用同樣的方法求出窗內(nèi)樣本的中值,即得到Y(jié)(no+1)。如此進行下去,中值濾波可以糾正個別奇異點而不影響周圍的樣點的值。</p><p>  (2)動態(tài)規(guī)劃平滑處理</p><p>  動態(tài)規(guī)劃平滑處理的

68、基本思想是:定義一個代價函數(shù),由每一步尋找最低累計代價的路徑,達到最終累計總代價最小。 </p><p>  3 聲音信號頻域分析</p><p>  大量的實驗表明,人類感知聲音的過程和聲音本身的頻譜特性關(guān)系密切。人類本身的聽覺對聲音的頻譜特性更為敏感。兩段時域上相差很大的聲音如果具有類似的頻譜特性,人類在感知它們時的感覺也是相似的。聲音信號的頻譜具有非常明顯的語言聲學意義,能反映一些非

69、常重要的聲音特征,比如共振峰頻率和帶寬等。因此,對聲音信號進行頻譜分析,是認識聲音信號和處理聲音信號的重要方法。</p><p>  傅立葉變換是分析線性系統(tǒng)和平穩(wěn)信號穩(wěn)態(tài)特性的強有力手段,它在許多工程和科學領(lǐng)域中得到了廣泛的應用。這種以復指數(shù)函數(shù)為基函數(shù)的正交變換,理論上很完善,計算上很方便,概念上易于為人們理解,在聲音處理領(lǐng)域也是一個非常重要的工具。</p><p>  聲音信號是一種

70、典型的非平穩(wěn)信號,但是其非平穩(wěn)性是由發(fā)音器官的物理運動過程而產(chǎn)生的。這個物理運動過程與聲波振動的速度比起來要緩慢得多,因此我們可以假定它在10ms~30ms這樣短的時間段中是平穩(wěn)的,用前一章所述的時間依賴方法來進行分析處理。短時傅立葉分析,就是在基于短時平穩(wěn)的假定下,用穩(wěn)態(tài)分析的方法處理非平穩(wěn)信號的一種方法,也可稱為時間依賴傅立葉變換。</p><p>  3.1 頻譜分析原理與方法</p><

71、;p>  3.1.1頻譜分析原理</p><p>  頻譜分析主要是指離散傅立葉變換的譜分析。眾所周知,任何信號都可以視作無限個不同頻率的正弦交變信號的疊加,在數(shù)學上它由傅立葉序列來表述。假設(shè)有一周期信號x(f),其周期為乃那么它的傅立葉序列為:</p><p><b>  (3.1)</b></p><p>  式中,,為傅立葉系數(shù),為

72、各次諧波的頻率。</p><p>  對于某一瞬時態(tài)信號可以設(shè)定其周期丁趨向無窮大,這時序列可以化為:</p><p><b>  (3.2)</b></p><p>  這里傅立葉系數(shù)變?yōu)檫B續(xù)的頻率函數(shù):</p><p><b>  (3.3)</b></p><p>  

73、式(3.3)即是著名的傅立葉變換,式(3.2)是傅立葉反變換,如果將信號x(f)經(jīng)A/D采樣變成數(shù)字信號序列x(t),則對照式(3.3)可以得出離散傅立葉變換及其逆變換如式(3.4)和(3.5)所示:</p><p><b>  (3.4)</b></p><p><b>  (3.5)</b></p><p>  式中n

74、,k為序列號,N為數(shù)字信號序列的點數(shù)。</p><p>  若A/D轉(zhuǎn)換的頻率是Z,且采樣點數(shù)為偶數(shù),則序列號k=N/2處代表的頻率為Z/2,序列號k=l處代表的頻率為T/N,其它后代表的頻率以此規(guī)則類推。當采樣點是2的整數(shù)次方時,即可用著名的基2的FFT算法進行快速運算,獲得Y(k)。</p><p>  一般Y(k)的值是復數(shù),對其求模即得該頻率下譜的幅度,一系列的模則構(gòu)成x(n)的離

75、散化的幅度譜(即通常講的頻譜),基于FFT的譜分析稱為線性譜分析。當k固定時的Y(k)的虛部與實部之比即為該頻率成份下的相位,由此還可以構(gòu)成相位譜。如果獲得x(n)點數(shù)不足2的整數(shù)次方,最簡單的辦法就是在實際的x(n)后補若干零值,使其滿足總點數(shù)為2的整數(shù)次方,這樣就可以用常規(guī)的FFT算法。但由于增加了FFT的計算長度,耗時量會顯著加大,因此在目標信號的時間動態(tài)許可范圍內(nèi)應盡可能減少x(n)的點數(shù)。另外,對x(n)的A/D采樣頻率也要滿

76、足奈奎斯特抽樣定律,該定理描述如下:</p><p>  假設(shè)x(f)是一個時間函數(shù),它的最高頻率為Z(截止頻率),則若|f|>時,x(t)的傅立葉變換X(f)=0,那么,該函數(shù)x(t)可以完全由時間間隔的時域抽樣(或者說抽樣頻率)序列唯一確定,即函數(shù)x(t)可以表示為:</p><p><b>  (3.6)</b></p><p> 

77、 顯然,抽樣定理包含著兩個限制,一是頻率函數(shù)的帶寬限制,即時,x(f)=0;一是對抽樣間隔的限制,即=1/(2),它也是最大的抽樣問隔。這種等間隔的抽樣又叫奈奎斯特(Nyquist)抽樣,叫做奈奎斯特抽樣頻率。抽樣定理指的是采樣頻率。實際應用中,一般保留一定的余量,取得比奈奎斯特采樣頻率高于此。</p><p>  3.1.2頻譜分析方法</p><p>  進行FFT運算時,一般先用各種

78、窗函數(shù)給x(n)加權(quán),然后再進行FFT運算,這樣可在一定程度上改善起伏現(xiàn)象。FFT的另一個不足是其分辨率往往較低,即使在x(n)后補上大量的零點,也只能減小FFT運算上Y(k)的離散化間隔,實際上并不能幫助使用者明確頻譜的真正細節(jié),且增加零點數(shù)造成FFT運算的點數(shù)增加,使運算速度大大降低。鑒于FFT分辨力不足的問題,可以用高分辨力的非線性譜分析方法。非線性譜分析的方法很多,如AR模型方法、自回歸滑動平均(ARMA)模型方法、量小交叉嫡方

79、法等,其中AR模型方法問世較早,研究與應用都比較成熟,且有多種較快運算速度的算法。</p><p>  除此之外,由于傅立葉變換無時間局部信息,也就是說,信號x(f)任何時刻的微小變化都會牽動整個頻譜;反過來,任何有限頻段上的信息都不足以確定在任意時間小范圍內(nèi)的函數(shù)x(t)。為了了解實時信號的局部特性,發(fā)展起來了預先加窗的辦法,使頻譜反映時間局部特性。因此,出現(xiàn)了許多基于傅立葉變換的譜分析方法。經(jīng)常應用于工程實踐

80、的除了FFT,還有短時傅立葉變換(STFT)、子波變換(WT)和ZOOM-FFT。從數(shù)學上看,三種不同的變換都是將所研究的信號在一組特定基函數(shù)上的分解問題,但由于基函數(shù)不同,就有了不同的分辨率特征。變換的分辨率特性完全取決于基函數(shù)的特征,即基函數(shù)的頻率帶寬和持續(xù)時間。</p><p>  FFT是在單頻上做分解,即=0,頻率分辨率可以任意設(shè)置,但基函數(shù)在時問軸上無限延伸=,故無時間分辨率。STFT法一旦窗函數(shù)選定

81、,基函數(shù)的包絡(luò)不再改變,只是載波改變,其頻寬和時寬也就確定,所以,時間和頻率分辨率在整個時頻平面固定不變。而且,由于一個窄的波形有一個寬的譜,而一個寬的波形有一個窄的譜,波形和頻譜的寬度兩者不能同時兼顧,即滿足下式所揭示的“不確定性原理"或稱“測不準原理”:</p><p><b>  (3.7)</b></p><p>  在分析信號,尤其是在分析聲音和圖

82、像信號的時候,不同的頻率上需要有不同的分辨率,低頻處應該有較高的頻率分辨率,而在高頻段頻率分辨率可以降低,使頻率分辨率隨頻率f而改變?;诖搜芯勘尘?,為了解決FFT和STFT中時間分辨率與頻率分辨率之間的矛盾,提出了子波變換。子波變換(WT)的公式如下:</p><p><b> ?。?.8)</b></p><p>  WT的基函數(shù)是基本子波的伸縮和平移,取基本子波

83、,g(t)為高斯函數(shù),令,若a減小,包絡(luò)壓縮,同時f增大,載頻升高,也增大。</p><p>  而ZOOM.FFT是用“局部細化放大"的方法,使感興趣的重點頻區(qū)得到較高的分辨率,若輪流按頻區(qū)逐段細化,還可以使整個頻譜圖得到詳細的分析。目前有兩種細化方法,一種是對某一局部的波形做簡單的放大,它并不提高分辨率,比較容易實現(xiàn):另一種是將局部頻段重新處理后得到的較原來頻譜圖上分辨率遠為提高的頻譜圖。</

84、p><p>  應用最廣泛的是移頻式ZOOM-FFT方法,它基于DFT變換的移頻原理,將信號乘以單位旋轉(zhuǎn)因子后,就能把頻率移至所需細化的處,頻率分量停留在頻率為0處的位置上。這樣就形成了一個以為頻率起點的新的信號,然后再將由此做始點的頻率截出感興趣的頻段,按普通FFT工作步驟做頻譜圖,得到的是以為起始點,有限范圍頻段的細化頻譜。</p><p>  綜上所述,目前發(fā)展起來了很多種頻譜分析方法,

85、這些方法都以傅立葉變換為基礎(chǔ)的,可以根據(jù)不同的檢測目的和要求來選用不同的方法。</p><p>  3.2傅里葉變換的原理及算法</p><p>  3.2.1 傅立葉變換的基本定義</p><p>  一個波形的傅立葉變換,其實質(zhì)是把這個波形是把這個波形分解成許多不同頻率的正弦波之和。如果被分解的波形為x(f),那么傅立葉變換在數(shù)學上可表示成:</p>

86、<p><b>  (3.9)</b></p><p>  式中t表示時間,f表示頻率。x(f)稱為x(t)的傅立葉變換,又把x(f)叫做時間函數(shù)的頻譜。</p><p>  式(3.9)是對時間域和頻率域而言的,它可以看作是時間函數(shù)x(t)在頻率域上的表示。顯然,頻率域上所包含的信息和時間域上所包含的信息應該是完全相同的,唯一的差別只是形式不同而己。&

87、lt;/p><p>  通常,x(f)是頻率f的一個復函數(shù),即:</p><p>  R(f)和I(f)分別為實部和虛部,則振幅譜|x(f)|表示為:</p><p><b> ?。?.10)</b></p><p><b>  相位函數(shù)表示為:</b></p><p><

88、b> ?。?.11)</b></p><p>  傅立葉逆變換定義為:</p><p><b> ?。?.12)</b></p><p>  式(3.12)表明,如果已知一個時間窗函數(shù)的傅立葉變換,那么就能夠確定該時間函數(shù)。式(3.9)和式(3.12)叫做傅立葉變換對。傅立葉變換對的存在需滿足時間函數(shù)x(t)在下式意義上是可積

89、的,即。</p><p>  以上是對無限長信號截取無限個樣本值進行計算的,只能進行離散、有限長運算,所以實現(xiàn)傅立葉變換,就必須對(3.9)中無限長信號x(t)做截斷,即截取有限長一段信號,并且對x(t)和x(f)做時域、頻域上的離散化,截取有限個樣本點。對信號做如此處理后進行的傅立葉變換稱作離散傅立葉變換(DFT)。</p><p>  3.2.2離散傅立葉變換</p>&

90、lt;p>  對x(t)進行等間隔采樣離散化,用x(n)表示,且設(shè)x(n)是一個周期為N的周期序列,則x(n)的離散傅立葉變換x(k)后為:</p><p><b>  (3.13)</b></p><p>  (k=0,1…..,N) (3.14)</p><p>  式中,稱為旋轉(zhuǎn)因子。</p>

91、<p>  進行這樣的處理以后,會產(chǎn)生一定的誤差,但在實際中,很多情況下,x(t)是帶限信號,即:x(t)=0(t>)。根據(jù)抽樣定理,當頻域和時域的采樣點足夠多時,這些離散信號時完全能夠代替連續(xù)信號,所以實現(xiàn)傅立葉變換時完全有可能的。</p><p>  如果時域信號x(t)在處是連續(xù)的,為抽樣間隔,那么,存在如下定理:</p><p>  定理1 函數(shù)x(t)以時間間隔t

92、抽樣后的譜是一個周期為l/t的周期函數(shù)。</p><p>  定理2頻譜x(f)以間隔f抽樣后所得到的傅立葉變換(即時域函數(shù))也是一個周期函數(shù)。</p><p>  定理1和定理2表明,時域的抽樣相應于頻域的周期化,頻域的抽樣也相應于時域的周期化,因此有定理3。</p><p>  定理3 函數(shù)x(t)以抽樣間隔抽樣的抽樣序列x(n)的譜,就是將函數(shù)x(t)的譜X(

93、f)以周期為l/進行周期延拓。</p><p>  x(f)的周期延拓,就是把x(f)以周期l/移動到整個頻率軸上。</p><p>  DFT是基于周期性的采樣數(shù)據(jù)而提出的,而事實上,這個周期是由采樣的時間窗所指定的。對在某個時間窗里的采樣數(shù)據(jù)做變換,這個時間窗就被認為是信號的周期了。一旦選定了一個,變換所得的譜的最小間隔就確定了。而且對這個譜再進行反變換所重建的信號,將具有以為間隔的周

94、期性。因此,DFT的一項重要工作就是選取時間窗。</p><p>  另外也應該看到,如果信號x(n)有N個離散的數(shù)據(jù)點,那么要想得到Ⅳ個獨立的正弦波幅值,其計算量正比于,即做次乘法。當N值較大時,其運算量也大的驚人。為了解決這一問題,就要使用快速傅立葉變換的算法(FFT)。</p><p>  3.2.3快速傅立葉變換</p><p><b>  根據(jù)D

95、FT的定義:</b></p><p><b> ?。?.15)</b></p><p>  式中,x(n)是N點離散時間序列,X(k)是x(n)的傅立葉變換。由上式可見,對于k為某一確定值,計算一個X(k),需要N次復數(shù)乘法運算和(N一1)次復數(shù)加法運算。若要計算N點x(后),則需要2次復數(shù)乘法和(N一1)次復數(shù)加法。計算量很大。</p>&

96、lt;p>  根據(jù)不同的實現(xiàn)方法,發(fā)展起來多種FFT算法,其基本原理是利用三角函數(shù)的周期性和對稱性,將較長序列的DFT逐次分解為較短序列的DFT,從而減少運算量。這種方法可以使傅立葉變換的復數(shù)乘法運算量從次減少到(N/2)次。當N=1024時,運算量節(jié)省近200倍。這種分解基本上分為兩類:一類是將時間序列x(n)進行逐次分解,由此得到的FFT算法稱為按時間抽取算法;另一類是將傅立葉變換序列x(k)進行分解,叫做按頻率抽取算法。對這

97、兩種算法,庫利一圖基和桑德一圖基進行了理論推導,故又稱庫利一圖基算法和桑德一圖基算法。對每一算法,按基本的蝶形運算的構(gòu)成又分為基2、基4、基8以及任意因子等的FFT算法。</p><p>  3.3短時傅立葉變換</p><p>  短時傅立葉分析是分析緩慢時變頻譜的一種簡便方法,在聲音分析中已經(jīng)得到廣泛應用。其方法是,先將聲音信號分成短段,再將各短段進行傅立葉變換。各聲音段可以認為是從各

98、個不同的平穩(wěn)信號波形中截取出來的,各段聲音的短時頻譜就是各個平穩(wěn)信號波形的頻譜的近似。</p><p>  信號{x(n)}的短時傅立葉變換的定義為:</p><p><b> ?。?.16)</b></p><p>  其中{w(n)}為一窗序列,顯然是個二維函數(shù),也稱時頻函數(shù)。</p><p>  我們可以從兩個角度

99、來理解時頻函數(shù)的物理意義:</p><p>  第一種理解是:當n固定時,例如n=,則是將窗函數(shù)的起點移至處截取信號x(n),再做傅立葉變換而得到的一個頻譜函數(shù)。這是直接由式(3.28)從頻率軸方向來理解的。第二種解釋是從時間軸方向來理解:當頻率固定時,例如w=wk,則可看作是信號經(jīng)過一個中心頻率為的帶通濾波器后產(chǎn)生的輸出。這是因為式(3.28)中窗序列函數(shù){w(n)}通常具有低通頻率響應,而的傅立葉變換為,這里

100、的指數(shù)對x(n)的調(diào)制作用,是使其頻譜產(chǎn)生移位,即將x(n)頻譜中對應于頻率的分量平移到零頻。</p><p>  3.4基于短時傅立葉變換的語譜圖</p><p>  短時傅立葉變換幅度的平方是信號x(n)在時間n處的頻譜能量密度函數(shù)。因為當我們把x(n)看成是能量有限信號時,其頻譜能量在頻域是連續(xù)分布的,只能以密度函數(shù)的形式給出。不難證明,它是信號x(n)的短時自相關(guān)函數(shù)的傅立葉變換,

101、即:</p><p><b>  (3.17)</b></p><p>  其中短時自相關(guān)函數(shù)定義為:</p><p><b>  (3.18)</b></p><p>  在實際計算時,一般用離散傅立葉代替連續(xù)傅立葉變換,這就需要對信號進行周期性擴展,也就是把x(n)w(n)看成是某個周期性信號的

102、一個周期,然后對它作離散傅立葉變換,這時得到的是功率譜。值得注意的是,如果窗長為L,那么x(n)w(n)的長度為L,則的長度為2L。如果我們對x(n)w(n)以L為周期進行擴展的話,在自相關(guān)域就會出現(xiàn)混疊,即這個周期函數(shù)的循環(huán)相關(guān)在一個周期中的值就與線性相關(guān)的值不同了,這樣得到的功率譜只是真正功率譜的一組欠采樣,即L個采樣值。若想得到功率譜的全部2L個值,可以在x(n)w(n)之后補L個零,將它擴展成為周期為2L的信號再作離散傅立葉變換

103、。這時的循環(huán)相關(guān)與線性相關(guān)才是等價的。</p><p>  能量密度譜函數(shù)(或功率譜函數(shù))是二維的非負實值函數(shù)。用時間n作為橫坐標,w作縱坐標,將的值表示為灰度級所構(gòu)成的二維圖像就是語譜圖(Spectrogram)。這種反映聲音信號動態(tài)頻譜特性的時頻圖在聲音分析中有重要的實用價值,被稱為可視語言。語譜圖的時間分辨率和頻率分辨率是由所用窗函數(shù)的特性決定的。我們?nèi)钥赏ㄟ^前節(jié)兩種解釋來估計它的時間、頻率分辨率。<

104、/p><p>  先看頻率分辨率。按前節(jié)第一種解釋,假定時間固定,例如n=no,對信號乘以窗函數(shù)w(n)的作用,在頻域相當于用以w(n)的頻率響應W()與信號頻譜相卷積。設(shè)W()的通帶帶寬為b,那么可分辨的頻率寬度即為b。這就是說,卷積作用將使相隔的頻率差小于b的任何兩個譜峰都合并為一個單峰。因為對于同一種窗函數(shù)而言,其通帶寬度與窗長是成反比的,因此,如果希望頻率分辨率高,則窗長應盡量長一些。</p>

105、<p>  我們再來看時間分辨率。按前節(jié)第二種解釋,假定頻率固定,例如w=k,對信號乘以窗函數(shù)w(n)的作用,相當于對時間序列x(n)作低通濾波。其輸出信號的帶寬就是w(n)的帶寬b。根據(jù)采樣定理,對這種信號只需以2b為采樣率就可以充分反映,可見它所具有的時問分辨寬度為1/(2b)。因此,如果希望時間分辨率高,則窗長應盡量取短一些。由此可見,短時傅立葉變換的時間分辨率和頻率分辨率是相互矛盾的,這是短時傅立葉變換本身的固有弱點。

106、為了彌補這一缺點,聲音分析中一般同時作兩種語譜圖,一種是窄帶語譜圖,另一種是寬帶語譜圖。前者用于獲得高的頻率分辨率,后者用于獲得高的時間分辨率。短時傅立葉分析一般采用漢明窗作為分析窗,與窄帶語譜圖和寬帶語譜圖相應的窗長分別為51.2ms和6.4ms,由于ls長的漢明窗的帶寬約為1.91Hz,因此51.2ms和6.4ms的漢明窗的頻率分辨寬度分別為1.91/0.0512≈37.5 Hz和1.91/0.0064≈298Hz。這些分析參數(shù)的選

107、取原則,在聲音識別的特征提取中也是有參考價值的。</p><p>  3.5基音同步分析方法</p><p>  對于真正的周期性信號,只有用整數(shù)倍周期長度的矩形窗截取信號來進行分析,即基音同步分析,才能準確地得到它的諧波譜。如果用非整數(shù)倍周期長的窗或非矩形窗截取信號,諧波泄露現(xiàn)象總是存在的,只不過是其嚴重程度可大可小而己。真周期性信號的合成只要考慮如何把一個周期合成好,其余復制就是了,因

108、此這樣進行合成的效率是很高的。盡管實際聲音信號都不是真周期性的,但實踐證明,基音同步分析與合成的思想在聲音處理中是十分有用的。要進行基音同步分析,首先要能準確地檢測到基音周期,下面我們介紹一種高精度的基音檢測算法,然后再介紹基音同步分析方法。</p><p>  3.5.1 短時頻譜用于基音檢測</p><p>  時域基音周期檢測精度很難做到比±1個樣本的誤差還小,而利用短時頻

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論