畢業(yè)設(shè)計--基于dsp的語音信號處理系統(tǒng)設(shè)計_第1頁
已閱讀1頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、<p><b>  摘要</b></p><p>  語音信號處理是研究用數(shù)字信號處理技術(shù)和語音學(xué)知識對語音信號進行處理的新興的學(xué)科,是目前發(fā)展最為迅速的信息科學(xué)研究領(lǐng)域的核心技術(shù)之一。通過語音傳遞信息是人類最重要、最有效、最常用和最方便的交換信息形式。</p><p>  數(shù)字信號處理(DigitalSignalProcessing,簡稱DSP)是利用計算

2、機或?qū)S锰幚碓O(shè)備,以數(shù)字形式對信號進行采集、變換、濾波、估值、增強、壓縮、識別等處理,以得到符合人們需要的信號形式。</p><p>  Matlab語言是一種數(shù)據(jù)分析和處理功能十分強大的計算機應(yīng)用軟件,它可以將聲音文件變換為離散的數(shù)據(jù)文件,然后利用其強大的矩陣運算能力處理數(shù)據(jù),如數(shù)字濾波、傅里葉變換、時域和頻域分析、聲音回放以及各種圖的呈現(xiàn)等,它的信號處理與分析工具箱為語音信號分析提供了十分豐富的功能函數(shù),利用

3、這些功能函數(shù)可以快捷而又方便地完成語音信號的處理和分析以及信號的可視化,使人機交互更加便捷。信號處理是Matlab重要應(yīng)用的領(lǐng)域之一。</p><p>  本設(shè)計針對現(xiàn)在大部分語音處理軟件內(nèi)容繁多、操作不便等問題,采用MATLAB7.0綜合運用GUI界面設(shè)計、各種函數(shù)調(diào)用等來實現(xiàn)語音信號的變頻、傅里葉變換及濾波,程序界面簡練,操作簡便,具有一定的實際應(yīng)用意義。</p><p>  關(guān)鍵字:

4、Matlab,語音信號,傅里葉變換,信號處理</p><p><b>  1 緒 論</b></p><p><b>  課題的背景與意義</b></p><p>  通過語音傳遞信息是人類最重要、最有效、最常用和最方便的交換信息的形式。語言是人類持有的功能。聲音是人類常用的工具,是相互傳遞信息的最主要的手段。因此

5、,語音信號是人們構(gòu)成思想疏通和感情交流的最主要的途徑。并且,由于語言和語音與人的智力活動密切相關(guān),與社會文化和進步緊密相連,所以它具有最大的信息容量和最高的智能水平?,F(xiàn)在,人類已開始進入了信息化時代,用現(xiàn)代手段研究語音信號,使人們能更加有效地產(chǎn)生、傳輸、存儲、獲取和應(yīng)用語音信息,這對于促進社會的發(fā)展具有十分重要的意義。</p><p>  讓計算機能聽懂人類的語言,是人類自計算機誕生以來夢寐以求的想法。隨著計算機

6、越來越向便攜化方向發(fā)展,隨著計算環(huán)境的日趨復(fù)雜化,人們越來越迫切要求擺脫鍵盤的束縛而代之以語音輸人這樣便于使用的、自然的、人性化的輸人方式。作為高科技應(yīng)用領(lǐng)域的研究熱點,語音信號采集與分析從理論的研究到產(chǎn)品的開發(fā)已經(jīng)走過了幾十個春秋并且取得了長遠的進步。它正在直接與辦公、交通、金融、公安、商業(yè)、旅游等行業(yè)的語音咨詢與管理。工業(yè)生產(chǎn)部門的語聲控制,電話、電信系統(tǒng)的自動撥號、輔助控制與查詢以及醫(yī)療衛(wèi)生和福利事業(yè)的生活支援系統(tǒng)等各種實際應(yīng)用領(lǐng)

7、域相接軌,并且有望成為下一代操作系統(tǒng)和應(yīng)用程序的用戶界面。可見,語音信號采集與分析的研究將是一項極具市場價值和挑戰(zhàn)性的工作。我們今天進行這一領(lǐng)域的研究與開拓就是要讓語音信號處理技術(shù)走入人們的日常生活當中,并不斷朝更高目標而努力。</p><p>  語音信號采集與分析之所以能夠那樣長期地、深深地吸引廣大科學(xué)工作者去不斷地對其進行研究和探討,除了它的實用性之外,另一個重要原因是,它始終與當時信息科學(xué)中最活躍的前沿學(xué)

8、科保持密切的聯(lián)系,并且一起發(fā)展。語音信號采集與分析是以語音語言學(xué)和數(shù)字信號處理為基礎(chǔ)而形成的一門涉及面很廣的綜合性學(xué)科,與心理、生理學(xué)、計算機科學(xué)、通信與信息科學(xué)以及模式識別和人工智能等學(xué)科都有著非常密切的關(guān)系。對語音信號采集與分析的研究一直是數(shù)字信號處理技術(shù)發(fā)展的重要推動力量。因為許多處理的新方法的提出,首先是在語音信號處理中獲得成功,然后再推廣到其他領(lǐng)域。</p><p><b>  國內(nèi)外研究現(xiàn)狀

9、</b></p><p>  語音信號的采集與分析作為一個重要的研究領(lǐng)域,已經(jīng)有很長的研究歷史。但是它的快速發(fā)展可以說是從1940年前后Dudley的聲碼器(vocoder)和potter等人的可見語音(Visible Speech)開始的。1952年貝爾(Bell)實驗室的Davis等人首次研制成功能識別十個英語數(shù)字的實驗裝置。1956年Olson和Belar等人采用8個帶通濾波器組提取頻譜參數(shù)作為

10、語音的特征,研制成功一臺簡單的語音打字機。20世紀60年代初由于Faut和Steven的努力,奠定了語音生成理論的基礎(chǔ),在此基礎(chǔ)上語音合成的研究得到了扎實的進展。20世紀60年代中期形成的一系列數(shù)字信號處理方法和技術(shù),如數(shù)字濾波器、快速博里葉變換(FFT)等成為語音信號數(shù)字處理的理論和技術(shù)基礎(chǔ)。在方法上,隨著電子計算機的發(fā)展,以往的以硬件為中心的研究逐漸轉(zhuǎn)化為以軟件為主的處理研究。然而,在語音識別領(lǐng)域內(nèi),初期有幾種語音打字機的研究也很活

11、躍,但后來已全部停了下來,這說明了當時人們對話音識別難度的認識得到了加深。所以1969年美國貝爾研究所的Pierce感嘆地說“語音識別向何處去?”。</p><p>  到了1970年,好似反駁Pierce的批評,單詞識別裝置開始了實用化階段,其后實用化的進程進一步高漲,實用機的生產(chǎn)銷售也上了軌道。此外社會上所宣傳的聲紋(Voice Print)識別,即說話人識別的研究也扎扎實實地開展起來,并很快達到了實用化的階

12、段。到了1971年,以美國ARPA(American Research Projects Agency)為主導(dǎo)的“語音理解系統(tǒng)”的研究計劃也開始起步。這個研究計劃不僅在美國園內(nèi),而且對世界各國都產(chǎn)生了很大的影響,它促進了連續(xù)語音識別研究的興起。歷時五年的龐大的ARPA研究計劃,雖然在語音理解、語言統(tǒng)計模型等方面的研究積累了一些經(jīng)驗,取得了許多成果,但沒能達到巨大投資應(yīng)得的成果,在1976年停了下來,進入了深刻的反省階段。但是,在整個20

13、世紀70年代還是有幾項研究成果對語音信號處理技術(shù)的進步和發(fā)展產(chǎn)生了重大的影響。這就是20世紀70年代初由板倉(Itakura)提出的動態(tài)時間規(guī)整(DTW)技術(shù),使語音識別研究在匹配算法方面開辟了新思路;20世紀70年代中期線性預(yù)測技術(shù)(LPC)被用于語音信號處理,此后隱馬爾可夫模型法(HNMM)也獲得初步成功,該</p><p>  20世紀80年代,由于矢量量化、隱馬爾可夫模型和人工神經(jīng)網(wǎng)絡(luò)(ANN)等相繼被應(yīng)

14、用于語音信號處理,并經(jīng)過不斷改進與完善,使得語音信號處理技術(shù)產(chǎn)生了突破性的進展。其中,隱馬爾可夫模型作為語音信號的一種統(tǒng)計模型,在語音信號處理的各個領(lǐng)域中獲得了廣泛的應(yīng)用。其理論基礎(chǔ)是1970年前后,由Baum等人建立起來的,隨后,由美國卡內(nèi)基梅隆大學(xué)(CMU)的Baker和美國IBM公司的Jelinek等人將其應(yīng)用到語音識別中。由于美國貝爾實驗室的Babiner等人在20世紀80年代中期,對隱馬爾可夫模型深人淺出的介紹,才使世界各國從

15、事語音信號處理的研究人員了解和熟悉,進而成為一個公認的研究熱點,也是目前語音識別等的主流研究途徑。</p><p>  進入20世紀90年代以來,語音信號采集與分析在實用化方面取得了許多實質(zhì)性的研究進展。其中,語音識別逐漸由實驗室走向?qū)嵱没?。一方面,對聲學(xué)語音學(xué)統(tǒng)計模型的研究逐漸深入,魯棒的語音識別、基于語音段的建模方法及隱馬爾可夫模型與人工神經(jīng)網(wǎng)絡(luò)的結(jié)合成為研究的熱點。另一方面,為了語音識別實用化的需要,講者自

16、適應(yīng)、聽覺模型、快速搜索識別算法以及進一步的語言模型的研究等課題倍受關(guān)注。</p><p>  數(shù)字信號處理(DSP)簡介</p><p>  數(shù)字信號處理(DigitalSignalProcessing,簡稱DSP)是一門涉及許多學(xué)科而又廣泛應(yīng)用于許多領(lǐng)域的新興學(xué)科。20世紀60年代以來,隨著計算機和信息技術(shù)的飛速發(fā)展,數(shù)字信號處理技術(shù)應(yīng)運而生并得到迅速的發(fā)展。在過去的二十多年時間里,數(shù)

17、字信號處理已經(jīng)在通信等領(lǐng)域得到極為廣泛的應(yīng)用。</p><p>  數(shù)字信號處理是利用計算機或?qū)S锰幚碓O(shè)備,以數(shù)字形式對信號進行采集、變換、濾波、估值、增強、壓縮、識別等處理,以得到符合人們需要的信號形式。</p><p>  數(shù)字信號處理是圍繞著數(shù)字信號處理的理論、實現(xiàn)和應(yīng)用等幾個方面發(fā)展起來的。數(shù)字信號處理在理論上的發(fā)展推動了數(shù)字信號處理應(yīng)用的發(fā)展。反過來,數(shù)字信號處理的應(yīng)用又促進了數(shù)

18、字信號處理理論的提高。而數(shù)字信號處理的實現(xiàn)則是理論和應(yīng)用之間的橋梁。</p><p>  數(shù)字信號處理是以眾多學(xué)科為理論基礎(chǔ)的,它所涉及的范圍極其廣泛。例如,在數(shù)學(xué)領(lǐng)域,微積分、概率統(tǒng)計、隨機過程、數(shù)值分析等都是數(shù)字信號處理的基本工具,與網(wǎng)絡(luò)理論、信號與系統(tǒng)、控制論、通信理論、故障診斷等也密切相關(guān)。近來新興的一些學(xué)科,如人工智能、模式識別、神經(jīng)網(wǎng)絡(luò)等,都與數(shù)字信號處理密不可分??梢哉f,數(shù)字信號處理是把許多經(jīng)典的理

19、論體系作為自己的理論基礎(chǔ),同時又使自己成為一系列新興學(xué)科的理論基礎(chǔ)。</p><p>  1.4 本文主要工作</p><p>  本文簡要介紹了語音信號采集與分析的發(fā)展史以及語音信號的特征、采集與分析方法,并通過PC機錄制自己的一段聲音,運用Matlab進行仿真分析,最后加入噪聲進行濾波處理,比較濾波前后的變化。第2章主要介紹語音信號的特點與采集,仿真主要是驗證奈奎斯特定理。第3章主要是

20、對語音信號進行時域、頻域上的分析,如短時功率譜,短時能量,短時平均過零率,語譜圖分析等等。第4章是對語音信號的綜合和分析,包括語音信號的調(diào)制、疊加和濾波。</p><p>  2 語音信號的特點與采集</p><p>  2.1 語音信號的特點</p><p>  通過對大量語音信號的觀察和分析發(fā)現(xiàn),語音信號主要有下面兩個特點:</p><p&g

21、t;  在頻域內(nèi),語音信號的頻譜分量主要集中在300~3400Hz的范圍內(nèi)。利用這個特點,可以用一個防混迭的帶通濾波器將此范圍內(nèi)的語音信號頻率分量取出,然后按8kHz的采樣率對語音信號進行采樣,就可以得到離散的語音信號。</p><p>  在時域內(nèi),語音信號具有“短時性”的特點,即在總體上,語音信號的特征是隨著時間而變化的,但在一段較短的時間間隔內(nèi),語音信號保持平穩(wěn)。在濁音段表現(xiàn)出周期信號的特征,在清音段表現(xiàn)出

22、隨機噪聲的特征。</p><p>  下面是一段語音信號的時域波形圖(圖2-1)和頻域圖(圖2-2),由這兩個圖可以看出語音信號的兩個特點。</p><p>  圖2-1語音信號時域波形圖 圖2-2語音信號頻域波形圖</p><p>  2.2語音信號的采集</p><p>  在將語音信號進行數(shù)字化前,必須先進行防混疊預(yù)濾波,預(yù)濾波

23、的目的有兩個:抑制輸入信導(dǎo)各領(lǐng)域分量中頻率超出fs/2的所有分量(fs為采樣頻率),以防止混疊干擾。抑制50Hz的電源工頻干擾。這樣,預(yù)濾波器必須是一個帶通濾波器,設(shè)其上、下截止頻率分別是fH和fL,則對于絕大多數(shù)語音編譯碼器,fH=3400Hz、fL=60~100Hz、采樣率為fs=8kHz;而對丁語音識別而言,當用于電話用戶時,指標與語音編譯碼器相同。當使用要求較高或很高的場合時fH=4500Hz或8000Hz、fL=60Hz、fs

24、=10kHz或20kHz。</p><p>  為了將原始模擬語音信號變?yōu)閿?shù)字信號,必須經(jīng)過采樣和量化兩個步驟,從而得到時間和幅度上均為離散的數(shù)字語音信號。采樣也稱抽樣,是信號在時間上的離散化,即按照一定時間間隔△t在模擬信號x(t)上逐點采取其瞬時值。采樣時必須要注意滿足奈奎斯特定理,即采樣頻率fs必須以高于受測信號的最高頻率兩倍以上的速度進行取樣,才能正確地重建波形,它是通過采樣脈沖和模擬信號相乘來實現(xiàn)的。下

25、圖時一段語音信號在采樣頻率44.1KHz情況下的頻譜圖。</p><p>  圖2-3原始信號時域波形圖和頻域波形圖</p><p>  由圖可知,這段語音信號的頻率主要集中在1KHz左右,當采樣頻率為44.1KHz時,由于采樣頻率比較大,所以采樣點數(shù)就越密,所得離散信號就越逼近于原信號,頻譜也沒有發(fā)生混疊。</p><p>  圖2-4抽取后的信號時域波形圖和頻域

26、波形圖</p><p>  對上述信號進行1/80采樣頻率抽取,即采樣頻率變?yōu)閷⒔?00Hz時,由于采樣頻率比較小,所以采樣點數(shù)就稀疏,所得離散信號就越偏離于原信號,頻譜也發(fā)生了混疊。</p><p>  在采樣的過程中應(yīng)注意采樣間隔的選擇和信號混淆:對模擬信號采樣首先要確定采樣間隔。如何合理選擇△t涉及到許多需要考慮的技術(shù)因素。一般而言,采樣頻率越高,采樣點數(shù)就越密,所得離散信號就越逼近

27、于原信號。但過高的采樣頻率并不可取,對固定長度(T)的信號,采集到過大的數(shù)據(jù)量(N=T/△t),給計算機增加不必要的計算工作量和存儲空間;若數(shù)據(jù)量(N)限定,則采樣時間過短,會導(dǎo)致一些數(shù)據(jù)信息被排斥在外。采樣頻率過低,采樣點間隔過遠,則離散信號不足以反映原有信號波形特征,無法使信號復(fù)原,造成信號混淆。根據(jù)采樣定理,當采樣頻率大于信號的兩倍帶寬時,采樣過程不會丟失信息,利用理想濾波器可從采樣信號中不失真地重構(gòu)原始信號波形。量化是對幅值進行

28、離散化,即將振動幅值用二進制量化電平來表示。量化電平按級數(shù)變化,實際的振動值是連續(xù)的物理量。具體振動值用舍入法歸到靠近的量化電平上。 </p><p>  語音信號經(jīng)過預(yù)濾波和采樣后,由A/D變換器變換為二進制數(shù)字碼。這種防混疊濾波通常與模數(shù)轉(zhuǎn)換器做在一個集成塊內(nèi),因此目前來說,語音信號的數(shù)字化的質(zhì)量還是有保證的。市面上購買到的普通聲卡在這方面做的都很好,語音聲波通過話筒輸入到聲卡后直接獲得的是經(jīng)過防混疊濾波、A

29、/D變換、量化處理的離散的數(shù)字信號。</p><p>  在實際工作中,我們可以利用windows自帶的錄音機錄制語音文件,圖2-5是基于PC機的語音信號采集過程,聲卡可以完成語音波形的A/D轉(zhuǎn)換,獲得WAVE文件,為后續(xù)的處理儲備原材料。調(diào)節(jié)錄音機保存界面的“更改”選項,可以存儲各種格式的WAVE文件。</p><p>  圖2-5基于PC機的語音信號采集過程</p>&l

30、t;p>  采集到語音信號之后,需要對語音信號進行分析,如語音信號的時域分析、頻譜分析、語譜圖分析以及加噪濾波等處理。</p><p><b>  3 語音信號的分析</b></p><p>  3.1語音信號分析技術(shù)</p><p>  語音信號分析是語音信號處理的前提和基礎(chǔ),只有分析出可表示語音信號本質(zhì)特征的參數(shù),才有可能利用這些參數(shù)

31、進行高效的語音通信、語音合成和語音識別等處理。而且,語音合成的音質(zhì)好壞,語音識別率的高低,也都取決于對語音信號分析的準確性和精確性。因此語音信號分析在語音信號處理應(yīng)用中具有舉足輕重的地位。</p><p>  貫穿于語音分析全過程的是“短時分析技術(shù)”。因為,語音信號從整體來看其特性及表征其本質(zhì)特征的參數(shù)均是隨時間而變化的,所以它是一個非平穩(wěn)態(tài)過程,不能用處理平穩(wěn)信號的數(shù)字信號處理技術(shù)對其進行分析處理。但是,由于不

32、同的語音是由人的口腔肌肉運動構(gòu)成聲道某種形狀而產(chǎn)生的響應(yīng),而這種口腔肌肉運動相對于語音頻率來說是非常緩慢的,所以從另一方面看,雖然語音信號具有時變特性,但是在一個短時間范圍內(nèi)(一般認為在10~30ms的短時間內(nèi)),其特性基本保持不變即相對穩(wěn)定,因而可以將其看作是一個準穩(wěn)態(tài)過程,即語音信號具有短時平穩(wěn)性。所以任何語音信號的分析和處理必須建立在“短時”的基礎(chǔ)上.即進行“短時分析”,將語音信號分為一段一段來分析其特征參數(shù),其中每一段稱為一“幀

33、”,幀長一般取為10~30ms。這樣,對于整體的語音信號來講,分析出的是由每一幀特征參數(shù)組成的特征參數(shù)時間序列。</p><p>  根據(jù)所分析出的參數(shù)的性質(zhì)的不同,可將語音信號分析分為時域分析、頻域分析、倒頻域分析等;時域分析方法具有簡單、計算量小、物理意義明確等優(yōu)點,但由于語音信號最重要的感知特性反映在功率譜中,而相位變化只起著很小的作用,所以相對于時域分析來說頻域分析更為重要。本文將簡要介紹時域分析、頻域分

34、析以及語譜圖分析。</p><p>  3.2 語音信號的時域分析</p><p>  語音信號的時域分析就是分析和提取語音信號的時域參數(shù)。進行語音分析時,最先接觸到并且也是最直觀的是它的時域波形。語音信號本身就是時域信號,因而時域分析是最早使用,也是應(yīng)用最廣泛的一種分析方法,這種方法直接利用語音信號的時域波形。時域分析通常用于最基本的參數(shù)分析及應(yīng)用,如語音的分割、預(yù)處理、大分類等。這種分

35、析方法的特點是:表示語音信號比較直觀、物理意義明確。實現(xiàn)起來比較簡單、運算且少??梢缘玫秸Z音的一些重要的參數(shù)。只使用示波器等通用設(shè)備,使用較為簡單等。</p><p>  語音信號的時域參數(shù)有短時能量、短時過零率、短時自相關(guān)函數(shù)和短時平均幅度差函數(shù)等,這是語音信號的一組最基本的短時參數(shù),在各種語音信號數(shù)字處理技術(shù)中都要應(yīng)用。在計算這些參數(shù)時使用的一般是矩形窗或漢明窗。</p><p>  

36、3.2.1 短時能量及短時平均幅度分析</p><p>  設(shè)語音波形時域信號為x(l)、加密分幀處理后得到的第n幀語音信號為 Xn(m),則Xn(m)滿足下式:</p><p>  其中,n=0,1T,2T,…,并且N為幀長,T為幀移長度。</p><p>  設(shè)第n幀語音信號Xn(m)的短時能量用En表示,則其計算公式如下:</p><p&g

37、t;  En是一個度量語音信號幅度值變化的函數(shù),但它有一個缺陷,即它對高電平非常敏感(因為它計算時用的是信號的平方)。為此可采用另一個度量語音信號幅度值變化的函數(shù).即短時平均幅度函數(shù)Mn,它定義為: </p><p>  Mn也是一幀語音信號能量大小的表征,它與En的區(qū)別在于計算時小取樣值和大取樣值不會因取平方而造成較大差異,在某些應(yīng)用領(lǐng)域也會帶來一些好處。</p><p>  短時能量

38、和短時平均幅度函數(shù)的主要用途有:①可以區(qū)分濁音段與清音段,因為濁音時En值比清音時大的多。②可以用來區(qū)分聲母與韻母的分界,無聲與有聲的分界,連字(指字之間無間隙)的分界等。③作為一種超音段信息,用于語音識別中。</p><p>  3.2.2短時過零率分析</p><p>  短時過零率表示一幀語音中語音信號波形穿過橫軸(零電平)的次數(shù)。過零分析是語音時域分析中最簡單的一種。對于連續(xù)語音信

39、號,過零即意味著時域波形通過時間軸;而對于離散信號,如果相鄰的取樣值改變符號則稱為過零。過零率就是樣本改變符號的次數(shù)。定義語音信號Xn(m)的短時過零率Zn為:</p><p>  式中,sgn[ ]是符號函數(shù),即:</p><p>  在實際中求過零率參數(shù)時,需要十分注意的一個問題是如果輸入信號中包含有50Hz的工頻干擾或者A/D變換器的工作點有偏移(這等效于輸入信號有直流偏移),往往會

40、使計算的過零率參數(shù)很不準確。為了解決前一個問題,A/D變換器前的防混疊帶通濾波器的低端截頻應(yīng)高于50Hz,以有效地抑制電源干擾。對于后一個問題除了可以采用低直流漂移器件外,也可以在軟件上加以解決,這就是算出每一幀的直流分量并予以濾除。</p><p>  對語音信號進行分析,發(fā)現(xiàn)發(fā)濁音時,盡管聲道有若干個共振峰,但由于聲門波引起功率譜的高頻跌落,所以其話音能量約集中在3kHz以下。而發(fā)清音時,多數(shù)能量出現(xiàn)在較高頻

41、率上。高頻就意味著高的平均過零率,低頻意味著低的平均過零率,所以可以認為濁音時具有較低的過零率,而清音時具有較高的過零率。當然,這種高低僅是相對而言,并沒有精確的數(shù)值關(guān)系。</p><p>  利用短時平均過零率還可以從背景噪聲中找出語音信號,可用于判斷寂靜無聲段和有聲段的起點和終點位置。在孤立詞的語音識別中,必須要在一連串連續(xù)的語音信號中進行適當分割,用以確定一個一個單詞的語音信號,即找出每一個單詞的開始和終止

42、位置,這在語音處理中是一個基本問題。此時,在背景噪聲較小時用平均能量識別較為有效,而在背景噪聲較大時用平均過零率識別較為有效。但是研究表明,在以某些音為開始或結(jié)尾時。如當弱摩擦音(如[f]、[h]等音素),弱爆破音(如[p]、[t]、[k]等音素)為語音的開頭或結(jié)尾;以鼻音(如[n]、[m]等音素)為語音的結(jié)尾時。只用其中一個參量來判別語音的起點和終點是有困難的,必須同時使用這兩個參數(shù)。圖3-1是用Mtalab仿真一段語音信號時域波形的

43、短時能量和短時平均過零率。</p><p>  圖3-1語音信號的短時能量和短時平均過零率</p><p>  3.3 語音信號的頻域分析</p><p>  語音信號的頻域分析就是分析語音信號的頻域持征。從廣義上講,語音信號的頻域分析包括語音信號的頻譜、功率譜、倒頻譜、頻譜包絡(luò)分析等,而常用的頻域分析方法有帶通濾波器組法、傅里葉變換法、線性預(yù)測法等幾種。本文介紹的

44、是語音信號的傅里葉分析法。因為語音波是一個非平穩(wěn)過程,因此適用于周期、瞬變或平穩(wěn)隨機信號的標準傅里葉變換不能用來直接表示語音信號,而應(yīng)該用短時傅里葉變換對語音信號的頻譜進行分析,相應(yīng)的頻譜稱為“短時譜”。</p><p>  3.3.1利用短時博里葉變換求語音的短時譜</p><p>  對第n幀語音信號Xn(m)進行傅里葉變換(離散時域傅里葉變換,DTFT),可得到短時傅里葉變換,其定義

45、如下:</p><p><b>  (3-1)</b></p><p>  由定義可知,短時傅里葉變換實際就是窗選語音信號的標準傅里葉變換。這里,窗w(n-m)是一個“滑動的”窗口,它隨n的變化而沿著序列X(n)滑動。由于窗口是有限長度的,滿足絕對可和條件,所以這個變換是存在的。當然窗口函數(shù)不同,博里葉變換的結(jié)果也將不同。</p><p>  

46、我們還可以將式(3—1)寫成另一種形式。設(shè)語音信號序列和窗口序列的標準傅里立葉變換均存在。當n取固定值時,w(n-m)的傅里葉變換為:</p><p><b>  (3-2)</b></p><p><b>  根據(jù)卷積定理,有:</b></p><p><b>  (3-3)</b></p&g

47、t;<p>  因為上式右邊兩個卷積項均為關(guān)于角頻率w的以2π為周期的連續(xù)函數(shù),所以也可將其寫成以下的卷積積分形式:</p><p><b> ?。?-4)</b></p><p>  即,假設(shè)x(m)的DTFT是,且的DTFT是,那么是和的周期卷積。</p><p>  根據(jù)信號的時寬帶寬積為一常數(shù)這一基本性質(zhì),可知主瓣寬度與窗

48、口寬度成反比,N越大,的主瓣越窄。由式(3-4)可知,為了使忠實再現(xiàn)的特性。相對于來說必須是—個沖激函數(shù)。所以為了使,需;但是N值太大時,信號的分幀又失去了意義。尤其是N大于語音的音素長度時,已不能反映該語音音素的頻譜了。因此,應(yīng)折衷選擇窗的寬度N。另外,窗的形狀也對短時傅氏頻譜有影響,如矩形窗,雖然頻率分辨率很高(即主辯狹窄尖銳),但由于第一旁瓣的衰減很小,有較大的上下沖,采用矩形窗時求得的與的偏差較大,這就是Gibbs效應(yīng),所以不適

49、合用于頻譜成分很寬的語音分析中。而漢明窗在頻率范圍中的分辨率較高,而且旁辯的衰減大,具有頻譜泄漏少的優(yōu)點。所以在求短時頻譜時一般采用具有較小上下沖的漢明窗。</p><p>  與離散傅里葉變換和連續(xù)博里葉變換的關(guān)系一樣,如令角頻率w=2πk/N,則得離散的短時傅里葉變換(DFT)。它實際上是在頻域的取樣,如下所示:</p><p><b>  (3-5)</b>&l

50、t;/p><p>  在語音信號數(shù)字處理中,都是采用的離散博里葉變換(DFT)來替代并且可以用高效的快速傅里葉變換(FFT)算法完成由至的轉(zhuǎn)換。當然,這時窗長N必須是2的倍數(shù)(L是整數(shù))。根據(jù)傅里葉變換的性質(zhì),實數(shù)序列的傅里葉變換的頻譜具有對稱性,因此,全部頻譜信息包含在長度為N/2+1個里。另外,為了使具有較高的頻率分辨率,所取的DFT以及相應(yīng)的FFT點數(shù)應(yīng)該足夠多,但有時的長度N要受到采樣率和短時性的限制,例如,

51、在通常采樣率為8kHz且?guī)L為20ms時,N=160。而一般取256、512或1024,為了將的點數(shù)從N擴大力,可以采用補0的辦法,在擴大的部分添若干個0取樣值,然后再對添0后的序列進行FFT。例如、在10kHz的范圍內(nèi)采樣求頻譜,并要求頻率分辨率在30Hz以下。由10k/<30,得>333,所以=要取比333大的值,這時可取==512點,不足的部分采用補0的辦法解決,此時頻率分辨率(即頻率間隔)為10Hz/512=19.53Hz,采樣

52、后的該幀信號頻率處在0~之間,因此,原連續(xù)信號頻率就處在0~之間(即),所以我們要在0~頻率范圍內(nèi)求其頻譜。FFT的計算可以在通用計算機上由相應(yīng)的算法軟件來完成,</p><p>  在語音信號數(shù)字處理中,功率譜具有重要意義,在一些語音應(yīng)用系統(tǒng)中。往往都是利用語音信號的功率譜。根據(jù)功率譜定義,可以寫出短時功率譜與短時傅里葉變換之間的關(guān)系:</p><p>  或者: &

53、lt;/p><p>  式中*表示復(fù)共軛運算。并且功率譜是短時自相關(guān)函數(shù)的傅里葉變換。</p><p>  圖3-2是用Matlab中的psdplot命令繪得的同一人兩次說同一詞的功率譜比較(窗函數(shù)取窗長度為256的Hamming窗)。</p><p>  圖3-2同一人兩次說同一詞的功率譜比較</p><p>  可以看出功率譜圖比較好地反映出

54、聲音的個人特征:在低頻部分(頻率低于6000Hz),同一人說同一詞,其功率譜圖中的各個波峰所對應(yīng)的頻率基本相同;不同人說同一詞,其功率譜圖的出現(xiàn)波峰的頻率比較接近;同一人說不同詞時功率譜的形狀差別較大。在高頻部分,波峰比較密集,特征不明顯。</p><p>  3.4 語音信號的語譜圖</p><p>  語音的時域分析和頻域分析是語音分析的兩種重要方法。顯然這兩種單獨分析的方法均有局限性

55、:時域分析對語音信號的頻率特性沒有直觀的了解;而頻域分析出的特征中又沒有語音信號隨時間的變化關(guān)系;語音信號是時變信號,所以其頻譜也是隨時間變化的。但是由于語音信號隨時間變化是很緩慢的,因而在一段短時間內(nèi)(如10~30ms之間,即所謂的一幀之內(nèi))可以認為其頻譜是固定不變的,這種頻譜又稱為短時譜。短時譜只能反映語音信號的靜態(tài)頻率特性,不能反映語音信號的動態(tài)頻率特性。因此,人們致力于研究語音的時頻分析特性。</p><p&

56、gt;  把和時序相關(guān)的傅里葉分析的顯示圖形稱為語譜圖(Sonogram,或者Spectrogram)。語譜圖是一種三維頻譜,它是表示語音頻譜隨時間變化的圖形,其縱軸為頻率,橫軸為時間,任一給定頻率成分在給定時刻的強弱用相應(yīng)點的灰度或色調(diào)的濃淡來表示。用語譜圖分析語音又稱為語譜分析。語譜圖中顯示了大量的與語音的語句特性有關(guān)的信息,它綜合了頻譜圖和時域波形的特點,明顯地顯示出語音頻譜隨時間的變化情況,或者說是一種動態(tài)的頻譜;記錄這種頻譜的

57、儀器就是語譜儀。</p><p>  語譜儀實際上是一個帶通濾波器組的輸出隨時間發(fā)生連續(xù)變化,連續(xù)重復(fù)進行語音信號頻率分析的儀器。帶通濾波器有兩種帶寬可供選擇:窄帶為45Hz,寬帶為300Hz。窄帶語譜圖有良好的頻率分辨率,有利于顯示基音頻率及其各次諧波,但它的時間分辨率較差,不利于觀察共振峰(聲道諧振)的變化;而寬帶語譜圖正相反,具有良好的時間分辨率及較差的頻率分辨率。寬帶語譜圖能給出語音的共振峰頻率及清輔音的

58、能量匯集區(qū),在語譜圖里共振峰呈現(xiàn)為黑色的條紋。</p><p>  可以利用語譜儀測量語譜圖的方法來確定語音參數(shù),例如共振峰頻率及基音頻率。語語圖的實際應(yīng)用是用于確定出講話人的本性。語譜圖上因其不同的黑白程度,形成了個同的紋路,稱之為“聲紋”,它因人而異,即不同講話者語譜圖的聲紋是不同的。因而可以利用聲紋鑒別不同的講話人。這與不同的人有不同的指紋,根據(jù)指紋可以區(qū)別不同的人是一個道理。雖然對采用語譜圖的講活人識別技

59、術(shù)的可靠性存在相當?shù)膽岩桑壳斑@一技術(shù)已在司法法庭得到某些認可及采用。</p><p>  圖3-3“河南理工大學(xué)”語譜圖</p><p>  圖3-3是用Mtalab繪制的一個寬帶語譜圖,其中橫抽坐標為時間,縱軸坐標為頻率,語句內(nèi)容為“河南城建學(xué)院”,它的發(fā)音在圖下方以音標表示。同時給出了相應(yīng)的語音的時域波形。語譜圖中的花紋有橫扛(Bar)、亂紋和豎直條等。橫杠是與時間軸平行的幾條深黑

60、色帶紋,它們相應(yīng)于短時譜中的幾個凸出點,也就是共振峰。從橫扛對應(yīng)的頻率和寬度可以確定相應(yīng)的共振峰頻率和帶寬。在一個語音段的語譜圖中,有沒有橫扛出現(xiàn)是判斷它是否是濁音的重要標志。豎直條(又叫沖直條)是語譜圖中出現(xiàn)與時間軸垂直的一條窄黑條。每個豎直條相當于一個基音,條紋的起點相當于聲門脈沖的起點,條紋之間的距離表示基音周期。條紋越密表示越音頻率越高。</p><p>  4 語音信號的綜合仿真分析</p>

61、<p>  4.1本文的仿真軟件Matlab</p><p>  MATLAB將矩陣運算、數(shù)值分析、圖形處理、編程技術(shù)結(jié)合在一起,為用戶提供了一個強有力的科學(xué)及工程問題的分析計算和程序設(shè)計工具,它還提供了專業(yè)水平的符號計算、文字處理、可視化建模仿真和實時控制等功能,是具有全部語言功能和特征的新一代軟件開發(fā)平臺。</p><p>  MATLAB 已發(fā)展成為適合眾多學(xué)科、多種工

62、作平臺、功能強大的大型軟件。在歐美等國家的高校,MATLAB已成為線性代數(shù)、自動控制理論、數(shù)理統(tǒng)計、數(shù)字信號處理、時間序列分析、動態(tài)系統(tǒng)仿真等高級課程的基本教學(xué)工具。成為攻讀學(xué)位的本科、碩士、博士生必須掌握的基本技能。在設(shè)計研究單位和工業(yè)開發(fā)部門,MATLAB被廣泛的應(yīng)用于研究和解決各種具體問題。在中國,MATLAB也已日益受到重視,短時間內(nèi)就將盛行起來,因為無論哪個學(xué)科或工程領(lǐng)域都可以從MATLAB中找到合適的功能。</p>

63、;<p>  MATLAB的功能 </p><p>  1)全新的開發(fā)環(huán)境GUIDE(GUI Development Environment):由早期的單一命令窗口發(fā)展為將一些常用的交互式工作界面高度的集中于操作桌面; </p><p>  2)在命令窗口增加了錯誤跟蹤功能(error display message and abort function); </p&

64、gt;<p>  3)提供了許多新的數(shù)值處理功能(numerical Treatment Techniques),更新了部分函數(shù)的功能和算法,增加了許多新函數(shù); </p><p>  4)在圖形窗口增加了曲線擬合、數(shù)據(jù)統(tǒng)計等交互工具;(Curve Fitting, Data Analyzing ) </p><p>  5)引入了類與對象及函數(shù)句柄等概念;(Object,Ha

65、ndle) 用戶可以創(chuàng)建自己定義的類函數(shù)和函數(shù)句柄; </p><p>  6)改進了編輯/調(diào)試器的界面及功能; (Editor/Debugger)增加了行號和書簽等功能; </p><p>  7)屬性編輯器功能更強(Property Debugger),使用更方便; </p><p>  8)建立了一個與以前完全不同的圖形用戶界面(GUI)圖形窗口,(Graph

66、ical Window)使用更加方便靈活; </p><p>  9)增加了虛擬現(xiàn)實工具箱,(Virtual Reality Toolbox)使用標準的虛擬現(xiàn)實建模語言(VRML)技術(shù),可以創(chuàng)建由MATLAB和simulink環(huán)境驅(qū)動的三維動畫場景; </p><p>  10)在應(yīng)用程序接口方面增加了與Java的接口(Interface for Java),并為二者的數(shù)據(jù)交換提供了相應(yīng)的

67、程序庫。 </p><p>  MATLAB的主要組成部分: </p><p>  1)開發(fā)環(huán)境(development Environment):一組圖形化用戶接口工具和組件的集成:MATLAB桌面、命令窗口、命令歷史窗口、編輯調(diào)試窗口及幫助信息、工作空間、文件和搜索路徑等瀏覽器; </p><p>  2)MATLAB數(shù)學(xué)函數(shù)庫:(Math Function L

68、ibrary)基本函數(shù):求和、正弦、余弦和復(fù)數(shù)運算等;特殊函數(shù):矩陣求逆、矩陣特征值、貝塞爾函數(shù)和快速付里葉變換等; </p><p>  3)MATLAB語言:(MATLAB Language)一種高級編程語言,包括控制流的描述、函數(shù)、數(shù)據(jù)結(jié)構(gòu)、輸入輸出及面對對象編程; </p><p>  4)句柄圖形:(Handle Graphics) 可以對各種圖形對象進行更為細膩的修飾和控制,建

69、立完整的圖形界面的應(yīng)用程序。 </p><p>  5)應(yīng)用程序接口:(Applied Function Interface)MATLAB的應(yīng)用程序接口允許用戶使用C或FORTRAN語言編寫程序與MATLAB連接。 </p><p>  工作空間窗口:(Workspace Window) </p><p>  用于儲存各種變量和結(jié)果的空間,顯示變量的名稱、大小、字節(jié)

70、數(shù)及數(shù)據(jù)類型,對變量進行觀察、編輯、保存和刪除。臨時變量不占空間,為了對變量的內(nèi)容進行觀察、編輯與修改,可以用三種方法打開內(nèi)存數(shù)組編輯器。*雙擊變量名;*選擇該窗口工具欄上的打開圖標;*鼠標指向變量名,點擊鼠標右鍵,彈出選擇菜單,然后選項操作。</p><p>  欲查看工作空間的情況,可以在命令窗口鍵入命令whos(顯示存在工作空間全部變量的名稱、大小、數(shù)據(jù)類型等信息)或命令who(只顯示變量名) </p

71、><p>  當前目錄瀏覽器:(Current Directory) </p><p>  用于顯示及設(shè)置當前工作目錄,同時顯示當前工作目錄下的文件名、文件類型及目錄的修改時間等信息。只有在當前目錄或搜索路徑下的文件及函數(shù)可以被運行或調(diào)用。 </p><p>  設(shè)置當前目錄可以在瀏覽器窗口左上角的輸入欄中直接輸入,或點擊瀏覽器下拉按鈕進行選擇。還可用cd命令在命令窗口

72、設(shè)置當前目錄,如: </p><p>  cd c:\mydir 可將c盤上的mydir目錄設(shè)為當前工作目錄。 </p><p>  命令歷史窗口:(Command History) </p><p>  記錄已運行過的MATLAB命令歷史,包括已運行過的命令、函數(shù)、表達式等信息,可進行命令歷史的查找、檢查等工作,也可以在該窗口中進行命令復(fù)制與重運行。</p&

73、gt;<p>  啟動平臺:(Launch Pad) </p><p>  幫助用戶方便地打開和調(diào)用MATLAB的各種程序、函數(shù)和幫助文件。 </p><p>  平臺列出了系統(tǒng)中安裝的所有的MATLAB產(chǎn)品的目錄,可以通過雙擊來啟動相應(yīng)的選項。7.0版取消了這個窗口,事實上Help工具完全具備它的功能。</p><p><b>  基本功能

74、</b></p><p>  MATLAB是由美國mathworks公司發(fā)布的主要面對科學(xué)計算、可視化以及交互式程序設(shè)計的高科技計算環(huán)境。它將數(shù)值分析、矩陣計算、科學(xué)數(shù)據(jù)可視化以及非線性動態(tài)系統(tǒng)的建模和仿真等諸多強大功能集成在一個易于使用的視窗環(huán)境中,為科學(xué)研究、工程設(shè)計以及必須進行有效數(shù)值計算的眾多科學(xué)領(lǐng)域提供了一種全面的解決方案,并在很大程度上擺脫了傳統(tǒng)非交互式程序設(shè)計語言(如C、Fortran)

75、的編輯模式,代表了當今國際科學(xué)計算軟件的先進水平。MATLAB和Mathematica、Maple并稱為三大數(shù)學(xué)軟件。它在數(shù)學(xué)類科技應(yīng)用軟件中在數(shù)值計算方面首屈一指。MATLAB可以進行矩陣運算、繪制函數(shù)和數(shù)據(jù)、實現(xiàn)算法、創(chuàng)建用戶界面、連matlab開發(fā)工作界面接其他編程語言的程序等,主要應(yīng)用于工程計算、控制設(shè)計、信號處理與通訊、圖像處理、信號檢測、金融建模設(shè)計與分析等領(lǐng)域。MATLAB的基本數(shù)據(jù)單位是矩陣,它的指令表達式與數(shù)學(xué)、工程中

76、常用的形式十分相似,故用MATLAB來解算問題要比用C、FORTRAN等語言完成相同的事情簡捷得多,并且MATLAB也吸收了像Maple等軟件的優(yōu)點,使MATLAB成為一個強大的數(shù)學(xué)軟件</p><p><b>  4.2原始語音信號</b></p><p>  錄制一段自己的語音信號,并對錄制的信號進行采樣;畫出采樣后語音信號的時域波形和頻譜圖;</p>

77、<p>  %語音信號時域頻域分析</p><p>  [y,Fs,bits]=wavread('2.wav');%讀出信號,采樣率和采樣位數(shù) </p><p>  y=y(:,1);%我這里假設(shè)你的聲音是雙聲道,我只取單聲道作分析 </p><p>  sigLength=length(y);%算出y的長度</p>&

78、lt;p>  Y = fft(y,sigLength);%在sigLength這個有限區(qū)間內(nèi)做快速傅立葉變換</p><p>  Pyy = Y.* conj(Y) / sigLength; %Y乘Y的共軛,得到功率譜</p><p>  halflength=floor(sigLength/2); %半寬度</p><p>  f=Fs*(0:halflen

79、gth)/sigLength; %采樣頻率的橫坐標</p><p>  figure;plot(f,Pyy(1:halflength+1));xlabel('Frequency(Hz)'); %在第一個窗口畫率譜</p><p>  t=(0:sigLength-1)/Fs; %計算時間軸</p><p>  figure;plot(t,y);xla

80、bel('Time(s)'); %在第二個窗口畫波形</p><p>  圖4-1原始語音信號</p><p>  由圖可知這段語音信號頻率主要集中在1000Hz左右。</p><p>  4.3對語音信號進行調(diào)制</p><p>  為了減少在傳輸時的耗損,人們一般是先對傳輸信號進行特殊處理,然后再傳遞。把原始的待傳信號托附

81、到高頻振蕩的過程稱為調(diào)制。我們知道音頻信號的頻率在我們的聽覺范圍內(nèi),音頻信號在無線傳輸?shù)倪^程中會受到各種聲音的干擾而產(chǎn)生能量消耗,因此限制了傳輸?shù)木嚯x,所以在現(xiàn)實的傳送過程中要現(xiàn)對語音信號進行調(diào)制再發(fā)送出去。</p><p>  若欲傳送信號為其振幅限制不可大于一</p><p><b>  載波為</b></p><p>  fc為載波中心頻

82、率,單位為赫茲。A是任意振幅。傳送信號將會是</p><p><b>  在此, </b></p><p>  公式中,f(t)是振蕩器的瞬時頻率,fΔ是頻偏(頻率偏移),代表在一個方向上相對fc的最大頻率偏離,在此我們假定xm(t)是有限的幅值限于±1之間。</p><p>  下面是對一段語音信號的調(diào)制仿真圖,載波頻率為fc=20

83、000。</p><p>  圖4-2調(diào)制后的語音信號</p><p>  由圖可知,經(jīng)過調(diào)制后的語音信號頻譜都搬移到fc=20000的頻段。</p><p>  4.4設(shè)計數(shù)字濾波器和畫出頻率響應(yīng)</p><p>  根據(jù)語音信號的特點給出有關(guān)濾波器的性能指標:</p><p>  低通濾波器性能指標,fp=1000

84、Hz,fc=1200Hz,As=100dB,Ap=1dB;</p><p>  用雙線性變換法設(shè)計的低通濾波器的程序如下:</p><p>  fp=1000;fc=1200;As=100;Ap=1;fs=22050;</p><p>  wc=2*fc/fs;wp=2*fp/fs;</p><p>  [n,wn]=ellipord(wp,

85、wc,Ap,As);</p><p>  [b,a]=ellip(n,Ap,As,wn);</p><p>  freqz(b,a,512,fs); </p><p><b>  濾波器的頻率響應(yīng)</b></p><p>  圖4-3濾波器的頻率響應(yīng) </p><p><b>  4.5

86、進行低通濾波</b></p><p>  低通濾波可以簡單的認為:設(shè)定一個頻率點,當信號頻率高于這個頻率時不能通過,在數(shù)字信號中,這個頻率點也就是截止頻率,當頻域高于這個截止頻率時,則全部賦值為0。因為在這一處理過程中,讓低頻信號全部通過,所以稱為低通濾波。比較濾波前后語音信號的波形及頻譜。低通濾波器(low-passfilter)容許低頻信號通過,但減弱(或減少)頻率高于截止頻率的信號的通過。對于不

87、同濾波器而言,每個頻率的信號的減弱程度不同。當使用在音頻應(yīng)用時,它有時被稱為高頻剪切濾波器或高音消除濾波器。低通濾波器在信號處理中的作用等同于其它領(lǐng)域如金融領(lǐng)域中移動平均數(shù)(moving average)所起的作用。 </p><p><b>  程序如下:</b></p><p>  [y,fs,bits]=wavread('e:\hy.wav');

88、 %函數(shù)wavread是對語音信號進行 采樣,格式是[y,fs,nbit]=wavread,返回采樣值放在向量y中,fs表示采樣頻率(Hz),nbit表示采樣位數(shù)。</p><p>  fp=1000;fs=2000;rp=0.5;rs=40;fc=40000;%設(shè)定通帶截止頻率(fp)、阻帶截止頻率(fs)、通帶波紋系數(shù)(rp)、阻帶波紋系數(shù)(rs)、抽樣頻率

89、(fc)。</p><p>  wp=2*fp/fc;ws=2*fs/fc; %將模擬域轉(zhuǎn)化成數(shù)字域。</p><p>  if get(handles.radiobutton1,'value')%如果選擇radiobutton1,則制做巴特沃思濾波器。</p><p>  [N,Wc]=buttord(wp,ws,rp,r

90、s); %估算巴特沃思濾波器的階數(shù)N和3dB截止頻率Wc。</p><p>  [num,den]=butter(N,Wc); %求傳輸函數(shù)的分子和分母多項式的系數(shù)。</p><p>  else %選擇radiobutton2,則制做切比雪夫Ⅰ型濾波器。</p><p>

91、;  [N,Wc]=cheb1ord(wp,ws,rp,rs); %估算切比雪夫Ⅰ型濾波器的階數(shù)N和截止頻率Wc。</p><p>  [num,den]=cheby1(N,rp,Wc); %求傳輸函數(shù)的分子和分母多項式的系數(shù)。</p><p><b>  end</b></p><p>  x=filter(nu

92、m,den,y); %根據(jù)傳輸函數(shù)的分子和分母多項式的系數(shù)得到模擬濾波器,并將y通過該濾波器,得到x。</p><p>  sound(x,fc,bits); %將濾波后的信號x進行回放。</p><p>  X=fft(x); %將x信號進行快速傅里葉變換。</

93、p><p>  plot(x); %在axes3坐標軸上畫出x信號的波形圖。</p><p>  plot(abs(X)); %在axes4坐標軸上畫出頻譜圖。</p><p>  圖4-4 低通濾波后的信號波形和頻譜</p><p>  由圖4

94、-4可知低通濾波后,高頻分量被低通濾波器衰減。所以聲音稍微有些發(fā)悶、低沉,但是很接近原來的聲音。</p><p><b>  總 結(jié)</b></p><p>  通過這次課程設(shè)計,使我對語音信號有了全面的認識,對數(shù)字信號處理的知識又有了深刻的理解,在之前數(shù)字信號與處理的學(xué)習(xí)以及完成課后的作業(yè)的過程中,已經(jīng)使用過MATLAB,對其有了一些基礎(chǔ)的了解和認識。通過這次練習(xí)是

95、我進一步了解了信號的產(chǎn)生、采樣及頻譜分析的方法。以及其中產(chǎn)生信號和繪制信號的基本命令和一些基礎(chǔ)編程語言。讓我感受到只有在了解課本知識的前提下,才能更好的應(yīng)用這個工具;并且熟練的應(yīng)用MATLAB也可以很好的加深我對課程的理解,方便我的思維。這次設(shè)計使我了解了MATLAB的使用方法,學(xué)會分析濾波器的優(yōu)劣和性能,提高了分析和動手實踐能力。同時我相信,進一步加強對MATLAB的學(xué)習(xí)與研究對我今后的學(xué)習(xí)將會起到很大的幫助。</p>

96、<p><b>  參 考 文 獻</b></p><p>  [1]胡航.語音信號處理[M].哈爾濱:哈爾濱工業(yè)大學(xué)出版社,2002.</p><p>  [2]丁玉美.高西全.數(shù)字信號處理[M].西安電子科技大學(xué)出版社,2006.</p><p>  [4]張威.MATLAB基礎(chǔ)與編程入門[M].西安電子科技大學(xué)出版社,2006.

97、</p><p>  [5]林福宗.多媒體技術(shù)基礎(chǔ)[M].北京:清華大學(xué)出版社,2000. </p><p>  [6]周淵,王炳和,劉斌勝.基于MATLAB的噪聲信號采集和分析系統(tǒng)的設(shè)計[M].噪聲控制.2004(7):52-54. </p><p>  [7]朱學(xué)芳,徐建平.計算機語音信號處理與語音識別系統(tǒng)[J].南京郵電學(xué)院學(xué)報,1998,18(5—6):11

98、3—1</p><p><b>  附錄一:</b></p><p>  %語音信號時域頻域分析</p><p>  [y,Fs,bits]=wavread('2.wav');%讀出信號,采樣率和采樣位數(shù)。 </p><p>  y=y(:,1);%我這里假設(shè)你的聲音是雙聲道,我只取單聲道作分析,如果你想

99、分析另外一個聲道,請改成y=y(:,2) </p><p>  sigLength=length(y); </p><p>  Y = fft(y,sigLength); </p><p>  Pyy = Y.* conj(Y) / sigLength; </p><p>  halflength=floor(sigLength/2); &l

100、t;/p><p>  f=Fs*(0:halflength)/sigLength; </p><p>  figure;plot(f,Pyy(1:halflength+1));xlabel('Frequency(Hz)'); </p><p>  t=(0:sigLength-1)/Fs; </p><p>  figure;pl

101、ot(t,y);xlabel('Time(s)');</p><p><b>  附錄二:</b></p><p><b>  %抽取的源程序</b></p><p>  [y,fs,bs]=wavread('d:\01.wav',[25000,75000]);</p><

102、;p><b>  y=y(:,1);</b></p><p>  lg=length(y);</p><p>  yx=(0:(lg-1))*fs/lg;</p><p>  yx=yx(1:lg/2);</p><p>  % sound(y,fs);</p><p>  figure(

103、1);</p><p>  subplot(211);</p><p><b>  plot(y);</b></p><p>  title('原始信號');</p><p>  subplot(212);</p><p>  yf=abs(fft(y));</p>

104、<p>  yf=yf(1:lg/2);</p><p>  plot(yx,yf);</p><p>  ycq=zeros(1,lg); %先將抽取后的值全設(shè)為零 </p><p>  for i=1:80:lg; %通過循環(huán),每隔80個點將抽取后的值賦值為原函數(shù)的 </p><p>  ycq(i)=y(i); %采樣值 &l

105、t;/p><p><b>  end </b></p><p>  sound(ycq,fs);</p><p>  figure(2);</p><p>  subplot(211);</p><p>  plot(ycq);</p><p>  title('抽取后

106、的信號');</p><p>  subplot(212);</p><p>  ycqf=abs(fft(ycq));</p><p>  ycqf=ycqf(1:lg/2);</p><p>  plot(yx,ycqf);</p><p><b>  附錄三:</b></p&g

107、t;<p>  “河南成建學(xué)院”語譜圖源程序:</p><p>  frmsize = 256; % 設(shè)置貞大小</p><p>  [x,fs,nbits] = wavread('3.wav'); % 讀取語音文件</p><p>  x = filter([1 -0.95],[1],x); % 高頻預(yù)加重,抵消頻譜傾斜</p&

108、gt;<p>  n = length(x); frmcnt = floor(n/frmsize); </p><p>  x = reshape(x(1:frmsize*frmcnt),frmsize,frmcnt); % 分幀</p><p>  xFFT = abs(fft(x)); % 傅里葉譜</p><p>  xFFT = xFFT(1:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論