版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、<p><b> 畢 業(yè) 論 文</b></p><p> 語音信號分析與處理系統(tǒng)設(shè)計(jì)</p><p><b> 摘要</b></p><p> 語音信號處理是研究用數(shù)字信號處理技術(shù)和語音學(xué)知識對語音信號進(jìn)行處理的新興的學(xué)科,是目前發(fā)展最為迅速的信息科學(xué)研究領(lǐng)域的核心技術(shù)之一。通過語音傳遞信息是人類最重要
2、、最有效、最常用和最方便的交換信息形式。</p><p> Matlab語言是一種數(shù)據(jù)分析和處理功能十分強(qiáng)大的計(jì)算機(jī)應(yīng)用軟件,它可以將聲音文件變換為離散的數(shù)據(jù)文件,然后利用其強(qiáng)大的矩陣運(yùn)算能力處理數(shù)據(jù),如數(shù)字濾波、傅里葉變換、時(shí)域和頻域分析、聲音回放以及各種圖的呈現(xiàn)等,它的信號處理與分析工具箱為語音信號分析提供了十分豐富的功能函數(shù),利用這些功能函數(shù)可以快捷而又方便地完成語音信號的處理和分析以及信號的可視化,使人
3、機(jī)交互更加便捷。信號處理是Matlab重要應(yīng)用的領(lǐng)域之一。</p><p> 本設(shè)計(jì)針對現(xiàn)在大部分語音處理軟件內(nèi)容繁多、操作不便等問題,采用MATLAB7.0綜合運(yùn)用GUI界面設(shè)計(jì)、各種函數(shù)調(diào)用等來實(shí)現(xiàn)語音信號的變頻、變幅、傅里葉變換及濾波,程序界面簡練,操作簡便,具有一定的實(shí)際應(yīng)用意義。</p><p> 最后,本文對語音信號處理的進(jìn)一步發(fā)展方向提出了自己的看法。</p>
4、<p> 關(guān)鍵字:Matlab;語音信號;傅里葉變換;信號處理;</p><p> The Design of Analysis and Processing Voice Signal</p><p><b> Abstract</b></p><p> Speech signal processing is to stu
5、dy the use of digital signal processing technology and knowledge of the voice signal voice processing of the emerging discipline is the fastest growing areas of information science one of the core technology. Transmissio
6、n of information through the voice of humanity's most important, most effective, most popular and most convenient form of exchange of information..</p><p> Matlab language is a data analysis and process
7、ing functions are very powerful computer application software, sound files which can be transformed into discrete data files, then use its powerful ability to process the data matrix operations, such as digital filtering
8、, Fourier transform, when domain and frequency domain analysis, sound playback and a variety of map rendering, and so on. Its signal processing and analysis toolkit for voice signal analysis provides a very rich feature
9、function, use </p><p> The design of voice-processing software for most of the content are numerous, easy to maneuver and so on, using MATLAB7.0 comprehensive use GUI interface design, various function call
10、s to voice signals such as frequency, amplitude, Fourier transform and filtering, the program interface concise, simple, has some significance in practice.</p><p> Finally, the speech signal processing furt
11、her development put forward their own views.</p><p> Keywords: Matlab, Voice Signal,F(xiàn)ourier transform,Signal Processing</p><p><b> 目 錄</b></p><p><b> 1 緒論1&
12、lt;/b></p><p> 1.1課題背景及意義1</p><p> 1.2國內(nèi)外研究現(xiàn)狀1</p><p> 1. 3本課題的研究內(nèi)容和方法2</p><p> 1.3.1 研究內(nèi)容2</p><p> 1.3.2 運(yùn)行環(huán)境2</p><p> 1.3.3 開發(fā)
13、環(huán)境2</p><p> 2 語音信號處理的總體方案3</p><p> 2.1 系統(tǒng)基本概述3</p><p> 2.2 系統(tǒng)基本要求3</p><p> 2.3 系統(tǒng)框架及實(shí)現(xiàn)3</p><p> 2.4系統(tǒng)初步流程圖4</p><p> 3 語音信號處理基本知識6
14、</p><p> 3.1語音的錄入與打開6</p><p> 3.2采樣位數(shù)和采樣頻率6</p><p> 3.3時(shí)域信號的FFT分析6</p><p> 3.4數(shù)字濾波器設(shè)計(jì)原理7</p><p> 3.5倒譜的概念7</p><p> 4 語音信號處理實(shí)例分析8&l
15、t;/p><p> 4.1圖形用戶界面設(shè)計(jì)8</p><p> 4.2信號的采集8</p><p> 4.3語音信號的處理設(shè)計(jì)8</p><p> 4.3.1 語音信號的提取8</p><p> 4.3.2 語音信號的調(diào)整10</p><p> 4.3.2.1 語音信號的頻率調(diào)
16、整10</p><p> 4.3.2.2語音信號的振幅調(diào)整11</p><p> 4.3.3 語音信號的傅里葉變換12</p><p> 4.3.4 語音信號的濾波13</p><p> 4.3.4.1 語音信號的低通濾波13</p><p> 4.3.4.2 語音信號的高通濾波15</p&
17、gt;<p> 4.3.4.3 語音信號的帶通濾波15</p><p> 4.3.4.4 語音信號的帶阻濾波16</p><p> 4.4 語音信號的輸出17</p><p><b> 5 總結(jié)18</b></p><p><b> 參考文獻(xiàn)19</b></p
18、><p><b> 致 謝20</b></p><p><b> 1 緒論</b></p><p> 語音是語言的聲學(xué)表現(xiàn),是人類交流信息最自然、最有效、最方便的手段。隨著社會文化的進(jìn)步和科學(xué)技術(shù)的發(fā)展,人類開始進(jìn)入了信息化時(shí)代,用現(xiàn)代手段研究語音處理技術(shù),使人們能更加有效地產(chǎn)生、傳輸、存儲、和獲取語音信息,這對于
19、促進(jìn)社會的發(fā)展具有十分重要的意義,因此,語音信號處理正越來越受到人們的關(guān)注和廣泛的研究。</p><p> 1.1課題背景及意義</p><p> 語音信號處理是一門比較實(shí)用的電子工程的專業(yè)課程,語音是人類獲取信息的重要來源和利用信息的重要手段。通過語言相互傳遞信息是人類最重要的基本功能之一。語言是人類特有的功能,它是創(chuàng)造和記載幾千年人類文明史的根本手段,沒有語言就沒有今天的人類文明。
20、語音是語言的聲學(xué)表現(xiàn),是相互傳遞信息的最重要的手段,是人類最重要、最有效、最常用和最方便的交換信息的形式。</p><p> 語音信號處理是研究用數(shù)字信號處理技術(shù)對語音信號進(jìn)行處理的一門學(xué)科,它是一門新興的學(xué)科,同時(shí)又是綜合性的多學(xué)科領(lǐng)域和涉及面很廣的交叉學(xué)科。</p><p> 1.2國內(nèi)外研究現(xiàn)狀</p><p> 20世紀(jì)60年代中期形成的一系列數(shù)字信號
21、處理的理論和算法,如數(shù)字濾波器、快速傅立葉變換(FFT)等是語音信號數(shù)字處理的理論和技術(shù)基礎(chǔ)。隨著信息科學(xué)技術(shù)的飛速發(fā)展,語音信號處理取得了重大的進(jìn)展:進(jìn)入70年代之后,提出了用于語音信號的信息壓縮和特征提取的線性預(yù)測技術(shù)(LPC),并已成為語音信號處理最強(qiáng)有力的工具,廣泛應(yīng)用于語音信號的分析、合成及各個應(yīng)用領(lǐng)域,以及用于輸入語音與參考樣本之間時(shí)間匹配的動態(tài)規(guī)劃方法;80年代初一種新的基于聚類分析的高效數(shù)據(jù)壓縮技術(shù)—矢量量化(VQ)應(yīng)用
22、于語音信號處理中;而用隱馬爾可夫模型(HMM)描述語音信號過程的產(chǎn)生是80年代語音信號處理技術(shù)的重大發(fā)展,目前HMM已構(gòu)成了現(xiàn)代語音識別研究的重要基石。近年來人工神經(jīng)網(wǎng)絡(luò)(ANN)的研究取得了迅速發(fā)展,語音信號處理的各項(xiàng)課題是促進(jìn)其發(fā)展的重要動力之一,同時(shí),它的許多成果也體現(xiàn)在有關(guān)語音信號處理的各項(xiàng)技術(shù)之中。</p><p> 1.3本課題的研究內(nèi)容和方法</p><p> 1.3.1
23、 研究內(nèi)容</p><p> 本論文主要介紹的是的語音信號的簡單處理。本論文針對以上問題,運(yùn)用數(shù)字信號學(xué)基本原理實(shí)現(xiàn)語音信號的處理,在matlab7.0環(huán)境下綜合運(yùn)用信號提取,幅頻變換以及傅里葉變換、濾波等技術(shù)來進(jìn)行語音信號處理。我所做的工作就是在matlab7.0軟件上編寫一個處理語音信號的程序,能對語音信號進(jìn)行采集,并對其進(jìn)行各種處理,達(dá)到簡單的語音信號處理的目的。</p><p>
24、 1.3.2 運(yùn)行環(huán)境</p><p> 運(yùn)行環(huán)境主要介紹了硬件環(huán)境和軟件環(huán)境。</p><p><b> 硬件環(huán)境:</b></p><p> ① 處理器:Inter Pentium 166 MX 或更高</p><p> ② 內(nèi)存:512MB或更高</p><p> ?、?硬盤空間:
25、40GB或更高</p><p> ?、?顯卡:SVGA顯示適配器</p><p><b> 軟件環(huán)境:</b></p><p> 操作系統(tǒng):Window 98/ME/2000/XP</p><p> 1.3.3 開發(fā)環(huán)境</p><p> 開發(fā)環(huán)境主要介紹了本系統(tǒng)采用的操作系統(tǒng)、開發(fā)語言。
26、</p><p> (1) 操作系統(tǒng):Windows XP</p><p> (2) 開發(fā)環(huán)境:Matlab 7.0</p><p> 2 語音信號處理的總體方案</p><p> 2.1 系統(tǒng)基本概述</p><p> 圖形用戶界面(Graphical User Interface,簡稱 GUI,又稱圖形用
27、戶接口)是指采用圖形方式顯示的計(jì)算機(jī)操作用戶界面。與早期計(jì)算機(jī)使用的命令行界面相比,圖形界面對于用戶來說在視覺上更易于接受。GUI的廣泛應(yīng)用是當(dāng)今計(jì)算機(jī)發(fā)展的重大成就之一,他極大地方便了非專業(yè)用戶的使用人們從此不再需要死記硬背大量的命令,取而代之的是可以通過窗口、菜單、按鍵等方式來方便地進(jìn)行操作。</p><p> 2.2 系統(tǒng)基本要求</p><p> 本文是用Matlab對含噪的的
28、語音信號同時(shí)在時(shí)域和頻域進(jìn)行濾波處理和分析,在MATLAB應(yīng)用軟件下設(shè)計(jì)一個簡單易用的圖形用戶界面(GUI),來解決一般應(yīng)用條件下的各種語音信號的處理。</p><p> 2.3 系統(tǒng)框架及實(shí)現(xiàn)</p><p><b> 語音信號的采集 </b></p><p> 使用電腦的聲卡設(shè)備采集一段語音信號,并將其保存在電腦中。</p>
29、;<p><b> 語音信號的處理</b></p><p> 語音信號的處理主要包括信號的提取、信號的調(diào)整、信號的變換和濾波等。</p><p> ?、?語音信號的時(shí)域分析</p><p> 語音信號是一種非平穩(wěn)的時(shí)變信號,它攜帶著各種信息。在語音編碼、語音合成、語音識別和語音增強(qiáng)等語音處理中無一例外需要提取語音中包含的各種
30、信息。語音信號分析的目的就在與方便有效的提取并表示語音信號所攜帶的信息。語音信號分析可以分為時(shí)域和變換域等處理方法,其中時(shí)域分析是最簡單的方法,直接對語音信號的時(shí)域波形進(jìn)行分析,提取的特征參數(shù)主要有語音的短時(shí)能量,短時(shí)平均過零率,短時(shí)自相關(guān)函數(shù)等。</p><p> 提?。和ㄟ^圖形用戶界面上的菜單功能按鍵采集電腦設(shè)備上的一段音頻信號,完成音頻信號的頻率,幅度等信息的提取,并得到該語音信號的波形圖。</p&
31、gt;<p> 調(diào)整:在設(shè)計(jì)的用戶圖形界面下對輸入的音頻信號進(jìn)行各種變化,如變化幅度、改變頻率等操作,以實(shí)現(xiàn)對語音信號的調(diào)整。</p><p> ?、?語音信號的頻域分析</p><p> 信號的傅立葉表示在信號的分析與處理中起著重要的作用。因?yàn)閷τ诰€性系統(tǒng)來說,可以很方便地確定其對正弦或復(fù)指數(shù)和的響應(yīng),所以傅立葉分析方法能完善地解決許多信號分析和處理問題。另外,傅立葉表
32、示使信號的某些特性變得更明顯,因此,它能更深入地說明信號的各項(xiàng)紅物理現(xiàn)象。</p><p> 由于語音信號是隨著時(shí)間變化的,通常認(rèn)為,語音是一個受準(zhǔn)周期脈沖或隨機(jī)噪聲源激勵的線性系統(tǒng)的輸出。輸出頻譜是聲道系統(tǒng)頻率響應(yīng)與激勵源頻譜的乘積。聲道系統(tǒng)的頻率響應(yīng)及激勵源都是隨時(shí)間變化的,因此一般標(biāo)準(zhǔn)的傅立葉表示雖然適用于周期及平穩(wěn)隨機(jī)信號的表示,但不能直接用于語音信號。由于語音信號可以認(rèn)為在短時(shí)間內(nèi),近似不變,因而可以
33、采用短時(shí)分析法。</p><p> ?、?變換:在用戶圖形界面下對采集的語音信號進(jìn)行Fourier等變換,并畫出變換前后的頻譜圖和變換后的倒譜圖。</p><p> 濾波:濾除語音信號中的噪音部分,可采用低通濾波、高通濾波、帶通濾波和帯阻濾波,并比較各種濾波后的效果。</p><p> 3)語音信號的效果顯示</p><p> 通過用戶
34、圖形界面的輸出功能,將處理后的信號的語音進(jìn)行播放,試聽處理后的效果。</p><p> 2.4系統(tǒng)初步流程圖</p><p> 圖2.1列出了整個語音信號處理系統(tǒng)的工作流程:</p><p> 圖2.1 語音信號處理系統(tǒng)的工作流程</p><p> 其中信號調(diào)整包括信號的幅度和頻率的任意倍數(shù)變化。如下圖2.2</p>&
35、lt;p><b> 圖2.2 信號調(diào)整</b></p><p> 信號的濾波采用了四種濾波方式,來觀察各種濾波性能的優(yōu)缺點(diǎn):</p><p> 圖2.3 語音信號濾波的方式</p><p> 在以上三圖中,可以看到整個語音信號處理系統(tǒng)的流程大概分為三步,首先要讀入待處理的語音信號,然后進(jìn)行語音信號的處理,包括信息的提取、幅度和頻
36、率的變換以及語音信號的傅里葉變換、濾波等;濾波又包括低通濾波、高通濾波、帶通濾波和帶阻濾波等方式。最后對處理過的語音信號進(jìn)行處理后的效果顯示。以上是本系統(tǒng)的工作流程,本文將從語音信號的采集開始做詳細(xì)介紹。</p><p> 3 語音信號處理基本知識</p><p> 3.1語音的錄入與打開</p><p> 在MATLAB中,[y,fs,bits]=wavre
37、ad('Blip',[N1 N2]);用于讀取語音,采樣值放在向量y中,fs表示采樣頻率(Hz),bits表示采樣位數(shù)。[N1 N2]表示讀取從N1點(diǎn)到N2點(diǎn)的值(若只有一個N的點(diǎn)則表示讀取前N點(diǎn)的采樣值)。</p><p> sound(x,fs,bits); 用于對聲音的回放。向量y則就代表了一個信號(也即一個復(fù)雜的“函數(shù)表達(dá)式”)也就是說可以像處理一個信號表達(dá)式一樣處理這個聲音信號。<
38、;/p><p> 3.2采樣位數(shù)和采樣頻率</p><p> 采樣位數(shù)即采樣值或取樣值,用來衡量聲音波動變化的參數(shù),是指聲卡在采集和播放聲音文件時(shí)所使用數(shù)字聲音信號的二進(jìn)制位數(shù)。采樣頻率是指錄音設(shè)備在一秒鐘內(nèi)對聲音信號的采樣次數(shù),采樣頻率越高聲音的還原就越真實(shí)越自然。</p><p> 采樣位數(shù)和采樣率對于音頻接口來說是最為重要的兩個指標(biāo),也是選擇音頻接口的兩個重
39、要標(biāo)準(zhǔn)。無論采樣頻率如何,理論上來說采樣的位數(shù)決定了音頻數(shù)據(jù)最大的力度范圍。每增加一個采樣位數(shù)相當(dāng)于力度范圍增加了6dB。采樣位數(shù)越多則捕捉到的信號越精確。對于采樣率來說你可以想象它類似于一個照相機(jī),44.1kHz意味著音頻流進(jìn)入計(jì)算機(jī)時(shí)計(jì)算機(jī)每秒會對其拍照達(dá)441000次。顯然采樣率越高,計(jì)算機(jī)攝取的圖片越多,對于原始音頻的還原也越加精確。</p><p> 3.3時(shí)域信號的FFT分析</p>
40、<p> FFT即為快速傅氏變換,是離散傅氏變換的快速算法,它是根據(jù)離散傅氏變換的奇、偶、虛、實(shí)等特性,對離散傅立葉變換的算法進(jìn)行改進(jìn)獲得的。在MATLAB的信號處理工具箱中函數(shù)FFT和IFFT用于快速傅立葉變換和逆變換。函數(shù)FFT用于序列快速傅立葉變換,其調(diào)用格式為y=fft(x),其中,x是序列,y是序列的FFT,x可以為一向量或矩陣,若x為一向量,y是x的FFT且和x相同長度;若x為一矩陣,則y是對矩陣的每一列向量進(jìn)行
41、FFT。如果x長度是2的冪次方,函數(shù)fft執(zhí)行高速基-2FFT算法,否則fft執(zhí)行一種混合基的離散傅立葉變換算法,計(jì)算速度較慢。函數(shù)FFT的另一種調(diào)用格式為y=fft(x,N),式中,x,y意義同前,N為正整數(shù)。函數(shù)執(zhí)行N點(diǎn)的FFT,若x為向量且長度小于N,則函數(shù)將x補(bǔ)零至長度N;若向量x的長度大于N,則函數(shù)截短x使之長度為N;若x 為矩陣,按相同方法對x進(jìn)行處理。</p><p> 3.4數(shù)字濾波器設(shè)計(jì)原理&
42、lt;/p><p> 數(shù)字濾波器的作用是利用離散時(shí)間系統(tǒng)的特性對輸入信號波形(或頻譜)進(jìn)行加工處理,或者說利用數(shù)字方法按預(yù)定的要求對信號進(jìn)行變換。</p><p> 數(shù)字濾波器可以理解為是一個計(jì)算程序或算法,將代表輸入信號的數(shù)字時(shí)間序列轉(zhuǎn)化為代表輸出信號的數(shù)字時(shí)間序列,并在轉(zhuǎn)化過程中,使信號按預(yù)定的形式變化。數(shù)字濾波器有多種分類,根據(jù)數(shù)字濾波器沖激響應(yīng)的時(shí)域特征,可將數(shù)字濾波器分為兩種,即
43、無限長沖激響應(yīng)(IIR)濾波器和有限長沖激響應(yīng)(FIR)濾波器。從性能上來說,IIR濾波器傳輸函數(shù)的極點(diǎn)可位于單位圓內(nèi)的任何地方,因此可用較低的階數(shù)獲得高的選擇性,所用的存貯單元少,所以經(jīng)濟(jì)而效率高。但是這個高效率是以相位的非線性為代價(jià)的。選擇性越好,則相位非線性越嚴(yán)重。相反,F(xiàn)IR濾波器卻可以得到嚴(yán)格的線性相位,然而由于FIR濾波器傳輸函數(shù)的極點(diǎn)固定在原點(diǎn),所以只能用較高的階數(shù)達(dá)到高的選擇性;對于同樣的濾波器設(shè)計(jì)指標(biāo),F(xiàn)IR濾波器所要
44、求的階數(shù)可以比IIR濾波器高5~10倍,結(jié)果,成本較高,信號延時(shí)也較大;如果按相同的選擇性和相同的線性要求來說,則IIR濾波器就必須加全通網(wǎng)絡(luò)進(jìn)行相位較正,同樣要大增加濾波器的節(jié)數(shù)和復(fù)雜性。</p><p> 整體來看,IIR濾波器達(dá)到同樣效果階數(shù)少,延遲小,但是有穩(wěn)定性問題,非線性相位;FIR濾波器沒有穩(wěn)定性問題,線性相位,但階數(shù)多,延遲大。</p><p><b> 3.
45、5倒譜的概念</b></p><p> 定義:倒譜定義為信號短時(shí)振幅譜的對數(shù)傅里葉反變換。</p><p> 特點(diǎn):具有可近似地分離并能提取出頻譜包絡(luò)信息和細(xì)微結(jié)構(gòu)信息的特點(diǎn)</p><p> 用途:① 提取聲道特征信息:提取頻譜包絡(luò)特征,以此作為描述音韻的特征參 數(shù)而應(yīng)用于語音識別。</p><p> ?、?
46、提取音源信息:提取基音特征,以此作為描述音韻特征的輔助參數(shù)而應(yīng)用于語音識別。</p><p><b> 求法:</b></p><p> A:短時(shí)信號;B:短時(shí)頻譜;C:對數(shù)頻譜; D:倒譜系數(shù);E:對數(shù)頻譜包絡(luò);</p><p><b> F:基本周期</b></p><p> 4 語音信
47、號處理實(shí)例分析</p><p> 4.1圖形用戶界面設(shè)計(jì)</p><p> 在MATLAB主窗口中,選擇File菜單中的New菜單項(xiàng),再選擇其中的GUI命令,就會顯示圖形用戶界面的設(shè)計(jì)模板。MATLAB為GUI設(shè)計(jì)一共準(zhǔn)備了4種模板,分別是Blank GUI(默認(rèn)) 、GUI with Uicontrols(帶控件對象的GUI模板) 、GUI with Axes and Menu(帶坐
48、標(biāo)軸與菜單的GUI模板)與Modal Question Dialog(帶模式問話對話框的GUI模板)。</p><p> 設(shè)計(jì)語音信號處理系統(tǒng)的用戶圖形操作界面(GUI)SoundProcess,其中菜單主要包括File、Process和Output三大主要部分,其中File菜單包括輸入(Input)、保存(Save)和退出(Quit)等功能;Process菜單主要包括提?。‥xtract)、調(diào)整(Extrac
49、t)、變換(Transform)和濾波(Filter)菜單,其中調(diào)整(Extract)包括幅度調(diào)整(Range)和頻率調(diào)整(Frequency),濾波(Filter)菜單包含低通濾波(LowpassFilter)、高通濾波(HighpassFilter)、帶通濾波(BandpassFilter)和帯阻濾波(BandstopFilter)等功能菜單。</p><p><b> 4.2信號的采集</
50、b></p><p> 該系統(tǒng)是以一段簡短的的語音信號做為分析樣本,通過計(jì)算機(jī)系統(tǒng)將一段“主人,信息收到了”的語音信號保存到到計(jì)算機(jī)中,并且保存格式為“*.wav”。</p><p> 4.3語音信號的處理設(shè)計(jì)</p><p> 4.3.1 語音信號的提取</p><p> 在Matlab中使用Wavread函數(shù),可得出信號的采
51、樣頻率為22500,并且聲音是單聲道的。利用Sound函數(shù)可以清晰的聽到“主人,信息收到了”的語音。采集數(shù)據(jù)并畫出波形圖。</p><p> 其中聲音的采樣頻率Fs=22050Hz,y為采樣 數(shù)據(jù),NBITS表示量化階數(shù)。</p><p><b> 部分程序如下:</b></p><p> fn=input(' Enter WAV
52、 filename:','s'); %獲取一個*.wav的文件</p><p> [x,fs,nb]=wavread(fn);</p><p> ms2=floor(fs*0.002);</p><p> ms10=floor(fs*0.01);</p><p> ms20=floor(fs*0.02);<
53、;/p><p> ms30=floor(fs*0.03);</p><p> t=(0:length(x)-1)/fs; %計(jì)算樣本時(shí)刻 </p><p> subplot(2,1,1); %確定顯示位置</p><p> plot(t,x); %畫波形圖</p>
54、<p> legend('Waveform');</p><p> xlabel( 'Time(s)');</p><p> ylabel('Amplitude'); </p><p> 運(yùn)行后彈出語音信號處理系統(tǒng)的操作界面如圖4.1:</p><p> 圖4.1語音信號
55、處理系統(tǒng)的操作界面</p><p> 然后點(diǎn)擊File菜單中的子菜單Input,回到Matlab軟件的輸入界面如圖4.2:</p><p><b> 圖4.2輸入界面</b></p><p> 輸入要處理的語音信號的名稱,便可得到語音語音的波形圖如圖4.3:</p><p> 圖4.3語音語音的波形圖</p
56、><p> 如圖中提取的語音的波形圖所示,整段音頻數(shù)據(jù)中得聲音高低起伏與錄入的聲音信號基本一致,并且可以觀察到其中包含部分高頻噪聲。</p><p> 4.3.2 語音信號的調(diào)整</p><p> 在語音信號的研究中,經(jīng)常會對語音信號進(jìn)行進(jìn)行多倍頻率以及多倍幅度變換調(diào)整,日常應(yīng)用中,這種變換調(diào)整也經(jīng)常要用到。所以在設(shè)計(jì)中也添加了這種功能,并能夠觀察調(diào)整后的信號的波
57、形圖得變化, 而且能通過語音處理界面的輸出功能試聽處理后的語音信號。</p><p> 4.3.2.1 語音信號的頻率調(diào)整</p><p> 在設(shè)計(jì)中,可以將語音信號的采樣頻率提高或降低,來實(shí)現(xiàn)語音信號的調(diào)整,得到理想的語音信號。例如將采樣頻率提高一倍,即可得到語音信號頻率為原頻率2倍新的語音信號。運(yùn)行ProcessAdjustFrequency,得到如圖4.4的信號波形圖,并試聽調(diào)整
58、后的效果。</p><p> 圖4.4頻率調(diào)整后波形圖</p><p> 與原語音信號相比,經(jīng)過調(diào)整后的信號周期變?yōu)樵瓉淼?/2,此時(shí)的語速明顯變快,即實(shí)現(xiàn)了信號的2倍頻功能。</p><p> 4.3.2.2語音信號的振幅調(diào)整</p><p> 在設(shè)計(jì)中,可以將語音信號的幅度進(jìn)行提高或降低操作,來實(shí)現(xiàn)語音信號的調(diào)整,得到聲音音量大小
59、不同的語音信號,例如將原語音信號的幅度提高一倍,得到如下圖4.5的信號波形圖,可以通過GUI操作界面的輸出功能試聽調(diào)整后的效果。</p><p> 圖4.5 幅度調(diào)整后波形圖</p><p> 此時(shí)聽到的調(diào)整后聲音聲調(diào)變高,但不是很明顯,可以將幅度的變化值設(shè)置的比較大,那樣的話就可以得到效果相當(dāng)明顯的語音信號了。</p><p> 4.3.3 語音信號的傅里葉
60、變換</p><p> 倒譜分析是指信號短時(shí)振幅譜的對數(shù)進(jìn)行傅里葉反變換。它具有可近似地分離并提取出頻譜包絡(luò)信息和細(xì)微結(jié)構(gòu)信息的特點(diǎn)。</p><p> 對語音信號進(jìn)行頻譜分析,在Matlab中可以利用函數(shù)fft對信號行快速傅里葉變換,得到信號的頻譜圖,并進(jìn)行倒譜分析,得到倒譜圖。</p><p> 傅里葉變換的部分程序如下:</p><p
61、> x=y(44101:55050,1); %提取原語音信號的一部分</p><p> t=(0:length(x)-1)/fs; %計(jì)算樣本時(shí)刻</p><p> subplot(3,1,1); %確定顯示位置</p><p> plot(t,x); %畫波
62、形圖</p><p> legend('波形圖');</p><p> xlabel( 'Time(s)');</p><p> ylabel('Amplitude');</p><p> Y=fft(x,hamming(length(x))); %做加窗傅里葉變換</p>
63、<p> fm=5000*length(Y)/fs; %限定頻率范圍</p><p> f=(0:fm)*fs/length(Y); %確定頻率刻度</p><p> subplot(3,1,2);</p><p> plot(f,20*log10(abs(Y(1:length(f)))+eps));</p&
64、gt;<p> legend('頻譜圖'); %畫頻譜圖</p><p> ylabel('幅度(db)');</p><p> xlabel('頻率(Hz)');</p><p> c=fft(log(abs(x)+eps)); %倒頻譜計(jì)算</p&
65、gt;<p> ms1=fs/1000;</p><p> ms20=fs/50</p><p> q=(ms1:ms20)/fs; %確定倒頻刻度</p><p> subplot(3,1,3);</p><p> plot(q,abs(c(ms1:ms20))); %畫倒譜圖&
66、lt;/p><p> legend('倒譜圖');</p><p> xlabel('倒頻(s)');</p><p> ylabel('倒頻譜幅度(Hz)');</p><p> 運(yùn)行Process Transform,對語音信號的一部分進(jìn)行傅里葉變換,并進(jìn)行倒譜分析,得到如圖4.6<
67、;/p><p> 圖4.6 聲音樣本波形圖、頻譜圖和倒譜圖</p><p> 從上面的倒譜圖可以看出.當(dāng)讀“主人,信息收到了”時(shí),所對應(yīng)的頻率大概在200Hz左右。這與人的語音信號頻率集中在200 Hz到4.5 kHz之間是相一致的。而在未發(fā)聲的時(shí)間段內(nèi),相對的小高頻部分(200500Hz)應(yīng)該屬于背景噪聲。</p><p> 4.3.4 語音信號的濾波</
68、p><p> 從圖4.4中發(fā)現(xiàn),語音信號中包含背景噪聲,這些噪聲的頻率一般較高。所以可以利用MATLAB軟件中的濾波器進(jìn)行濾波處理,得到較為理想的語音信號。</p><p> 4.3.4.1 語音信號的低通濾波</p><p> 系統(tǒng)中設(shè)計(jì)了一個截止頻率為200Hz切比雪夫—I型低通濾波器,它的幅頻特性如下圖4.7:</p><p> 圖
69、4.7 低通濾波器的幅頻特性</p><p> 低通濾波器性能指標(biāo): wp=0.075pi,ws =0.125pi,Rp=0.25;As =50dB;</p><p> 經(jīng)過低通濾波器處理后,比較處理前后的波形圖的變化,如下圖4.8:</p><p> 圖4.8 低通濾波后波形和頻譜的變化</p><p> 低通濾波后,聲音稍微有些發(fā)
70、悶、低沉,原因是高頻分量被低通濾波器衰減。但是很接近原來的聲音。</p><p> 4.3.4.2 語音信號的高通濾波</p><p> 運(yùn)用切比雪夫—Ⅱ型數(shù)字高通濾波器,對語音信號進(jìn)行濾波處理。高通濾波器性能指標(biāo): wp=0.375pi,ws =0.425pi,Rp=0.25;As =50dB;然后將其與原信號的比較圖如下圖4.9:</p><p> 圖4.
71、9高通濾波后波形和頻譜的變化</p><p> 高通濾波后,此時(shí)只有少許雜音,原因是低頻分量被高通濾波器衰減,而人聲部分正好是低頻部分,所以只剩下雜音,或者發(fā)出高頻雜音但人的耳朵聽不到。</p><p> 4.3.4.3 語音信號的帶通濾波</p><p> 運(yùn)用橢圓數(shù)字帶通濾波器函數(shù),對語音信號進(jìn)行濾波處理后其與原信號的比較圖如下圖4.10:</p&g
72、t;<p> 圖4.10帶通濾波后波形和頻譜的變化</p><p> 4.3.4.4 語音信號的帶阻濾波</p><p> 運(yùn)用切比雪夫—Ⅱ型數(shù)字帶阻濾波器,對語音信號進(jìn)行濾波處理后其與原信號的比較圖如下圖3.11:</p><p> 圖4.11帯阻濾波后波形和頻譜的變化</p><p> 從以上各種數(shù)字濾波器經(jīng)過濾波
73、后得出的語音信號相比較,低通濾波后,聲音稍微有些發(fā)悶,但是很接近原來的聲音;高通濾波后聽不到人的聲音;帶通濾波后聲音有點(diǎn)像機(jī)器人小叮當(dāng)發(fā)出的聲音。帶阻濾波后,聲音比較接近原來的聲音。從頻譜圖中我們可以看出聲音的能量主要集中在低頻(0.2pi即2204.5Hz以內(nèi))部分。</p><p> 4.4 語音信號的輸出</p><p> 可以將處理后的語音信號在Matlab軟件先播放,體驗(yàn)處理
74、后的語音信號的效果。還可以將處理后的語音信號保存在電腦上。</p><p> 運(yùn)行FileSave,保存處理后的語音信號。如果沒有語音信號被處理,則系統(tǒng)會出現(xiàn)提示如下圖4.12:</p><p> 圖4.12 保存提示界面</p><p> 如果有語音信號被處理,運(yùn)行FileSave,系統(tǒng)會出現(xiàn)提示如下圖4.13:</p><p>
75、圖4.13 保存界面</p><p> 保存后,整個操作過程就完成了。</p><p><b> 5 總結(jié)</b></p><p> 本文對語音信號處理系統(tǒng)的設(shè)計(jì)作了詳細(xì)的介紹,采用一系列圖像分析和處理技術(shù),實(shí)現(xiàn)了語音信號的基本處理的功能,經(jīng)過測試運(yùn)行,本設(shè)計(jì)圓滿的完成了對語音信號的讀取與打開;較好的完成了對語音信號的頻譜分析,通過fft
76、變換,得出了語音信號的頻譜圖;在濾波這一塊,課題主要是從數(shù)字濾波器入手來設(shè)計(jì)濾波器,基本實(shí)現(xiàn)了濾波,完成了各種濾波器的濾波效果比較,與課題的要求十分相符。</p><p> 本文對語音信號處理系統(tǒng)的設(shè)計(jì)作了詳細(xì)的介紹,采用一系列圖像分析和處理技術(shù),實(shí)現(xiàn)了語音信號的基本處理的功能,經(jīng)過測試運(yùn)行,基本達(dá)到預(yù)期目的。</p><p> 本設(shè)計(jì)主要有以下優(yōu)點(diǎn):</p><p
77、> 操作界面簡練。在進(jìn)行語音信號處理的操作界面中,菜單按鍵明了,每個功能只對應(yīng)一個按鍵,省去了大型軟件的操作復(fù)雜步驟。</p><p> 處理速度較快。由于整個操作過程存在多個分步驟,并且每個步驟的聯(lián)系不是很緊密,所以每個步驟中的運(yùn)行速度很快。</p><p> 占用內(nèi)存空間比較小。整個程序僅占用數(shù)十KB的物理空間,省去了軟件的安裝麻煩。</p><p>
78、; 本設(shè)計(jì)還存在許多可以改進(jìn)的地方,主要有以下幾個方面:</p><p> 本程序僅能進(jìn)行一般應(yīng)用條件下的語音信號處理,功能比較單一,不能進(jìn)行復(fù)雜的語音信號處理。</p><p> 由于系統(tǒng)定位于一般條件下的語音信號處理,計(jì)算精度比較低,不能進(jìn)行精度較高的語音信號處理。</p><p> 3) 該程序由于編寫簡單,操作界面較小,對較大物理內(nèi)存的語音信號文件
79、不能進(jìn)行處理。</p><p><b> 參考文獻(xiàn)</b></p><p> [1] 李勇、徐震,MATLAB輔助現(xiàn)代工程數(shù)字信號處理,西安電子科技大學(xué)出版社.</p><p> [2] 陳懷琛,數(shù)字信號處理教程——Matlab釋義與實(shí)現(xiàn) ,電子工業(yè)出版社.</p><p> [3] 王一世,數(shù)字信號處理,北京理
80、工大學(xué)出版社.</p><p> [4] 陳杰,Matlab寶典,電子工業(yè)出版社.</p><p> [5] 劉幺和、宋庭新,語音識別與控制技術(shù),科學(xué)出版社.</p><p> [6] 高西全、丁玉美,數(shù)字信號處理,西安電子科技大學(xué)出版社.</p><p> [7] 程佩青, 數(shù)字信號處理教程, 清華大學(xué)出版社.</p>
81、<p> [8] 趙力,語音信號處理,機(jī)械工業(yè)出版社.</p><p> [9] 韓紀(jì)慶、張磊,語音信號處理,清華大學(xué)出版社.</p><p> [10] 胡航,語音信號處理,哈爾濱工業(yè)大學(xué)出版社.</p><p> [11] 蘇金明、張蓮花、劉波,MATLAB工具箱應(yīng)用,電子工業(yè)出版社.</p><p> [12] 王
82、京輝,語音信號處理技術(shù)研究,論文,山東大學(xué).</p><p> [13] 于俊鳳,語音信號的識別和轉(zhuǎn)換研究,學(xué)位論文,成都理工大學(xué).</p><p> [14] Gersho A,Gr R M.Vector quantization and signal Compression</p><p> Boston,Kluwer Academic Publisher
83、s.</p><p> [15] Q.Zhang,A.Benveniste,WaveletNetworks,IEEETrans,NeuralNetworks.</p><p><b> 致 謝</b></p><p> 四年的大學(xué)學(xué)習(xí),匆匆而過,回首走過的每一步,每一個腳印都令人倍加懷念,每一份情慷都令人倍加珍惜。本文是在xx老師的悉心
84、指導(dǎo)下完成的,論文從開題到論文的完成,老師都投入了極大的精力和心血,在這段期間,xx老師對我給予了多方面的指導(dǎo)、關(guān)心和幫助,使我培養(yǎng)了從事科學(xué)研究的良好態(tài)度和習(xí)慣。xx老師嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度、孜孜不倦的敬業(yè)精神、為人師表的高尚風(fēng)范、寬廣坦蕩的胸懷、極大地激勵著我不斷求知和探索,并將對我今后的學(xué)習(xí)和工作產(chǎn)生深遠(yuǎn)的影響。在此謹(jǐn)向xx老師表示衷心的感謝;同時(shí)感謝各位老師給我們辛勤的教學(xué),讓我們學(xué)到豐富的知識。</p><p&g
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 畢業(yè)論文語音信號分析與處理系統(tǒng)設(shè)計(jì)
- 課程設(shè)計(jì)--語音信號變聲處理系統(tǒng)
- 基于dsp的語音信號處理系統(tǒng)設(shè)計(jì)
- 畢業(yè)設(shè)計(jì)--基于dsp的語音信號處理系統(tǒng)設(shè)計(jì)
- 語音信號時(shí)域分析畢業(yè)設(shè)計(jì)論文
- 基于DSP的語音信號采集與處理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 畢業(yè)論文范文——語音信號的去噪處理
- 基于matlab語音信號采集與分析的畢業(yè)論文
- 煤礦調(diào)度語音信號采集與處理系統(tǒng)的研究.pdf
- 實(shí)時(shí)語音信號處理系統(tǒng)理論和應(yīng)用.pdf
- 基于matlab語音信號處理去噪畢業(yè)設(shè)計(jì)論文
- 基于matlab語音信號處理去噪畢業(yè)設(shè)計(jì)論文
- 畢業(yè)論文——基于matlab的語音信號頻譜分析
- 語音信號的采集及其基本處理技術(shù)仿真畢業(yè)論文
- 基于matlab的語音信號fir數(shù)字濾波處理畢業(yè)論文
- 語音信號的采集與分析 畢業(yè)設(shè)計(jì)
- 語音信號處理課程設(shè)計(jì)
- 畢業(yè)設(shè)計(jì)---語音信號的采集與分析
- 基于USB與虛擬儀器技術(shù)的語音信號處理系統(tǒng).pdf
- 基于+matlab+的語音信號分析與處理設(shè)計(jì)
評論
0/150
提交評論