版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、國(guó)家“十一五”規(guī)劃教材《數(shù)字語(yǔ)音編碼》講議同濟(jì)大學(xué)電子與信息工程學(xué)院趙曉群 編著機(jī)械工業(yè)出版社,2007年,第7章 語(yǔ)音信號(hào)的線性預(yù)測(cè)分析(LPC)7.1 概述 ◆ 1947年美國(guó)科學(xué)家N.Wiener提出 線性預(yù)測(cè)理論,創(chuàng)立了控制論?!?1948年美國(guó)科學(xué)家C.E.Shannon提出 信息的測(cè)度理論,創(chuàng)立了信息論?!艟€性預(yù)測(cè)(縮寫:LP)◆線性預(yù)測(cè)分析(縮寫:LPC) LP理論:一種適用廣泛的數(shù)學(xué)理論,應(yīng)用于
2、許多領(lǐng)域;1967年日本學(xué)者Itakura(板倉(cāng))等將LP技術(shù)應(yīng)用于語(yǔ)音分析和語(yǔ)音合成,數(shù)字語(yǔ)音技術(shù)獲得巨大的發(fā)展。,線性預(yù)測(cè)已普遍地應(yīng)用于語(yǔ)音信號(hào)處理的各個(gè)方面?!魠?shù)估計(jì):基音周期、共振峰頻率、譜特征、 聲道截面積函數(shù)等◆特點(diǎn):LPC能精確估計(jì)語(yǔ)音參數(shù),用少量參數(shù)有效表示語(yǔ)音, 計(jì)算LPC參數(shù)較簡(jiǎn)單。LPC基本思想:◆利用信號(hào)間相關(guān)性,用過(guò)去值預(yù)測(cè)現(xiàn)在或未來(lái)的值, 即用過(guò)去若干個(gè)取樣值的線性組合逼近一
3、個(gè)取樣值。◆在某種測(cè)度準(zhǔn)則下,通過(guò)使實(shí)際的取樣值與預(yù)測(cè)值之間的差別達(dá)最小,確定唯一的一組預(yù)測(cè)系數(shù)。語(yǔ)音的LPC系數(shù):可于語(yǔ)音編碼、語(yǔ)音合成和語(yǔ)音識(shí)別等。LPC的基本原理和語(yǔ)音信號(hào)數(shù)字模型密切相關(guān) 本章內(nèi)容:LPC基本原理、計(jì)算方法以及應(yīng)用問(wèn)題。,第7章 語(yǔ)音信號(hào)的線性預(yù)測(cè)分析7.2 LPC的基本原理 7.2.1 信號(hào)模型時(shí)間序列可模型化為白噪聲序列作用于數(shù)字濾波器H(z)的輸出。H(z)通常為有理分式的形式:
4、 ,模型參數(shù):ai,bi ——系數(shù), , G ——增益因子。圖7.1:信號(hào)x(n)的模型化。 x(n)、X(z) —— 模型化的信號(hào)和其 z 變換, u(n)、U(z) —— 模型的激勵(lì)和其 z
5、變換。 ◆ z 域關(guān)系式: ◆時(shí)域關(guān)系式:物理意義: x(n)由其過(guò)去值及模型輸入的線性組合來(lái)預(yù)測(cè)得到。,x(n) 為零均值的隨機(jī)信號(hào)時(shí), 系統(tǒng)的輸出、輸入關(guān)系可用相關(guān)函數(shù)或功率譜來(lái)表征 : 式中,Rxx(z) —— 信號(hào) x(n) 的自相關(guān)函數(shù)的 z 變換; Ruu(z) —— 輸入 u(n) 的自相關(guān)函數(shù)的 z 變換。 ◆通常,u(n) 是零均值、 方差白噪聲序列,因此
6、有: ◆假設(shè) ,則本頁(yè)第一式的變換寫成功率譜形式,有: ◆上式表明,信號(hào) x(n) 的功率譜完全由濾波器的幅頻響應(yīng)決定。 即系統(tǒng) H(z) 確實(shí)可以用來(lái)模型化信號(hào) x(n)。上式是用模型參數(shù)分析法估計(jì)隨機(jī)信號(hào)的理論依據(jù)。,,信號(hào)模型分三種(按濾波器的有理分式): ◆ ARMA模型:傳遞函數(shù)含有極點(diǎn)和零點(diǎn)(零極點(diǎn)模型) 。 (自回歸?滑動(dòng)
7、平均模型) ARMA模型產(chǎn)生的序列稱為ARMA過(guò)程序列?!?AR模型:傳遞函數(shù)的分子多項(xiàng)式為常數(shù)(全極點(diǎn)模型)。 (自回歸模型) 輸出只取決于過(guò)去的信號(hào)值。 AR模型產(chǎn)生的序列稱為AR過(guò)程序列?!?MA模型:傳遞函數(shù)的分母多項(xiàng)式為常數(shù)(全
8、零點(diǎn)模型)。 (滑動(dòng)平均模型) 輸出只由模型的輸入來(lái)決定。 MA模型產(chǎn)生的序列稱為MA過(guò)程序列。ARMA模型是AR模型和MA模型的混合結(jié)構(gòu)。,求解模型參數(shù)的過(guò)程通常是一個(gè)逼近過(guò)程(有精度問(wèn)題)?!舴椒ㄊ窍却_定極點(diǎn)和零點(diǎn)的個(gè)數(shù),然后將 u(n) 送入系統(tǒng), 得到的輸出將是 x(n) 的近
9、似值 ?!舨捎媚撤N逼近準(zhǔn)則,使 逼近 x(n) 。 語(yǔ)音信號(hào)處理中最常用的模型是全極點(diǎn)模型。語(yǔ)音信號(hào)處理中使用全極點(diǎn)模型的理論依據(jù): (1) 不考慮鼻音和摩擦音,則聲道傳遞函數(shù)是全極點(diǎn)模型; 若考慮鼻音和摩擦音,則聲道傳遞函數(shù)有極、零點(diǎn)。 一個(gè)零點(diǎn)可以用多個(gè)極點(diǎn)來(lái)近似,依據(jù)為: (2) 用LPC法估計(jì)全極點(diǎn)模型參數(shù),求解線性方程組;
10、 而模型中含有限個(gè)零點(diǎn)時(shí),則求解非線性方程組。,7.2.2 LPC誤差濾波p 個(gè)極點(diǎn)的全極點(diǎn)模型的傳遞函數(shù)H(z): ◆ 輸入和輸出之間滿足差分方程:定義線性預(yù)測(cè)值為: 式中,a1,a2,…,ap —— LPC系數(shù)。◆上式稱為線性預(yù)測(cè)器,預(yù)測(cè)器的階數(shù)為 p 階。 p 階線性預(yù)測(cè)器的傳遞函數(shù)有如下形式:,LPC誤差e(n) :信號(hào)值 x(n) 與線性預(yù)測(cè)值 之差。 ◆ e(n)
11、 是 x(n) 通過(guò)如下系統(tǒng)轉(zhuǎn)移函數(shù)的系統(tǒng)的輸出: ◆稱系統(tǒng) A(z) 為L(zhǎng)PC誤差濾波器,如圖7.2所示。 ◆ A(z) 是 AR(p) 模型 H(z) 的逆濾波器, 關(guān)系式為:設(shè)計(jì)預(yù)測(cè)誤差濾波器 A(z) 就是求解預(yù)測(cè)系數(shù), 使誤差在某個(gè)預(yù)定的準(zhǔn)則下最小,稱為L(zhǎng)PC分析。常用的誤差準(zhǔn)則:方均誤差最小準(zhǔn)則。,求解LPC預(yù)測(cè)系數(shù) ◆將方均誤差 E[e2(n)] 對(duì)各個(gè)系數(shù) ai 求偏導(dǎo),并令為零,得
12、 代入 ,可推得: 將上式 代入第一式,得:◆上式為L(zhǎng)PC中的重要結(jié)果,稱為正交方程。◆正交方程表明:預(yù)測(cè)誤差 e(n) 與信號(hào) x(n) 的過(guò)去 p 個(gè)取樣值x(n-1), x(n-2),…, x(n-p) 是正交的。,,,正交方程,推導(dǎo)正交方程的另一種形式
13、。◆將 代入正交方程,整理得: 改寫為: 式中, ◆上式為L(zhǎng)PC中的一個(gè)重要結(jié)果,稱為標(biāo)準(zhǔn)方程式。 ◆ p 個(gè)預(yù)測(cè)系數(shù)a1,a2,…,ap可通過(guò)解標(biāo)準(zhǔn)方程式得到, ◆ 求得的 p 個(gè)預(yù)測(cè)系數(shù)將使 預(yù)測(cè)誤差濾波器的輸出方均值或者輸出功率最小。,標(biāo)準(zhǔn)方程式,正向預(yù)測(cè)誤差功率:最佳預(yù)測(cè)時(shí),誤差的最小方均
14、值,即 因 ,代入上式,得 即:◆注:上式成立條件,最佳預(yù)測(cè)系數(shù)時(shí)。◆合并標(biāo)準(zhǔn)方程式和上式,最后得到: ——稱為標(biāo)準(zhǔn)方程??山獬?p+1個(gè)未知數(shù)a1,a2,…,ap,Ep。,標(biāo)準(zhǔn)方程,p+1個(gè)線性方程,已知信號(hào)的相關(guān)函數(shù)c(j,i)。,特殊情況:若信號(hào)恰為一個(gè)
15、 p 階的過(guò)程序列, 其信號(hào)模型的傳遞函數(shù): 模型的時(shí)域 差分方程: 其中,輸入的激勵(lì)信號(hào)u(n) 是零均值、方差為 1 的白噪聲序列?!舾膶懖罘址匠虨椋?(*) 式(*) 兩邊乘 x(n-j),求平均值,因E[u(n)x(n-j)]=0 ,有: 式(*)
16、兩邊乘x(n),求平均值,類似地有: 比較上兩式與式 , 可發(fā)現(xiàn)預(yù)測(cè)系數(shù)和信號(hào)模型參數(shù)滿足相同的方程組,G=Ep。,結(jié)論: (1)已知模型階數(shù) p 的AR過(guò)程序列,按LPC設(shè)計(jì)A(z)時(shí), 所得預(yù)測(cè)系數(shù)和該模型相應(yīng)的模型參數(shù)有相同的值; (2)
17、未知模型階數(shù) p ,或過(guò)程模型含零點(diǎn)時(shí), 可認(rèn)為L(zhǎng)PC提供了該過(guò)程信號(hào)模型的一個(gè)估計(jì)。◆ LPC分析是估計(jì)隨機(jī)信號(hào)功率譜的一種有效方法。 p=有限值,預(yù)測(cè)濾波器A(z)為FIR濾波器,只有零點(diǎn)。 與AR(p)模型對(duì)應(yīng)。p=∞,預(yù)測(cè)濾波器A(z)有下面形式: 對(duì)應(yīng)于信號(hào)模型中的ARMA過(guò)程。,7.2.3 語(yǔ)音信號(hào)的LPC分析 語(yǔ)音序列為緩變的隨機(jī)序列,可近似用信號(hào)模型化方法分析。圖7.3:信
18、號(hào)模型化的思想建立的語(yǔ)音信號(hào)的產(chǎn)生模型?!魧⑤椛?、聲道、聲門激勵(lì)的譜效應(yīng)簡(jiǎn)化為時(shí)變數(shù)字濾波器, 其穩(wěn)態(tài)系統(tǒng)函數(shù)為: 語(yǔ)音信號(hào)x(n)被模型化 為一個(gè)過(guò)程序列?!魸嵋艏?lì)為準(zhǔn)周期沖激序列,◆清音激勵(lì)為白噪聲序列。H(z)稱為合成濾波器。模型參數(shù):濁/清音判決、 基音周期、增益常數(shù)G、 數(shù)字濾波器參數(shù)a1,a2,…,ap。,求解濾波器參數(shù)和增益常數(shù)的過(guò)程稱為語(yǔ)音信號(hào)的LPC分析。 ◆基本問(wèn)題是從
19、語(yǔ)音信號(hào)序列確定一組LPC系數(shù)。 ◆預(yù)測(cè)系數(shù)的估計(jì)須在一短段(幀)語(yǔ)音信號(hào)的范圍內(nèi)進(jìn)行。 激勵(lì)源問(wèn)題: ◆清音:用模型合成語(yǔ)音時(shí),產(chǎn)生的序列與和被分析序列 有相同的譜包絡(luò)特性。 ◆濁音:激勵(lì)源 u(n) 的譜是一組幅度相同的諧波線譜, 與模型化中的信號(hào)源假設(shè)有所不同。 但激勵(lì)源 u(n) 的大部分時(shí)間的值
20、非常?。阒担?由于方均預(yù)測(cè)誤差最小準(zhǔn)則使預(yù)測(cè)誤差e(n)逼近于u(n) , 與u(n)能量很小這一事實(shí)并不矛盾。 ◆因此,為不使問(wèn)題復(fù)雜化,認(rèn)為模型適于清音、濁音。,使用全極點(diǎn)模型進(jìn)行語(yǔ)音信號(hào)LPC分析的主要缺點(diǎn): (1) 理論上,語(yǔ)音是極零點(diǎn)模型(特別是清音和鼻音), 應(yīng)該用 ARMA模型; (2) 模型中,對(duì)于濁音時(shí),激勵(lì)源不滿足白噪聲的假設(shè)條件。近期研究,
21、努力解決這些問(wèn)題。 全極點(diǎn)模型求解方便,在相當(dāng)廣泛的條件適于工程, 在數(shù)字語(yǔ)音信號(hào)處理的眾多領(lǐng)域得到了非常成功的應(yīng)用。,第7章 語(yǔ)音信號(hào)的線性預(yù)測(cè)分析7.3 LPC分析的解法 求信號(hào)模型參數(shù)可以通過(guò)LPC完成; ◆ LPC系數(shù)以及預(yù)測(cè)誤差功率可從下式標(biāo)準(zhǔn)方程解出: ◆解線性方程組的方法有多種, ◆以系數(shù)矩陣的特殊性質(zhì)可簡(jiǎn)化解法。標(biāo)準(zhǔn)方程的系數(shù)矩陣中, 的值取決于求數(shù)學(xué)期望的方法。 ◆c(j,
22、i)的定義不同,導(dǎo)致不同的LPC解法。經(jīng)典解法:自相關(guān)法、協(xié)方差法。,7.3.1 自相關(guān)法假定 x(n) 在 0≤ n ≤N-1以外為零( N 長(zhǎng)加窗截?。?◆截取序列為:x(0),x(1),…, x(N-1) ; ◆ c(j,i)是加窗的信號(hào)序列x(n)的自相關(guān)函數(shù) r(j-i),即: ◆將r(j,i)代入標(biāo)準(zhǔn)方程中,寫成矩陣形式,得: 式中,預(yù)測(cè)系數(shù) ai 用 ap,i代替(p 特指是
23、 p 階預(yù)測(cè)系數(shù))。上式稱為Yule–Walker(尤利–沃爾克)方程。,特點(diǎn):主對(duì)角線和與主對(duì)角線平行的斜對(duì)角線上, 該方程組的系數(shù)矩陣的元素相同,具有這樣性質(zhì)的矩陣稱為Toeplitz(托普利茲)矩陣;同時(shí)該系數(shù)矩陣是對(duì)稱矩陣。,利用對(duì)稱Toeplitz矩陣性質(zhì),Yule–Walker方程可用Levinson–Durbin(萊文遜–杜賓)遞推算法高效地求解。 ◆算法的計(jì)算復(fù)雜度為 O(p2)(一般解
24、法復(fù)雜度為 O(p3))。設(shè)已知 p-1 階Yule–Walker方程的解為: 則有:◆由方程的系數(shù)矩陣的對(duì)稱特點(diǎn)知,將 p 階和 p-1 階兩方程中 后面兩個(gè)列矢量倒置,再代入到原方程中,等式保持不變。,◆設(shè) p 階方程的解為 p-1 階方程解的一種線性組合:并代入 p-1 階方程,得:式中,,◆要使左式為待求方程式(見(jiàn)上頁(yè))的解,要求下式右邊的矢量,除第一個(gè)元素外,均為零。
25、 ◆需通過(guò)選擇 kp,使其滿足q-kpEp-1=0即: kp=q/Ep-1 。,由上頁(yè)結(jié)果,可推出: 將上式代入解表達(dá)式(見(jiàn)上頁(yè)),得LPC系數(shù)的遞推公式為: ◆比較上面兩個(gè)方程,知:在每次遞推求解過(guò)程中,系數(shù) ki, i=1,2,…,p 起到關(guān)鍵作用?!衾碚摲治觯簁i 為無(wú)損級(jí)聯(lián)聲管的反射系數(shù)或偏相關(guān)系數(shù)。以上三式是Levinson–Durbin的遞推公式。Levinson–Durbin的計(jì)
26、算量:乘法 p2 次,除法 p 次。,計(jì)算量:乘法 (p2-p)/2 次, 除法 p 次。,計(jì)算量:乘法 (p2-p)/2 次。,計(jì)算量:乘法 p 次。,Levinson–Durbin算法的遞推步驟: (1) 初始化: ; (2) 已知p-1階預(yù)測(cè)器的參數(shù):
27、 ; (3) 計(jì)算 p 階預(yù)測(cè)器的反射系數(shù): (4) 計(jì)算 p 階預(yù)測(cè)器的預(yù)測(cè)參數(shù)和誤差能量: (5) 返回第(2)步。 ◆當(dāng)遞推過(guò)程達(dá)到指定的階數(shù)時(shí),終止計(jì)算。計(jì)算得三類結(jié)果:各階預(yù)測(cè)器的預(yù)測(cè)系數(shù); 各階預(yù)測(cè)器的反射系數(shù); 各階預(yù)測(cè)器的預(yù)測(cè)誤差
28、功率 。,從式 可以得到:◆結(jié)論:(1) 最小預(yù)測(cè)誤差能量 Ep > 0,且隨階數(shù) p 增大而減小。 (2)反射系數(shù) ki 滿足: (3) 時(shí),系統(tǒng)穩(wěn)定;H(z) 的根在單位圓內(nèi)。,7.3.2 協(xié)方差法自相關(guān)法定義 c(j,i) 為: ◆需 N 個(gè) x(n) 樣本:x(0), x(1), …, x(
29、N-1), 可加窗;協(xié)方差法定義 c(j,i) 為: ◆需 N+p 個(gè) x(n) 樣本: x(-p), x(-p+1), …, x(N-1) 或定義 c(j,i) 為: ◆需 N 個(gè) x(n) 樣本:x(0), x(1), …, x(N-1); ◆此時(shí),預(yù)測(cè)誤差在 [p, N-1] 范圍內(nèi)為最小。嚴(yán)格講,協(xié)方差法定義的 c(j,i) 是:
30、 兩個(gè)相似的信號(hào)序列段間的互相關(guān)函數(shù)。相關(guān)函數(shù)的微小的不同,使LPC方程組解法有很大不同。,將標(biāo)準(zhǔn)方程 寫成矩陣形式: ◆協(xié)方差法不需要加窗,計(jì)算精度大大提高。缺點(diǎn):不保證 ,即不保證系統(tǒng)的穩(wěn)定性; 進(jìn)行線性預(yù)測(cè)時(shí),
31、需隨時(shí)判定 H(z) 的極點(diǎn)位置, 并加以修正,才能得到穩(wěn)定的結(jié)果。,對(duì)稱系數(shù)矩陣,不具有Toeplitz性質(zhì)。自相關(guān)法的求解捷徑無(wú)效,而需要新的解法。,Choleskey(喬里斯基)分解法解協(xié)方差方程: ◆將標(biāo)準(zhǔn)方程式 中的第一個(gè)寫成矩陣形式: 式中,C 是 p×p 階正定對(duì)稱矩陣,A 和 B 是列矢量:◆正定性的系數(shù)矩陣 C 可分解為: 式中,V 是下三角矩
32、陣,主對(duì)角元素=1;D 是對(duì)角矩陣:,令式 兩邊的第 (i, j) 項(xiàng)元素相等,可得: 解得: ◆確定矩陣 V 和 D 后,分兩步確定列矢量 A。 由 得: , 令: , 有:
33、 或:,,利用該組式,可得遞推解法。,(1) 由 解得矢量 Y 元素: (2) 由 ,解得矢量 A 元素: 上兩式與下式構(gòu)成Choleskey分解法的計(jì)算過(guò)程。分析計(jì)算量:以上三式均需1/di,計(jì)算一次需 p 次除法; 分析乘法量:Choleskey分
34、解法的計(jì)算量:乘法 (p3+9p2-10p)/6 次, 除法 p 次。,計(jì)算量:乘法 (p2-p)/2 次。,計(jì)算量:乘法 (p3+3p2-4p)/2 次。,計(jì)算量:乘法 (p2-p)/2 次。,7.3.3 自相關(guān)法與協(xié)方差法的比較自相關(guān)法適應(yīng)于平穩(wěn)信號(hào),協(xié)方差法適用于非平穩(wěn)信號(hào)。由經(jīng)驗(yàn)可知,對(duì)摩擦音,自相關(guān)法較好;
35、 對(duì)于周期性語(yǔ)音,協(xié)方差法較好。 Levinson–Durbin和Choleskey均可有效求解相關(guān)方程。自相關(guān)法略微簡(jiǎn)單一些。 自相關(guān)法時(shí)需要用窗函數(shù)截取信號(hào),引入了誤差, 求解精度不高,這是自相關(guān)法本質(zhì)性的缺點(diǎn)。協(xié)方差法無(wú)需加窗處理,計(jì)算精度大大提高,所得到的協(xié)方差系數(shù)能更精確地代表語(yǔ)音信號(hào)。協(xié)方差法的主要缺點(diǎn):可能會(huì)產(chǎn)生不穩(wěn)定的逆濾波器。,第7章 語(yǔ)音信號(hào)的線
36、性預(yù)測(cè)分析7.4 格型法及其改進(jìn) 1970年代初,板倉(cāng)(Itakura)提出預(yù)測(cè)逆濾波器的格型結(jié)構(gòu)。格型法特點(diǎn):在運(yùn)算中不需要窗函數(shù)加權(quán),同時(shí)保證解的 穩(wěn)定性,較好解決了精度和穩(wěn)定性間的矛盾。提出正向預(yù)測(cè)和反向預(yù)測(cè)概念,增加了選擇方均誤差準(zhǔn)則的 靈活性,衍生出系列格型結(jié)構(gòu)的新的LPC算法。Burg從最大熵譜分析的觀點(diǎn)也得到了相似
37、和等價(jià)的結(jié)果。格型法運(yùn)算量:比自相關(guān)法或協(xié)方差法大 4 倍左右。Makhoul提出改進(jìn)的協(xié)方差格型法: 該方法可使運(yùn)算量恢復(fù)到自相關(guān)法或協(xié)方差法的水平, 同時(shí)保持較高的精度和解的穩(wěn)定性。,7.4.1 格型法基本原理定義:正向預(yù)測(cè)和反向預(yù)測(cè)的概念。Levinson–Durbin算法遞推到第 p 階的預(yù)測(cè)系數(shù):定義: p 階LPC誤差濾波器為: ◆ Ap(z) 的輸入信號(hào)為x(n),輸出預(yù)
38、測(cè)誤差為 e(n)= ep(n),有: 時(shí)域關(guān)系: z 域關(guān)系:,由Levinson–Durbin遞推算法知, p 階預(yù)測(cè)器的遞推解可寫為: (見(jiàn)前面推導(dǎo)) 式兩邊左乘 ,得: 即:◆將上式代入式
39、 中,得:式中,Bp(z) 及其逆 z 變換 bp(n) 為:,定義:正向預(yù)測(cè)誤差 fp(n)的 z 變換為Fp(z)= Ep(z)。定義:反向預(yù)測(cè)誤差 注:f,F 表示正向, b,B 表示反向。 圖7.4:兩種預(yù)測(cè)示意圖。,推導(dǎo)格型濾波器的結(jié)構(gòu)?!粲汕懊嬷?Fp(z)的逆 z 變換為:◆將式
40、 (將變換 z 用 z-1 替代) 代入式 ,得: Bp(z)的逆 z 變換為:◆當(dāng) p=0時(shí),由正向預(yù)測(cè)誤差和反向預(yù)測(cè)誤差的定義式,得:注:上面三個(gè)綠色公式是構(gòu)造格型濾波器的關(guān)鍵式。,綜合上頁(yè)三個(gè)關(guān)系式,得遞推關(guān)系:◆上式是構(gòu)造格型(分析)濾波器的重要表達(dá)式。圖7
41、.5:格型分析濾波器的結(jié)構(gòu)?!舨V器的輸入為信號(hào) x(n), 輸出為正向預(yù)測(cè)誤差x(n) ,亦即預(yù)測(cè)誤差 e(n) 。,上頁(yè)三個(gè)關(guān)系式可改寫為:◆上式是構(gòu)造格型(合成)濾波器的重要表達(dá)式。圖7.6:格型合成濾波器的結(jié)構(gòu)。 格型合成濾波器可用于數(shù)字語(yǔ)音模型中的合成濾波器 H(z)?!舾裥蜑V波器由 p 節(jié)構(gòu)成,關(guān)鍵參數(shù)僅為反射系數(shù) ki。,7.4.2 格型法求解可設(shè)計(jì)出多種最優(yōu)準(zhǔn)則
42、(規(guī)則)求解反射系數(shù), 衍生出多種格型法求解算法。根據(jù)格型的結(jié)構(gòu)形式特點(diǎn),分別定義: 正向方均誤差: 反向方均誤差: 交叉方均誤差: 依據(jù)三種方均誤差定義,所衍生出的幾種常用的格型法: 1.正向格型法 4.Burg(伯格)法 2.反向格型法 5.協(xié)方差格型法
43、 3.幾何平均格型法,1.正向格型法逼近準(zhǔn)則:使第 p 節(jié)正向方均誤差 epf(n) 為最小?!袅?,利用正向預(yù)測(cè)誤差定義式 得: 即:◆在實(shí)際運(yùn)算時(shí)總是用時(shí)間平均近似代替集合平均。 為提高計(jì)算精度,可不限制 x(n) 的長(zhǎng)度范圍,上式可寫成:,2.反向格型法逼近準(zhǔn)則:使第 p 節(jié)反向方均誤差 epb(n) 為最小。
44、◆令 ,利用反向預(yù)測(cè)誤差定義式 得: 即:◆在實(shí)際運(yùn)算時(shí)總是用時(shí)間平均近似代替集合平均。 為提高計(jì)算精度,也不限制 x(n) 的長(zhǎng)度范圍,上式可寫成:,3.幾何平均格型法該方法不采用逼近準(zhǔn)則,而采用逼近規(guī)則?!舳x:反射系數(shù)為epf(n) 和epb(n)的幾何平均值: 整理得: 式中,sgn(x) 是取 x 的符號(hào)函數(shù)
45、。 ◆這種方法確定的反射系數(shù)保證合成系統(tǒng)是穩(wěn)定的?!艨勺C明:,4. Burg(伯格)法逼近準(zhǔn)則:使第 p 節(jié)epf(n)+epb(n)為最小?!袅?,利用正、反向預(yù)測(cè)誤差式,得: 即: 或:◆這種方法確定的反射系數(shù)將保證合成系統(tǒng)是穩(wěn)定的。◆可證明:,5.協(xié)方差格型法格型法計(jì)算量:大(約為自相關(guān)法或協(xié)方差法的4倍以
46、上 ) ◆需要算:fp(n)、bp(n)、kp、LPC系數(shù)。 ◆特點(diǎn):多次調(diào)用相同的語(yǔ)音取樣值,可簡(jiǎn)化計(jì)算的可能。協(xié)方差格型法:格型法的改進(jìn)算法,可減少運(yùn)算量。改進(jìn)思路:去掉 c(i,j) 中冗余計(jì)算,化簡(jiǎn)預(yù)測(cè)誤差的計(jì)算。 仍可以不同誤差準(zhǔn)則求解,既保持格型法的靈活性、 解的穩(wěn)定性和精確性,又使運(yùn)算量與自相關(guān)法相當(dāng)。,協(xié)方差c(i,j)的定義式:
47、 或:◆考慮對(duì)稱性,約定僅使用 c(i,j),i≥j?!衾?c(i,j) 與 c(i-1,j-1) 之間的關(guān)系,減少計(jì)算量?!舢?dāng)信號(hào) x(n) 的長(zhǎng)度定義在 -p≤ n ≤N-1內(nèi)時(shí),有: 得:◆當(dāng)信號(hào) x(n) 的長(zhǎng)度定義在0≤ n ≤N-1內(nèi)時(shí),有: 得:◆結(jié)合上面兩綠式,得 c(i,j) 與 c(i-1,j-1) 之間的關(guān)系式見(jiàn)下面,,,,,兩式相減,,,兩式相減,,,◆將上式分別代
48、入各預(yù)測(cè)誤差表達(dá)式,化簡(jiǎn)后得:,協(xié)方差格型法的求解分為四個(gè)主要步驟:(1) 利用式 由輸入信號(hào) x(n) 計(jì)算所需要的協(xié)方差c(i,j);(2) 利用下式計(jì)算預(yù)測(cè)誤差:(3) 利用格型法求解反射系數(shù):ki;(4) 計(jì)算LPC系數(shù):ap,i?!魠f(xié)方差格型法的實(shí)際運(yùn)算量可以大幅度下降。,7.4.3 各種LPC分析方法的比較分析:(經(jīng)分析) ◆運(yùn)算量:協(xié)方差法的運(yùn)算量略高于自相關(guān)法。
49、 格型法的運(yùn)算量與協(xié)方差法相近。 ◆運(yùn)算量:自相關(guān)法、格型法可保穩(wěn)定,協(xié)方差法不保穩(wěn)定。 實(shí)際參數(shù)時(shí),協(xié)方差法基本保穩(wěn)定。,第7章 語(yǔ)音信號(hào)的線性預(yù)測(cè)分析7.5 LPC的頻域特性 7.5.1 最小預(yù)測(cè)誤差的頻域解釋 x(n) —— 語(yǔ)音信號(hào), e(n)——預(yù)測(cè)誤差; A(z), A(ejω) —— 預(yù)測(cè)誤差濾波器; H(z),H(ejω
50、) —— 合成濾波器; 則有:◆設(shè):X(ejω) = F [x(n)], E(ejω) = F [e(n)]。 由Parseval定理,得:,因 是用全極點(diǎn)模型估計(jì)的語(yǔ)音譜 ,即有:◆上頁(yè)式寫成:◆ min E[e2(n)] 等效于語(yǔ)音譜與全極點(diǎn)模型估計(jì)譜的 比值的積分值最小。頻域上,LPC的原理:
51、給定語(yǔ)音信號(hào)的譜 , 期望用一個(gè) p 階全極點(diǎn)濾波器作為其模型, 該模型輸出的譜 使其比值的積分最小。,定義:預(yù)測(cè)誤差信號(hào)的譜平坦度:◆譜平坦度 f 是指譜的幾何均值與算術(shù)均值之比,0≤ f ≤1。 恒定譜的平坦度等于 1。min E[e2(n)] 可以看成是使 E[e2(n)
52、] 的譜最平坦, 或者說(shuō)具有最大的譜平坦度。,7.5.2 LPC譜估計(jì)LPC分析:可看成用全極點(diǎn)譜逼近語(yǔ)音信號(hào)譜的譜匹配問(wèn)題, 也是用全極點(diǎn)模型估計(jì)語(yǔ)音信號(hào)的譜的譜估計(jì)問(wèn)題。LPC分析:是求解信號(hào)模型參數(shù)的有效的方法, 也是估計(jì)隨機(jī)信號(hào)功率譜的有效方法。語(yǔ)音模型的 H(z) 是聲道響應(yīng)、聲門激勵(lì)及輻
53、射組合效應(yīng)的 模型,它使用全極點(diǎn)形式。若語(yǔ)音信號(hào) x(n) 確實(shí)是一個(gè) p 階AR過(guò)程,則LPC分析的預(yù)測(cè)系數(shù)恰好等于 H(z) 的參數(shù),且有: 式中, H(ejω) 是模型 H(z) 的頻率響應(yīng),簡(jiǎn)稱為L(zhǎng)PC譜。,語(yǔ)音信號(hào)并非 p 階AR過(guò)程,LPC應(yīng)理解為語(yǔ)音的譜估計(jì)。 ◆多數(shù)輔音(清音)和鼻音,應(yīng)用極零點(diǎn)模型表示; ◆一個(gè)零點(diǎn)能夠用無(wú)窮多個(gè)極點(diǎn)來(lái)逼近,
54、 即極零模型可用無(wú)窮高階的全極點(diǎn)模型來(lái)逼近。語(yǔ)音信號(hào)應(yīng)為ARMA過(guò)程,但階數(shù)足夠大,全極點(diǎn)模型譜則以任意小的誤差逼近語(yǔ)音信號(hào)譜,即: 注:p→∞,表明成立式: 因相位的因素,但不一定成立式:圖7.7:元音 [ou] 的LPC譜實(shí)例。,圖7.8:元音段 [æ] 的LPC譜和語(yǔ)音信號(hào)譜的比較。 ◆信號(hào)譜由FFT分析得到; LPC譜: Hamming窗, 14 階,自相關(guān)法; ◆該信號(hào)的譜有很好
55、的諧波結(jié)構(gòu); 在信號(hào)譜的峰值處,LPC譜和信號(hào)譜匹配良好; 在信號(hào)譜的谷底處,LPC譜和信號(hào)譜匹配較差;濁音語(yǔ)音譜,在諧波成分處 匹配效果要遠(yuǎn)比諧波之間好得多。原因:源于方均誤差最小的準(zhǔn)則, 譜值大時(shí)誤差要小。,階數(shù) p 的選擇:從譜估計(jì)精度、計(jì)算量、存儲(chǔ)量等綜合考慮, 與LPC求解方法無(wú)關(guān)。 ◆一般原則
56、:先保證足夠的極點(diǎn)模擬聲道響應(yīng)的諧振結(jié)構(gòu)。 通常,每kHz兩個(gè)極點(diǎn)(或共軛極點(diǎn))表征聲道響應(yīng), 需 3~4 個(gè)極點(diǎn)逼近可能的零點(diǎn)、聲門激勵(lì)和輻射效應(yīng)。 ◆10 kHz取樣時(shí),要求12~24階數(shù)。圖7.9:歸一化預(yù)測(cè)誤差與 p 的變化曲線。 ◆ p 增加,預(yù)測(cè)誤差趨于下降, ◆ p=12~14 時(shí),誤差變化基本趨于平緩。 ◆清音比濁音的歸一化預(yù)測(cè)誤差高得多,
57、 即濁音時(shí)估計(jì)精確。 ◆ p 增加,LPC譜有更多的信號(hào)譜細(xì)節(jié)。若譜估計(jì)關(guān)注聲道諧振特性,取 p=12~14。,幀長(zhǎng) N 的選擇: (N 小,則求解LPC參數(shù)的計(jì)算量?。┳韵嚓P(guān)法:一般 N 不低于兩個(gè)基音周期,為 20 ~ 30 ms。協(xié)方差法和斜格法: 因無(wú)需加窗,理論上幀長(zhǎng)小到什么程度沒(méi)有實(shí)際限制, 但是估計(jì)譜的精度隨著 N 的增加而提高。一般,幀長(zhǎng) N 取 2~3 個(gè)基音周期才是合理的
58、 語(yǔ)音信號(hào)譜的高頻分量小,常采用預(yù)加重提高之。,7.5.3 LPC倒譜聲道模型的系統(tǒng)函數(shù)H(z): H(z) 的激勵(lì)響應(yīng)為 h(n)。先求序列 h(n) 的倒譜 ?!舾鶕?jù)同態(tài)處理方法,有: ◆因 H(z) 是最小相位的(單位圓內(nèi)解析),故 可展開(kāi): 即存在 的逆變換 ,且 ?!?/p>
59、將 對(duì) z-1 求導(dǎo)數(shù),考慮到上 3 式,經(jīng)整理得:◆由恒等式,得:,◆倒譜的遞推公式,基于 LPC 預(yù)測(cè)系數(shù)推得,◆稱為 LPC 倒譜。◆利用了最小相位特性,避免相位卷繞問(wèn)題。,分析倒譜,可分別估計(jì)語(yǔ)音信號(hào)短時(shí)譜包絡(luò)和聲門激勵(lì)參數(shù)。估計(jì)語(yǔ)音信號(hào)的短時(shí)譜包絡(luò)的方法有:(1) 按式 ,從LPC系數(shù)估計(jì)短時(shí)譜包絡(luò);(2) 對(duì)信號(hào)
60、作FFT、對(duì)數(shù)變換,后求逆FFT,用適當(dāng)?shù)妮o助因子 獲得倒譜,并用低時(shí)窗取出譜包絡(luò)信息。(3) 從LPC倒譜求短時(shí)譜包絡(luò)。 圖7.10:三種短時(shí)譜包絡(luò)的實(shí)例?!?FFT和LPC法的頻譜包絡(luò)接近, 后者比前者更好地重現(xiàn)譜的峰值?!羲鼈兌急戎苯訌腖PC系數(shù)導(dǎo)出 的頻譜包絡(luò)要平滑得多?!鬖PC倒譜法運(yùn)算量小。,第7章 語(yǔ)音信號(hào)的線性預(yù)測(cè)分析7.6 線譜對(duì)分析 線譜頻率(LSF):與LPC系數(shù)、反射系數(shù)等
61、價(jià)的另一種 系數(shù)。也稱為線譜對(duì)(LSP)?!?LSP 是頻域參數(shù),與語(yǔ)音信號(hào)譜包絡(luò)的峰有更緊密的聯(lián)系?!?LSP優(yōu)點(diǎn):其合成濾波器與反射系數(shù)一樣,易保證穩(wěn)定性, 而參數(shù)的量化和內(nèi)插特性均優(yōu)于反射系數(shù), 使相同質(zhì)量的合成語(yǔ)音所需的數(shù)碼率得以降低?!鬖SP缺點(diǎn)
62、: 運(yùn)算量較大。,7.6.1 線譜對(duì)分析原理p 階LPC誤差濾波器的傳遞函數(shù)為:定義: p+1 階多項(xiàng)式: ◆則:◆不難看出,P(z) 相當(dāng)于 kp+1=-1 時(shí)的 Ap+1(z), Q(z) 相當(dāng)于 kp+1=1 時(shí)的 Ap+1(z)。可證明:A(z) 的零點(diǎn)在 z 平面單位圓內(nèi)時(shí), P(z)和Q(z)的零點(diǎn) 都在單位圓上,并且沿
63、單位圓上隨 ω 的增加交替出現(xiàn)。,◆ P(z)是對(duì)稱實(shí)系數(shù)的 p+1 階 多項(xiàng)式,以-1為根;◆ Q(z)是反對(duì)稱實(shí)系數(shù)的 p+1 階多項(xiàng)式,以+1為根。即:,設(shè): ◆易得系數(shù)間的關(guān)系為: ◆若 p 是偶數(shù),設(shè) P(z) 的零點(diǎn)為 , Q(z) 的零點(diǎn)為 , 則 P(z) 和 Q(z) 可寫成因式分解形式:◆ ωi、θi 的值排列為:◆ ωi和 θi
64、 成對(duì)出現(xiàn),反映了譜的特性,稱之為線譜對(duì)(LSP)。,◆ P’(z)、Q’(z)的系數(shù)也是對(duì)稱的;◆且α0=β0=0?!魹楣曹棌?fù)根:◆其基本因式:,當(dāng) p 為奇數(shù)時(shí),可以同樣求得LSP參數(shù)的表達(dá)式。 P(z)、Q(z)的零點(diǎn)互相分離,是合成濾波器穩(wěn)定的充要條件;即:在單位圓上, P(z) 和 Q(z)不可能同時(shí)為零。LSP參數(shù)和語(yǔ)音譜特性之間有密切的聯(lián)系。 語(yǔ)音譜可由LPC模型譜來(lái)估計(jì),而LPC譜可以寫成: ◆
65、若ωi 和 θi 很靠近,則當(dāng) ω 接近這些頻率時(shí), 變小, 顯強(qiáng)諧振特性,語(yǔ)音譜包絡(luò)在這些頻率處出現(xiàn)峰值。LSP分析是用 p 個(gè)離散頻率 ωi 和 θi 的分布密度 表示語(yǔ)音信號(hào)譜特性的一種方法。,分析: 1. 當(dāng)ω 接近 0 或 θi,i=1,2,..時(shí),括號(hào)內(nèi)的第一項(xiàng)接近于零; 2. 當(dāng) ω 接近π 或 ωi,i=1,2,..時(shí),括號(hào)中第
66、二項(xiàng)接近于零。,一般不直接利用LSP參數(shù)去構(gòu)成聲道模型參數(shù)。 主要原因: ◆用LPC系數(shù)構(gòu)成聲道模型參數(shù)比較容易, LSP參數(shù)與聲道模型的 z 域表示是隱性關(guān)系, ◆ LPC系數(shù)到LSP參數(shù)的轉(zhuǎn)換是可逆的。 LPC參數(shù)廣泛應(yīng)用于各種語(yǔ)音編碼、語(yǔ)音合成和語(yǔ)音識(shí)別等應(yīng)用領(lǐng)域中。實(shí)驗(yàn)表明:表達(dá)LPC參數(shù)的最有效方式為L(zhǎng)SP參數(shù)。
67、 ◆一個(gè)LSP參數(shù)的誤差僅僅影響全極點(diǎn)模型中鄰近這個(gè)參數(shù) 對(duì)應(yīng)頻率處的語(yǔ)音譜,而不影響其他地方。 ◆對(duì)敏感頻率段對(duì)應(yīng)的LSP參數(shù)分配較多的比特?cái)?shù), 對(duì)不敏感頻率段對(duì)應(yīng)的LSP參數(shù)分配較少的比特?cái)?shù)。 ◆在相對(duì)低的碼率上,使用LSP參數(shù)能獲得高質(zhì)量的語(yǔ)音, 主觀性能也表明它能產(chǎn)生高質(zhì)量的合成語(yǔ)音。,LSP參數(shù)的主要性質(zhì): (1) 保持LSP參數(shù)的有序有界性質(zhì),就保證了H(z)
68、是穩(wěn)定的; (2) LSP參數(shù)具有相對(duì)獨(dú)立的性質(zhì);◆移動(dòng)LSP參數(shù)中任一線譜頻率的位置,則頻譜只在該線譜頻率附近與原始譜有差異,在其他LSP頻率上變化很小?!暨@一特性有利于LSP參數(shù)的量化和內(nèi)插。 (3) LSP參數(shù)反映聲道幅度譜的特點(diǎn);◆ 在幅度大的地方分布較密,反之較疏。 反映出幅度譜中的共振峰特性。 (4) 相鄰幀LPC間有較強(qiáng)相關(guān)性,便于幀間參數(shù)的內(nèi)插。 (5) 量化效率高?!?/p>
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 語(yǔ)音信號(hào)的預(yù)測(cè)研究.pdf
- 語(yǔ)音編碼中的線性預(yù)測(cè)分析.pdf
- 基于dsp的語(yǔ)音信號(hào)編碼器
- 語(yǔ)音信號(hào)壓縮編碼原理及應(yīng)用
- 語(yǔ)音信號(hào)的壓縮感知研究及其在語(yǔ)音編碼中的應(yīng)用.pdf
- 語(yǔ)音信號(hào)混合激勵(lì)線線預(yù)測(cè)編碼的研究和實(shí)現(xiàn).pdf
- 語(yǔ)音信號(hào)采集和分析報(bào)告
- 數(shù)字信號(hào)課程設(shè)計(jì)語(yǔ)音信號(hào)的采集、分析與處理
- 語(yǔ)音信號(hào)的數(shù)字化噪聲抑制技術(shù)
- 語(yǔ)音信號(hào)的小波分析.pdf
- 語(yǔ)音信號(hào)lpc分析的編程實(shí)現(xiàn)
- 數(shù)字信號(hào)處理課程設(shè)計(jì)---語(yǔ)音信號(hào)的頻譜分析
- 語(yǔ)音信號(hào)數(shù)字處理中語(yǔ)音編解碼算法的研究.pdf
- 碼激勵(lì)線性預(yù)測(cè)語(yǔ)音編碼的研究.pdf
- 語(yǔ)音信號(hào)矢量量化編碼技術(shù)研究.pdf
- 開(kāi)題報(bào)告---語(yǔ)音信號(hào)處理
- 語(yǔ)音信號(hào)情感識(shí)別.pdf
- 基于CELP算法語(yǔ)音信號(hào)的編碼壓縮設(shè)計(jì).pdf
- 探析語(yǔ)音信號(hào)的數(shù)字化噪聲抑制技術(shù)
- 語(yǔ)音信號(hào)采集系統(tǒng)設(shè)計(jì)
評(píng)論
0/150
提交評(píng)論