語(yǔ)音信號(hào)壓縮感知關(guān)鍵技術(shù)研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩124頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、信號(hào)的稀疏性是壓縮感知理論的應(yīng)用前提,壓縮感知用最少的觀測(cè)數(shù)來(lái)對(duì)信號(hào)進(jìn)行壓縮采樣,實(shí)現(xiàn)了信號(hào)的降維處理,節(jié)約了采樣和傳輸?shù)某杀荆o信號(hào)采樣技術(shù)帶來(lái)一場(chǎng)新的革命。對(duì)于語(yǔ)音信號(hào)而言,由于其具有近似稀疏性,可以將壓縮感知理論與語(yǔ)音信號(hào)處理技術(shù)結(jié)合,打破了傳統(tǒng)的建立于奈奎斯特采樣的語(yǔ)音信號(hào)處理經(jīng)典模式。用壓縮感知理論中的觀測(cè)序列來(lái)代替?zhèn)鹘y(tǒng)奈奎斯特語(yǔ)音采樣值,將導(dǎo)致信號(hào)特征發(fā)生根本性的變化,從而影響語(yǔ)音信號(hào)處理應(yīng)用的各個(gè)領(lǐng)域。本課題在對(duì)壓縮感知理

2、論深入研究的基礎(chǔ)上,研究了語(yǔ)音信號(hào)的壓縮感知稀疏域和基于觀測(cè)序列的語(yǔ)音端點(diǎn)檢測(cè)算法,提出一種適合語(yǔ)音的觀測(cè)矩陣,并對(duì)該觀測(cè)矩陣投影下的觀測(cè)序列模型進(jìn)行研究,針對(duì)語(yǔ)音壓縮感知,提出一種碼本映射聯(lián)合l1重構(gòu)算法。論文的主要工作和創(chuàng)新如下:
  (1)研究語(yǔ)音觀測(cè)序列在不同稀疏域下的壓縮感知重構(gòu)技術(shù),對(duì)比語(yǔ)音信號(hào)在DCT、DFT、DWT及K-L變換下的稀疏性。研究表明,雖然在K-L變換下語(yǔ)音系數(shù)是最稀疏的,但由于重構(gòu)時(shí)需要用到原信號(hào)的自

3、相關(guān)矩陣,實(shí)際應(yīng)用困難,而在前三種稀疏域下,DCT變換的稀疏性最好。研究了在隨機(jī)高斯矩陣投影下,壓縮感知BP重構(gòu)和OMP重構(gòu)的原理及性能。實(shí)驗(yàn)結(jié)果顯示對(duì)語(yǔ)音信號(hào)而言,在相同觀測(cè)點(diǎn)數(shù)下,BP重構(gòu)性能優(yōu)于OMP,但運(yùn)算復(fù)雜度大。研究了語(yǔ)音觀測(cè)在過(guò)完備余弦字典及KSVD字典下的壓縮感知,由于系數(shù)稀疏性的增強(qiáng),其重構(gòu)效果比DCT基均有提高,且KSVD字典重構(gòu)性能優(yōu)于過(guò)完備余弦字典。根據(jù)語(yǔ)音幀和非語(yǔ)音幀壓縮感知觀測(cè)序列頻譜幅度分布分散且差異較大的

4、特性,提出一種基于壓縮感知觀測(cè)序列倒譜距離的語(yǔ)音端點(diǎn)檢測(cè)算法,以直接根據(jù)觀測(cè)序列特性分析判斷出原始輸入語(yǔ)音的屬性。對(duì)不同信噪比下的帶噪語(yǔ)音進(jìn)行端點(diǎn)檢測(cè)仿真實(shí)驗(yàn),其性能與傳統(tǒng)奈奎斯特采樣下的倒譜端點(diǎn)檢測(cè)相當(dāng),但可以降低運(yùn)算量。
  (2)針對(duì)DCT稀疏基下,語(yǔ)音信號(hào)采用隨機(jī)高斯觀測(cè)矩陣投影時(shí),壓縮感知重構(gòu)零(近似零)系數(shù)定位能力差,導(dǎo)致對(duì)重構(gòu)質(zhì)量起主導(dǎo)作用的系數(shù)樣值發(fā)生較大誤差的問(wèn)題,提出一種適合于語(yǔ)音信號(hào)壓縮采樣的行階梯觀測(cè)矩陣,

5、并對(duì)壓縮觀測(cè)序列采用對(duì)偶仿射尺度內(nèi)點(diǎn)算法進(jìn)行重構(gòu)。仿真實(shí)驗(yàn)結(jié)果顯示,行階梯矩陣做觀測(cè)矩陣,能夠?qū)φZ(yǔ)音信號(hào)的零(近似零)系數(shù)進(jìn)行較好的定位,從而得到明顯優(yōu)于高斯觀測(cè)矩陣下語(yǔ)音壓縮感知的重構(gòu)性能,并且行階梯觀測(cè)矩陣與隨機(jī)高斯觀測(cè)矩陣相比,相應(yīng)的數(shù)據(jù)量和運(yùn)算量都大大減小。因此,作者認(rèn)為,行階梯觀測(cè)矩陣是適合語(yǔ)音信號(hào)壓縮感知采樣的比較理想的投影矩陣。
 ?。?)鑒于行階梯矩陣投影下得到的語(yǔ)音壓縮觀測(cè)序列仍具有較強(qiáng)的相關(guān)性,提出對(duì)觀測(cè)序列采

6、用Volterra級(jí)數(shù)二次建模,分析輸入序列維數(shù)和模型階數(shù)對(duì)語(yǔ)音行階梯觀測(cè)序列預(yù)測(cè)的效果,并聯(lián)合使用Wiener濾波器以提高預(yù)測(cè)準(zhǔn)確程度,實(shí)現(xiàn)了基于部分CS觀測(cè)序列、Volterra模型、Wiener濾波器的CS重構(gòu)。
  (4)論文最后針對(duì)CS重構(gòu)算法計(jì)算量大的問(wèn)題,提出一種基于觀測(cè)序列與原始序列關(guān)系的碼本映射重構(gòu)方法,該方法與l1重構(gòu)相比,對(duì)稀疏系數(shù)的位置估計(jì)較為準(zhǔn)確,且不需要優(yōu)化算法進(jìn)行重構(gòu),而是從訓(xùn)練得到的碼本中直接得到重

7、構(gòu)系數(shù),重構(gòu)時(shí)需要的計(jì)算量比BP和OMP算法明顯下降。但由于系數(shù)大小估計(jì)不夠準(zhǔn)確,綜合考慮重構(gòu)性能和運(yùn)算量,采用碼本映射聯(lián)合l1重構(gòu)。該算法訓(xùn)練階段得到語(yǔ)音碼本和觀測(cè)碼本,測(cè)試階段先估計(jì)測(cè)試語(yǔ)音的SNR,然后根據(jù)SNR和CS壓縮比選擇相應(yīng)的能量門(mén)限?,觀測(cè)序列幀能量大于?采用l1重構(gòu),小于l1采用碼本重構(gòu)。實(shí)驗(yàn)表明,在中低SNR環(huán)境下,碼本映射聯(lián)合l1重構(gòu)算法在一定的能量門(mén)限下重構(gòu)性能優(yōu)于l1重構(gòu),在高SNR和無(wú)噪環(huán)境下,碼本映射聯(lián)合l

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論