基于可控功率響應(yīng)的聲源定位快速算法研究.pdf_第1頁
已閱讀1頁,還剩78頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、麥克風(fēng)陣列聲源定位是利用麥克風(fēng)組成的陣列來估計聲源位置的技術(shù),在日常生產(chǎn)與生活中有著廣泛的應(yīng)用。聲源定位算法一般分為基于高分辨率譜估計,基于時延差估計和基于可控波束形成三大類,可控功率響應(yīng)(SRP:SteeredResponsePower)算法是典型的基于可控波束的聲源定位方法,在混響環(huán)境中具有較強的穩(wěn)健性,但復(fù)雜的計算量限制了它在實時環(huán)境中的應(yīng)用。因此,本文的研究目標(biāo)就是在保持定位性能基本不變的前提下,減少SRP的計算量。
  

2、 首先,介紹了傳統(tǒng)SRP算法的原理,并做了一系列仿真實驗,包括用Image算法仿真了房間脈沖響應(yīng),直觀地演示了混響;仿真廣義互相關(guān)(GCC:GeneralizedCrossCorrelation)算法,說明GCC由于麥克風(fēng)個數(shù)較少,只能確定聲源的一系列候選位置,且性能隨混響增加而急劇下降;仿真?zhèn)鹘y(tǒng)SRP算法,直觀演示了定位的結(jié)果,說明其在強混響環(huán)境中也能取得較好的定位效果。
   其次,給出了三線快速SRP算法。該算法是一個由

3、粗到精的聲源搜索過程,在粗搜索階段,估計出水平偏角和大致的徑向距離,從徑向距離中可以判斷聲源處于近場還是遠(yuǎn)場,在精搜索階段則根據(jù)近遠(yuǎn)場采用不同的策略進(jìn)一步搜索聲源可能出現(xiàn)的位置。分析計算復(fù)雜度,三線快速SRP有效地減少了一個維度的計算量。TIMIT語音庫的數(shù)據(jù)仿真和真實環(huán)境的數(shù)據(jù)仿真表明,三線快速SRP算法與傳統(tǒng)SRP算法有著相當(dāng)?shù)亩ㄎ恍阅堋?br>   最后,給出了基于時延差聚類的快速SRP算法,著重討論了六種不同的聚類算法,分別是

4、:k-means,k-medoids,isodata,GMM,譜聚類和層次聚類。該算法分成三個步驟:第一步是對時延差聚類,可以離線完成;第二步是對聲源位置粗搜索,實際上就是分別計算所有聚類中心的SRP功率值,功率值最大的聚類即為聲源可能存在的目標(biāo)區(qū)域;第三步是在目標(biāo)區(qū)域內(nèi)對聲源位置精搜索。分析計算復(fù)雜度,基于時延差聚類快速SRP的計算量比傳統(tǒng)SRP的計算量要小很多。TIMIT語音庫的數(shù)據(jù)仿真和真實環(huán)境的數(shù)據(jù)仿真表明,基于時延差聚類的快速

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論