版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、科技在進(jìn)步,時(shí)代在發(fā)展,在這個(gè)“讀圖”和“聽音”的時(shí)代,語音技術(shù)深入到人們生活的各方各面,讓機(jī)器說話已不是幻想。然而,目前語音合成的質(zhì)量仍不是很高,主要表現(xiàn)在:合成的語音自然度低、節(jié)奏感差,所以,語音合成自然度的進(jìn)一步提高是目前亟待解決的問題。
本文的研究工作主要針對漢語韻律結(jié)構(gòu)中的韻律短語識別展開。韻律結(jié)構(gòu)是以句法結(jié)構(gòu)為基礎(chǔ)的。通過對大量語料的分析可以看出,韻律結(jié)構(gòu)和句法結(jié)構(gòu)之間存在著一定的聯(lián)系。由于語塊本身可以反映出一定的
2、句法信息,且人們在朗讀或說話時(shí)往往是以語塊為基本單位的,語塊的切分可以把句法上相關(guān)的詞進(jìn)行整合,所以本文提出將語塊結(jié)構(gòu)這種非遞歸嵌套的淺層句法結(jié)構(gòu)應(yīng)用于韻律短語的預(yù)測。
本文的主要工作包括以下幾個(gè)方面:
?。?)語塊的定義及獲取
目前對韻律層級的劃分所使用的特征多為詞、詞性和詞長?;谶@些特征的局限性和韻律結(jié)構(gòu)與句法信息之間的緊密聯(lián)系,在對漢語語塊結(jié)構(gòu)與韻律結(jié)構(gòu)之間的關(guān)系進(jìn)行比較研究的基礎(chǔ)上,本文定義了8種適
3、用于韻律短語邊界識別的語塊類型,并歸納總結(jié)了語塊的處理規(guī)則,通過語塊之間結(jié)合緊密度的度量,實(shí)現(xiàn)了語塊的歸并,生成了最終的語塊結(jié)構(gòu)。
?。?)基于語塊和條件隨機(jī)場的韻律短語識別
本文將語塊結(jié)構(gòu)這種非遞歸嵌套的淺層句法結(jié)構(gòu)應(yīng)用于韻律短語的預(yù)測,提出了一種基于語塊信息,并利用條件隨機(jī)場CRFs對韻律短語進(jìn)行識別的方法。首先基于語塊結(jié)構(gòu)抽取、選擇模型特征,然后利用CRFs訓(xùn)練構(gòu)建模型用于韻律短語的識別。
?。?)基于語
4、塊和AdaBoost-SVM集成算法的韻律短語識別
由于尋找一種較強(qiáng)的分類算法用于韻律短語的識別較為困難,基于強(qiáng)、弱學(xué)習(xí)算法的等價(jià)性問題,利用集成學(xué)習(xí)方法能夠使多個(gè)準(zhǔn)確率略高于隨機(jī)猜測弱分類器進(jìn)行加權(quán)融合,形成一個(gè)強(qiáng)學(xué)習(xí)算法,達(dá)到比強(qiáng)分類器更好的分類效果,所以,本文使用AdaBoost集成學(xué)習(xí)算法,以SVM作為基分類器,通過對訓(xùn)練語料多次隨機(jī)抽取,經(jīng)過多次訓(xùn)練更改權(quán)重,訓(xùn)練生成多個(gè)基分類器,最終將這幾個(gè)基分類器進(jìn)行加權(quán)投票的方
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于規(guī)則抽取的漢語語塊識別.pdf
- 基于主動學(xué)習(xí)的漢語韻律短語預(yù)測研究.pdf
- 基于用法屬性的現(xiàn)代漢語介詞短語邊界識別研究.pdf
- 基于多Agent策略的漢語語塊識別.pdf
- 基于句法特征的漢語韻律邊界預(yù)測的研究.pdf
- 基于半監(jiān)督學(xué)習(xí)的漢語韻律短語預(yù)測研究.pdf
- 基于二叉樹結(jié)構(gòu)的漢語韻律邊界研究.pdf
- 基于簡單名詞短語的漢語介詞短語識別研究.pdf
- 基于AMEMM的漢語韻律短語預(yù)測系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于條件隨機(jī)場的漢語短語識別研究
- 日本留學(xué)生漢語語篇朗讀中韻律詞尾和韻律詞內(nèi)非邊界位置的“我”.pdf
- 基于CRF模型的漢語介詞短語識別.pdf
- 漢語文語轉(zhuǎn)換中韻律模型的研究.pdf
- 基于多層CRFs的漢語介詞短語識別研究.pdf
- 漢語文語轉(zhuǎn)換中韻律標(biāo)注的研究.pdf
- 基于語義分析的漢語短語識別方法研究.pdf
- 漢語短語識別方法研究.pdf
- 基于條件隨機(jī)場模型的半監(jiān)督漢語韻律短語預(yù)測的研究與實(shí)現(xiàn).pdf
- 基于領(lǐng)域詞典的漢語語塊分析的研究.pdf
- 基于最大熵的漢語介詞短語自動識別.pdf
評論
0/150
提交評論